Trả lời:
Đáp án đúng: A
Câu hỏi này kiểm tra kiến thức về các thành phần trong hệ sinh thái Hadoop. Trong Hadoop, dữ liệu được lưu trữ chủ yếu trong Hệ thống tệp phân tán Hadoop (HDFS) và HBase. HBase là một cơ sở dữ liệu NoSQL chạy trên đỉnh HDFS và cung cấp quyền truy cập đọc/ghi ngẫu nhiên, thời gian thực vào dữ liệu lớn. Avro là một định dạng tuần tự hóa dữ liệu. Sqoop là một công cụ để chuyển dữ liệu giữa Hadoop và các cơ sở dữ liệu quan hệ. Zookeeper là một dịch vụ điều phối tập trung.
Trong các lựa chọn được đưa ra, HBase là thành phần được sử dụng để lưu trữ dữ liệu trong Hadoop, đặc biệt là khi cần truy cập ngẫu nhiên và thời gian thực.