50 câu hỏi 60 phút
Các ứng dụng người dùng có thể hướng dẫn NameNode để lưu vào bộ đệm các tệp bằng cách
thêm tên tệp bộ đệm vào nhóm bộ đệm
thêm cấu hình bộ đệm vào nhóm bộ đệm
thêm chỉ thị bộ nhớ cache vào nhóm bộ nhớ cache
chuyển tên tệp làm tham số cho nhóm bộ nhớ cache
50 câu hỏi 60 phút
45 câu hỏi 60 phút
50 câu hỏi 60 phút
22 câu hỏi 60 phút
50 câu hỏi 60 phút
50 câu hỏi 60 phút
50 câu hỏi 60 phút
50 câu hỏi 60 phút
50 câu hỏi 60 phút
50 câu hỏi 60 phút
Công cụ Hadoop được sử dụng để phân tán dữ liệu một cách đồng nhất trên các DataNode là Balancer. Balancer có nhiệm vụ đảm bảo rằng dữ liệu được phân phối đều trên tất cả các DataNode trong cluster, tránh tình trạng một số node bị quá tải trong khi các node khác lại ít dữ liệu. Điều này giúp tối ưu hiệu suất và đảm bảo tính ổn định của hệ thống Hadoop.
Câu hỏi này kiểm tra kiến thức về các thành phần trong hệ sinh thái Hadoop. Trong Hadoop, dữ liệu được lưu trữ chủ yếu trong Hệ thống tệp phân tán Hadoop (HDFS) và HBase. HBase là một cơ sở dữ liệu NoSQL chạy trên đỉnh HDFS và cung cấp quyền truy cập đọc/ghi ngẫu nhiên, thời gian thực vào dữ liệu lớn. Avro là một định dạng tuần tự hóa dữ liệu. Sqoop là một công cụ để chuyển dữ liệu giữa Hadoop và các cơ sở dữ liệu quan hệ. Zookeeper là một dịch vụ điều phối tập trung.
Trong các lựa chọn được đưa ra, HBase là thành phần được sử dụng để lưu trữ dữ liệu trong Hadoop, đặc biệt là khi cần truy cập ngẫu nhiên và thời gian thực.