Khi bạn tăng số lượng tệp được lưu trữ trong HDFS, Bộ nhớ được yêu cầu bởi NameNode:
Đáp án đúng: A
Câu hỏi liên quan
* A. Solr: Là một nền tảng tìm kiếm, không phải hệ thống xử lý luồng.
* B. Tez: Là một framework thực thi cho Hadoop, cải thiện hiệu suất của các ứng dụng MapReduce. Nó không phải là một hệ thống xử lý luồng chuyên dụng, mà là một nền tảng để xây dựng các ứng dụng xử lý dữ liệu hàng loạt và tương tác.
* C. Spark: Là một nền tảng xử lý dữ liệu mạnh mẽ, cung cấp API cho cả xử lý hàng loạt và xử lý luồng (Spark Streaming hoặc Structured Streaming). Spark Streaming cho phép xử lý dữ liệu từ các luồng thời gian thực.
* D. Hive: Là một hệ thống data warehouse cho phép truy vấn và phân tích dữ liệu lớn được lưu trữ trong Hadoop. Nó không phải là một hệ thống xử lý luồng.
Do đó, đáp án chính xác nhất là Spark, vì nó cung cấp hệ thống xử lý luồng trong hệ sinh thái Hadoop.
Trong hệ thống tệp HDFS (Hadoop Distributed File System), NameNode quản lý siêu dữ liệu (metadata) của hệ thống tệp, bao gồm cấu trúc thư mục, thông tin về các khối dữ liệu và vị trí của chúng. DataNode lưu trữ các khối dữ liệu thực tế. Khi một khách hàng muốn đọc hoặc ghi dữ liệu vào HDFS, trước tiên nó phải giao tiếp với NameNode để lấy thông tin về vị trí của các khối dữ liệu cần thiết. Sau đó, nó sẽ giao tiếp trực tiếp với các DataNode chứa các khối dữ liệu đó để thực hiện các thao tác đọc/ghi. Do đó, khách hàng cần giao tiếp với cả NameNode và DataNode.
* A. Sao chép siêu dữ liệu hệ thống tệp từ NameNode chính: Mặc dù NameNode phụ sao chép dữ liệu từ NameNode chính để thực hiện việc hợp nhất, nhưng đây không phải là vai trò *chính* của nó.
* B. Sao chép siêu dữ liệu hệ thống tệp từ NFS được lưu trữ bởi NameNode chính: NameNode không trực tiếp lưu trữ siêu dữ liệu trên NFS. Siêu dữ liệu được lưu trữ trên đĩa cục bộ và trong bộ nhớ.
* C. Theo dõi xem NameNode chính có đang hoạt động hay không: Việc theo dõi trạng thái của NameNode chính thường được thực hiện bởi các cơ chế khác, chẳng hạn như ZooKeeper trong cấu hình HA (High Availability).
Các khối dữ liệu HDFS được truy cập thường xuyên sẽ được lưu trữ trong bộ nhớ của DataNode (đáp án A). DataNode là nơi lưu trữ các khối dữ liệu thực tế trong hệ thống HDFS. Việc lưu trữ các khối thường xuyên truy cập trong bộ nhớ DataNode giúp tăng tốc độ truy cập dữ liệu, giảm độ trễ và cải thiện hiệu suất tổng thể của hệ thống.
NameNode (đáp án B) quản lý metadata của hệ thống tệp tin HDFS, bao gồm thông tin về các tệp tin, thư mục, quyền truy cập và vị trí của các khối dữ liệu. NameNode không lưu trữ dữ liệu thực tế.
Đáp án C không chính xác vì chỉ có DataNode lưu trữ dữ liệu đã được truy cập thường xuyên.
Đáp án D không chính xác vì DataNode sẽ lưu trữ thay vì ứng dụng khách.
Mục tiêu chính của HDFS High Availability (Tính sẵn sàng cao) là đảm bảo hệ thống tiếp tục hoạt động ngay cả khi một trong các thành phần của nó bị lỗi. Trong trường hợp của HDFS, NameNode là một thành phần quan trọng, vì nó quản lý không gian tên của hệ thống tệp và ánh xạ giữa các khối dữ liệu và DataNode. Nếu NameNode chính bị lỗi, toàn bộ hệ thống tệp sẽ trở nên không khả dụng. Vì vậy, mục tiêu chính của HDFS HA là ngăn chặn NameNode chính trở thành một điểm lỗi duy nhất (single point of failure). Điều này đạt được bằng cách có một NameNode dự phòng (standby) luôn sẵn sàng để tiếp quản vai trò của NameNode chính nếu nó bị lỗi. Các lựa chọn khác không hoàn toàn chính xác vì:
- A. Tạo bản sao của NameNode chính nhanh hơn: Việc tạo bản sao nhanh hơn là một lợi ích phụ, nhưng không phải là mục tiêu chính.
- B. Để giảm thời gian chu kỳ cần thiết để khôi phục lại NameNode chính mới sau khi nút chính hiện có bị lỗi: Đây là một phần của HA, nhưng không phải là mục tiêu chính. HA hướng đến việc giảm thiểu thời gian chết hơn là chỉ giảm thời gian khôi phục.
- C. Ngăn chặn việc mất dữ liệu do lỗi của NameNode chính: Mặc dù HA giúp giảm nguy cơ mất dữ liệu, nhưng nó không hoàn toàn ngăn chặn được việc mất dữ liệu trong mọi trường hợp.

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.