Khi khách hàng giao tiếp với hệ thống tệp HDFS, nó cần giao tiếp với:
Đáp án đúng: C
Trong hệ thống tệp HDFS (Hadoop Distributed File System), NameNode quản lý siêu dữ liệu (metadata) của hệ thống tệp, bao gồm cấu trúc thư mục, thông tin về các khối dữ liệu và vị trí của chúng. DataNode lưu trữ các khối dữ liệu thực tế. Khi một khách hàng muốn đọc hoặc ghi dữ liệu vào HDFS, trước tiên nó phải giao tiếp với NameNode để lấy thông tin về vị trí của các khối dữ liệu cần thiết. Sau đó, nó sẽ giao tiếp trực tiếp với các DataNode chứa các khối dữ liệu đó để thực hiện các thao tác đọc/ghi. Do đó, khách hàng cần giao tiếp với cả NameNode và DataNode.
Câu hỏi liên quan
* A. Sao chép siêu dữ liệu hệ thống tệp từ NameNode chính: Mặc dù NameNode phụ sao chép dữ liệu từ NameNode chính để thực hiện việc hợp nhất, nhưng đây không phải là vai trò *chính* của nó.
* B. Sao chép siêu dữ liệu hệ thống tệp từ NFS được lưu trữ bởi NameNode chính: NameNode không trực tiếp lưu trữ siêu dữ liệu trên NFS. Siêu dữ liệu được lưu trữ trên đĩa cục bộ và trong bộ nhớ.
* C. Theo dõi xem NameNode chính có đang hoạt động hay không: Việc theo dõi trạng thái của NameNode chính thường được thực hiện bởi các cơ chế khác, chẳng hạn như ZooKeeper trong cấu hình HA (High Availability).
Các khối dữ liệu HDFS được truy cập thường xuyên sẽ được lưu trữ trong bộ nhớ của DataNode (đáp án A). DataNode là nơi lưu trữ các khối dữ liệu thực tế trong hệ thống HDFS. Việc lưu trữ các khối thường xuyên truy cập trong bộ nhớ DataNode giúp tăng tốc độ truy cập dữ liệu, giảm độ trễ và cải thiện hiệu suất tổng thể của hệ thống.
NameNode (đáp án B) quản lý metadata của hệ thống tệp tin HDFS, bao gồm thông tin về các tệp tin, thư mục, quyền truy cập và vị trí của các khối dữ liệu. NameNode không lưu trữ dữ liệu thực tế.
Đáp án C không chính xác vì chỉ có DataNode lưu trữ dữ liệu đã được truy cập thường xuyên.
Đáp án D không chính xác vì DataNode sẽ lưu trữ thay vì ứng dụng khách.
Mục tiêu chính của HDFS High Availability (Tính sẵn sàng cao) là đảm bảo hệ thống tiếp tục hoạt động ngay cả khi một trong các thành phần của nó bị lỗi. Trong trường hợp của HDFS, NameNode là một thành phần quan trọng, vì nó quản lý không gian tên của hệ thống tệp và ánh xạ giữa các khối dữ liệu và DataNode. Nếu NameNode chính bị lỗi, toàn bộ hệ thống tệp sẽ trở nên không khả dụng. Vì vậy, mục tiêu chính của HDFS HA là ngăn chặn NameNode chính trở thành một điểm lỗi duy nhất (single point of failure). Điều này đạt được bằng cách có một NameNode dự phòng (standby) luôn sẵn sàng để tiếp quản vai trò của NameNode chính nếu nó bị lỗi. Các lựa chọn khác không hoàn toàn chính xác vì:
- A. Tạo bản sao của NameNode chính nhanh hơn: Việc tạo bản sao nhanh hơn là một lợi ích phụ, nhưng không phải là mục tiêu chính.
- B. Để giảm thời gian chu kỳ cần thiết để khôi phục lại NameNode chính mới sau khi nút chính hiện có bị lỗi: Đây là một phần của HA, nhưng không phải là mục tiêu chính. HA hướng đến việc giảm thiểu thời gian chết hơn là chỉ giảm thời gian khôi phục.
- C. Ngăn chặn việc mất dữ liệu do lỗi của NameNode chính: Mặc dù HA giúp giảm nguy cơ mất dữ liệu, nhưng nó không hoàn toàn ngăn chặn được việc mất dữ liệu trong mọi trường hợp.
A. Khách hàng luôn giao tiếp với NameNode đang hoạt động, không phải ngẫu nhiên.
B. NameNode chờ không "tắt", mà ở trạng thái chờ và đồng bộ hóa.
C. Các DataNode gửi báo cáo khối đến cả hai NameNode (đang hoạt động và chờ) để đảm bảo tính nhất quán và dự phòng.
* A. Tắt cổng mạng của nó thông qua lệnh quản lý từ xa: Đây là một cơ chế hàng rào hợp lệ. Bằng cách ngắt kết nối mạng của NameNode cũ, nó sẽ bị cô lập và không thể tiếp tục phục vụ các yêu cầu.
* B. Thu hồi quyền truy cập của nó vào thư mục lưu trữ được chia sẻ: Đây cũng là một cơ chế hàng rào hợp lệ. Nếu NameNode không thể truy cập vào thư mục lưu trữ dữ liệu chung (ví dụ, thư mục chứa metadata của hệ thống tệp HDFS), nó sẽ không thể hoạt động đúng cách.
* C. Định dạng ổ đĩa của nó: Đây *không* phải là một cơ chế hàng rào hợp lệ, mà là một hành động phá hủy dữ liệu. Hàng rào nhằm mục đích ngăn NameNode cũ hoạt động, không phải là phá hủy dữ liệu của nó. Việc định dạng ổ đĩa sẽ làm mất toàn bộ dữ liệu trên ổ đĩa đó, bao gồm cả metadata quan trọng của HDFS.
* D. STONITH (Shoot The Other Node In The Head): Đây là một cơ chế hàng rào phổ biến. STONITH bao gồm việc sử dụng một thiết bị (ví dụ, một PDU - Power Distribution Unit) để tắt nguồn của NameNode cũ.
Do đó, đáp án đúng là C.

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.