DataNode và NameNode là tương ứng:
Đáp án đúng: B
Trong kiến trúc Hadoop, NameNode đóng vai trò là nút chính (master node), chịu trách nhiệm quản lý không gian tên của hệ thống tệp tin và điều phối truy cập tệp tin từ các DataNode. DataNode đóng vai trò là nút công nhân (worker node), lưu trữ các khối dữ liệu thực tế và phục vụ dữ liệu theo yêu cầu của NameNode.
Câu hỏi liên quan
NameNode lưu trữ hai loại tệp liên tục trên đĩa cục bộ: hình ảnh không gian tên (Namespace Image) và nhật ký chỉnh sửa (Edit Log). Hình ảnh không gian tên là một bản chụp nhanh của hệ thống tệp Hadoop tại một thời điểm nhất định. Nhật ký chỉnh sửa ghi lại tất cả các thay đổi được thực hiện đối với hệ thống tệp sau khi tạo hình ảnh không gian tên cuối cùng. Các thay đổi này bao gồm việc tạo tệp, xóa tệp và sửa đổi siêu dữ liệu tệp. Khi NameNode khởi động, nó tải hình ảnh không gian tên từ đĩa và sau đó áp dụng tất cả các chỉnh sửa từ nhật ký chỉnh sửa để đưa hệ thống tệp về trạng thái hiện tại. Vì vậy, đáp án đúng là A.
Hadoop sử dụng hai cơ chế chính để đảm bảo khả năng chống chịu lỗi cho NameNode:
- Sao lưu siêu dữ liệu (metadata) hệ thống tệp vào đĩa cục bộ: NameNode định kỳ ghi lại trạng thái của hệ thống tệp (ví dụ: cấu trúc thư mục, quyền truy cập, v.v.) vào một tệp trên đĩa cục bộ. Điều này đảm bảo rằng nếu NameNode gặp sự cố, nó có thể khôi phục trạng thái hệ thống tệp từ bản sao lưu này.
- Gắn kết NFS từ xa (Network File System): NameNode có thể sao lưu siêu dữ liệu vào một hệ thống tệp NFS được gắn kết từ xa. Điều này cung cấp thêm một lớp bảo vệ bằng cách lưu trữ bản sao của siêu dữ liệu trên một máy chủ khác, giảm nguy cơ mất dữ liệu nếu máy chủ NameNode chính bị lỗi.
Các lựa chọn khác không liên quan trực tiếp đến khả năng chịu lỗi của NameNode trong Hadoop:
- Lưu trữ siêu dữ liệu trên đám mây có thể là một lựa chọn sao lưu, nhưng không phải là cơ chế mặc định hoặc tiêu chuẩn được Hadoop sử dụng cho khả năng chịu lỗi NameNode.
- Số lượng CPU không ảnh hưởng trực tiếp đến khả năng chịu lỗi.
- Sử dụng phần cứng đắt tiền có thể tăng độ tin cậy, nhưng không giải quyết vấn đề mất dữ liệu trong trường hợp lỗi phần cứng hoặc phần mềm. Hadoop được thiết kế để chạy trên phần cứng commodity (tiêu chuẩn) và cung cấp khả năng chịu lỗi thông qua các cơ chế phần mềm.
Phương án A sai vì liên kết HDFS không chỉ đơn thuần là cho phép các NameNode giao tiếp với nhau, mà còn bao gồm việc phân chia không gian tên và quản lý các DataNode độc lập.
Phương án B sai vì nó mô tả việc mở rộng quy mô bằng cách thêm DataNode, điều này là mở rộng dung lượng lưu trữ chứ không phải là liên kết HDFS.
Phương án D sai vì nó liên quan đến việc thêm bộ nhớ vật lý, không liên quan trực tiếp đến khái niệm liên kết HDFS.
Trong cấu hình High Availability (HA) của HDFS với một cặp NameNode, một NameNode hoạt động (Active NameNode) và một NameNode chờ (Standby NameNode) được thiết lập. NameNode hoạt động chịu trách nhiệm xử lý tất cả các yêu cầu của client và quản lý không gian tên của hệ thống tệp. NameNode chờ liên tục theo dõi trạng thái của NameNode hoạt động và sẵn sàng tiếp quản vai trò nếu NameNode hoạt động gặp sự cố. NameNode chờ nhận các điểm kiểm tra định kỳ (periodic checkpoints) của không gian tên từ NameNode đang hoạt động. Điều này đảm bảo rằng NameNode chờ có một bản sao gần đây nhất của không gian tên, cho phép nó nhanh chóng tiếp quản vai trò của NameNode hoạt động trong trường hợp cần thiết. Các DataNode gửi báo cáo khối đến cả hai NameNode.
Phương án A sai vì Zookeeper đảm bảo chỉ có *một* NameNode active.
Phương án C sai vì chuyển đổi dự phòng được kích hoạt khi *NameNode* active bị lỗi, không phải DataNode.
Phương án D sai vì quản trị viên vẫn có thể can thiệp vào quá trình chuyển đổi dự phòng, mặc dù Zookeeper tự động thực hiện nó.

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.