Đáp án đúng: B
Câu hỏi liên quan
Câu hỏi này kiểm tra sự hiểu biết về sự khác biệt giữa chế độ độc lập (Standalone mode) và chế độ giả phân tán (Pseudo-Distributed mode) trong Hadoop.
- Chế độ độc lập (Standalone mode): Đây là chế độ đơn giản nhất, thường được sử dụng cho mục đích gỡ lỗi hoặc phát triển. Trong chế độ này, tất cả các tiến trình Hadoop (NameNode, DataNode, ResourceManager, NodeManager) đều chạy trên cùng một máy ảo Java (JVM). Nó không yêu cầu cấu hình phức tạp và không sử dụng HDFS.
- Chế độ giả phân tán (Pseudo-Distributed mode): Trong chế độ này, tất cả các tiến trình Hadoop cũng chạy trên cùng một máy, nhưng mỗi tiến trình chạy trong một JVM riêng biệt. Nó vẫn sử dụng HDFS và yêu cầu cấu hình. Chế độ này được sử dụng để mô phỏng một cụm Hadoop thực tế trên một máy duy nhất.
Phân tích các lựa chọn:
- A. Đứng một mình không thể sử dụng bản đồ giảm: Sai. Chế độ độc lập vẫn có thể sử dụng MapReduce.
- B. Đứng riêng có một quy trình java duy nhất chạy trong đó: Đúng. Trong chế độ độc lập, tất cả các tiến trình Hadoop chạy trong cùng một JVM.
- C. Chế độ phân tán giả không sử dụng HDFS: Sai. Chế độ giả phân tán sử dụng HDFS.
- D. Chế độ phân tán giả cần hai hoặc nhiều máy vật lý: Sai. Chế độ giả phân tán chạy trên một máy duy nhất.
Do đó, đáp án đúng là B.
- A: Các cơ chế vận chuyển tệp liên quan đến việc di chuyển dữ liệu giữa các DataNode, không phải nén dữ liệu.
- C: Cơ chế sao chép dữ liệu dùng để tạo bản sao dữ liệu để đảm bảo tính sẵn sàng và độ tin cậy, khác với nén dữ liệu.
- D: Cơ chế đồng bộ hóa dữ liệu đảm bảo rằng dữ liệu trên các DataNode được cập nhật và nhất quán, không liên quan trực tiếp đến nén dữ liệu.
Các phương án khác không đúng vì:
- B: Sai. NameNode *cần* cập nhật ánh xạ.
- C: Sai. Dữ liệu không bị mất vĩnh viễn, chỉ là NameNode cần cập nhật thông tin.
- D: Sai. Không cần thiết phải khởi động lại NameNode; thông thường, có các cơ chế để cập nhật thông tin này một cách linh hoạt.
CouchDB là một hệ quản trị cơ sở dữ liệu NoSQL mã nguồn mở, hướng tài liệu (document-oriented). Nó lưu trữ dữ liệu dưới dạng các tài liệu JSON (JavaScript Object Notation), cho phép truy vấn và lập chỉ mục linh hoạt.
HBase là một cơ sở dữ liệu NoSQL, cột-định hướng (column-oriented), được xây dựng trên Hadoop, thường được sử dụng cho lưu trữ và truy cập dữ liệu lớn.
Hive là một hệ thống kho dữ liệu (data warehouse) được xây dựng trên Hadoop, cho phép truy vấn và phân tích dữ liệu lớn bằng ngôn ngữ giống SQL.
Cassandra là một cơ sở dữ liệu NoSQL phân tán, cột-định hướng, được thiết kế để xử lý lượng lớn dữ liệu trên nhiều máy chủ.

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.