Đáp án đúng: C
Hadoop framework được viết bằng Java. Java là ngôn ngữ chính được sử dụng để phát triển Hadoop và các thành phần liên quan của nó. Mặc dù có các thư viện và công cụ cho phép sử dụng các ngôn ngữ khác như Python hoặc C++ để tương tác với Hadoop, nhưng lõi của Hadoop framework vẫn là Java.
Câu hỏi liên quan
* A. Yếu tố nhân rộng: Yếu tố nhân rộng (replication factor) là thuộc tính của HDFS, được cấu hình trong `hdfs-site.xml`, không phải `hadoop-env.sh`.
* B. Tên thư mục để lưu trữ tệp hdfs: Tên thư mục lưu trữ tệp HDFS được cấu hình trong `hdfs-site.xml` bằng thuộc tính `dfs.namenode.name.dir` và `dfs.datanode.data.dir`, không phải trong `hadoop-env.sh`.
* C. Máy chủ và cổng nơi tác vụ MapReduce chạy: Địa chỉ máy chủ và cổng cho MapReduce được cấu hình trong `mapred-site.xml` (hoặc `yarn-site.xml` nếu sử dụng YARN), không phải trong `hadoop-env.sh`.
* D. Các biến môi trường Java: Đây là đáp án đúng. `hadoop-env.sh` được sử dụng để đặt các biến môi trường liên quan đến Java, ví dụ như đường dẫn đến thư mục cài đặt Java (JAVA_HOME), các tùy chọn JVM, v.v. Các biến này cần thiết để Hadoop có thể chạy các tiến trình Java của nó.
Phương án A đúng vì NameNode cần phần cứng cao cấp hơn (cao cấp hơn loại hàng hóa - commodity hardware) để xử lý lượng lớn metadata và các hoạt động quản lý. Các DataNode thường sử dụng phần cứng loại hàng hóa để lưu trữ dữ liệu.
Phương án B sai vì DataNode thường sử dụng phần cứng loại hàng hóa, không phải NameNode.
Phương án C sai vì phần cứng của NameNode rất quan trọng.
Phương án D sai vì tuy RAM là yếu tố quan trọng, nhưng không phải là yếu tố duy nhất. CPU và khả năng I/O cũng rất quan trọng đối với NameNode.
ZooKeeper là một dịch vụ điều phối tập trung, duy trì thông tin cấu hình, đặt tên, cung cấp đồng bộ hóa phân tán và dịch vụ nhóm. Trong Hadoop, ZooKeeper được sử dụng để quản lý cụm, đặc biệt là để duy trì danh sách tất cả các thành phần và địa chỉ IP của chúng. Điều này giúp các thành phần khác trong cụm Hadoop có thể tìm và giao tiếp với nhau một cách dễ dàng và đáng tin cậy. Các lựa chọn khác không mô tả đúng vai trò của Zookeeper trong cụm Hadoop.
Khi một ứng dụng khách (client) muốn truy cập một tệp trong Hadoop Distributed File System (HDFS), nó sẽ liên hệ với NameNode. NameNode, sau khi kiểm tra quyền truy cập và các điều kiện khác, sẽ cung cấp cho client thông tin về vị trí của các khối (blocks) tạo nên tệp đó. Thông tin này bao gồm:
- Block ID: Định danh duy nhất của mỗi khối dữ liệu.
- Tên máy chủ (hostname) của DataNode: Địa chỉ của DataNode nơi chứa khối dữ liệu đó. HDFS thường sao chép mỗi khối dữ liệu trên nhiều DataNode để đảm bảo tính sẵn sàng và chịu lỗi. Vì vậy, NameNode sẽ cung cấp danh sách các DataNode chứa bản sao của khối dữ liệu đó. Client có thể chọn một trong các DataNode này để truy xuất dữ liệu.
Do đó, đáp án chính xác là D. Các lựa chọn khác không đầy đủ hoặc không chính xác về thông tin mà NameNode cung cấp cho client.

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.