Đáp án đúng: C
Hệ thống Apache Hadoop được viết chủ yếu bằng ngôn ngữ Java. Mặc dù có thể sử dụng các ngôn ngữ khác như Python hoặc C++ để tương tác với Hadoop thông qua các API, nhưng lõi của Hadoop và các thành phần chính của nó (HDFS, MapReduce, YARN) được xây dựng bằng Java.
Câu hỏi liên quan
Đáp án đúng là B: Data node
Giải thích:
- Data node: Trong Hadoop Distributed File System (HDFS), Data node là nơi thực tế lưu trữ các khối dữ liệu (data blocks). Mỗi Data node lưu trữ một phần dữ liệu của toàn bộ hệ thống.
- Name node: Name node quản lý metadata của hệ thống, bao gồm thông tin về các file, thư mục và vị trí của các khối dữ liệu trên các Data node. Nó không lưu trữ dữ liệu thực tế.
- Master node: Thuật ngữ "Master node" chung chung hơn và có thể áp dụng cho các hệ thống khác nhau. Trong ngữ cảnh của HDFS, Name node thường được xem là master node.
Mô hình PaaS (Platform as a Service) là mô hình điện toán đám mây cung cấp một nền tảng cho phép khách hàng phát triển, chạy và quản lý các ứng dụng mà không cần phải quản lý cơ sở hạ tầng cơ bản (máy chủ, hệ điều hành, lưu trữ, mạng). Trong các lựa chọn được cung cấp, 'Nền tảng dưới dạng dịch vụ' mô tả chính xác mô hình PaaS.
Dịch vụ Google Data Catalog trên Google Cloud Platform (GCP) được sử dụng để quản lý danh mục dữ liệu. Nó cung cấp một kho lưu trữ metadata tập trung để người dùng có thể khám phá, hiểu và quản lý dữ liệu của họ trên GCP. Data Catalog giúp tổ chức dữ liệu, cung cấp khả năng tìm kiếm và khám phá dữ liệu, cũng như quản lý các chính sách truy cập và bảo mật dữ liệu.
Google Cloud Dataprep là một dịch vụ để chuẩn bị dữ liệu, làm sạch và chuyển đổi dữ liệu cho mục đích phân tích. Google BigQuery là một dịch vụ kho dữ liệu (data warehouse) để lưu trữ và phân tích dữ liệu lớn.
Trong các đáp án trên, đáp án A và C giống nhau. Vì vậy, cả hai đều là đáp án đúng.
* A. Hadoop: Đúng. Cloudera nổi tiếng với việc cung cấp các bản phân phối Hadoop và các công cụ liên quan để phân tích dữ liệu lớn.
* B. BigQuery: Sai. BigQuery là một dịch vụ kho dữ liệu (data warehouse) trên nền tảng đám mây của Google.
* C. Elastic MapReduce: Sai. Elastic MapReduce (EMR) là một dịch vụ của Amazon Web Services (AWS) cung cấp nền tảng Hadoop được quản lý để xử lý dữ liệu lớn.
* D. Không có: Sai. Vì đáp án A đúng.
* Google Cloud: Cloudera Enterprise có thể triển khai trên Google Cloud.
* Amazon AWS: Cloudera Enterprise có thể triển khai trên Amazon AWS.
* Microsoft Azure: Cloudera Enterprise có thể triển khai trên Microsoft Azure.
Vì Cloudera Enterprise có thể triển khai trên cả Google Cloud, Amazon AWS và Microsoft Azure, nên đáp án đúng là "Tất cả".

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.