Hệ thống Apache nào dưới đây giải quyết việc nhập dữ liệu phát trực tuyến vào Hadoop?

Đầu ra của một nhiệm vụ ánh xạ là

Lời giải:

Đáp án đúng: B

Đầu ra của một nhiệm vụ ánh xạ (map task) trong các hệ thống như Hadoop MapReduce là các cặp khóa-giá trị. Nhiệm vụ ánh xạ xử lý một phần tách đầu vào (input split) và tạo ra các cặp khóa-giá trị tương ứng. Vì vậy, đáp án đúng là B. Cặp khóa-giá trị của tất cả các bản ghi từ phần tách đầu vào được trình ánh xạ xử lý.

Câu 36:

Zookeeper

Lời giải:

Đáp án đúng: A

Zookeeper là một dịch vụ điều phối tập trung, duy trì thông tin cấu hình, đặt tên, cung cấp đồng bộ hóa phân tán và các dịch vụ nhóm. Trong Hadoop, Zookeeper được sử dụng chủ yếu để quản lý cụm HBase và hỗ trợ NameNode dự phòng trong HDFS HA (High Availability). Vai trò quan trọng nhất của Zookeeper trong ngữ cảnh này là giám sát trạng thái của NameNode và tự động chọn một NameNode dự phòng (standby NameNode) để thay thế NameNode chính (active NameNode) khi nó bị lỗi. Do đó, đáp án A là chính xác nhất.

Câu 37:

Nếu địa chỉ IP hoặc tên máy chủ của DataNode thay đổi

Lời giải:

Đáp án đúng: B

Khi địa chỉ IP hoặc tên máy chủ của DataNode thay đổi, NameNode không cần cập nhật ánh xạ giữa tên tệp và tên khối. Thay vào đó, DataNode sẽ thông báo cho NameNode về sự thay đổi này và NameNode sẽ cập nhật thông tin về vị trí của các khối dữ liệu được lưu trữ trên DataNode đó. Điều này cho phép hệ thống tiếp tục hoạt động mà không bị gián đoạn và không làm mất dữ liệu.

Câu 38:

JobTracker chạy trên

Lời giải:

Đáp án đúng: A

JobTracker là một tiến trình quan trọng trong Hadoop 1.x, chịu trách nhiệm quản lý các công việc MapReduce. Nó chạy trên NameNode. NameNode là trung tâm quản lý của hệ thống tệp Hadoop (HDFS), lưu trữ metadata về các tệp và thư mục trong hệ thống. JobTracker làm việc với NameNode để xác định vị trí dữ liệu và lên lịch các tác vụ cho các DataNode.

Câu 39:

Tùy chọn nào sau đây không phải là tùy chọn lập lịch có sẵn trong YARN?

Lời giải:

Đáp án đúng: A

YARN (Yet Another Resource Negotiator) là một hệ thống quản lý tài nguyên cluster. Nó cung cấp các tùy chọn lập lịch khác nhau để quản lý và phân bổ tài nguyên cho các ứng dụng. Ba tùy chọn lập lịch phổ biến trong YARN là: Fair Scheduler (Lập lịch trình công bằng), Capacity Scheduler (Bộ lập lịch dung lượng) và FIFO Scheduler (Máy quét FIFO, thực chất là FIFO Queue).

* Fair Scheduler (Lập lịch trình công bằng): Phân bổ tài nguyên một cách công bằng giữa các ứng dụng đang chạy. Nếu chỉ có một ứng dụng, nó sẽ sử dụng toàn bộ cluster. Khi có các ứng dụng khác được gửi, nó sẽ chia sẻ tài nguyên, sao cho mỗi ứng dụng đều nhận được một phần tài nguyên công bằng.
* Capacity Scheduler (Bộ lập lịch dung lượng): Cho phép nhiều tổ chức chia sẻ một cluster Hadoop trong khi vẫn đảm bảo mỗi tổ chức có thể truy cập một dung lượng nhất định của cluster. Điều này được thực hiện bằng cách thiết lập các hàng đợi (queues) với dung lượng tối thiểu được đảm bảo.
* FIFO Scheduler (Máy quét FIFO): Ứng dụng được thực hiện theo thứ tự đến trước phục vụ trước (First-In-First-Out). Ứng dụng đến trước sẽ được cấp tài nguyên trước.

"Bộ lập lịch cân bằng" (Bộ lập lịch cân bằng) không phải là một tùy chọn lập lịch chính thức hoặc được công nhận trong YARN. Do đó, đây là tùy chọn không có sẵn.

Câu 40:

Nút nào sau đây quản lý các nút khác?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 41:

Có thể ghi là gì?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 42:

Hadoop xử lý khối lượng lớn dữ liệu như thế nào?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 43:

Khi ghi dữ liệu vào HDFS điều gì là đúng nếu hệ số sao chép là ba? (Chọn 2 câu trả lời)

1 - Dữ liệu được ghi vào DataNodes trên ba giá đỡ riêng biệt (nếu Rack Aware).

2 - Dữ liệu được lưu trữ trên mỗi Mã dữ liệu bằng một tệp riêng biệt chứa giá trị tổng kiểm tra.

3 - Dữ liệu được ghi vào các khối trên ba DataNodes khác nhau.

4 - Khách hàng được trả lại thành công khi ghi thành công khối đầu tiên và kiểm tra tổng kiểm tra.

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 44:

Nhiệm vụ nào sau đây là trong số các nhiệm vụ của các DataNode trong HDFS?

E - Quản lý không gian tên hệ thống tệp.

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Hệ thống Apache nào dưới đây giải quyết việc nhập dữ liệu phát trực tuyến vào Hadoop?

100+ câu hỏi trắc nghiệm Dữ liệu lớn giải thích chi tiết từng câu - Phần 1

Câu hỏi liên quan

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu

ĐĂNG KÝ GÓI THI VIP