Thành phần nào sau đây truy xuất các phân tách đầu vào trực tiếp từ HDFS để xác định số tác vụ bản đồ?
Trả lời:
Đáp án đúng: D
Giải thích:
Thành phần truy xuất các phân tách đầu vào trực tiếp từ HDFS (Hadoop Distributed File System) để xác định số lượng tác vụ map là JobClient. JobClient có trách nhiệm gửi job tới JobTracker và tính toán các InputSplits. Dựa trên số lượng InputSplits, JobClient sẽ xác định số lượng map tasks cần thiết để xử lý dữ liệu.
Các lựa chọn khác không đúng vì:
- Mã Tên (NameNode): Quản lý không gian tên của hệ thống tệp và điều phối quyền truy cập tệp.
- TaskTrackers: Thực thi các tác vụ riêng lẻ được giao bởi JobTracker.
- JobTracker: Điều phối tất cả các jobs được chạy trên hệ thống Hadoop.