Thành phần nào sau đây truy xuất các phân tách đầu vào trực tiếp từ HDFS để xác định số tác vụ bản đồ?
Trả lời:
Đáp án đúng: D
Trong Hadoop MapReduce, JobClient là thành phần giao tiếp với JobTracker để gửi các job (công việc) cần thực hiện. Một phần quan trọng của quá trình này là JobClient phải xác định số lượng map tasks (tác vụ map) cần thiết để xử lý dữ liệu đầu vào. Để làm được điều này, JobClient sẽ truy xuất thông tin về các khối (blocks) dữ liệu đầu vào trực tiếp từ HDFS (Hadoop Distributed File System). Mỗi khối dữ liệu này thường sẽ tương ứng với một map task. Do đó, JobClient có trách nhiệm phân tích đầu vào từ HDFS để xác định số lượng map tasks cần tạo ra.