JavaScript is required

Tính năng định vị dữ liệu trong Hadoop có nghĩa là:

A.

Lưu trữ cùng một dữ liệu trên nhiều nút

B.

Chuyển vị trí dữ liệu từ nút này sang nút khác

C.

Đồng định vị dữ liệu với các nút tính toán

D.

Phân phối dữ liệu trên nhiều nút

Trả lời:

Đáp án đúng: C


Tính năng định vị dữ liệu (Data Locality) trong Hadoop là một yếu tố quan trọng để tối ưu hóa hiệu suất. Nó có nghĩa là Hadoop cố gắng đưa quá trình tính toán đến gần dữ liệu nhất có thể, thay vì di chuyển dữ liệu đến nơi tính toán. Điều này giúp giảm thiểu việc truyền dữ liệu qua mạng, vốn là một hoạt động tốn kém về thời gian và băng thông. Do đó, đáp án đúng là C: Đồng định vị dữ liệu với các nút tính toán. Các đáp án khác không mô tả đúng ý nghĩa của Data Locality: - A. Lưu trữ cùng một dữ liệu trên nhiều nút: Đây là tính năng sao lưu dữ liệu (replication) để đảm bảo tính sẵn sàng và độ tin cậy, không phải là định vị dữ liệu. - B. Chuyển vị trí dữ liệu từ nút này sang nút khác: Đây là điều Hadoop cố gắng tránh bằng cách sử dụng định vị dữ liệu. - D. Phân phối dữ liệu trên nhiều nút: Đây là cách Hadoop lưu trữ dữ liệu, nhưng không giải thích tại sao Hadoop lại phân phối dữ liệu như vậy. Định vị dữ liệu giải thích lý do: để các nút tính toán có thể truy cập dữ liệu cục bộ một cách hiệu quả.

Câu hỏi liên quan