JavaScript is required

Khi ghi dữ liệu vào HDFS điều gì là đúng nếu hệ số sao chép là ba? (Chọn 2 câu trả lời)

1 - Dữ liệu được ghi vào DataNodes trên ba giá đỡ riêng biệt (nếu Rack Aware).

2 - Dữ liệu được lưu trữ trên mỗi Mã dữ liệu bằng một tệp riêng biệt chứa giá trị tổng kiểm tra.

3 - Dữ liệu được ghi vào các khối trên ba DataNodes khác nhau.

4 - Khách hàng được trả lại thành công khi ghi thành công khối đầu tiên và kiểm tra tổng kiểm tra.

A.

A. 1 & 3

B.

B. 2 & 3

C.

C. 3 & 4

D.

D. 1 & 4

Trả lời:

Đáp án đúng: C


Câu hỏi này kiểm tra kiến thức về cách HDFS hoạt động với hệ số sao chép. * **Ý 1:** Đúng. Khi Rack Aware được kích hoạt (và thường là như vậy trong các cụm HDFS lớn), HDFS cố gắng đặt các bản sao dữ liệu trên các giá đỡ (rack) khác nhau để tăng khả năng chịu lỗi. Với hệ số sao chép là 3, HDFS sẽ cố gắng ghi dữ liệu lên 3 DataNode trên 3 rack khác nhau. * **Ý 2:** Sai. Mặc dù dữ liệu được lưu trữ trên mỗi DataNode, nhưng việc lưu trữ bao gồm cả dữ liệu và thông tin kiểm tra tính toàn vẹn (checksum), tuy nhiên, không nhất thiết phải là các tệp riêng biệt. Checksum có thể được lưu trữ cùng với dữ liệu trong cùng một tệp hoặc trong các tệp metadata liên quan. * **Ý 3:** Đúng. Hệ số sao chép 3 có nghĩa là dữ liệu được sao chép thành 3 bản và lưu trữ trên 3 DataNode khác nhau. * **Ý 4:** Sai. Client chỉ nhận được thông báo thành công khi tất cả các bản sao (trong trường hợp này là 3 bản) đã được ghi thành công và checksum đã được xác minh. Việc trả về thành công sau khi chỉ ghi khối đầu tiên sẽ dẫn đến mất dữ liệu nếu các bản sao khác không thành công. Vậy, các đáp án đúng là 1 & 3.

Câu hỏi liên quan