JavaScript is required

Cơ chế tổ chức dữ liệu của Datanode trong HDFS

A.

các chunk là các tệp tin trong hệ thống tệp tin cục bộ của máy chủ datanode

B.

các chunk là các vùng dữ liệu liên tục trên ổ cứng của máy chủ data node

C.

các chunk được lưu trữ tin cậy trên datanode theo cơ chế RAID

Trả lời:

Đáp án đúng: A


Trong HDFS (Hadoop Distributed File System), Datanode là nơi lưu trữ dữ liệu thực tế. Dữ liệu được chia thành các khối (blocks) và mỗi khối có thể được sao chép trên nhiều Datanode để đảm bảo tính sẵn sàng và độ tin cậy. Cách tổ chức dữ liệu của Datanode như sau:

  • Các chunk là các tệp tin trong hệ thống tệp tin cục bộ của máy chủ datanode: Đây là phương án chính xác. Mỗi chunk (block) dữ liệu thực chất được lưu trữ như một tệp tin riêng biệt trên hệ thống tệp tin của máy chủ Datanode. Các tệp tin này chứa dữ liệu của khối đó.
  • Các chunk là các vùng dữ liệu liên tục trên ổ cứng của máy chủ data node: Mặc dù các chunk chiếm không gian lưu trữ trên ổ cứng, nhưng chúng không nhất thiết phải là các vùng dữ liệu liên tục. Mỗi chunk là một tệp tin riêng biệt, nên có thể nằm rải rác trên ổ cứng.
  • Các chunk được lưu trữ tin cậy trên datanode theo cơ chế RAID: HDFS tự đảm bảo tính tin cậy bằng cách sao chép các khối dữ liệu trên nhiều Datanode. Mặc dù RAID (Redundant Array of Independent Disks) có thể được sử dụng ở cấp độ phần cứng của mỗi Datanode để tăng độ tin cậy, nhưng đây không phải là cơ chế tổ chức dữ liệu chính của HDFS. Cơ chế sao chép của HDFS mới là yếu tố then chốt để đảm bảo dữ liệu không bị mất.

Câu hỏi liên quan