Trong một cụm Hadoop, điều gì đúng với khối HDFS không còn khả dụng do hỏng đĩa hoặc lỗi máy?
Đáp án đúng: B
Trong Hadoop, dữ liệu được lưu trữ trong các khối (blocks) và được sao chép (replicated) trên nhiều DataNode để đảm bảo tính sẵn sàng và độ tin cậy. Khi một khối HDFS trở nên không khả dụng do hỏng đĩa hoặc lỗi máy, hệ thống Hadoop sẽ tự động sao chép khối đó từ các bản sao còn lại sang các DataNode khác. Điều này đảm bảo rằng dữ liệu không bị mất và vẫn có thể truy cập được.
Phương án A không đúng vì dữ liệu không bị mất vĩnh viễn nhờ cơ chế sao chép.
Phương án B đúng vì Hadoop có cơ chế tự động sao chép dữ liệu từ các bản sao khác khi một khối bị hỏng.
Phương án C không đúng vì NameNode sẽ không cho phép các yêu cầu mới tiếp tục cố gắng đọc một khối đã hỏng. Thay vào đó, nó sẽ hướng các yêu cầu đến các bản sao còn hoạt động của khối đó.
Phương án D không đúng vì MapReduce không bỏ qua các khối bị hỏng. Hadoop sẽ đảm bảo rằng dữ liệu được xử lý đến từ các bản sao hoạt động của khối đó.