JavaScript is required

Phát biểu nào sau đây là sai về Bộ nhớ đệm phân tán?

A.

Khung công tác Hadoop sẽ đảm bảo rằng bất kỳ tệp nào trong Bộ đệm phân tán được phân phối cho tất cả các tác vụ bản đồ và giảm bớt.

B.

Các tệp trong bộ đệm có thể là tệp văn bản hoặc chúng có thể là tệp lưu trữ như tệp zip và JAR.

C.

Disk I/O bị tránh vì dữ liệu trong bộ đệm được lưu trong bộ nhớ.

D.

Khung công tác Hadoop sẽ sao chép các tệp trong Bộ đệm ẩn phân tán vào nút phụ trước khi bất kỳ nhiệm vụ nào cho công việc được thực thi trên nút đó.

Trả lời:

Đáp án đúng: C


Bộ nhớ đệm phân tán (Distributed Cache) là một cơ chế trong Hadoop cho phép các tác vụ truy cập nhanh chóng đến các tệp chỉ đọc (read-only) được chia sẻ bởi tất cả các tác vụ trong một công việc (job). Hadoop sẽ sao chép các tệp này đến tất cả các nút (node) nơi các tác vụ được thực thi. Điều này giúp tránh việc đọc đi đọc lại tệp từ HDFS, tăng hiệu suất đáng kể.

Xét các phương án:

  • A: Đúng. Hadoop framework đảm bảo các tệp trong bộ đệm phân tán được phân phối đến tất cả các tác vụ map và reduce.
  • B: Đúng. Các tệp có thể là tệp văn bản, tệp zip hoặc JAR.
  • C: Sai. Disk I/O không hoàn toàn bị tránh. Dữ liệu được sao chép từ HDFS vào ổ đĩa cục bộ của các nút, sau đó các tác vụ sẽ đọc từ ổ đĩa cục bộ này, thay vì đọc trực tiếp từ HDFS. Điều này vẫn cần I/O từ ổ đĩa cục bộ, nhưng nhanh hơn nhiều so với I/O từ HDFS.
  • D: Đúng. Hadoop sẽ sao chép các tệp vào nút phụ trước khi các tác vụ được thực thi.

Vậy, phát biểu sai là C.

Câu hỏi liên quan