Đáp án đúng: C
Yếu tố sao chép mặc định (default replication factor) cho hệ thống tệp HDFS (Hadoop Distributed File System) trong Hadoop là 3. Điều này có nghĩa là mỗi khối dữ liệu trong HDFS sẽ được sao chép thành 3 bản sao và lưu trữ trên các DataNode khác nhau trong cluster. Việc sao chép này giúp đảm bảo tính sẵn sàng và độ tin cậy của dữ liệu, vì nếu một DataNode bị lỗi, dữ liệu vẫn có thể được truy cập từ các bản sao khác.
Câu hỏi liên quan
Trong HDFS (Hadoop Distributed File System), thư mục không lưu trữ dữ liệu theo cách giống như tệp. Thư mục đóng vai trò là cấu trúc tổ chức để quản lý các tệp. Do đó, hệ số sao chép (Replication Factor - RF) là một thuộc tính áp dụng cho các tệp, chứ không phải thư mục. Vì thư mục không chứa dữ liệu thực tế, khái niệm RF không áp dụng cho chúng.
HDFS (Hadoop Distributed File System) là một hệ thống tệp phân tán được thiết kế để lưu trữ và xử lý lượng lớn dữ liệu trên các cụm máy tính. Một trong những cách để truy cập dữ liệu trong HDFS từ các máy khách là thông qua NFS (Network File System). HDFS có thể được gắn vào hệ thống tệp của máy khách cục bộ bằng NFS, cho phép người dùng tương tác với các tệp HDFS như thể chúng là các tệp cục bộ.
Tuy nhiên, cần lưu ý một số hạn chế khi sử dụng NFS để truy cập HDFS:
- Tính bất biến của tệp HDFS: Các tệp HDFS thường được coi là bất biến, nghĩa là sau khi đã được tạo và ghi xong, chúng không thể được sửa đổi. Do đó, bạn không thể chỉnh sửa các bản ghi hiện có trong một tệp HDFS đã được gắn kết bằng NFS.
- Chỉ ghi nối (append): Mặc dù không thể chỉnh sửa các bản ghi hiện có, HDFS cho phép ghi nối vào cuối tệp. Tuy nhiên, khả năng này có thể không được hỗ trợ đầy đủ hoặc nhất quán khi truy cập thông qua NFS, tùy thuộc vào cấu hình và phiên bản của các thành phần liên quan.
Dựa trên những điều này, ta có thể phân tích các phương án:
- A. Hệ thống tệp HDFS có thể được gắn trên Hệ thống tệp của máy khách cục bộ bằng NFS: Đây là phát biểu đúng.
- B. Hệ thống tệp HDFS không bao giờ có thể được gắn vào Hệ thống tệp của máy khách cục bộ: Đây là phát biểu sai.
- C. Bạn có thể chỉnh sửa bản ghi hiện có trong tệp HDFS đã được gắn kết bằng NFS: Đây là phát biểu sai, vì các tệp HDFS thường là bất biến.
- D. Bạn không thể thêm vào tệp HDFS được gắn bằng NFS: Đây là phát biểu sai, vì HDFS cho phép ghi nối, mặc dù có thể có các hạn chế khi sử dụng NFS.
1. Khoảng cách: Các nút trên các giá đỡ khác nhau cách xa nhau hơn so với các nút trên cùng một giá đỡ. Do đó, dữ liệu phải đi qua nhiều thiết bị mạng hơn, làm tăng độ trễ và yêu cầu băng thông cao hơn để duy trì tốc độ truyền dữ liệu.
2. Kiến trúc mạng: Trong một trung tâm dữ liệu, lưu lượng truy cập giữa các giá đỡ thường phải đi qua các switch lõi (core switches) hoặc các thiết bị định tuyến khác, vốn có thể trở thành nút thắt cổ chai nếu không có đủ băng thông. Các nút trên cùng một giá đỡ thường kết nối trực tiếp với nhau thông qua một switch duy nhất, giảm thiểu nhu cầu về băng thông.
3. So sánh với các lựa chọn khác:
- A. Các nút khác nhau trên cùng một giá đỡ: Khoảng cách ngắn hơn, kết nối trực tiếp hơn.
- C. Các nút trong các trung tâm dữ liệu khác nhau: Mặc dù khoảng cách xa nhất, việc truyền dữ liệu giữa các trung tâm dữ liệu thường được tối ưu hóa cho độ trễ thấp hơn là băng thông cực cao, và các ứng dụng thường được thiết kế để chịu được độ trễ cao hơn trong trường hợp này. Ngoài ra, chi phí cho băng thông liên kết các trung tâm dữ liệu thường rất cao.
- D. Dữ liệu trên cùng một nút: Không yêu cầu truyền dữ liệu qua mạng, do đó không cần băng thông cao.
* A. Dừng công việc sao chép trong toàn bộ hệ thống tệp hdfs: Việc dừng toàn bộ công việc sao chép là không cần thiết và có thể ảnh hưởng đến tính sẵn sàng của dữ liệu.
* B. Nó làm chậm quá trình nhân bản cho các khối đó: Việc làm chậm quá trình nhân bản không giải quyết vấn đề sao chép quá mức.
* D. Nó để lại các khối thừa như nó vốn có: Việc giữ lại các khối thừa sẽ lãng phí không gian lưu trữ.
Tệp mapred-site.xml
được sử dụng để cấu hình các thuộc tính liên quan đến MapReduce. Trong đó:
- C. Máy chủ và cổng nơi tác vụ MapReduce chạy: Đây là đáp án đúng. Các thuộc tính cấu hình địa chỉ và cổng của JobTracker (trong Hadoop 1.x) hoặc ResourceManager (trong Hadoop 2.x) được đặt trong tệp này.
- A. Yếu tố nhân rộng: Yếu tố nhân rộng (replication factor) thường được cấu hình trong
hdfs-site.xml
, tệp cấu hình cho HDFS. - B. Tên thư mục để lưu trữ tệp hdfs: Tên thư mục lưu trữ tệp HDFS cũng được cấu hình trong
hdfs-site.xml
. - D. Các biến môi trường Java: Các biến môi trường Java thường được cấu hình thông qua biến môi trường hệ thống hoặc trong các script khởi động Hadoop, chứ không phải trong
mapred-site.xml
.

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.