Lệnh được sử dụng để sao chép một thư mục từ node này sang node khác trong HDFS là:
Đáp án đúng: D
Lệnh distcp
(distributed copy) được sử dụng trong Hadoop để sao chép dữ liệu giữa các cụm Hadoop khác nhau, hoặc trong cùng một cụm. Nó có khả năng sao chép dữ liệu song song, phân tán trên nhiều node, làm cho quá trình sao chép nhanh chóng và hiệu quả, đặc biệt khi làm việc với lượng dữ liệu lớn.
Câu hỏi liên quan
Trong Hadoop, tệp lưu trữ (archive file) được tạo ra bằng công cụ Hadoop Archive
, có phần mở rộng là .har
. Tệp HAR giúp giảm số lượng file trong HDFS (Hadoop Distributed File System), từ đó cải thiện hiệu suất của hệ thống.
* Đáp án A: Sai. Dữ liệu từ một cụm Hadoop hoàn toàn có thể được đọc bởi một cụm Hadoop khác.
* Đáp án B: Đúng. Dữ liệu trong Hadoop có thể được truy cập thông qua giao thức HTTP. Hadoop cung cấp các giao diện RESTful và các dịch vụ HTTP cho phép truy cập dữ liệu.
* Đáp án C: Sai. "hhtp" không phải là một giao thức chuẩn hoặc được sử dụng trong Hadoop.
* Đáp án D: Sai. "hftp" không phải là một giao thức chuẩn hoặc được sử dụng trong Hadoop để truy cập dữ liệu. HFTP (Hadoop File Transfer Protocol) đã từng tồn tại, nhưng nó đã bị loại bỏ và thay thế bằng các phương pháp khác như HTTP hoặc các API trực tiếp.
Vậy đáp án đúng là B.
Nếu kích thước tệp tăng lên mà số lượng tệp không đổi, thì số lượng block mà NameNode cần quản lý sẽ tăng lên. Mỗi block sẽ cần thêm metadata (ví dụ: vị trí của block trên các DataNode). Do đó, bộ nhớ mà NameNode yêu cầu sẽ tăng lên để lưu trữ thông tin metadata bổ sung này.
Các phương án khác không đúng vì:
* B. Giảm: Việc tăng kích thước tệp chắc chắn sẽ không làm giảm bộ nhớ NameNode yêu cầu.
* C. Vẫn không thay đổi: Bộ nhớ NameNode cần thay đổi để theo dõi kích thước block tăng thêm.
* D. Có thể tăng hoặc giảm: Việc tăng kích thước tệp sẽ luôn làm tăng bộ nhớ NameNode cần (trong trường hợp số lượng tệp không đổi).
Trong Hadoop, dữ liệu được lưu trữ trong các khối (blocks) và được sao chép (replicated) trên nhiều DataNode để đảm bảo tính sẵn sàng và độ tin cậy. Khi một khối HDFS trở nên không khả dụng do hỏng đĩa hoặc lỗi máy, nó không bị mất vĩnh viễn. Thay vào đó, hệ thống sẽ tự động sao chép khối đó từ các bản sao khác (nếu có) sang một DataNode khác còn hoạt động. NameNode đóng vai trò quản lý metadata và biết về vị trí của tất cả các khối dữ liệu. Khi một khối bị hỏng, NameNode sẽ kích hoạt quá trình sao chép để duy trì số lượng bản sao mong muốn.
Phương án A không đúng vì dữ liệu không bị mất vĩnh viễn, nó được sao chép.
Phương án B đúng vì hệ thống sẽ sao chép khối bị hỏng sang các máy khác để đảm bảo tính dự phòng.
Phương án C không đúng vì NameNode sẽ không cho phép client tiếp tục cố gắng đọc khối đã hỏng; nó sẽ chuyển hướng client đến một bản sao khác.
Phương án D không đúng vì MapReduce không bỏ qua khối bị hỏng. Nếu một khối bị lỗi trong quá trình xử lý MapReduce, tác vụ sẽ thất bại và có thể được thử lại trên một bản sao khác của khối đó.
Câu hỏi yêu cầu tìm lệnh Hadoop để liệt kê các khối tạo nên mỗi tệp trong hệ thống tệp HDFS. Lệnh hdfs fsck
là công cụ dòng lệnh được sử dụng để kiểm tra tính toàn vẹn của hệ thống tệp HDFS và cung cấp thông tin chi tiết về các tệp và khối. Các tùy chọn -files
và -blocks
được sử dụng để chỉ định rằng chúng ta muốn thông tin về các tệp và các khối tương ứng của chúng.
Phương án A: hdfs fsck / -files -blocks
- Đây là đáp án đúng. Lệnh này sẽ kiểm tra toàn bộ hệ thống tệp (bắt đầu từ thư mục gốc '/') và liệt kê thông tin về các tệp và các khối tạo nên chúng.
Phương án B: hdfs fsck / -blocks -files
- Mặc dù các tùy chọn được đảo ngược, nhưng lệnh này vẫn hoạt động tương tự như phương án A. Tuy nhiên, theo quy ước và tài liệu chính thức, thứ tự thường là -files -blocks
. Mặc dù không sai hoàn toàn, phương án A được ưu tiên hơn.
Phương án C: hdfs fchk / -blocks -files
- Lệnh hdfs fchk
không phải là một lệnh HDFS hợp lệ. Lệnh đúng là hdfs fsck
.
Phương án D: hdfs fchk / -files -block
- Tương tự như phương án C, hdfs fchk
không phải là một lệnh HDFS hợp lệ. Hơn nữa, tùy chọn -block
(số ít) không chính xác; phải là -blocks
(số nhiều).

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.