Lệnh hdfs để tạo bản sao của tệp từ hệ thống cục bộ là:
Đáp án đúng: D
Lệnh hdfs dfs -copyFromLocal
được sử dụng để sao chép tệp từ hệ thống tệp cục bộ vào hệ thống tệp Hadoop (HDFS). Các biến thể khác như CopyFromLocal
, CopyLocal
, và copyfromlocal
không phải là các lệnh hợp lệ trong HDFS. Do đó, đáp án đúng là copyFromLocal
.
Câu hỏi liên quan
Đáp án đúng là C. Flume.
- Flume: Là một hệ thống phân tán, tin cậy và có sẵn để thu thập, tổng hợp và di chuyển một lượng lớn dữ liệu nhật ký một cách hiệu quả từ nhiều nguồn khác nhau đến kho lưu trữ dữ liệu tập trung như Hadoop HDFS. Flume có thể xử lý dữ liệu phát trực tuyến (streaming data) một cách liên tục.
- Oozie: Là một hệ thống điều phối công việc (workflow scheduler) để quản lý và lên lịch các công việc Hadoop.
- Kafka: Là một nền tảng truyền tải thông điệp phân tán (distributed streaming platform) thường được sử dụng để xây dựng các pipeline dữ liệu thời gian thực (real-time data pipelines) và các ứng dụng phát trực tuyến (streaming applications). Mặc dù Kafka có thể lưu trữ dữ liệu, nhưng nó không trực tiếp nhập dữ liệu vào Hadoop theo cách mà Flume làm.
- Hive: Là một hệ thống kho dữ liệu (data warehouse system) được xây dựng trên Hadoop, cung cấp các chức năng tóm tắt, truy vấn và phân tích dữ liệu.
Phân tích câu hỏi:
Câu hỏi này kiểm tra kiến thức về các công nghệ được sử dụng trong hệ sinh thái Hadoop, đặc biệt là công nghệ tuần tự hóa dữ liệu.
Đánh giá các phương án:
- A. HBase: Là một hệ quản trị cơ sở dữ liệu NoSQL, lưu trữ dữ liệu dạng cột, không phải là công cụ tuần tự hóa dữ liệu.
- B. Avro: Là một framework tuần tự hóa dữ liệu. Nó cung cấp cơ chế để chuyển đổi các đối tượng dữ liệu thành định dạng nhị phân, cho phép lưu trữ và truyền dữ liệu một cách hiệu quả. Avro được sử dụng rộng rãi trong Hadoop để tuần tự hóa dữ liệu, đặc biệt là cho dữ liệu được lưu trữ trong HDFS.
- C. Sqoop: Là một công cụ để truyền dữ liệu giữa Hadoop và các hệ quản trị cơ sở dữ liệu quan hệ (RDBMS), không phải là công cụ tuần tự hóa dữ liệu.
- D. Zookeeper: Là một dịch vụ điều phối tập trung, cung cấp khả năng đồng bộ hóa và quản lý cấu hình cho các ứng dụng phân tán, không phải là công cụ tuần tự hóa dữ liệu.
Kết luận:
Avro là công nghệ phù hợp nhất để tuần tự hóa dữ liệu trong Hadoop.
Câu hỏi yêu cầu tìm phát biểu không đúng về Hadoop.
- A. Đây là một khung phân tán: Đúng. Hadoop là một framework mã nguồn mở được sử dụng để lưu trữ và xử lý các tập dữ liệu lớn một cách phân tán trên các cụm máy tính.
- B. Thuật toán chính được sử dụng trong đó là Map Reduce: Đúng. MapReduce là một mô hình lập trình và một thuật toán quan trọng được Hadoop sử dụng để xử lý song song các tập dữ liệu lớn.
- C. Nó chạy với đồ cứng hàng hóa: Đúng. Hadoop được thiết kế để chạy trên các phần cứng (máy tính) thông thường (commodity hardware), giúp giảm chi phí xây dựng và vận hành hệ thống.
- D. Tất cả đều đúng: Sai, vì cả A, B và C đều đúng, nên D sai.
Do đó, đáp án đúng là D. Tất cả đều đúng, vì câu này khẳng định tất cả các đáp án A, B, C đều đúng, nhưng thực chất câu hỏi yêu cầu tìm câu không đúng.
Trong HDFS (Hadoop Distributed File System), khi một tệp bị xóa khỏi dòng lệnh, nếu tính năng "thùng rác" (Trash) được bật, thì tệp đó sẽ không bị xóa vĩnh viễn ngay lập tức. Thay vào đó, nó sẽ được chuyển vào thư mục thùng rác riêng của người dùng đã thực hiện thao tác xóa. Điều này cho phép người dùng có thể khôi phục lại tệp đã xóa nếu cần thiết, trước khi nó bị xóa hoàn toàn sau một khoảng thời gian cấu hình trước.
Các lựa chọn khác không đúng vì:
- A: Sai. Tệp không bị xóa vĩnh viễn ngay lập tức nếu thùng rác được bật.
- B: Sai. Không có thư mục thùng rác chung cho tất cả người dùng. Mỗi người dùng có thư mục thùng rác riêng.
- C: Sai. Tệp không bị xóa vĩnh viễn và không có việc ghi nhật ký các thuộc tính tệp vào tệp nhật ký trong trường hợp này.

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.