Trả lời:
Đáp án đúng: C
Khung Hadoop được viết bằng Java. Java là ngôn ngữ chính được sử dụng để phát triển Hadoop vì tính di động, khả năng mở rộng và hỗ trợ thư viện rộng lớn của nó.
Câu hỏi liên quan
Lời giải:
Đáp án đúng: B
Câu hỏi này kiểm tra kiến thức về các lệnh cơ bản của HDFS (Hadoop Distributed File System). HDFS là một hệ thống tệp phân tán được thiết kế để lưu trữ lượng lớn dữ liệu. Các lệnh HDFS được sử dụng để thao tác với các tệp và thư mục trong hệ thống tệp HDFS.
Phương án A chỉ đề cập đến việc sao chép tệp, thiếu khả năng sao chép thư mục.
Phương án B chính xác vì lệnh HDFS có thể được sử dụng để sao chép cả tệp và thư mục từ hệ thống tệp cục bộ lên HDFS. Ví dụ, lệnh `hadoop fs -copyFromLocal` hoặc `hadoop fs -put` có thể được sử dụng cho mục đích này.
Phương án C và D liên quan đến việc sao chép từ HDFS về hệ thống tệp cục bộ, không phải từ hệ thống tệp cục bộ lên HDFS như câu hỏi đang hỏi.
Phương án A chỉ đề cập đến việc sao chép tệp, thiếu khả năng sao chép thư mục.
Phương án B chính xác vì lệnh HDFS có thể được sử dụng để sao chép cả tệp và thư mục từ hệ thống tệp cục bộ lên HDFS. Ví dụ, lệnh `hadoop fs -copyFromLocal` hoặc `hadoop fs -put` có thể được sử dụng cho mục đích này.
Phương án C và D liên quan đến việc sao chép từ HDFS về hệ thống tệp cục bộ, không phải từ hệ thống tệp cục bộ lên HDFS như câu hỏi đang hỏi.
Lời giải:
Đáp án đúng: C
NameNode trong Hadoop chịu trách nhiệm quản lý hệ thống tệp HDFS. Khi NameNode phát hiện ra rằng một số khối (block) đang được sao chép (replicated) quá mức, nó sẽ thực hiện hành động để đảm bảo tính nhất quán và hiệu quả của hệ thống. Trong trường hợp này, NameNode sẽ xóa các khối thừa (extra blocks). Việc này giúp tiết kiệm không gian lưu trữ và tránh lãng phí tài nguyên.
Lời giải:
Đáp án đúng: D
hadoop-env.sh là một tập tin cấu hình quan trọng trong Hadoop. Nó được sử dụng để thiết lập các biến môi trường cần thiết cho Hadoop hoạt động, đặc biệt là các biến liên quan đến Java. Các biến này bao gồm đường dẫn đến thư mục cài đặt Java (JAVA_HOME), các tùy chọn JVM (ví dụ: kích thước heap), và các cấu hình khác liên quan đến Java. Các lựa chọn A, B, và C không phải là các thuộc tính thường được cấu hình trong hadoop-env.sh.
Lời giải:
Đáp án đúng: A
NameNode đóng vai trò quan trọng trong Hadoop, chịu trách nhiệm quản lý metadata của hệ thống tệp tin. Vì vậy, phần cứng cho NameNode cần đáng tin cậy và có khả năng xử lý cao hơn so với các DataNode. Lựa chọn phần cứng 'cao cấp hơn loại hàng hóa' (higher than commodity) đảm bảo hiệu năng và độ ổn định cần thiết cho NameNode. DataNode có thể sử dụng phần cứng commodity do chúng chủ yếu lưu trữ và truy xuất dữ liệu, trong khi NameNode cần quản lý metadata một cách hiệu quả.
Lời giải:
Đáp án đúng: C
Giải thích:
Câu hỏi này kiểm tra kiến thức về các thành phần khác nhau trong hệ sinh thái Hadoop, đặc biệt là các công cụ được sử dụng để xử lý dữ liệu phát trực tuyến.
- Oozie: Là một hệ thống điều phối công việc (workflow scheduler) cho Hadoop. Nó được sử dụng để quản lý và chạy các công việc (jobs) Hadoop phức tạp, không phải để thu thập dữ liệu phát trực tuyến.
- Kafka: Là một nền tảng phát trực tuyến phân tán. Nó được thiết kế để xử lý các luồng dữ liệu lớn trong thời gian thực, nhưng không trực tiếp nhập dữ liệu vào Hadoop. Kafka thường được sử dụng như một nguồn dữ liệu cho các hệ thống xử lý dữ liệu khác, bao gồm cả Hadoop.
- Flume: Là một dịch vụ phân tán, tin cậy và có sẵn để thu thập, tổng hợp và di chuyển lượng lớn dữ liệu nhật ký (log data) từ nhiều nguồn khác nhau đến một kho lưu trữ dữ liệu tập trung, như Hadoop Distributed File System (HDFS). Do đó, Flume được thiết kế để nhập dữ liệu phát trực tuyến vào Hadoop.
- Hive: Là một hệ thống kho dữ liệu (data warehouse) được xây dựng trên Hadoop, cung cấp một giao diện giống SQL để truy vấn và phân tích dữ liệu được lưu trữ trong Hadoop. Nó không được sử dụng để nhập dữ liệu phát trực tuyến.
Đáp án đúng: C. Flume
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy
89 tài liệu310 lượt tải

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin
125 tài liệu441 lượt tải

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông
104 tài liệu687 lượt tải

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán
103 tài liệu589 lượt tải

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp
377 tài liệu1030 lượt tải

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
99 tài liệu1062 lượt tải
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.
77.000 đ/ tháng