Dữ liệu từ một cụm hadoop từ xa có thể:

không được đọc bởi một cụm hadoop khác

được đọc bằng http

được đọc bằng hhtp

được đọc suing hftp

Trả lời:

Đáp án đúng: D

Trong môi trường Hadoop, dữ liệu từ một cụm Hadoop từ xa có thể được truy cập và đọc bởi các cụm Hadoop khác thông qua giao thức HTTP. Giao thức này cho phép truyền dữ liệu giữa các hệ thống phân tán một cách hiệu quả. Các giao thức 'hhtp' và 'hftp' không phải là các giao thức chuẩn hoặc được sử dụng rộng rãi trong Hadoop.

300+ câu hỏi trắc nghiệm Big Data đầy đủ đáp án và lời giải - Phần 3

50 câu hỏi 60 phút

Bắt đầu thi

Câu hỏi liên quan

Câu 10:

Đối với thư mục HDFS, hệ số sao chép (RF) là:

Lời giải:

Đáp án đúng: D

Trong HDFS (Hadoop Distributed File System), thư mục (directory) không thực sự lưu trữ dữ liệu theo cách mà các tệp (file) lưu trữ. Do đó, khái niệm "hệ số sao chép" (replication factor) không áp dụng trực tiếp cho thư mục. Hệ số sao chép là thuộc tính của các tệp, quy định số lượng bản sao của mỗi khối dữ liệu được lưu trữ trên các DataNode khác nhau để đảm bảo tính sẵn sàng và độ tin cậy của dữ liệu.

Vì thư mục chỉ chứa thông tin metadata về cấu trúc thư mục và các tệp chứa trong đó, nên việc sao chép thư mục (về mặt metadata) được quản lý bởi NameNode, và cơ chế này khác với hệ số sao chép của các tệp. Do đó, đáp án chính xác nhất là "Không áp dụng".

Câu 11:

Hadoop sử dụng những cơ chế nào để làm cho namenode có khả năng chống lại sự cố:

Lời giải:

Đáp án đúng: A

Đáp án đúng là A. Hadoop sử dụng hai cơ chế chính để đảm bảo khả năng chịu lỗi của NameNode:

1. Sao lưu siêu dữ liệu hệ thống tệp vào đĩa cục bộ: NameNode lưu trữ siêu dữ liệu (metadata) của hệ thống tệp HDFS (ví dụ: cấu trúc thư mục, thông tin về các khối dữ liệu) vào một tệp gọi là "fsimage" và các tệp nhật ký giao dịch (edit logs). Các tệp này được lưu trữ trên đĩa cục bộ của NameNode. Việc sao lưu định kỳ fsimage và các edit logs đảm bảo rằng nếu NameNode bị lỗi, siêu dữ liệu có thể được khôi phục từ bản sao lưu.

2. Gắn kết NFS từ xa: Ngoài việc lưu trữ siêu dữ liệu trên đĩa cục bộ, Hadoop cũng hỗ trợ sao lưu siêu dữ liệu vào một hệ thống tệp NFS (Network File System) từ xa. Điều này cung cấp một lớp bảo vệ bổ sung. Nếu đĩa cục bộ của NameNode bị hỏng, siêu dữ liệu có thể được khôi phục từ bản sao lưu NFS. Trong trường hợp NameNode chính bị lỗi, NameNode dự phòng (standby namenode) có thể nhanh chóng tiếp quản vai trò của NameNode chính, sử dụng dữ liệu từ NFS để tiếp tục hoạt động.

Các phương án khác không đúng vì:

* B. Lưu trữ siêu dữ liệu hệ thống tệp trên đám mây: Hadoop không trực tiếp sử dụng đám mây để lưu trữ siêu dữ liệu theo mặc định. Mặc dù có thể tích hợp Hadoop với các dịch vụ lưu trữ đám mây, nhưng đây không phải là cơ chế chính để đảm bảo khả năng chịu lỗi của NameNode.
* C. Sử dụng máy có ít nhất 12 CPU: Số lượng CPU không liên quan trực tiếp đến khả năng chịu lỗi của NameNode.
* D. Sử dụng phần cứng đắt tiền và đáng tin cậy: Mặc dù việc sử dụng phần cứng tốt có thể giảm thiểu nguy cơ hỏng hóc, nhưng Hadoop được thiết kế để chịu lỗi ngay cả khi phần cứng không đáng tin cậy. Việc sao lưu siêu dữ liệu là yếu tố quan trọng hơn.

Câu 12:

HDFS giải quyết bài toán single-point-of-failure cho Namenode bằng cách nào:

Lời giải:

Đáp án đúng: C

The question tests knowledge of how HDFS (Hadoop Distributed File System) addresses the single point of failure for the NameNode. The NameNode is the most important component in HDFS, responsible for managing the metadata of the file system. If the NameNode fails, the entire HDFS system becomes inaccessible. Therefore, ensuring high availability for the NameNode is crucial. The Secondary NameNode periodically backs up the metadata from the NameNode, mitigating data loss but not providing automatic failover. Modern solutions like NameNode HA use active-passive failover.

Câu 13:

HDFS là viết tắt của:

Lời giải:

Đáp án đúng: D

HDFS là viết tắt của Hadoop Distributed File System, có nghĩa là Hệ thống tệp phân tán Hadoop. Đây là một hệ thống tệp được thiết kế để lưu trữ và xử lý các bộ dữ liệu lớn trên các cụm máy tính commodity. Do đó, đáp án D là đáp án chính xác.

Câu 14:

Hệ số sao chép của tệp trong HDFS có thể được thay đổi bằng cách sử dụng:

Lời giải:

Đáp án đúng: C

Trong Hadoop HDFS, lệnh setrep được sử dụng để thay đổi hệ số sao chép (replication factor) của một tệp. Các lệnh khác như changerep, rerep, và xrep không phải là các lệnh HDFS hợp lệ để thực hiện chức năng này.

Câu 15:

Job tracker runs on:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 16:

Khái niệm sử dụng nhiều máy để xử lý dữ liệu được lưu trữ trong hệ thống phân tán không phải là mới. "Máy tính hiệu suất cao (HPC) sử dụng nhiều máy tính để xử lý khối lượng lớn dữ liệu được lưu trữ trong mạng vùng lưu trữ (SAN). So với HPC, Hadoop":

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 17:

Khi lưu trữ tệp Hadoop, phát biểu nào sau đây là đúng? (Chọn hai câu trả lời)

Các tệp đã lưu trữ sẽ hiển thị với phần mở rộng .arc

Nhiều tệp nhỏ sẽ trở thành ít tệp lớn hơn

MapReduce xử lý tên tệp gốc ngay cả sau khi tệp được lưu trữ

Các tệp đã lưu trữ phải được lưu trữ tại Liên hợp quốc cho HDFS và MapReduce để truy cập vào các tệp nhỏ, gốc

Lưu trữ dành cho các tệp cần được lưu nhưng HDFS không còn truy cập được nữa

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 18:

Khi một node dự phòng được sử dụng trong một cụm thì không cần:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 19:

Khi một ứng dụng khách liên hệ với NameNode để truy cập tệp, NameNode phản hồi với:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Đồ Án Tốt Nghiệp Trí Tuệ Nhân Tạo Và Học Máy

ĐĂNG KÝ GÓI THI VIP

Truy cập hơn 100K đề thi thử và chính thức các năm
2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
Tải toàn bộ tài liệu trên TaiLieu.VN
Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.

Dữ liệu từ một cụm hadoop từ xa có thể:

300+ câu hỏi trắc nghiệm Big Data đầy đủ đáp án và lời giải - Phần 3

Câu hỏi liên quan

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu

ĐĂNG KÝ GÓI THI VIP