JavaScript is required
Danh sách đề

100+ câu hỏi trắc nghiệm Dữ liệu lớn giải thích chi tiết từng câu - Phần 1

50 câu hỏi 60 phút

Thẻ ghi nhớ
Luyện tập
Thi thử
Nhấn để lật thẻ
1 / 50

Trong NameNode, lượng bộ nhớ cần thiết là

A.

Tương tự như của node chính

B.

Phải có ít nhất một nửa node chính

C.

Phải gấp đôi node chính

D.

Chỉ phụ thuộc vào số lượng node dữ liệu mà nó sẽ xử lý

Đáp án

Trong Hadoop, NameNode lưu trữ metadata về hệ thống tệp tin, bao gồm thông tin về các khối dữ liệu, vị trí của chúng, và cấu trúc thư mục. Lượng bộ nhớ NameNode cần thiết phụ thuộc chủ yếu vào số lượng tệp và khối dữ liệu trong hệ thống, chứ không phải trực tiếp vào số lượng DataNode. Do đó, đáp án D (Chỉ phụ thuộc vào số lượng node dữ liệu mà nó sẽ xử lý) là phù hợp nhất, mặc dù cách diễn đạt có thể gây nhầm lẫn. Lượng RAM NameNode yêu cầu phụ thuộc vào metadata mà nó phải lưu trữ, và metadata này tỉ lệ thuận với số lượng tệp/khối dữ liệu chứ không phải số lượng DataNode.

Danh sách câu hỏi:

Câu 1:

Trong NameNode, lượng bộ nhớ cần thiết là

Lời giải:
Đáp án đúng: A

Trong Hadoop, NameNode lưu trữ metadata về hệ thống tệp tin, bao gồm thông tin về các khối dữ liệu, vị trí của chúng, và cấu trúc thư mục. Lượng bộ nhớ NameNode cần thiết phụ thuộc chủ yếu vào số lượng tệp và khối dữ liệu trong hệ thống, chứ không phải trực tiếp vào số lượng DataNode. Do đó, đáp án D (Chỉ phụ thuộc vào số lượng node dữ liệu mà nó sẽ xử lý) là phù hợp nhất, mặc dù cách diễn đạt có thể gây nhầm lẫn. Lượng RAM NameNode yêu cầu phụ thuộc vào metadata mà nó phải lưu trữ, và metadata này tỉ lệ thuận với số lượng tệp/khối dữ liệu chứ không phải số lượng DataNode.

Câu 2:

Khi một node dự phòng được sử dụng trong một cụm thì không cần

Lời giải:
Đáp án đúng: C
Khi một node dự phòng được sử dụng trong một cụm, nó sẽ tiếp quản vai trò của node chính nếu node chính bị lỗi. Việc sử dụng node dự phòng không loại bỏ sự cần thiết của việc nhận thức về giá đỡ (Rack awareness). Rack awareness là một tính năng quan trọng để đảm bảo tính sẵn sàng cao và khả năng chịu lỗi trong một cụm bằng cách phân phối dữ liệu và các bản sao trên các giá đỡ khác nhau. Điều này giúp giảm thiểu rủi ro mất dữ liệu nếu toàn bộ một giá đỡ bị lỗi. Các node kiểm tra, node tên phụ và DataNode phụ vẫn cần thiết cho các chức năng cụ thể của chúng, do đó rack awareness là thành phần không thể thiếu để đảm bảo khả năng phục hồi tối đa.

Câu 3:

Nhận thức về giá trong NameNode có nghĩa là (Rack awareness in name node means)

Lời giải:
Đáp án đúng: A

Nhận thức về giá (Rack awareness) trong NameNode là khả năng của NameNode để biết nút dữ liệu (DataNode) nào thuộc về giá đỡ (rack) nào. Điều này cho phép NameNode đưa ra các quyết định thông minh về việc đặt bản sao dữ liệu, đảm bảo tính sẵn sàng và độ tin cậy của dữ liệu bằng cách phân tán chúng trên các giá đỡ khác nhau. Do đó, phương án B là chính xác nhất vì nó đề cập trực tiếp đến việc NameNode nhận thức được ánh xạ giữa nút và giá đỡ.

Câu 4:

Khi một máy được khai báo là datanode, dung lượng ổ đĩa trong đó (When a machine is declared as a datanode, the disk space in it)

Lời giải:
Đáp án đúng: B
Khi một máy được khai báo là Datanode trong Hadoop, nó chịu trách nhiệm lưu trữ các khối dữ liệu tạo nên các tệp trong HDFS (Hadoop Distributed File System). Dung lượng ổ đĩa trên Datanode đó có thể được sử dụng cho cả việc lưu trữ dữ liệu HDFS và các mục đích khác không liên quan đến HDFS. Ví dụ, bạn có thể cài đặt phần mềm khác hoặc lưu trữ các tệp nhật ký trên cùng một ổ đĩa. Tuy nhiên, cần lưu ý rằng việc quản lý dung lượng ổ đĩa hiệu quả là rất quan trọng để đảm bảo Datanode hoạt động tốt và không bị hết dung lượng. Do đó, phương án B là chính xác nhất.

Câu 5:

Mục đích của nút checkpoint trong cụm Hadoop là (The purpose of checkpoint node in a Hadoop cluster is to)

Lời giải:
Đáp án đúng: B
Nút Checkpoint (Checkpoint Node) trong Hadoop có nhiệm vụ chính là định kỳ hợp nhất tệp hình ảnh (fsimage) và các chỉnh sửa nhật ký (edit logs) từ NameNode. Sau khi hợp nhất, nó tạo ra một hình ảnh mới và tải nó trở lại NameNode đang hoạt động. Quá trình này giúp giảm thời gian khởi động lại của NameNode vì nó không cần phải xử lý một lượng lớn các chỉnh sửa nhật ký khi khởi động.

Câu 6:

Khi một tệp trong HDFS bị người dùng xóa (When a file in HDFS is deleted by a user)

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 7:

Nguồn của kiến trúc HDFS trong Hadoop có nguồn gốc là (The source of HDFS architecture in Hadoop originated as)

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 8:

Lệnh "hadoop fs -test -z URI" cho kết quả 0 nếu

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 9:

hadoop fs –expunge

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 12:

Số lượng nhiệm vụ mà trình theo dõi tác vụ có thể chấp nhận phụ thuộc vào

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 13:

Khái niệm sử dụng nhiều máy để xử lý dữ liệu được lưu trữ trong hệ thống phân tán không phải là mới. Máy tính hiệu suất cao (HPC) sử dụng nhiều máy tính để xử lý khối lượng lớn dữ liệu được lưu trữ trong mạng vùng lưu trữ (SAN). So với HPC, Hadoop:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 14:

Tính năng định vị dữ liệu trong Hadoop có nghĩa là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 15:

Các tệp HDFS được thiết kế cho:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 16:

DataNode và NameNode là tương ứng:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 17:

Trong đĩa cục bộ của NameNode, các tệp được lưu trữ liên tục là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 18:

Hadoop sử dụng những cơ chế nào để làm cho NameNode có khả năng chống lại sự cố?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 19:

Trong Hadoop 2.x, liên kết HDFS phát hành có nghĩa là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 20:

Là một phần của tính khả dụng cao HDFS, một cặp NameNode chính được cấu hình. Điều gì là đúng với họ?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 21:

Zookeeper đảm bảo rằng:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 22:

Theo Tính khả dụng cao của Hadoop, nghĩa là Hàng rào:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 23:

Cơ chế nào sau đây không phải là cơ chế hàng rào cho NameNode đã hoạt động trước đó?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 24:

Đối với thư mục HDFS, hệ số sao chép (RF) là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 25:

HDFS có thể được truy cập qua HTTP bằng cách sử dụng:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 26:

Điều gì là đúng về HDFS?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 27:

Kịch bản nào yêu cầu băng thông cao nhất để truyền dữ liệu giữa các nút trong Hadoop?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 28:

Tùy chọn nào trong số này không phải là tùy chọn lập lịch có sẵn với YARN?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 30:

Lệnh HDFS được sử dụng để

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 31:

Khi NameNode nhận thấy rằng một số khối được sao chép quá mức, nó

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 32:

Thuộc tính nào dưới đây được định cấu hình trên hadoop-env.sh?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 33:

Bản chất của phần cứng cho NameNode phải là

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 35:

Đầu ra của một nhiệm vụ ánh xạ là

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 36:

Zookeeper

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 37:

Nếu địa chỉ IP hoặc tên máy chủ của DataNode thay đổi

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 38:

JobTracker chạy trên

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 39:

Tùy chọn nào sau đây không phải là tùy chọn lập lịch có sẵn trong YARN?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 40:

Nút nào sau đây quản lý các nút khác?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 41:

Có thể ghi là gì?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 42:

Hadoop xử lý khối lượng lớn dữ liệu như thế nào?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 44:

Nhiệm vụ nào sau đây là trong số các nhiệm vụ của các DataNode trong HDFS?

E - Quản lý không gian tên hệ thống tệp.

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 46:

Câu nào sau đây là đúng đối với các cặp <key, value> của một công việc MapReduce?</key,>

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 47:

Thành phần nào sau đây không phải là thành phần chính của HBase?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 48:

Điều nào sau đây là sai về RawComparator?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 49:

Con quỷ (daemon) nào chịu trách nhiệm sao chép dữ liệu trong Hadoop?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 50:

Các phím từ đầu ra của xáo trộn và sắp xếp thực hiện giao diện nào sau đây?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP