JavaScript is required
Danh sách đề

300+ câu hỏi trắc nghiệm Big Data đầy đủ đáp án và lời giải - Đề 2

50 câu hỏi 60 phút

Thẻ ghi nhớ
Luyện tập
Thi thử
Nhấn để lật thẻ
1 / 50

Bản chất của phần cứng cho NameNode phải là

A.

Cao cấp hơn loại hàng hóa

B.

Loại hàng hóa

C.

Không thành vấn đề

D.

Chỉ cần có nhiều Ram hơn mỗi DataNode

Đáp án
Đáp án đúng: A
NameNode là thành phần quan trọng nhất trong Hadoop Distributed File System (HDFS). Nó quản lý metadata của hệ thống tệp, bao gồm thông tin về các tệp, thư mục, và các khối dữ liệu (blocks) nằm trên DataNodes. Vì NameNode chịu trách nhiệm quản lý toàn bộ hệ thống tệp, nó cần phần cứng mạnh mẽ và đáng tin cậy để đảm bảo hiệu suất và tính ổn định.

* Đáp án A đúng: NameNode cần phần cứng cao cấp hơn loại hàng hóa (commodity hardware) vì nó phải xử lý lượng lớn metadata và các yêu cầu từ client. Việc sử dụng phần cứng cao cấp hơn giúp NameNode hoạt động nhanh hơn, ổn định hơn và ít bị lỗi hơn.
* Đáp án B sai: Loại hàng hóa (commodity hardware) thường không đủ mạnh để đáp ứng yêu cầu về hiệu suất và độ tin cậy của NameNode.
* Đáp án C sai: Phần cứng của NameNode rất quan trọng và ảnh hưởng trực tiếp đến hiệu suất của hệ thống HDFS.
* Đáp án D sai: Mặc dù RAM là quan trọng, nhưng chỉ có nhiều RAM hơn DataNode là không đủ. NameNode cần CPU mạnh, bộ nhớ nhanh, và ổ cứng có tốc độ đọc/ghi cao để xử lý metadata một cách hiệu quả.

Danh sách câu hỏi:

Câu 1:

Bản chất của phần cứng cho NameNode phải là

Lời giải:
Đáp án đúng: A
NameNode là thành phần quan trọng nhất trong Hadoop Distributed File System (HDFS). Nó quản lý metadata của hệ thống tệp, bao gồm thông tin về các tệp, thư mục, và các khối dữ liệu (blocks) nằm trên DataNodes. Vì NameNode chịu trách nhiệm quản lý toàn bộ hệ thống tệp, nó cần phần cứng mạnh mẽ và đáng tin cậy để đảm bảo hiệu suất và tính ổn định.

* Đáp án A đúng: NameNode cần phần cứng cao cấp hơn loại hàng hóa (commodity hardware) vì nó phải xử lý lượng lớn metadata và các yêu cầu từ client. Việc sử dụng phần cứng cao cấp hơn giúp NameNode hoạt động nhanh hơn, ổn định hơn và ít bị lỗi hơn.
* Đáp án B sai: Loại hàng hóa (commodity hardware) thường không đủ mạnh để đáp ứng yêu cầu về hiệu suất và độ tin cậy của NameNode.
* Đáp án C sai: Phần cứng của NameNode rất quan trọng và ảnh hưởng trực tiếp đến hiệu suất của hệ thống HDFS.
* Đáp án D sai: Mặc dù RAM là quan trọng, nhưng chỉ có nhiều RAM hơn DataNode là không đủ. NameNode cần CPU mạnh, bộ nhớ nhanh, và ổ cứng có tốc độ đọc/ghi cao để xử lý metadata một cách hiệu quả.
Lời giải:
Đáp án đúng: D
Câu hỏi này liên quan đến kiến trúc của Hadoop Distributed File System (HDFS). Trong HDFS, NameNode là trung tâm điều khiển, lưu trữ metadata của hệ thống tệp, bao gồm ánh xạ giữa các khối dữ liệu và các tệp tương ứng của chúng. DataNode lưu trữ các khối dữ liệu thực tế. Job Tracker và Task Tracker liên quan đến MapReduce, một mô hình lập trình để xử lý song song các tập dữ liệu lớn.

* A. DataNode: Lưu trữ các khối dữ liệu thực tế, nhưng không lưu trữ ánh xạ giữa khối dữ liệu và tệp.
* B. Job Tracker: Điều phối các công việc MapReduce, không liên quan đến việc lưu trữ metadata của hệ thống tệp.
* C. Task Tracker: Thực thi các tác vụ do Job Tracker giao, không liên quan đến việc lưu trữ metadata của hệ thống tệp.
* D. NameNode: Lưu trữ metadata, bao gồm ánh xạ giữa các khối dữ liệu và các tệp tương ứng. Đây là đáp án đúng.

Vậy, đáp án đúng là D.
Lời giải:
Đáp án đúng: B

Trong Hadoop, Avro là một hệ thống tuần tự hóa dữ liệu (serialization system) được sử dụng rộng rãi. Nó cung cấp một khuôn khổ mạnh mẽ để chuyển đổi các đối tượng dữ liệu thành định dạng có thể được lưu trữ hoặc truyền đi, sau đó có thể được chuyển đổi trở lại thành các đối tượng dữ liệu ban đầu. Avro hỗ trợ schema evolution, cho phép thay đổi schema theo thời gian mà không làm hỏng khả năng đọc dữ liệu cũ. Các lựa chọn khác không đúng vì:



  • HBase là một hệ quản trị cơ sở dữ liệu NoSQL.

  • Sqoop là công cụ để chuyển dữ liệu giữa Hadoop và các cơ sở dữ liệu quan hệ.

  • Zookeeper là dịch vụ điều phối (coordination service) cho các ứng dụng phân tán.

Lời giải:
Đáp án đúng: D

Apache Cassandra được phát triển ban đầu tại Facebook để phục vụ nhu cầu lưu trữ hộp thư đến (inbox) của người dùng. Sau đó, nó được chuyển giao cho Apache Software Foundation và trở thành một dự án mã nguồn mở.

Câu 5:

Đáp án nào không phải là một "output operation" khi thao tác với DStream:
Lời giải:
Đáp án đúng: D
Câu hỏi này kiểm tra kiến thức về các thao tác "output operation" trong Spark Streaming với DStream. Output operations là các thao tác cho phép bạn đẩy dữ liệu đã xử lý từ DStream ra các hệ thống bên ngoài.

* saveAsTextFile, saveAsHadoopFile, foreachRDD là các output operation: cho phép lưu DStream ra hệ thống file (text file, hadoop file) hoặc thực hiện các thao tác trên từng RDD của DStream.
* reduceByKeyAndWindow là một transformation operation: thực hiện tính toán trên DStream và trả về một DStream mới.

Do đó, đáp án D không phải là một output operation mà là một transformation operation.

Câu 6:

Hadoop khác với máy tính tình nguyện ở chỗ:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 9:

Khi một jobTracker lên lịch, một công việc sẽ được tìm kiếm đầu tiên:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 10:

Khi một máy được khai báo là datanode, dung lượng ổ đĩa trong đó:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 11:

Mô tả cách thức một client đọc dữ liệu trên HDFS:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 14:

Khi một tệp trong HDFS bị người dùng xóa:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 16:

Loại dữ liệu mà Hadoop có thể xử lý là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 17:

Hadoop khác với máy tính tình nguyện ở chỗ:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 18:

Trong Hadoop 2.x, liên kết HDFS phát hành có nghĩa là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 19:

Chế độ nào sau đây không phải là chế độ hoạt động của Hadoop?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 21:

Lệnh hadfs được sử dụng để:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 22:

Thuộc tính nào dưới đây được định cấu hình trên hadoop-env.sh?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 23:

Bản chất của phần cứng cho NameNode phải là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 24:

Người giữ vườn thú (zookeeper):

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 25:

Khi một ứng dụng khách liên hệ với NameNode để truy cập tệp, NameNode phản hồi với:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 27:

Job tracker runs on:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 29:

Cái nào sau đây lưu trữ dữ liệu?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 30:

Nút nào sau đây quản lý các nút khác?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 31:

Hadoop xử lý khối lượng lớn dữ liệu như thế nào?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 33:

Câu nào sau đây là đúng đối với các cặp <key, value> của một công việc MapReduce?</key,>

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 34:

Thành phần nào sau đây không phải là thành phần chính của HBase?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 35:

Điều nào sau đây là sai về RawComparator?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 36:

Đặc trưng quan trọng nhất của Big Data?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 37:

Đâu không phải là phương thức xử lý dữ liệu lớn?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 38:

Nhược điểm của tích hợp dữ liệu theo phương pháp Tight Coupling:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 39:

Hệ quản trị CSDL MongoDB là kiểu nào?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 40:

Hệ quản trị CSDL IBM Graph là kiểu nào?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 42:

CSDL nào không phải kiểu Key-Value:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 43:

Ưu điểm của công nghệ Cluster:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 44:

Nguồn của kiến trúc HDFS trong Hadoop có nguồn gốc là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 45:

Điều nào sau đây không phải là mục tiêu của HDFS?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 46:

Node nào sau đây quản lý các nút khác?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 47:

Mô hình Điện toán đám mây SaaS?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 48:

Dịch vụ lưu trữ của Microsoft Azure là?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 49:

Dịch vụ lưu trữ của Google Cloud Platform là?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 50:

Đám mây AWS cung cấp dịch vụ NoSQL Database:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP