300+ câu trắc nghiệm Big Data có đáp án và lời giải chi tiết

Câu 1:

Bản chất của phần cứng cho NameNode phải là

Lời giải:

Đáp án đúng: A

NameNode là thành phần quan trọng nhất trong Hadoop Distributed File System (HDFS). Nó quản lý metadata của hệ thống tệp, bao gồm thông tin về các tệp, thư mục, và các khối dữ liệu (blocks) nằm trên DataNodes. Vì NameNode chịu trách nhiệm quản lý toàn bộ hệ thống tệp, nó cần phần cứng mạnh mẽ và đáng tin cậy để đảm bảo hiệu suất và tính ổn định.

* Đáp án A đúng: NameNode cần phần cứng cao cấp hơn loại hàng hóa (commodity hardware) vì nó phải xử lý lượng lớn metadata và các yêu cầu từ client. Việc sử dụng phần cứng cao cấp hơn giúp NameNode hoạt động nhanh hơn, ổn định hơn và ít bị lỗi hơn.
* Đáp án B sai: Loại hàng hóa (commodity hardware) thường không đủ mạnh để đáp ứng yêu cầu về hiệu suất và độ tin cậy của NameNode.
* Đáp án C sai: Phần cứng của NameNode rất quan trọng và ảnh hưởng trực tiếp đến hiệu suất của hệ thống HDFS.
* Đáp án D sai: Mặc dù RAM là quan trọng, nhưng chỉ có nhiều RAM hơn DataNode là không đủ. NameNode cần CPU mạnh, bộ nhớ nhanh, và ổ cứng có tốc độ đọc/ghi cao để xử lý metadata một cách hiệu quả.

Câu 2:

Các khối dữ liệu ánh xạ thông tin với các tệp tương ứng của chúng được lưu trữ trong

Lời giải:

Đáp án đúng: D

Câu hỏi này liên quan đến kiến trúc của Hadoop Distributed File System (HDFS). Trong HDFS, NameNode là trung tâm điều khiển, lưu trữ metadata của hệ thống tệp, bao gồm ánh xạ giữa các khối dữ liệu và các tệp tương ứng của chúng. DataNode lưu trữ các khối dữ liệu thực tế. Job Tracker và Task Tracker liên quan đến MapReduce, một mô hình lập trình để xử lý song song các tập dữ liệu lớn.

* A. DataNode: Lưu trữ các khối dữ liệu thực tế, nhưng không lưu trữ ánh xạ giữa khối dữ liệu và tệp.
* B. Job Tracker: Điều phối các công việc MapReduce, không liên quan đến việc lưu trữ metadata của hệ thống tệp.
* C. Task Tracker: Thực thi các tác vụ do Job Tracker giao, không liên quan đến việc lưu trữ metadata của hệ thống tệp.
* D. NameNode: Lưu trữ metadata, bao gồm ánh xạ giữa các khối dữ liệu và các tệp tương ứng. Đây là đáp án đúng.

Vậy, đáp án đúng là D.

Câu 3:

Công nghệ nào được sử dụng để tuần tự hóa dữ liệu trong Hadoop?

Lời giải:

Đáp án đúng: B

Trong Hadoop, Avro là một hệ thống tuần tự hóa dữ liệu (serialization system) được sử dụng rộng rãi. Nó cung cấp một khuôn khổ mạnh mẽ để chuyển đổi các đối tượng dữ liệu thành định dạng có thể được lưu trữ hoặc truyền đi, sau đó có thể được chuyển đổi trở lại thành các đối tượng dữ liệu ban đầu. Avro hỗ trợ schema evolution, cho phép thay đổi schema theo thời gian mà không làm hỏng khả năng đọc dữ liệu cũ. Các lựa chọn khác không đúng vì:

HBase là một hệ quản trị cơ sở dữ liệu NoSQL.

Sqoop là công cụ để chuyển dữ liệu giữa Hadoop và các cơ sở dữ liệu quan hệ.

Zookeeper là dịch vụ điều phối (coordination service) cho các ứng dụng phân tán.

Câu 4:

Công ty nào đã phát triển Apache Cassandra giai đoạn đầu tiên

Lời giải:

Đáp án đúng: D

Apache Cassandra được phát triển ban đầu tại Facebook để phục vụ nhu cầu lưu trữ hộp thư đến (inbox) của người dùng. Sau đó, nó được chuyển giao cho Apache Software Foundation và trở thành một dự án mã nguồn mở.

Câu 5:

Đáp án nào không phải là một "output operation" khi thao tác với DStream:

Lời giải:

Đáp án đúng: D

Câu hỏi này kiểm tra kiến thức về các thao tác "output operation" trong Spark Streaming với DStream. Output operations là các thao tác cho phép bạn đẩy dữ liệu đã xử lý từ DStream ra các hệ thống bên ngoài.

* saveAsTextFile, saveAsHadoopFile, foreachRDD là các output operation: cho phép lưu DStream ra hệ thống file (text file, hadoop file) hoặc thực hiện các thao tác trên từng RDD của DStream.
* reduceByKeyAndWindow là một transformation operation: thực hiện tính toán trên DStream và trả về một DStream mới.

Do đó, đáp án D không phải là một output operation mà là một transformation operation.

Câu 6:

Hadoop khác với máy tính tình nguyện ở chỗ:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 7:

Hệ thống apache nào dưới đây giải quyết việc nhập dữ liệu phát trực tuyến vào hadoop:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 8:

Hệ thống nào cho phép đọc ghi dữ liệu tại vị trí ngẫu nhiên, thời gian thực tới hàng terabyte dữ liệu:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 9:

Khi một jobTracker lên lịch, một công việc sẽ được tìm kiếm đầu tiên:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 10:

Khi một máy được khai báo là datanode, dung lượng ổ đĩa trong đó:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 11:

Mô tả cách thức một client đọc dữ liệu trên HDFS:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 12:

NameNode biết rằng DataNode đang hoạt động bằng cách sử dụng một cơ chế được gọi là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 13:

NameNode mất bản sao duy nhất của tệp fsimage. Chúng ta có thể khôi phục điều này từ:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 14:

Khi một tệp trong HDFS bị người dùng xóa:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 15:

Giao tiếp giữa các quá trình giữa các nút khác nhau trong Hadoop sử dụng:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 16:

Loại dữ liệu mà Hadoop có thể xử lý là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 17:

Hadoop khác với máy tính tình nguyện ở chỗ:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 18:

Trong Hadoop 2.x, liên kết HDFS phát hành có nghĩa là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 19:

Chế độ nào sau đây không phải là chế độ hoạt động của Hadoop?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 20:

Công việc khung hadoop được viết bằng:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 21:

Lệnh hadfs được sử dụng để:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 22:

Thuộc tính nào dưới đây được định cấu hình trên hadoop-env.sh?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 23:

Bản chất của phần cứng cho NameNode phải là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 24:

Người giữ vườn thú (zookeeper):

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 25:

Khi một ứng dụng khách liên hệ với NameNode để truy cập tệp, NameNode phản hồi với:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 26:

Công cụ Hadoop được sử dụng để phân tán dữ liệu một cách đồng nhất trên các DataNode được đặt tên là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 27:

Job tracker runs on:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 28:

Công nghệ nào được sử dụng để nhập và xuất dữ liệu trong Hadoop?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 29:

Cái nào sau đây lưu trữ dữ liệu?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 30:

Nút nào sau đây quản lý các nút khác?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 31:

Hadoop xử lý khối lượng lớn dữ liệu như thế nào?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 32:

Khi lưu trữ tệp Hadoop, câu nào sau đây là đúng? (Chọn hai câu trả lời)

Các tệp đã lưu trữ sẽ hiển thị với phần mở rộng .arc. Nhiều tệp nhỏ sẽ trở thành ít tệp lớn hơn

MapReduce xử lý tên tệp gốc ngay cả sau khi tệp được lưu trữ

Các tệp đã lưu trữ phải được lưu trữ tại Liên hợp quốc cho HDFS và MapReduce để truy cập các tệp nhỏ, gốc

Lưu trữ dành cho các tệp cần được lưu nhưng HDFS không còn truy cập được nữa

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 33:

Câu nào sau đây là đúng đối với các cặp <key, value> của một công việc MapReduce?</key,>

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 34:

Thành phần nào sau đây không phải là thành phần chính của HBase?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 35:

Điều nào sau đây là sai về RawComparator?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 36:

Đặc trưng quan trọng nhất của Big Data?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 37:

Đâu không phải là phương thức xử lý dữ liệu lớn?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 38:

Nhược điểm của tích hợp dữ liệu theo phương pháp Tight Coupling:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 39:

Hệ quản trị CSDL MongoDB là kiểu nào?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 40:

Hệ quản trị CSDL IBM Graph là kiểu nào?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 41:

Loại nào là dữ liệu Bán cấu trúc?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 42:

CSDL nào không phải kiểu Key-Value:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 43:

Ưu điểm của công nghệ Cluster:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 44:

Nguồn của kiến trúc HDFS trong Hadoop có nguồn gốc là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 45:

Điều nào sau đây không phải là mục tiêu của HDFS?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 46:

Node nào sau đây quản lý các nút khác?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 47:

Mô hình Điện toán đám mây SaaS?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 48:

Dịch vụ lưu trữ của Microsoft Azure là?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 49:

Dịch vụ lưu trữ của Google Cloud Platform là?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 50:

Đám mây AWS cung cấp dịch vụ NoSQL Database:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Danh sách đề

ĐH Sư Phạm Kỹ Thuật TP.HCM

Luật

Đề thi cuối học kì 1 môn Luật Hiến pháp có đáp án chi tiết

Kinh tế

Câu hỏi trắc nghiệm Thị trường chứng khoán có lời giải minh họa

Kế toán

Đề thi học kì 1 môn Kế toán ngân hàng có đáp án chi tiết

Đề thi học kì 1 môn Kế toán quốc tế có đáp án chi tiết

Công Nghệ Thông Tin

100+ câu hỏi trắc nghiệm Nhập môn Công nghệ thông tin có lời giải dễ hiểu

100+ câu hỏi trắc nghiệm Tin học cơ sở có đáp án và mẹo làm bài

100+ câu hỏi trắc nghiệm An ninh mạng có giải thích dễ hiểu và thực tế

100+ câu hỏi trắc nghiệm Cấu trúc dữ liệu và giải thuật có lời giải từng bước

200+ câu hỏi trắc nghiệm Lập trình có cấu trúc có lời giải từng bước

100+ câu hỏi trắc nghiệm Lập trình python có giải thích cụ thể

100+ câu hỏi trắc nghiệm Lập trình java có đáp án và tình huống thực tế

200+ câu hỏi trắc nghiệm Hệ quản trị cơ sở dữ liệu SQL có lời giải cụ thể

100+ câu hỏi trắc nghiệm Mạng máy tính có đáp án minh họa

300+ câu hỏi trắc nghiệm Hệ điều hành có đáp án và phân tích lựa chọn

100+ câu hỏi trắc nghiệm Phân tích thiết kế hệ thống thông tin có lời giải chi tiết

250+ câu hỏi trắc nghiệm Trí tuệ nhân tạo cơ bản có đáp án và giải thích

100+ câu hỏi trắc nghiệm Học máy có lời giải và ứng dụng

100+ câu hỏi trắc nghiệm Lập trình web có đáp án chi tiết

Khoa học Ứng dụng

Đề thi cuối học kì 3 môn Toán 1 có đáp án chi tiết

Đề thi cuối học kì 3 môn Toán 3 có đáp án chi tiết

Đề thi cuối kì 2 môn Xác suất thống kê ứng dụng có đáp án

Đề thi cuối học kì 3 môn Toán 2 trình bày lời giải rõ ràng

Đề thi cuối học kì 3 môn Vật lí 1 có đáp án chi tiết

Đề thi cuối học kì 3 môn Toán kinh tế 2 có đáp án chi tiết

Đề thi cuối học kì 3 môn Toán cao cấp kỹ sư 1 có đáp án chi tiết

Đề thi cuối học kì 3 môn Xác suất thống kê ứng dụng có đáp án chi tiết

Đề thi cuối học kì 3 môn Vật lí 2 có hướng dẫn giải chi tiết

Điện - Điện Tử

140+ câu hỏi trắc nghiệm Điện thân xe và điều khiển tự động giải thích từng bước rõ ràng

300+ câu hỏi trắc nghiệm Điện tử tương tự có đáp án và mẹo nhớ nhanh

150+ câu hỏi trắc nghiệm Vi xử lý có đáp án và mô phỏng hoạt động

100+ câu hỏi trắc nghiệm Cung cấp điện có đáp án đầy đủ

100+ câu hỏi trắc nghiệm Quy trình an toàn điện có đáp án

100+ câu hỏi trắc nghiệm Điện tử cơ bản có giải thích rõ ràng

150+ câu hỏi trắc nghiệm Điện tử số có lời giải từng câu

100+ câu hỏi trắc nghiệm Truyền động điện có đáp án phân tích

100+ câu hỏi trắc nghiệm Điều khiển tự động có giải thích logic rõ ràng

200+ câu hỏi trắc nghiệm PLC cơ bản có lời giải và hướng dẫn lập trình

100+ câu hỏi trắc nghiệm Lý thuyết trường điện từ có giải thích dễ hiểu

100+ câu hỏi trắc nghiệm Năng lượng tái tạo dành cho sinh viên ngành điện

100+ câu hỏi trắc nghiệm Khí cụ điện có lời giải cụ thể và chính xác

Cơ Khí - Chế Tạo Máy

Đề thi cuối học kì 1 môn Công nghệ Nano có đáp án chi tiết

150+ câu hỏi trắc nghiệm Công nghệ gia công cơ khí có đáp án chi tiết

180+ câu hỏi trắc nghiệm Vật liệu kỹ thuật có đáp án và mẹo làm bài

500+ câu hỏi trắc nghiệm Động cơ có đáp án và hình minh họa có đầy đủ đáp án

400+ câu hỏi trắc nghiệm Vật liệu cơ khí có đáp án và mẹo làm bài

140+ Câu hỏi trắc nghiệm Nguyên lý máy có đáp án chi tiết

130+ câu hỏi trắc nghiệm An toàn lao động trong gia công cơ khí có đáp án chuẩn

100+ câu hỏi trắc nghiệm Thiết kế và chế tạo khuôn mẫu có đáp án từng bước

300+ câu hỏi trắc nghiệm Công nghệ hàn có giải thích chi tiết

250+ câu hỏi trắc nghiệm Chi tiết máy có đáp án phân tích dễ hiểu

150+ câu hỏi trắc nghiệm Dung sai – kỹ thuật đo có đáp án và mẹo nhớ nhanh

100+ câu hỏi trắc nghiệm Công nghệ chế tạo máy có lời giải dễ hiểu

300+ câu hỏi trắc nghiệm Công nghệ CAD/CAM/CNC cơ bản có đáp án thực hành

150+ câu hỏi trắc nghiệm Cơ khí đại cương có giải thích chi tiết

Cơ Khí Động Lực

800+ câu hỏi trắc nghiệm Nguyên lý động cơ đốt trong có đáp án kèm giải thích

140+ câu hỏi trắc nghiệm Hệ thống điều khiển động cơ đầy đủ đáp án và lời giải

650+ câu hỏi trắc nghiệm Nhập môn ngành Công nghệ Kỹ thuật Ô tô phù hợp ôn thi cuối kỳ

100+ câu hỏi trắc nghiệm Cấu tạo ô tô – máy kéo kèm lời giải từng câu

100+ câu hỏi trắc nghiệm Thiết kế và tính toán ô tô – máy kéo có đáp án chi tiết dễ hiểu

200+ câu hỏi trắc nghiệm Điện thân xe và điều khiển tự động giải thích từng bước rõ ràng

100+ câu hỏi trắc nghiệm Kiểm định, chẩn đoán, bảo dưỡng và sửa chữa ô tô hướng dẫn giải cụ thể

200+ câu hỏi trắc nghiệm Quản lý dịch vụ ô tô cập nhật mới nhất, bám sát đề thi

Xây Dựng

150+ câu hỏi trắc nghiệm Sức bền vật liệu có lời giải dễ hiểu

100+ câu hỏi trắc nghiệm Cơ học kết cấu có đáp án và phân tích cụ thể

100+ câu hỏi trắc nghiệm Nền móng có lời giải từng câu

200+ câu hỏi trắc nghiệm Kết cấu bê tông cốt thép có giải thích kèm sơ đồ

100+ câu hỏi trắc nghiệm Vật liệu xây dựng có đáp án đầy đủ

150+ câu hỏi trắc nghiệm Trắc địa cơ bản có lời giải và hình minh họa

100+ câu hỏi trắc nghiệm Thiết kế nền đường ô tô có giải thích từng phần