300+ câu trắc nghiệm Big Data có đáp án và lời giải chi tiết

Câu 1:

Bản chất DStream:

Lời giải:

Đáp án đúng: A

Trong Spark Streaming, DStream (Discretized Stream) là một chuỗi liên tục các RDD (Resilient Distributed Datasets). Mỗi RDD trong DStream đại diện cho dữ liệu được xử lý trong một khoảng thời gian nhất định. Vì vậy, đáp án A là đáp án chính xác nhất.

Câu 2:

Bạn có thể dự trữ lượng sử dụng đĩa trong một DataNode bằng cách định cấu hình dfs.datanode.du.reserved trong tệp nào sau đây

Lời giải:

Đáp án đúng: A

Tham số dfs.datanode.du.reserved dùng để dự trữ dung lượng đĩa cho DataNode, được cấu hình trong tệp hdfs-site.xml. Tệp này chứa các cấu hình đặc thù cho HDFS, bao gồm các thuộc tính liên quan đến DataNode và NameNode.

hdfs-default.xml: Chứa các cấu hình mặc định của HDFS.

core-site.xml: Chứa các cấu hình lõi, chẳng hạn như cấu hình Hadoop Common (ví dụ: fs.defaultFS).

mapred-site.xml: Chứa các cấu hình cho MapReduce.

Câu 3:

Các tệp HDFS được thiết kế cho

Lời giải:

Đáp án đúng: B

Các tệp HDFS (Hadoop Distributed File System) được thiết kế để lưu trữ và xử lý các tệp dữ liệu lớn. Do đó, chúng được tối ưu hóa cho việc ghi một lần và sau đó đọc nhiều lần. Việc sửa đổi ngẫu nhiên trên các tệp này không được hỗ trợ hiệu quả.

* Phương án A: Sai. HDFS không được thiết kế cho việc nhiều người cùng viết và sửa đổi tệp tùy ý. Điều này sẽ gây ra các vấn đề về đồng bộ và nhất quán dữ liệu.
* Phương án B: Sai. Mặc dù HDFS hỗ trợ việc thêm dữ liệu vào cuối tệp, nhưng đây không phải là mục đích thiết kế chính của nó.
* Phương án C: Đúng. HDFS được thiết kế chủ yếu cho việc ghi dữ liệu một lần và sau đó đọc nhiều lần. Điều này phù hợp với các ứng dụng xử lý dữ liệu hàng loạt, nơi dữ liệu thường được ghi một lần và sau đó được phân tích nhiều lần.
* Phương án D: Sai. HDFS không được thiết kế để truy cập dữ liệu có độ trễ thấp. Nó được tối ưu hóa cho việc xử lý dữ liệu lớn, ngay cả khi việc truy cập có độ trễ cao hơn.

Vì vậy, đáp án chính xác là C. Chỉ ghi thành tệp một lần.

Câu 4:

Cái nào trong số này cung cấp hệ thống xử lý Luồng được sử dụng trong hệ sinh thái Hadoop?

Lời giải:

Đáp án đúng: C

Đáp án đúng là C. Spark.

Giải thích:

Spark là một framework tính toán cluster mã nguồn mở, nhanh chóng và đa năng. Nó cung cấp một hệ thống xử lý luồng (stream processing) mạnh mẽ, cho phép xử lý dữ liệu thời gian thực (real-time) hoặc gần thời gian thực (near real-time). Spark Streaming là một phần của Spark, được thiết kế để xử lý các luồng dữ liệu trực tiếp (live data streams) từ nhiều nguồn khác nhau như Kafka, Flume, Twitter, ZeroMQ hoặc các socket TCP.

Các lựa chọn khác không phù hợp vì những lý do sau:

A. Solr: Solr là một nền tảng tìm kiếm (search platform) dựa trên Lucene, được sử dụng để lập chỉ mục (indexing) và tìm kiếm dữ liệu. Nó không phải là một hệ thống xử lý luồng.
B. Tez: Tez là một framework thực thi dữ liệu (data execution framework) được xây dựng trên Hadoop, cho phép các ứng dụng xử lý dữ liệu quy mô lớn một cách hiệu quả hơn. Nó không trực tiếp cung cấp khả năng xử lý luồng.
D. Hive: Hive là một hệ thống kho dữ liệu (data warehouse system) được xây dựng trên Hadoop, cho phép truy vấn dữ liệu bằng SQL. Nó chủ yếu được sử dụng để xử lý dữ liệu theo lô (batch processing) thay vì xử lý luồng.

Câu 5:

Chạy Start-dfs.sh kết quả là

Lời giải:

Đáp án đúng: A

Lệnh start-dfs.sh được sử dụng trong Hadoop để khởi động các thành phần cơ bản của hệ thống tệp phân tán Hadoop (HDFS). Khi chạy lệnh này, nó sẽ khởi động cả NameNode và DataNode. NameNode là nút chủ quản lý không gian tên hệ thống tệp và DataNode là các nút lưu trữ dữ liệu thực tế.

Câu 6:

Chế độ nào sau đây không phải là chế độ hoạt động của Hadoop?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 7:

Chọn phát biểu đúng khi nói về MongoDB

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 8:

Công nghệ nào được sử dụng để nhập và xuất dữ liệu trong Hadoop?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 9:

Dữ liệu từ một cụm hadoop từ xa có thể:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 10:

Đối với thư mục HDFS, hệ số sao chép (RF) là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 11:

Hadoop sử dụng những cơ chế nào để làm cho namenode có khả năng chống lại sự cố:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 12:

HDFS giải quyết bài toán single-point-of-failure cho Namenode bằng cách nào:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 13:

HDFS là viết tắt của:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 14:

Hệ số sao chép của tệp trong HDFS có thể được thay đổi bằng cách sử dụng:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 15:

Job tracker runs on:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 16:

Khái niệm sử dụng nhiều máy để xử lý dữ liệu được lưu trữ trong hệ thống phân tán không phải là mới. "Máy tính hiệu suất cao (HPC) sử dụng nhiều máy tính để xử lý khối lượng lớn dữ liệu được lưu trữ trong mạng vùng lưu trữ (SAN). So với HPC, Hadoop":

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 17:

Khi lưu trữ tệp Hadoop, phát biểu nào sau đây là đúng? (Chọn hai câu trả lời)

Các tệp đã lưu trữ sẽ hiển thị với phần mở rộng .arc

Nhiều tệp nhỏ sẽ trở thành ít tệp lớn hơn

MapReduce xử lý tên tệp gốc ngay cả sau khi tệp được lưu trữ

Các tệp đã lưu trữ phải được lưu trữ tại Liên hợp quốc cho HDFS và MapReduce để truy cập vào các tệp nhỏ, gốc

Lưu trữ dành cho các tệp cần được lưu nhưng HDFS không còn truy cập được nữa

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 18:

Khi một node dự phòng được sử dụng trong một cụm thì không cần:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 19:

Khi một ứng dụng khách liên hệ với NameNode để truy cập tệp, NameNode phản hồi với:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 20:

Lệnh hdfs để tạo bản sao của tệp từ hệ thống cục bộ là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 21:

Loại dữ liệu mà Hadoop có thể xử lý là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 22:

Mục tiêu chính của HDFS Tính sẵn sàng cao là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 23:

Trong NameNode, lượng bộ nhớ cần thiết là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 24:

Nhận thức về giá trong NameNode có nghĩa là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 25:

Điều nào sau đây không phải là mục tiêu của HDFS?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 26:

hadoop fs –expunge:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 27:

Mục đích của việc khởi động NameNode trong chế độ khôi phục là để:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 28:

Yếu tố giới hạn hiện tại đối với kích thước của một cụm hadoop là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 29:

Trong hệ thống HDFS với kích thước khối 64MB, chúng tôi lưu trữ một tệp nhỏ hơn 64MB. Điều nào sau đây là đúng?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 30:

So với RDBMS, Hadoop:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 31:

Vấn đề chính gặp phải khi đọc và ghi dữ liệu song song từ nhiều đĩa là gì?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 32:

Theo liên kết HDFS:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 33:

HDFS có thể được truy cập qua HTTP bằng cách sử dụng:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 34:

Máy khách đọc dữ liệu từ hệ thống tệp HDFS trong Hadoop:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 35:

Lệnh hdfs để tạo bản sao của tệp từ hệ thống cục bộ là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 36:

Hệ thống apache nào dưới đây giải quyết việc nhập dữ liệu phát trực tuyến vào hadoop:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 37:

Công nghệ nào được sử dụng để tuần tự hóa dữ liệu trong Hadoop?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 38:

Điều nào sau đây không đúng đối với Hadoop?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 39:

Bạn có thể chạy Bản đồ - Giảm công việc trực tiếp trên dữ liệu Avro không?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 40:

Khi sử dụng HDFS, điều gì xảy ra khi tệp bị xóa khỏi dòng lệnh?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 41:

Phát biểu nào sau đây là sai về Bộ nhớ đệm phân tán?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 42:

Loại nào không phải là CSDL NoSQL?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 43:

Đâu là đặc trưng quyết định việc triển khai Dữ liệu lớn?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 44:

Tích hợp dữ liệu là quá trình?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 45:

Nhược điểm của tích hợp dữ liệu theo phương pháp Loose Coupling:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 46:

Công cụ tích hợp dữ liệu Boomi là của?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 47:

SAP Data Service là công cụ để làm gì?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 48:

Đâu không phải là RDBMS?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 49:

Loại dữ liệu mà Hadoop có thể xử lý là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 50:

MapReduce do công ty nào phát triển?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Danh sách đề

ĐH Sư Phạm Kỹ Thuật TP.HCM

Luật

Đề thi cuối học kì 1 môn Luật Hiến pháp có đáp án chi tiết

Kinh tế

Câu hỏi trắc nghiệm Thị trường chứng khoán có lời giải minh họa

Kế toán

Đề thi học kì 1 môn Kế toán ngân hàng có đáp án chi tiết

Đề thi học kì 1 môn Kế toán quốc tế có đáp án chi tiết

Công Nghệ Thông Tin

100+ câu hỏi trắc nghiệm Nhập môn Công nghệ thông tin có lời giải dễ hiểu

100+ câu hỏi trắc nghiệm Tin học cơ sở có đáp án và mẹo làm bài

100+ câu hỏi trắc nghiệm An ninh mạng có giải thích dễ hiểu và thực tế

100+ câu hỏi trắc nghiệm Cấu trúc dữ liệu và giải thuật có lời giải từng bước

200+ câu hỏi trắc nghiệm Lập trình có cấu trúc có lời giải từng bước

100+ câu hỏi trắc nghiệm Lập trình python có giải thích cụ thể

100+ câu hỏi trắc nghiệm Lập trình java có đáp án và tình huống thực tế

200+ câu hỏi trắc nghiệm Hệ quản trị cơ sở dữ liệu SQL có lời giải cụ thể

100+ câu hỏi trắc nghiệm Mạng máy tính có đáp án minh họa

300+ câu hỏi trắc nghiệm Hệ điều hành có đáp án và phân tích lựa chọn

100+ câu hỏi trắc nghiệm Phân tích thiết kế hệ thống thông tin có lời giải chi tiết

250+ câu hỏi trắc nghiệm Trí tuệ nhân tạo cơ bản có đáp án và giải thích

100+ câu hỏi trắc nghiệm Học máy có lời giải và ứng dụng

100+ câu hỏi trắc nghiệm Lập trình web có đáp án chi tiết

Khoa học Ứng dụng

Đề thi cuối học kì 3 môn Toán 1 có đáp án chi tiết

Đề thi cuối học kì 3 môn Toán 3 có đáp án chi tiết

Đề thi cuối kì 2 môn Xác suất thống kê ứng dụng có đáp án

Đề thi cuối học kì 3 môn Toán 2 trình bày lời giải rõ ràng

Đề thi cuối học kì 3 môn Vật lí 1 có đáp án chi tiết

Đề thi cuối học kì 3 môn Toán kinh tế 2 có đáp án chi tiết

Đề thi cuối học kì 3 môn Toán cao cấp kỹ sư 1 có đáp án chi tiết

Đề thi cuối học kì 3 môn Xác suất thống kê ứng dụng có đáp án chi tiết

Đề thi cuối học kì 3 môn Vật lí 2 có hướng dẫn giải chi tiết

Điện - Điện Tử

140+ câu hỏi trắc nghiệm Điện thân xe và điều khiển tự động giải thích từng bước rõ ràng

300+ câu hỏi trắc nghiệm Điện tử tương tự có đáp án và mẹo nhớ nhanh

150+ câu hỏi trắc nghiệm Vi xử lý có đáp án và mô phỏng hoạt động

100+ câu hỏi trắc nghiệm Cung cấp điện có đáp án đầy đủ

100+ câu hỏi trắc nghiệm Quy trình an toàn điện có đáp án

100+ câu hỏi trắc nghiệm Điện tử cơ bản có giải thích rõ ràng

150+ câu hỏi trắc nghiệm Điện tử số có lời giải từng câu

100+ câu hỏi trắc nghiệm Truyền động điện có đáp án phân tích

100+ câu hỏi trắc nghiệm Điều khiển tự động có giải thích logic rõ ràng

200+ câu hỏi trắc nghiệm PLC cơ bản có lời giải và hướng dẫn lập trình

100+ câu hỏi trắc nghiệm Lý thuyết trường điện từ có giải thích dễ hiểu

100+ câu hỏi trắc nghiệm Năng lượng tái tạo dành cho sinh viên ngành điện

100+ câu hỏi trắc nghiệm Khí cụ điện có lời giải cụ thể và chính xác

Cơ Khí - Chế Tạo Máy

Đề thi cuối học kì 1 môn Công nghệ Nano có đáp án chi tiết

150+ câu hỏi trắc nghiệm Công nghệ gia công cơ khí có đáp án chi tiết

180+ câu hỏi trắc nghiệm Vật liệu kỹ thuật có đáp án và mẹo làm bài

500+ câu hỏi trắc nghiệm Động cơ có đáp án và hình minh họa có đầy đủ đáp án

400+ câu hỏi trắc nghiệm Vật liệu cơ khí có đáp án và mẹo làm bài

140+ Câu hỏi trắc nghiệm Nguyên lý máy có đáp án chi tiết

130+ câu hỏi trắc nghiệm An toàn lao động trong gia công cơ khí có đáp án chuẩn

100+ câu hỏi trắc nghiệm Thiết kế và chế tạo khuôn mẫu có đáp án từng bước

300+ câu hỏi trắc nghiệm Công nghệ hàn có giải thích chi tiết

250+ câu hỏi trắc nghiệm Chi tiết máy có đáp án phân tích dễ hiểu

150+ câu hỏi trắc nghiệm Dung sai – kỹ thuật đo có đáp án và mẹo nhớ nhanh

100+ câu hỏi trắc nghiệm Công nghệ chế tạo máy có lời giải dễ hiểu

300+ câu hỏi trắc nghiệm Công nghệ CAD/CAM/CNC cơ bản có đáp án thực hành

150+ câu hỏi trắc nghiệm Cơ khí đại cương có giải thích chi tiết

Cơ Khí Động Lực

800+ câu hỏi trắc nghiệm Nguyên lý động cơ đốt trong có đáp án kèm giải thích

140+ câu hỏi trắc nghiệm Hệ thống điều khiển động cơ đầy đủ đáp án và lời giải

650+ câu hỏi trắc nghiệm Nhập môn ngành Công nghệ Kỹ thuật Ô tô phù hợp ôn thi cuối kỳ

100+ câu hỏi trắc nghiệm Cấu tạo ô tô – máy kéo kèm lời giải từng câu

100+ câu hỏi trắc nghiệm Thiết kế và tính toán ô tô – máy kéo có đáp án chi tiết dễ hiểu

200+ câu hỏi trắc nghiệm Điện thân xe và điều khiển tự động giải thích từng bước rõ ràng

100+ câu hỏi trắc nghiệm Kiểm định, chẩn đoán, bảo dưỡng và sửa chữa ô tô hướng dẫn giải cụ thể

200+ câu hỏi trắc nghiệm Quản lý dịch vụ ô tô cập nhật mới nhất, bám sát đề thi

Xây Dựng

150+ câu hỏi trắc nghiệm Sức bền vật liệu có lời giải dễ hiểu

100+ câu hỏi trắc nghiệm Cơ học kết cấu có đáp án và phân tích cụ thể

100+ câu hỏi trắc nghiệm Nền móng có lời giải từng câu

200+ câu hỏi trắc nghiệm Kết cấu bê tông cốt thép có giải thích kèm sơ đồ

100+ câu hỏi trắc nghiệm Vật liệu xây dựng có đáp án đầy đủ

150+ câu hỏi trắc nghiệm Trắc địa cơ bản có lời giải và hình minh họa

100+ câu hỏi trắc nghiệm Thiết kế nền đường ô tô có giải thích từng phần