300+ câu trắc nghiệm Big Data có đáp án và lời giải chi tiết

Câu 1:

Các ứng dụng người dùng có thể hướng dẫn NameNode để lưu vào bộ đệm các tệp bằng cách

Lời giải:

Đáp án đúng: C

Câu trả lời đúng là C. Các ứng dụng người dùng có thể hướng dẫn NameNode lưu vào bộ đệm các tệp bằng cách thêm chỉ thị bộ nhớ cache vào nhóm bộ nhớ cache. Cache Directive (Chỉ thị bộ nhớ cache) là một cách để yêu cầu Hadoop lưu trữ một tệp hoặc thư mục cụ thể trong bộ nhớ cache. Cache Pool (Nhóm bộ nhớ cache) là một nhóm các chỉ thị bộ nhớ cache có chung các thuộc tính như quyền và giới hạn. Khi một chỉ thị bộ nhớ cache được thêm vào một nhóm bộ nhớ cache, NameNode sẽ cố gắng lưu trữ các tệp và thư mục được chỉ định bởi chỉ thị đó trong bộ nhớ cache.

Câu 2:

Cái nào không phải là một trong những tính năng dữ liệu lớn?

Lời giải:

Đáp án đúng: D

Các tính năng đặc trưng của dữ liệu lớn (Big Data) thường được mô tả bằng mô hình 5V (ban đầu là 3V, sau đó phát triển lên 4V và 5V). Các V này bao gồm:

* Volume (Khối lượng): Đề cập đến lượng lớn dữ liệu được tạo ra và lưu trữ.
* Velocity (Vận tốc): Tốc độ dữ liệu được tạo ra và xử lý.
* Variety (Đa dạng): Các loại dữ liệu khác nhau (có cấu trúc, bán cấu trúc và phi cấu trúc).
* Veracity (Tính xác thực): Độ tin cậy và chất lượng của dữ liệu.
* Value (Giá trị): Khả năng trích xuất thông tin có giá trị từ dữ liệu.

Trong các phương án trên, A, C và D đều là các đặc tính của Big Data. Tuy nhiên phương án B: Tính xác thực (Veracity) là một yếu tố, nhưng câu hỏi yêu cầu tính năng "không phải là" của big data. Tuy nhiên, Tính xác thực (Veracity) thường được xem là một thuộc tính hoặc thách thức đi kèm với dữ liệu lớn hơn là một tính năng cốt lõi. Trong mô hình 3V ban đầu (Volume, Velocity, Variety), Veracity không được nhắc đến, và sau này mới được thêm vào khi người ta nhận ra tầm quan trọng của việc đảm bảo chất lượng dữ liệu lớn.

Vì vậy, tất cả các đáp án đều có thể coi là đúng tùy theo cách tiếp cận và định nghĩa về big data, tuy nhiên trong trường hợp này không có đáp án nào là đáp án "không phải là" một tính năng của big data.

Câu 3:

Chế độ cài đặt phân phối hoàn toàn (không ảo hóa) cần tối thiểu (The fully distributed mode of installation(without virtualization) needs a minimum of)

Lời giải:

Đáp án đúng: A

Trong chế độ cài đặt phân tán hoàn toàn (fully distributed mode), các dịch vụ khác nhau của Hadoop (ví dụ: NameNode, DataNode, ResourceManager, NodeManager) chạy trên các máy vật lý riêng biệt. Để có một hệ thống Hadoop hoạt động đầy đủ và chịu lỗi cơ bản, cần tối thiểu 3 máy vật lý:

1. Một máy cho NameNode (quản lý hệ thống tệp HDFS).
2. Một máy cho ResourceManager (quản lý tài nguyên cho các ứng dụng MapReduce).
3. Một máy cho DataNode và NodeManager (lưu trữ dữ liệu và thực thi các tác vụ MapReduce).

Do đó, đáp án đúng là 3 máy vật lý.

Câu 4:

Công cụ Hadoop được sử dụng để phân tán dữ liệu một cách đồng nhất trên các DataNode được đặt tên là:

Lời giải:

Đáp án đúng: B

Công cụ Hadoop được sử dụng để phân tán dữ liệu một cách đồng nhất trên các DataNode là Balancer. Balancer có nhiệm vụ đảm bảo rằng dữ liệu được phân phối đều trên tất cả các DataNode trong cluster, tránh tình trạng một số node bị quá tải trong khi các node khác lại ít dữ liệu. Điều này giúp tối ưu hiệu suất và đảm bảo tính ổn định của hệ thống Hadoop.

Scheduler: Là công cụ lập lịch các công việc (jobs) cần thực hiện trên cluster.
Spreader: Không phải là một công cụ chính thức trong Hadoop.
Reporter: Là công cụ báo cáo trạng thái của các node trong cluster.

Câu 5:

Công nghệ nào được sử dụng để lưu trữ dữ liệu trong Hadoop?

Lời giải:

Đáp án đúng: A

Câu hỏi này kiểm tra kiến thức về các thành phần trong hệ sinh thái Hadoop. Trong Hadoop, dữ liệu được lưu trữ chủ yếu trong Hệ thống tệp phân tán Hadoop (HDFS) và HBase. HBase là một cơ sở dữ liệu NoSQL chạy trên đỉnh HDFS và cung cấp quyền truy cập đọc/ghi ngẫu nhiên, thời gian thực vào dữ liệu lớn. Avro là một định dạng tuần tự hóa dữ liệu. Sqoop là một công cụ để chuyển dữ liệu giữa Hadoop và các cơ sở dữ liệu quan hệ. Zookeeper là một dịch vụ điều phối tập trung.

Trong các lựa chọn được đưa ra, HBase là thành phần được sử dụng để lưu trữ dữ liệu trong Hadoop, đặc biệt là khi cần truy cập ngẫu nhiên và thời gian thực.

Câu 6:

Công nghệ nào sau đây là cơ sở dữ liệu lưu trữ tài liệu?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 7:

Cơ chế tổ chức dữ liệu của Datanode trong HDFS

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 8:

DataNode và NameNode là tương ứng

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 9:

Định dạng đầu vào mặc định là gì?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 10:

Đối với các tệp HDFS được truy cập thường xuyên, các khối được lưu vào bộ nhớ đệm:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 11:

HBASE là gì?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 12:

HDFS có thể được truy cập qua HTTP bằng cách sử dụng:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 13:

Khi ghi dữ liệu vào HDFS, điều gì là đúng nếu hệ số nhân bản là ba? (Chọn 2 câu trả lời)

Dữ liệu được ghi vào DataNodes trên ba giá đỡ riêng biệt (nếu Rack Aware)

Dữ liệu được lưu trữ trên mỗi DataNode bằng một tệp riêng biệt chứa checksum

Dữ liệu được ghi vào các khối trên ba DataNodes khác nhau

Khách hàng được trả lại thành công khi ghi thành công khối đầu tiên và kiểm tra tổng kiểm tra

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 14:

Lệnh để kiểm tra xem Hadoop có hoạt động hay không là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 15:

Lệnh "hadoop fs -test -z URI" cho kết quả 0 nếu:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 16:

Mô tả cách thức một client đọc dữ liệu trên HDFS:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 17:

Mục đích của lệnh sau đây là gì:

(trainingData, testData) = dataset.randomSplit([0.8, 0.2], seed=100)

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 18:

Mục đích của nút checkpoint trong cụm Hadoop là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 19:

Khi một máy được khai báo là datanode, dung lượng ổ đĩa trong đó:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 20:

Mục đích của nút checkpoint trong cụm Hadoop là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 21:

Nguồn của kiến trúc HDFS trong Hadoop có nguồn gốc là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 22:

Hệ số sao chép của tệp trong HDFS có thể được thay đổi bằng cách sử dụng:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 23:

Lệnh được sử dụng để sao chép một thư mục từ node này sang node khác trong HDFS là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 24:

Tệp lưu trữ được tạo trong Hadoop luôn có phần mở rộng là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 25:

Dữ liệu từ một cụm hadoop từ xa có thể:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 26:

Nếu chúng tôi tăng kích thước tệp được lưu trữ trong HDFS mà không tăng số tệp, thì bộ nhớ được yêu cầu bởi NameNode:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 27:

Trong một cụm Hadoop, điều gì đúng với khối HDFS không còn khả dụng do hỏng đĩa hoặc lỗi máy?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 28:

Lệnh nào liệt kê các khối tạo nên mỗi tệp trong hệ thống tệp?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 29:

DataNode và NameNode là tương ứng:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 30:

Theo Tính khả dụng cao của Hadoop, nghĩa là Hàng rào:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 31:

Vị trí khối hiện tại của HDFS nơi dữ liệu đang được ghi vào:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 32:

Sao chép thiếu trong HDFS có nghĩa là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 33:

Thuộc tính nào dưới đây được định cấu hình trên hdfs-site.xml?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 34:

Lệnh để kiểm tra xem Hadoop có hoạt động hay không là:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 35:

Khi một jobTracker lên lịch, một công việc sẽ được tìm kiếm đầu tiên:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 36:

Có thể ghi là gì?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 37:

Nhiệm vụ nào sau đây là trong số các nhiệm vụ của các DataNode trong HDFS?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 38:

Các phím từ đầu ra của xáo trộn và sắp xếp thực hiện giao diện nào sau đây?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 39:

Mục tiêu của NoSQL là gì?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 40:

Công cụ SQL Server Integrator do ai phát triển?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 41:

Hệ quản trị CSDL DynamoDB là kiểu nào?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 42:

CSDL nào không phải kiểu Document:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 43:

So với RDBMS, Hadoop:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 44:

Các tệp HDFS được thiết kế cho:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 45:

Hệ thống Apache Hadoop được viết bằng ngôn ngữ nào?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 46:

Loại nào sau đây lưu trữ dữ liệu?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 47:

Mô hình Điện toán đám mây PaaS?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 48:

Trên Google Cloud Platform dịch vụ nào quản lý danh mục dữ liệu:

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 49:

Dich vụ phân tích dữ liệu lớn Cloudera cung cấp là?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 50:

Cloudera Enterprise có thể ược triển khai trên ám mây nào

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Danh sách đề

ĐH Sư Phạm Kỹ Thuật TP.HCM

Luật

Đề thi cuối học kì 1 môn Luật Hiến pháp có đáp án chi tiết

Kinh tế

Câu hỏi trắc nghiệm Thị trường chứng khoán có lời giải minh họa

Kế toán

Đề thi học kì 1 môn Kế toán ngân hàng có đáp án chi tiết

Đề thi học kì 1 môn Kế toán quốc tế có đáp án chi tiết

Công Nghệ Thông Tin

100+ câu hỏi trắc nghiệm Nhập môn Công nghệ thông tin có lời giải dễ hiểu

100+ câu hỏi trắc nghiệm Tin học cơ sở có đáp án và mẹo làm bài

100+ câu hỏi trắc nghiệm An ninh mạng có giải thích dễ hiểu và thực tế

100+ câu hỏi trắc nghiệm Cấu trúc dữ liệu và giải thuật có lời giải từng bước

200+ câu hỏi trắc nghiệm Lập trình có cấu trúc có lời giải từng bước

100+ câu hỏi trắc nghiệm Lập trình python có giải thích cụ thể

100+ câu hỏi trắc nghiệm Lập trình java có đáp án và tình huống thực tế

200+ câu hỏi trắc nghiệm Hệ quản trị cơ sở dữ liệu SQL có lời giải cụ thể

100+ câu hỏi trắc nghiệm Mạng máy tính có đáp án minh họa

300+ câu hỏi trắc nghiệm Hệ điều hành có đáp án và phân tích lựa chọn

100+ câu hỏi trắc nghiệm Phân tích thiết kế hệ thống thông tin có lời giải chi tiết

250+ câu hỏi trắc nghiệm Trí tuệ nhân tạo cơ bản có đáp án và giải thích

100+ câu hỏi trắc nghiệm Học máy có lời giải và ứng dụng

100+ câu hỏi trắc nghiệm Lập trình web có đáp án chi tiết

Khoa học Ứng dụng

Đề thi cuối học kì 3 môn Toán 1 có đáp án chi tiết

Đề thi cuối học kì 3 môn Toán 3 có đáp án chi tiết

Đề thi cuối kì 2 môn Xác suất thống kê ứng dụng có đáp án

Đề thi cuối học kì 3 môn Toán 2 trình bày lời giải rõ ràng

Đề thi cuối học kì 3 môn Vật lí 1 có đáp án chi tiết

Đề thi cuối học kì 3 môn Toán kinh tế 2 có đáp án chi tiết

Đề thi cuối học kì 3 môn Toán cao cấp kỹ sư 1 có đáp án chi tiết

Đề thi cuối học kì 3 môn Xác suất thống kê ứng dụng có đáp án chi tiết

Đề thi cuối học kì 3 môn Vật lí 2 có hướng dẫn giải chi tiết

Điện - Điện Tử

140+ câu hỏi trắc nghiệm Điện thân xe và điều khiển tự động giải thích từng bước rõ ràng

300+ câu hỏi trắc nghiệm Điện tử tương tự có đáp án và mẹo nhớ nhanh

150+ câu hỏi trắc nghiệm Vi xử lý có đáp án và mô phỏng hoạt động

100+ câu hỏi trắc nghiệm Cung cấp điện có đáp án đầy đủ

100+ câu hỏi trắc nghiệm Quy trình an toàn điện có đáp án

100+ câu hỏi trắc nghiệm Điện tử cơ bản có giải thích rõ ràng

150+ câu hỏi trắc nghiệm Điện tử số có lời giải từng câu

100+ câu hỏi trắc nghiệm Truyền động điện có đáp án phân tích

100+ câu hỏi trắc nghiệm Điều khiển tự động có giải thích logic rõ ràng

200+ câu hỏi trắc nghiệm PLC cơ bản có lời giải và hướng dẫn lập trình

100+ câu hỏi trắc nghiệm Lý thuyết trường điện từ có giải thích dễ hiểu

100+ câu hỏi trắc nghiệm Năng lượng tái tạo dành cho sinh viên ngành điện

100+ câu hỏi trắc nghiệm Khí cụ điện có lời giải cụ thể và chính xác

Cơ Khí - Chế Tạo Máy

Đề thi cuối học kì 1 môn Công nghệ Nano có đáp án chi tiết

150+ câu hỏi trắc nghiệm Công nghệ gia công cơ khí có đáp án chi tiết

180+ câu hỏi trắc nghiệm Vật liệu kỹ thuật có đáp án và mẹo làm bài

500+ câu hỏi trắc nghiệm Động cơ có đáp án và hình minh họa có đầy đủ đáp án

400+ câu hỏi trắc nghiệm Vật liệu cơ khí có đáp án và mẹo làm bài

140+ Câu hỏi trắc nghiệm Nguyên lý máy có đáp án chi tiết

130+ câu hỏi trắc nghiệm An toàn lao động trong gia công cơ khí có đáp án chuẩn

100+ câu hỏi trắc nghiệm Thiết kế và chế tạo khuôn mẫu có đáp án từng bước

300+ câu hỏi trắc nghiệm Công nghệ hàn có giải thích chi tiết

250+ câu hỏi trắc nghiệm Chi tiết máy có đáp án phân tích dễ hiểu

150+ câu hỏi trắc nghiệm Dung sai – kỹ thuật đo có đáp án và mẹo nhớ nhanh

100+ câu hỏi trắc nghiệm Công nghệ chế tạo máy có lời giải dễ hiểu

300+ câu hỏi trắc nghiệm Công nghệ CAD/CAM/CNC cơ bản có đáp án thực hành

150+ câu hỏi trắc nghiệm Cơ khí đại cương có giải thích chi tiết

Cơ Khí Động Lực

800+ câu hỏi trắc nghiệm Nguyên lý động cơ đốt trong có đáp án kèm giải thích

140+ câu hỏi trắc nghiệm Hệ thống điều khiển động cơ đầy đủ đáp án và lời giải

650+ câu hỏi trắc nghiệm Nhập môn ngành Công nghệ Kỹ thuật Ô tô phù hợp ôn thi cuối kỳ

100+ câu hỏi trắc nghiệm Cấu tạo ô tô – máy kéo kèm lời giải từng câu

100+ câu hỏi trắc nghiệm Thiết kế và tính toán ô tô – máy kéo có đáp án chi tiết dễ hiểu

200+ câu hỏi trắc nghiệm Điện thân xe và điều khiển tự động giải thích từng bước rõ ràng

100+ câu hỏi trắc nghiệm Kiểm định, chẩn đoán, bảo dưỡng và sửa chữa ô tô hướng dẫn giải cụ thể

200+ câu hỏi trắc nghiệm Quản lý dịch vụ ô tô cập nhật mới nhất, bám sát đề thi

Xây Dựng

150+ câu hỏi trắc nghiệm Sức bền vật liệu có lời giải dễ hiểu

100+ câu hỏi trắc nghiệm Cơ học kết cấu có đáp án và phân tích cụ thể

100+ câu hỏi trắc nghiệm Nền móng có lời giải từng câu

200+ câu hỏi trắc nghiệm Kết cấu bê tông cốt thép có giải thích kèm sơ đồ

100+ câu hỏi trắc nghiệm Vật liệu xây dựng có đáp án đầy đủ

150+ câu hỏi trắc nghiệm Trắc địa cơ bản có lời giải và hình minh họa

100+ câu hỏi trắc nghiệm Thiết kế nền đường ô tô có giải thích từng phần