JavaScript is required
Danh sách đề

300+ câu hỏi trắc nghiệm Big Data đầy đủ đáp án và lời giải - Đề 6

50 câu hỏi 60 phút

Thẻ ghi nhớ
Luyện tập
Thi thử
Nhấn để lật thẻ
1 / 50

Bộ nhớ đệm phân tán là gì?

A.

Bộ đệm phân tán là thành phần đặc biệt trên NameNode sẽ lưu vào bộ đệm dữ liệu được sử dụng thường xuyên để phản hồi máy khách nhanh hơn. Nó được sử dụng trong bước giảm

B.

Bộ nhớ đệm phân tán là thành phần đặc biệt trên DataNode sẽ lưu vào bộ đệm dữ liệu được sử dụng thường xuyên để phản hồi máy khách nhanh hơn. Nó được sử dụng trong bước bản đồ

C.

Bộ đệm phân tán là một thành phần lưu trữ các đối tượng java

D.

Bộ nhớ đệm phân tán là một thành phần cho phép các nhà phát triển triển khai các chum để xử lý Map-Reduce

Đáp án
Đáp án đúng: B
Bộ nhớ đệm phân tán (Distributed Cache) trong Hadoop là một cơ chế cho phép các file cần thiết cho các tác vụ MapReduce (ví dụ: file cấu hình, file dữ liệu, file thực thi) được phân phối và lưu trữ cục bộ trên các node trong cluster trước khi các tác vụ này bắt đầu. Điều này giúp giảm thiểu việc truy cập dữ liệu từ vị trí trung tâm, cải thiện hiệu suất bằng cách tăng tốc độ truy cập dữ liệu và giảm tải cho NameNode.

Phương án A, B, C, D đều không mô tả chính xác khái niệm và chức năng của bộ nhớ đệm phân tán.

Do không có đáp án đúng trong các lựa chọn đã cho, chúng ta cần tìm một định nghĩa chính xác hơn về bộ nhớ đệm phân tán.

Danh sách câu hỏi:

Câu 1:

Bộ nhớ đệm phân tán là gì?

Lời giải:
Đáp án đúng: B
Bộ nhớ đệm phân tán (Distributed Cache) trong Hadoop là một cơ chế cho phép các file cần thiết cho các tác vụ MapReduce (ví dụ: file cấu hình, file dữ liệu, file thực thi) được phân phối và lưu trữ cục bộ trên các node trong cluster trước khi các tác vụ này bắt đầu. Điều này giúp giảm thiểu việc truy cập dữ liệu từ vị trí trung tâm, cải thiện hiệu suất bằng cách tăng tốc độ truy cập dữ liệu và giảm tải cho NameNode.

Phương án A, B, C, D đều không mô tả chính xác khái niệm và chức năng của bộ nhớ đệm phân tán.

Do không có đáp án đúng trong các lựa chọn đã cho, chúng ta cần tìm một định nghĩa chính xác hơn về bộ nhớ đệm phân tán.

Câu 2:

Cái nào sau đây lưu trữ dữ liệu?

Lời giải:
Đáp án đúng: B

Trong kiến trúc Hadoop, DataNode là thành phần chịu trách nhiệm lưu trữ dữ liệu thực tế. Các DataNode lưu trữ các khối dữ liệu tạo nên các file trong hệ thống file Hadoop (HDFS). NameNode quản lý metadata về hệ thống file, nhưng không lưu trữ dữ liệu thực tế.


Câu 3:

Đâu là một dạng của NoSQL:

Lời giải:
Đáp án đúng: B

Câu hỏi yêu cầu xác định một dạng của NoSQL. NoSQL (Not Only SQL) là một loại hệ quản trị cơ sở dữ liệu khác với hệ quản trị cơ sở dữ liệu quan hệ truyền thống (RDBMS) như MySQL. Các loại NoSQL bao gồm Key-value store, Document database, Column-family store, và Graph database.

\n

A. MySQL: MySQL là một hệ quản trị cơ sở dữ liệu quan hệ (RDBMS), không phải NoSQL.

\n

B. JSON: JSON (JavaScript Object Notation) là một định dạng dữ liệu, thường được sử dụng để truyền dữ liệu. Nó không phải là một hệ quản trị cơ sở dữ liệu NoSQL, mặc dù nó thường được sử dụng để lưu trữ dữ liệu trong các cơ sở dữ liệu NoSQL.

\n

C. Key-value store: Key-value store là một loại cơ sở dữ liệu NoSQL, nơi dữ liệu được lưu trữ dưới dạng cặp key-value. Ví dụ: Redis, Memcached.

\n

D. OLAP: OLAP (Online Analytical Processing) là một phương pháp xử lý phân tích trực tuyến, thường được sử dụng cho các ứng dụng báo cáo và phân tích. Nó không phải là một hệ quản trị cơ sở dữ liệu NoSQL.

\n

Vậy, đáp án đúng là C.

Lời giải:
Đáp án đúng: C
Câu hỏi liên quan đến việc hủy lưu trữ (unarchive) một tệp đã được lưu trữ (archived) trong Hadoop. Trong Hadoop, các tệp lưu trữ thường được tạo bằng công cụ `hadoop archive` (HAR). Để khôi phục các tệp từ một kho lưu trữ HAR, ta sử dụng lệnh `hadoop fs -cp` (copy) để sao chép các tệp từ kho lưu trữ HAR đến một vị trí khác trong hệ thống tệp Hadoop. Trong các lựa chọn trên, không có lệnh `hadoop fs -cp`, tuy nhiên phương án C. Cp có thể hiểu là viết tắt của lệnh `hadoop fs -cp`. Các lệnh khác như `Unrar` và `Unhar` không phải là các lệnh Hadoop tiêu chuẩn để xử lý các kho lưu trữ HAR. `Cphar` không phải là lệnh Hadoop hợp lệ.

Vì không có đáp án nào hoàn toàn chính xác, nhưng đáp án C là gần đúng nhất, ta có thể chọn C với lưu ý rằng nó cần được sử dụng với tiền tố `hadoop fs -`.

Câu 5:

Điều nào sau đây đúng với ổ đĩa trong một khoảng thời gian?

Lời giải:
Đáp án đúng: B
Trong quá trình phát triển của ổ đĩa, tốc độ truyền dữ liệu (data transfer rate) đã tăng lên nhanh chóng hơn so với tốc độ cải thiện thời gian tìm kiếm dữ liệu (seek time). Điều này có nghĩa là, mặc dù ổ đĩa có thể lưu trữ nhiều dữ liệu hơn và truyền dữ liệu nhanh hơn, nhưng thời gian cần thiết để tìm và truy cập một khối dữ liệu cụ thể không giảm nhanh tương ứng. Do đó, đáp án B là chính xác.
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 7:

Hadoop được viết bằng:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 9:

Khi khách hàng giao tiếp với hệ thống tệp HDFS, nó cần giao tiếp với:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 10:

Khi một tệp trong HDFS bị người dùng xóa:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 11:

Kịch bản nào yêu cầu băng thông cao nhất để truyền dữ liệu giữa các nút trong Hadoop?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 12:

label và feature của câu lệnh bên dưới có nghĩa là gì

LogisticRegression(labelCol = "label" , featuresCol = "features", maxIter = 10)

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 13:

Lệnh nào liệt kê các khối tạo nên mỗi tệp trong hệ thống tệp:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 14:

Máy khách đọc dữ liệu từ hệ thống tệp HDFS trong Hadoop:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 15:

Một công việc đang chạy trong Hadoop:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 16:

Mục đích của sử dụng SparkML là gì:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 18:

YARN là viết tắt của:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 19:

Tính năng decommission trong hadoop được sử dụng cho:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 21:

Điều nào sau đây đúng với ổ đĩa trong một khoảng thời gian?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 23:

Trong đĩa cục bộ của NameNode, các tệp được lưu trữ liên tục là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 24:

Các ứng dụng người dùng có thể hướng dẫn NameNode để lưu vào bộ đệm các tệp bằng cách:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 25:

Zookeeper đảm bảo rằng:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 27:

Điều sau không được phép trên các tệp HDFS:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 28:

Thuộc tính nào dưới đây được định cấu hình trên core-site.xml?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 30:

Vai trò của nút Nhật ký là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 31:

HDFS là viết tắt của:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 32:

Tùy chọn nào sau đây không phải là tùy chọn lập lịch có sẵn trong YARN:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 33:

Định dạng đầu vào mặc định là gì?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 34:

Cái nào không phải là một trong những tính năng dữ liệu lớn?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 35:

Bộ nhớ đệm phân tán là gì?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 37:

Đặc trưng nào không phải của Big Data?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 38:

Các dạng thức khoa học dữ liệu của Jim Gray?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 40:

Loại nào là dữ liệu Unstructured?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 41:

CSDL nào không phải kiểu Graph:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 42:

Ưu điểm của DFS là gì?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 44:

YARN là viết tắt của:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 45:

Trong HDFS, các tệp không thể:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 46:

Nhược điểm khi triển khai Big Data trên nền tảng Cloud Computing là?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 47:

Lợi ích vượt trội của Cloud Computing với Big Data là?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 48:

Trên Google Cloud Platform dịch vụ nào quản lý CSDL NoSQL:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 49:

Trên Google Cloud Platform dịch vụ phân tích dữ liệu được cung cấp:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP