Thuật ngữ Dữ liệu lớn ra đời năm nào?

1997

2000

1998

1941

Trả lời:

Đáp án đúng: A

Thuật ngữ "Dữ liệu lớn" (Big Data) bắt đầu xuất hiện vào khoảng năm 1997, khi mà các nhà nghiên cứu bắt đầu nhận thấy sự gia tăng đáng kể về lượng dữ liệu được tạo ra và cần được xử lý. Do đó, đáp án chính xác là A.

300+ câu hỏi trắc nghiệm Big Data đầy đủ đáp án và lời giải - Phần 5

50 câu hỏi 60 phút

Bắt đầu thi

Câu hỏi liên quan

Câu 45:

Công cụ nào hỗ trợ tốt NoSQL?

Lời giải:

Đáp án đúng: D

Câu hỏi này kiểm tra kiến thức về các công cụ hỗ trợ NoSQL. Trong số các lựa chọn được đưa ra:

SAP Data Services, Oracle Data Integrator, và SQL Server Integration Services là các công cụ ETL (Extract, Transform, Load) truyền thống, thường được sử dụng cho các hệ thống quản lý dữ liệu quan hệ (RDBMS) như SQL Server, Oracle, DB2, v.v. Mặc dù chúng có thể được tùy chỉnh để làm việc với NoSQL, nhưng không phải là lựa chọn tối ưu hoặc được thiết kế đặc biệt để hỗ trợ NoSQL một cách hiệu quả.

Không có công cụ nào trong số A, B, C hỗ trợ tốt cho NoSQL.

Câu 46:

Cái nào không phải là một trong đặc trưng 3Vs của dữ liệu lớn?

Lời giải:

Đáp án đúng: B

Đặc trưng 3Vs của dữ liệu lớn bao gồm: Khối lượng (Volume), Vận tốc (Velocity) và Đa dạng (Variety). Tính xác thực (Veracity) là một đặc trưng quan trọng khác, thường được nhắc đến trong các mô tả mở rộng hơn về dữ liệu lớn (ví dụ, 4Vs hoặc 5Vs), nhưng không nằm trong bộ 3Vs cốt lõi.

Câu 47:

Điều nào sau đây đúng đối với Hadoop?

Lời giải:

Đáp án đúng: D

Hadoop là một framework mã nguồn mở được sử dụng để lưu trữ và xử lý các tập dữ liệu lớn một cách phân tán trên các cụm máy tính. Nó bao gồm Hệ thống Tệp Phân tán Hadoop (HDFS) để lưu trữ và MapReduce để xử lý dữ liệu song song. Hadoop cũng có thể chạy trên hạ tầng Cloud Computing.

A. Đúng, Hadoop là một framework phân tán.

B. Đúng, thuật toán chính được sử dụng trong Hadoop là MapReduce.

C. Đúng, Hadoop có thể chạy trên hạ tầng Cloud Computing.

Do đó, đáp án D là đáp án đúng nhất vì nó bao gồm tất cả các khẳng định đúng về Hadoop.

Câu 48:

Hadoop xử lý khối lượng lớn dữ liệu như thế nào?

Lời giải:

Đáp án đúng: C

Hadoop xử lý khối lượng lớn dữ liệu bằng cách phân chia dữ liệu thành các khối nhỏ hơn và phân tán chúng trên một cụm các máy tính. Mỗi máy tính trong cụm xử lý một phần của dữ liệu song song với các máy khác. Hadoop gửi mã đến dữ liệu (nguyên tắc "data locality") thay vì gửi dữ liệu đến mã, giảm thiểu việc truyền dữ liệu qua mạng và tăng tốc độ xử lý.

Câu 49:

Mô hình Điện toán đám mây IaaS?

Lời giải:

Đáp án đúng: A

IaaS là viết tắt của Infrastructure as a Service, có nghĩa là Cơ sở hạ tầng dưới dạng dịch vụ. Đây là một mô hình điện toán đám mây cung cấp tài nguyên cơ sở hạ tầng máy tính (ví dụ: máy ảo, lưu trữ, mạng) cho người dùng thông qua Internet. Người dùng có quyền kiểm soát hệ điều hành, lưu trữ và các ứng dụng đã triển khai, đồng thời có thể cài đặt và cấu hình bất kỳ phần mềm nào. Vì vậy, đáp án đúng là A.

Các lựa chọn khác không đúng vì:
- B. Nền tảng dưới dạng dịch vụ (PaaS): Cung cấp một nền tảng để phát triển, chạy và quản lý các ứng dụng.
- C. Phần mềm dưới dạng dịch vụ (SaaS): Cung cấp phần mềm ứng dụng cho người dùng qua Internet.
- D. Internet dưới dạng dịch vụ: Không phải là một mô hình điện toán đám mây.

Câu 50:

Dịch vụ tích hợp dữ liệu trên đám mây trên Google Cloud Platform:

Lời giải: