JavaScript is required
Danh sách đề

300+ câu hỏi trắc nghiệm Big Data đầy đủ đáp án và lời giải - Đề 4

50 câu hỏi 60 phút

Thẻ ghi nhớ
Luyện tập
Thi thử
Nhấn để lật thẻ
1 / 50

Các ứng dụng người dùng có thể hướng dẫn NameNode để lưu vào bộ đệm các tệp bằng cách

A.

thêm tên tệp bộ đệm vào nhóm bộ đệm

B.

thêm cấu hình bộ đệm vào nhóm bộ đệm

C.

thêm chỉ thị bộ nhớ cache vào nhóm bộ nhớ cache

D.

chuyển tên tệp làm tham số cho nhóm bộ nhớ cache

Đáp án
Đáp án đúng: C
Câu trả lời đúng là C. Các ứng dụng người dùng có thể hướng dẫn NameNode lưu vào bộ đệm các tệp bằng cách thêm chỉ thị bộ nhớ cache vào nhóm bộ nhớ cache. Cache Directive (Chỉ thị bộ nhớ cache) là một cách để yêu cầu Hadoop lưu trữ một tệp hoặc thư mục cụ thể trong bộ nhớ cache. Cache Pool (Nhóm bộ nhớ cache) là một nhóm các chỉ thị bộ nhớ cache có chung các thuộc tính như quyền và giới hạn. Khi một chỉ thị bộ nhớ cache được thêm vào một nhóm bộ nhớ cache, NameNode sẽ cố gắng lưu trữ các tệp và thư mục được chỉ định bởi chỉ thị đó trong bộ nhớ cache.

Danh sách câu hỏi:

Câu 1:

Các ứng dụng người dùng có thể hướng dẫn NameNode để lưu vào bộ đệm các tệp bằng cách

Lời giải:
Đáp án đúng: C
Câu trả lời đúng là C. Các ứng dụng người dùng có thể hướng dẫn NameNode lưu vào bộ đệm các tệp bằng cách thêm chỉ thị bộ nhớ cache vào nhóm bộ nhớ cache. Cache Directive (Chỉ thị bộ nhớ cache) là một cách để yêu cầu Hadoop lưu trữ một tệp hoặc thư mục cụ thể trong bộ nhớ cache. Cache Pool (Nhóm bộ nhớ cache) là một nhóm các chỉ thị bộ nhớ cache có chung các thuộc tính như quyền và giới hạn. Khi một chỉ thị bộ nhớ cache được thêm vào một nhóm bộ nhớ cache, NameNode sẽ cố gắng lưu trữ các tệp và thư mục được chỉ định bởi chỉ thị đó trong bộ nhớ cache.

Câu 2:

Cái nào không phải là một trong những tính năng dữ liệu lớn?

Lời giải:
Đáp án đúng: D
Các tính năng đặc trưng của dữ liệu lớn (Big Data) thường được mô tả bằng mô hình 5V (ban đầu là 3V, sau đó phát triển lên 4V và 5V). Các V này bao gồm:

* Volume (Khối lượng): Đề cập đến lượng lớn dữ liệu được tạo ra và lưu trữ.
* Velocity (Vận tốc): Tốc độ dữ liệu được tạo ra và xử lý.
* Variety (Đa dạng): Các loại dữ liệu khác nhau (có cấu trúc, bán cấu trúc và phi cấu trúc).
* Veracity (Tính xác thực): Độ tin cậy và chất lượng của dữ liệu.
* Value (Giá trị): Khả năng trích xuất thông tin có giá trị từ dữ liệu.

Trong các phương án trên, A, C và D đều là các đặc tính của Big Data. Tuy nhiên phương án B: Tính xác thực (Veracity) là một yếu tố, nhưng câu hỏi yêu cầu tính năng "không phải là" của big data. Tuy nhiên, Tính xác thực (Veracity) thường được xem là một thuộc tính hoặc thách thức đi kèm với dữ liệu lớn hơn là một tính năng cốt lõi. Trong mô hình 3V ban đầu (Volume, Velocity, Variety), Veracity không được nhắc đến, và sau này mới được thêm vào khi người ta nhận ra tầm quan trọng của việc đảm bảo chất lượng dữ liệu lớn.

Vì vậy, tất cả các đáp án đều có thể coi là đúng tùy theo cách tiếp cận và định nghĩa về big data, tuy nhiên trong trường hợp này không có đáp án nào là đáp án "không phải là" một tính năng của big data.
Lời giải:
Đáp án đúng: A
Trong chế độ cài đặt phân tán hoàn toàn (fully distributed mode), các dịch vụ khác nhau của Hadoop (ví dụ: NameNode, DataNode, ResourceManager, NodeManager) chạy trên các máy vật lý riêng biệt. Để có một hệ thống Hadoop hoạt động đầy đủ và chịu lỗi cơ bản, cần tối thiểu 3 máy vật lý:

1. Một máy cho NameNode (quản lý hệ thống tệp HDFS).
2. Một máy cho ResourceManager (quản lý tài nguyên cho các ứng dụng MapReduce).
3. Một máy cho DataNode và NodeManager (lưu trữ dữ liệu và thực thi các tác vụ MapReduce).

Do đó, đáp án đúng là 3 máy vật lý.
Lời giải:
Đáp án đúng: B

Công cụ Hadoop được sử dụng để phân tán dữ liệu một cách đồng nhất trên các DataNode là Balancer. Balancer có nhiệm vụ đảm bảo rằng dữ liệu được phân phối đều trên tất cả các DataNode trong cluster, tránh tình trạng một số node bị quá tải trong khi các node khác lại ít dữ liệu. Điều này giúp tối ưu hiệu suất và đảm bảo tính ổn định của hệ thống Hadoop.

  • Scheduler: Là công cụ lập lịch các công việc (jobs) cần thực hiện trên cluster.
  • Spreader: Không phải là một công cụ chính thức trong Hadoop.
  • Reporter: Là công cụ báo cáo trạng thái của các node trong cluster.
Lời giải:
Đáp án đúng: A

Câu hỏi này kiểm tra kiến thức về các thành phần trong hệ sinh thái Hadoop. Trong Hadoop, dữ liệu được lưu trữ chủ yếu trong Hệ thống tệp phân tán Hadoop (HDFS) và HBase. HBase là một cơ sở dữ liệu NoSQL chạy trên đỉnh HDFS và cung cấp quyền truy cập đọc/ghi ngẫu nhiên, thời gian thực vào dữ liệu lớn. Avro là một định dạng tuần tự hóa dữ liệu. Sqoop là một công cụ để chuyển dữ liệu giữa Hadoop và các cơ sở dữ liệu quan hệ. Zookeeper là một dịch vụ điều phối tập trung.

Trong các lựa chọn được đưa ra, HBase là thành phần được sử dụng để lưu trữ dữ liệu trong Hadoop, đặc biệt là khi cần truy cập ngẫu nhiên và thời gian thực.

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 7:

Cơ chế tổ chức dữ liệu của Datanode trong HDFS

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 8:

DataNode và NameNode là tương ứng

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 9:

Định dạng đầu vào mặc định là gì?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 10:

Đối với các tệp HDFS được truy cập thường xuyên, các khối được lưu vào bộ nhớ đệm:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 11:

HBASE là gì?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 12:

HDFS có thể được truy cập qua HTTP bằng cách sử dụng:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 15:

Lệnh "hadoop fs -test -z URI" cho kết quả 0 nếu:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 16:

Mô tả cách thức một client đọc dữ liệu trên HDFS:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 17:

Mục đích của lệnh sau đây là gì:

(trainingData, testData) = dataset.randomSplit([0.8, 0.2], seed=100)

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 18:

Mục đích của nút checkpoint trong cụm Hadoop là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 19:

Khi một máy được khai báo là datanode, dung lượng ổ đĩa trong đó:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 20:

Mục đích của nút checkpoint trong cụm Hadoop là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 21:

Nguồn của kiến trúc HDFS trong Hadoop có nguồn gốc là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 25:

Dữ liệu từ một cụm hadoop từ xa có thể:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 27:

Trong một cụm Hadoop, điều gì đúng với khối HDFS không còn khả dụng do hỏng đĩa hoặc lỗi máy?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 28:

Lệnh nào liệt kê các khối tạo nên mỗi tệp trong hệ thống tệp?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 29:

DataNode và NameNode là tương ứng:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 30:

Theo Tính khả dụng cao của Hadoop, nghĩa là Hàng rào:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 31:

Vị trí khối hiện tại của HDFS nơi dữ liệu đang được ghi vào:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 32:

Sao chép thiếu trong HDFS có nghĩa là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 33:

Thuộc tính nào dưới đây được định cấu hình trên hdfs-site.xml?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 35:

Khi một jobTracker lên lịch, một công việc sẽ được tìm kiếm đầu tiên:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 36:

Có thể ghi là gì?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 37:

Nhiệm vụ nào sau đây là trong số các nhiệm vụ của các DataNode trong HDFS?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 38:

Các phím từ đầu ra của xáo trộn và sắp xếp thực hiện giao diện nào sau đây?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 39:

Mục tiêu của NoSQL là gì?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 41:

Hệ quản trị CSDL DynamoDB là kiểu nào?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 42:

CSDL nào không phải kiểu Document:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 43:

So với RDBMS, Hadoop:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 44:

Các tệp HDFS được thiết kế cho:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 46:

Loại nào sau đây lưu trữ dữ liệu?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 47:

Mô hình Điện toán đám mây PaaS?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 48:

Trên Google Cloud Platform dịch vụ nào quản lý danh mục dữ liệu:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 49:

Dich vụ phân tích dữ liệu lớn Cloudera cung cấp là?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 50:

Cloudera Enterprise có thể ược triển khai trên ám mây nào

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP