Phát biểu nào không phải dạng thức nghiên cứu Khoa học dữ liệu của Jim Gray?
Trả lời:
Đáp án đúng: B
Jim Gray đã mô tả bốn dạng thức nghiên cứu khoa học dữ liệu, bao gồm: thực nghiệm, mô phỏng, lý thuyết và khai thác dữ liệu. Do đó, "Tính toán" không phải là một trong các dạng thức được Jim Gray đề xuất.
Câu hỏi liên quan
Lời giải:
Đáp án đúng: A
Dữ liệu Unstructured (phi cấu trúc) là loại dữ liệu không tuân theo một cấu trúc hoặc định dạng dữ liệu được xác định trước. Nó thường là dữ liệu văn bản hoặc đa phương tiện, khó phân tích và xử lý bằng các phương pháp truyền thống.
* Video: Video là một ví dụ điển hình của dữ liệu phi cấu trúc. Nội dung video bao gồm hình ảnh, âm thanh và các thông tin khác, không được tổ chức theo một cấu trúc cố định.
* XML: Mặc dù XML có cấu trúc, nhưng sự linh hoạt trong cấu trúc và nội dung của nó khiến nó thường được coi là bán cấu trúc hoặc phi cấu trúc, đặc biệt khi so sánh với dữ liệu dạng bảng.
* Table: Dữ liệu dạng bảng (table) là dữ liệu cấu trúc, có hàng và cột rõ ràng, dễ dàng truy vấn và phân tích.
Vì video là dữ liệu phi cấu trúc, XML đôi khi được coi là phi cấu trúc và table là dữ liệu có cấu trúc, nên đáp án A là chính xác nhất trong trường hợp này vì nó đại diện cho một ví dụ điển hình của dữ liệu phi cấu trúc. Tuy nhiên, vì XML cũng có thể được xem là phi cấu trúc ở một mức độ nào đó, nên đáp án D (Tất cả) có thể gây nhầm lẫn. Trong ngữ cảnh này, video là lựa chọn tốt nhất để minh họa dữ liệu phi cấu trúc.
* Video: Video là một ví dụ điển hình của dữ liệu phi cấu trúc. Nội dung video bao gồm hình ảnh, âm thanh và các thông tin khác, không được tổ chức theo một cấu trúc cố định.
* XML: Mặc dù XML có cấu trúc, nhưng sự linh hoạt trong cấu trúc và nội dung của nó khiến nó thường được coi là bán cấu trúc hoặc phi cấu trúc, đặc biệt khi so sánh với dữ liệu dạng bảng.
* Table: Dữ liệu dạng bảng (table) là dữ liệu cấu trúc, có hàng và cột rõ ràng, dễ dàng truy vấn và phân tích.
Vì video là dữ liệu phi cấu trúc, XML đôi khi được coi là phi cấu trúc và table là dữ liệu có cấu trúc, nên đáp án A là chính xác nhất trong trường hợp này vì nó đại diện cho một ví dụ điển hình của dữ liệu phi cấu trúc. Tuy nhiên, vì XML cũng có thể được xem là phi cấu trúc ở một mức độ nào đó, nên đáp án D (Tất cả) có thể gây nhầm lẫn. Trong ngữ cảnh này, video là lựa chọn tốt nhất để minh họa dữ liệu phi cấu trúc.
Lời giải:
Đáp án đúng: B
Câu hỏi yêu cầu xác định CSDL *không* thuộc kiểu Graph.
* InfoGrid: Không phải là một CSDL Graph phổ biến hoặc được biết đến rộng rãi. Có thể là một sản phẩm hoặc dự án cụ thể nhưng không thuộc danh mục CSDL Graph tiêu chuẩn.
* HBase: Là một CSDL NoSQL, cột hướng (column-oriented) được thiết kế để lưu trữ và xử lý dữ liệu lớn, phân tán. *Không phải* là một CSDL Graph.
* InfiniteGraph: Là một CSDL Graph được thiết kế để xử lý các đồ thị lớn và phức tạp.
* IBM Graph: Là một dịch vụ CSDL Graph được cung cấp bởi IBM.
Vậy, cả InfoGrid và HBase đều không phải là CSDL Graph, tuy nhiên HBase phổ biến hơn và được biết đến nhiều hơn trong lĩnh vực NoSQL. Vì InfoGrid ít thông tin hơn, HBase phù hợp hơn trong ngữ cảnh này.
* InfoGrid: Không phải là một CSDL Graph phổ biến hoặc được biết đến rộng rãi. Có thể là một sản phẩm hoặc dự án cụ thể nhưng không thuộc danh mục CSDL Graph tiêu chuẩn.
* HBase: Là một CSDL NoSQL, cột hướng (column-oriented) được thiết kế để lưu trữ và xử lý dữ liệu lớn, phân tán. *Không phải* là một CSDL Graph.
* InfiniteGraph: Là một CSDL Graph được thiết kế để xử lý các đồ thị lớn và phức tạp.
* IBM Graph: Là một dịch vụ CSDL Graph được cung cấp bởi IBM.
Vậy, cả InfoGrid và HBase đều không phải là CSDL Graph, tuy nhiên HBase phổ biến hơn và được biết đến nhiều hơn trong lĩnh vực NoSQL. Vì InfoGrid ít thông tin hơn, HBase phù hợp hơn trong ngữ cảnh này.
Lời giải:
Đáp án đúng: C
DFS (Distributed File System) là hệ thống tệp phân tán. Ưu điểm chính của nó là tính sẵn sàng cao. Khi một máy chủ hoặc bộ nhớ trong hệ thống gặp sự cố, dữ liệu vẫn có thể được truy cập từ các máy chủ hoặc bộ nhớ khác trong hệ thống. Do đó, hệ thống tệp phân tán đảm bảo khả năng cung cấp dữ liệu ổn định ngay cả khi có lỗi xảy ra.
Lời giải:
Đáp án đúng: B
Cluster node có 2 loại chính:
1. Master node (hay còn gọi là control plane node): Chịu trách nhiệm quản lý và điều phối toàn bộ cluster. Nó lưu trữ trạng thái của cluster, lên lịch các công việc (pods), và giám sát sức khỏe của các worker node.
2. Worker node: Thực thi các công việc (pods) được giao bởi master node. Các worker node cung cấp tài nguyên tính toán (CPU, memory) cho các ứng dụng.
Vì vậy, đáp án đúng là B.
1. Master node (hay còn gọi là control plane node): Chịu trách nhiệm quản lý và điều phối toàn bộ cluster. Nó lưu trữ trạng thái của cluster, lên lịch các công việc (pods), và giám sát sức khỏe của các worker node.
2. Worker node: Thực thi các công việc (pods) được giao bởi master node. Các worker node cung cấp tài nguyên tính toán (CPU, memory) cho các ứng dụng.
Vì vậy, đáp án đúng là B.
Lời giải:
Đáp án đúng: B
YARN là một thành phần quan trọng trong Hadoop, đóng vai trò quản lý tài nguyên và lập lịch công việc. Tên đầy đủ của nó là "Yet Another Resource Negotiator". Nó chịu trách nhiệm phân bổ tài nguyên hệ thống (CPU, bộ nhớ, băng thông) cho các ứng dụng Hadoop khác nhau. Các lựa chọn khác không chính xác.
Vậy đáp án đúng là B.
Vậy đáp án đúng là B.
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy
89 tài liệu310 lượt tải

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin
125 tài liệu441 lượt tải

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông
104 tài liệu687 lượt tải

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán
103 tài liệu589 lượt tải

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp
377 tài liệu1030 lượt tải

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
99 tài liệu1062 lượt tải
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.
77.000 đ/ tháng