Đáp án đúng: C
Hadoop là một framework mã nguồn mở được sử dụng để lưu trữ và xử lý các tập dữ liệu lớn. Nó được viết bằng ngôn ngữ lập trình Java. Các thành phần chính của Hadoop, như Hadoop Distributed File System (HDFS) và MapReduce, đều được triển khai bằng Java.
Câu hỏi liên quan
Khách hàng (client) khi tương tác với HDFS cần giao tiếp với cả NameNode và DataNode. NameNode quản lý metadata của hệ thống tệp tin (ví dụ: thông tin về các file, thư mục, quyền truy cập, vị trí các block dữ liệu). Client sẽ liên hệ với NameNode để biết vị trí của các block dữ liệu cần đọc/ghi. Sau đó, client sẽ giao tiếp trực tiếp với các DataNode chứa các block dữ liệu đó để thực hiện việc đọc/ghi dữ liệu thực tế.
Trong HDFS (Hadoop Distributed File System), khi một tệp bị xóa bởi người dùng, nó không bị mất vĩnh viễn ngay lập tức. Thay vào đó, nó sẽ được chuyển vào thùng rác (Trash directory) nếu tính năng này được kích hoạt. Việc này tương tự như thùng rác trong các hệ điều hành thông thường, cho phép khôi phục tệp nếu cần thiết trong một khoảng thời gian nhất định trước khi nó bị xóa hoàn toàn khỏi hệ thống. Nếu thùng rác không được định cấu hình, file sẽ bị xóa vĩnh viễn.
Trong Hadoop, băng thông cần thiết để truyền dữ liệu giữa các nút tăng lên khi các nút nằm ở vị trí địa lý cách xa nhau hơn. Điều này là do dữ liệu phải truyền qua nhiều hop mạng hơn, mỗi hop có thể giới thiệu độ trễ và tắc nghẽn. Vì vậy, dữ liệu trên cùng một nút (D) không yêu cầu băng thông để truyền dữ liệu, trong khi các nút khác nhau trên cùng một giá đỡ (A) yêu cầu băng thông ít hơn so với các nút trên các giá đỡ khác nhau trong cùng một trung tâm dữ liệu (B). Các nút trong các trung tâm dữ liệu khác nhau (C) yêu cầu băng thông cao nhất, vì dữ liệu phải truyền qua mạng diện rộng (WAN), thường chậm hơn và ít tin cậy hơn mạng cục bộ (LAN) được sử dụng trong một trung tâm dữ liệu.
* `featuresCol = "features"` chỉ định rằng cột có tên "features" trong DataFrame đầu vào chứa các đặc trưng (features) được sử dụng để huấn luyện mô hình. Đây là dữ liệu đầu vào của mô hình.
* `labelCol = "label"` chỉ định rằng cột có tên "label" trong DataFrame đầu vào chứa các nhãn (labels) hoặc biến mục tiêu (target variable) mà mô hình sẽ học cách dự đoán. Đây là kết quả hoặc giá trị mà ta muốn dự đoán dựa trên các đặc trưng.
Do đó, đáp án đúng là C: dữ liệu đầu vào được gán là feature và kết quả của dữ liệu đầu vào được gán vào label.

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.