JavaScript is required

Những loại bộ dữ liệu nào thường cần thiết để xây dựng mô hình học máy như a quy trình 'hoàn thành'? 

A.
Tập huấn luyện, tập xác thực và tập kiểm tra
B.
Bộ kiểm tra và bộ xác nhận
C.
Tập huấn luyện và tập xác nhận
D.
Tập huấn luyện và tập kiểm tra
Trả lời:

Đáp án đúng: A


Để xây dựng một mô hình học máy hoàn chỉnh, chúng ta thường cần ba loại tập dữ liệu chính: * **Tập huấn luyện (Training set):** Được sử dụng để huấn luyện mô hình. Mô hình học các mẫu và quan hệ từ dữ liệu này. * **Tập xác thực (Validation set):** Được sử dụng để tinh chỉnh các siêu tham số của mô hình và đánh giá hiệu suất của mô hình trong quá trình huấn luyện. Nó giúp ngăn ngừa tình trạng quá khớp (overfitting) bằng cách cung cấp một đánh giá khách quan về khả năng khái quát hóa của mô hình trên dữ liệu chưa thấy. * **Tập kiểm tra (Test set):** Được sử dụng để đánh giá hiệu suất cuối cùng của mô hình sau khi đã hoàn thành quá trình huấn luyện và tinh chỉnh. Tập kiểm tra phải là dữ liệu hoàn toàn mới mà mô hình chưa từng thấy trước đó. Do đó, đáp án đúng là a. Tập huấn luyện, tập xác thực và tập kiểm tra. Các đáp án còn lại thiếu một hoặc nhiều loại tập dữ liệu cần thiết cho quy trình xây dựng mô hình học máy hoàn chỉnh.

Câu hỏi liên quan