JavaScript is required

L1.X. Những loại tập dữ liệu nào thường cần thiết để xây dựng mô hình học máy dưới dạng quy trình 'hoàn thành'? 

A.
Bộ kiểm tra và bộ xác nhận
B.
Tập huấn luyện và tập xác thực
C.
Tập huấn luyện, tập xác thực và tập kiểm tra
D.
Tập huấn luyện và tập kiểm tra
Trả lời:

Đáp án đúng: C


Để xây dựng một mô hình học máy hoàn chỉnh, cần phải có ba loại tập dữ liệu khác nhau: * **Tập huấn luyện (Training set):** Được sử dụng để huấn luyện mô hình, giúp mô hình học các mẫu và mối quan hệ trong dữ liệu. * **Tập xác thực (Validation set):** Được sử dụng để đánh giá hiệu suất của mô hình trong quá trình huấn luyện và điều chỉnh các siêu tham số (hyperparameters) để tối ưu hóa mô hình. Tập xác thực giúp ngăn ngừa tình trạng quá khớp (overfitting), khi mô hình học quá kỹ dữ liệu huấn luyện và không thể tổng quát hóa tốt cho dữ liệu mới. * **Tập kiểm tra (Test set):** Được sử dụng để đánh giá hiệu suất cuối cùng của mô hình sau khi đã hoàn thành quá trình huấn luyện và điều chỉnh. Tập kiểm tra cung cấp một ước lượng khách quan về khả năng tổng quát hóa của mô hình trên dữ liệu chưa từng thấy. Vì vậy, đáp án đúng là c.

Câu hỏi liên quan