JavaScript is required

Trong học máy, tập dữ liệu được xử lý trước thường được chia thành các tập con trong quá trình tìm kiếm mô hình “tốt”. Các tập hợp con này là ... 

A.
bộ tàu và bộ kiểm tra
B.
tập kiểm tra, tập huấn luyện và tập xác nhận
C.
bộ kiểm tra và bộ xác nhận
D.
tập huấn luyện và tập xác nhận
Trả lời:

Đáp án đúng: B


Trong học máy, việc chia tập dữ liệu thành các tập con là một bước quan trọng để đánh giá và lựa chọn mô hình phù hợp. - **Tập huấn luyện (training set):** Được sử dụng để huấn luyện mô hình, tức là để mô hình học các mối quan hệ trong dữ liệu. - **Tập kiểm tra (test set):** Được sử dụng để đánh giá hiệu năng của mô hình sau khi đã huấn luyện. Tập này giúp ước lượng khả năng tổng quát hóa của mô hình trên dữ liệu mới, chưa từng thấy. - **Tập xác nhận (validation set):** Được sử dụng để tinh chỉnh các siêu tham số (hyperparameters) của mô hình trong quá trình huấn luyện. Việc này giúp tối ưu hóa mô hình để đạt hiệu năng tốt nhất trên tập kiểm tra. Vì vậy, đáp án đúng là b. tập kiểm tra, tập huấn luyện và tập xác nhận. Các đáp án khác chỉ liệt kê một phần của quá trình này và không đầy đủ. Ví dụ: Khi xây dựng một mô hình dự đoán giá nhà, chúng ta có thể chia dữ liệu thành: - 70% dữ liệu cho tập huấn luyện. - 15% dữ liệu cho tập xác nhận. - 15% dữ liệu cho tập kiểm tra.

Câu hỏi liên quan