Trong học máy, tập dữ liệu được xử lý trước thường được chia thành các tập con trong quá trình tìm kiếm mô hình “tốt”. Các tập hợp con này là ...
Trả lời:
Đáp án đúng: B
Trong học máy, việc chia tập dữ liệu thành các tập con là một bước quan trọng để đánh giá và lựa chọn mô hình phù hợp.
- **Tập huấn luyện (training set):** Được sử dụng để huấn luyện mô hình, tức là để mô hình học các mối quan hệ trong dữ liệu.
- **Tập kiểm tra (test set):** Được sử dụng để đánh giá hiệu năng của mô hình sau khi đã huấn luyện. Tập này giúp ước lượng khả năng tổng quát hóa của mô hình trên dữ liệu mới, chưa từng thấy.
- **Tập xác nhận (validation set):** Được sử dụng để tinh chỉnh các siêu tham số (hyperparameters) của mô hình trong quá trình huấn luyện. Việc này giúp tối ưu hóa mô hình để đạt hiệu năng tốt nhất trên tập kiểm tra.
Vì vậy, đáp án đúng là b. tập kiểm tra, tập huấn luyện và tập xác nhận. Các đáp án khác chỉ liệt kê một phần của quá trình này và không đầy đủ.
Ví dụ:
Khi xây dựng một mô hình dự đoán giá nhà, chúng ta có thể chia dữ liệu thành:
- 70% dữ liệu cho tập huấn luyện.
- 15% dữ liệu cho tập xác nhận.
- 15% dữ liệu cho tập kiểm tra.
Câu hỏi liên quan

FORM.08: Bộ 130+ Biểu Mẫu Thống Kê Trong Doanh Nghiệp

FORM.07: Bộ 125+ Biểu Mẫu Báo Cáo Trong Doanh Nghiệp

FORM.06: Bộ 320+ Biểu Mẫu Hành Chính Thông Dụng

FORM.05: Bộ 330+ Biểu Mẫu Thuế - Kê Khai Thuế Mới Nhất

FORM.04: Bộ 240+ Biểu Mẫu Chứng Từ Kế Toán Thông Dụng
