Bộ xác thực là a phần của tập dữ liệu gốc, được xử lý trước, chủ yếu được sử dụng để ...
Trả lời:
Đáp án đúng: C
Bộ xác thực (validation set) là một phần của tập dữ liệu được tách ra từ tập dữ liệu gốc, sau khi đã có tập huấn luyện (training set). Tập xác thực này được sử dụng để đánh giá khách quan mô hình trong quá trình huấn luyện và điều chỉnh các siêu tham số (hyperparameters) của mô hình. Việc sử dụng tập xác thực giúp ngăn chặn tình trạng "quá khớp" (overfitting), khi mô hình học quá kỹ dữ liệu huấn luyện và không còn khả năng tổng quát hóa tốt cho dữ liệu mới.
Phương án A không đúng vì bộ xác thực không dùng để "ban đầu phù hợp với mô hình". Việc "phù hợp" ban đầu thường được thực hiện trên tập huấn luyện.
Phương án B không đúng vì đây là mục đích của tập kiểm tra (test set), không phải tập xác thực. Tập kiểm tra được dùng để đánh giá hiệu năng cuối cùng của mô hình *sau* khi đã hoàn thành quá trình huấn luyện và điều chỉnh trên tập huấn luyện và tập xác thực.
Phương án C đúng vì nó mô tả chính xác vai trò của bộ xác thực: cung cấp đánh giá khách quan trong quá trình huấn luyện và cho phép điều chỉnh các siêu tham số để cải thiện hiệu năng của mô hình.
Phương án D không liên quan đến mục đích sử dụng của bộ xác thực. Việc "giữ cân bằng giữa dữ liệu trong các tập hợp con khác nhau" thường được thực hiện trong quá trình chuẩn bị dữ liệu (ví dụ: sử dụng các kỹ thuật như stratified sampling).
Câu hỏi liên quan

FORM.08: Bộ 130+ Biểu Mẫu Thống Kê Trong Doanh Nghiệp

FORM.07: Bộ 125+ Biểu Mẫu Báo Cáo Trong Doanh Nghiệp

FORM.06: Bộ 320+ Biểu Mẫu Hành Chính Thông Dụng

FORM.05: Bộ 330+ Biểu Mẫu Thuế - Kê Khai Thuế Mới Nhất

FORM.04: Bộ 240+ Biểu Mẫu Chứng Từ Kế Toán Thông Dụng
