JavaScript is required

Trong học máy, "cross-validation" là gì?

A.

Một kỹ thuật chia tập dữ liệu thành các tập con để đánh giá hiệu suất của mô hình.

B.

Một phương pháp để chọn lọc các đặc trưng quan trọng từ dữ liệu.

C.

Một phương pháp để xử lý dữ liệu bị thiếu.

D.

Một phương pháp để giảm kích thước của dữ liệu đầu vào.

Trả lời:

Đáp án đúng: A


Cross-validation (kiểm định chéo) là một kỹ thuật trong học máy được sử dụng để đánh giá hiệu suất của một mô hình học máy trên một tập dữ liệu. Quá trình này bao gồm việc chia tập dữ liệu ban đầu thành các tập con (folds), sử dụng một số tập con để huấn luyện mô hình và tập con còn lại để kiểm tra (validation) hiệu suất của mô hình. Kết quả từ các lần kiểm tra khác nhau này sau đó được tổng hợp để đưa ra một ước lượng tổng quan về hiệu suất của mô hình. Vì vậy, đáp án A là chính xác. Các đáp án còn lại mô tả các kỹ thuật khác nhau trong học máy, không phải cross-validation. B. Chọn lọc đặc trưng (feature selection) là quá trình chọn ra các đặc trưng quan trọng nhất từ dữ liệu để huấn luyện mô hình. C. Xử lý dữ liệu bị thiếu (missing data imputation) là quá trình điền vào các giá trị bị thiếu trong dữ liệu. D. Giảm kích thước dữ liệu (dimensionality reduction) là quá trình giảm số lượng biến hoặc đặc trưng trong dữ liệu.

Câu hỏi liên quan