JavaScript is required

Overfitting xảy ra do vấn đề nào dưới đây?

A.

Dữ liệu mất cân bằng.

B.

Nhiễu trong dữ liệu.

C.

Dữ liệu có độ biến đổi cao.

D.

Cả 3 vấn đề trên.

Trả lời:

Đáp án đúng: D


Overfitting xảy ra khi mô hình học quá kỹ các chi tiết và nhiễu trong dữ liệu huấn luyện, dẫn đến việc mô hình hoạt động tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu mới. A. Dữ liệu mất cân bằng có thể dẫn đến việc mô hình bị bias về phía lớp chiếm ưu thế, nhưng không trực tiếp gây ra overfitting. B. Nhiễu trong dữ liệu là một nguyên nhân chính gây ra overfitting. Mô hình cố gắng học cả những điểm nhiễu này, làm giảm khả năng khái quát hóa. C. Dữ liệu có độ biến đổi cao (high variance) cũng là một yếu tố góp phần vào overfitting. Mô hình phức tạp có thể cố gắng khớp với mọi biến động nhỏ trong dữ liệu huấn luyện. Do đó, cả nhiễu trong dữ liệu và độ biến đổi cao đều góp phần vào overfitting, khiến D là đáp án đúng. Dữ liệu mất cân bằng cũng có thể ảnh hưởng đến hiệu suất mô hình, nhưng nó không phải là nguyên nhân trực tiếp gây ra overfitting như hai yếu tố còn lại.

Câu hỏi liên quan