Khẳng định nào đúng?
1 - Tăng số đặc trưng không làm tăng số mẫu huấn luyện.
2 - Tăng đặc trưng không làm ảnh hưởng tới hiệu năng của hệ thống.
3 - Tăng đặc trưng không luôn luôn tăng độ chính xác của phân lớp.
Đáp án đúng: A
Phân tích các khẳng định:
1 - Tăng số đặc trưng *không* làm tăng số mẫu huấn luyện. Đây là khẳng định đúng. Số lượng mẫu huấn luyện là số lượng các bản ghi dữ liệu có sẵn, việc tăng số lượng đặc trưng (số cột thông tin của mỗi bản ghi) không làm thay đổi số lượng bản ghi (số hàng).
2 - Tăng đặc trưng *không* làm ảnh hưởng tới hiệu năng của hệ thống. Đây là khẳng định sai. Việc tăng số lượng đặc trưng có thể ảnh hưởng đến hiệu năng của hệ thống. Nếu tăng quá nhiều đặc trưng không liên quan, có thể gây ra hiện tượng "lời nguyền chiều cao" (curse of dimensionality), làm giảm hiệu năng và độ chính xác của mô hình.
3 - Tăng đặc trưng *không* luôn luôn tăng độ chính xác của phân lớp. Đây là khẳng định đúng. Như đã nói ở trên, việc tăng quá nhiều đặc trưng không liên quan có thể làm giảm độ chính xác của mô hình. Ngoài ra, việc tăng đặc trưng có thể dẫn đến overfitting nếu số lượng mẫu huấn luyện không đủ lớn.
Vậy, các khẳng định đúng là 1 và 3.