Trong học máy, "dimensionality reduction" được sử dụng để làm gì?
Trả lời:
Đáp án đúng: A
Trong học máy, "dimensionality reduction" (giảm chiều dữ liệu) là quá trình giảm số lượng các biến ngẫu nhiên hoặc đặc trưng (features) được xem xét. Mục đích chính là giảm độ phức tạp của mô hình, tránh hiện tượng overfitting (quá khớp), và cải thiện hiệu suất tính toán. Việc giảm số chiều cũng có thể giúp trực quan hóa dữ liệu dễ dàng hơn.
* **Phương án A: Giảm số chiều của dữ liệu để giảm độ phức tạp của mô hình** - Đây là đáp án đúng vì nó thể hiện mục tiêu chính của việc giảm chiều dữ liệu.
* **Phương án B: Tăng số chiều của dữ liệu để cải thiện hiệu suất của mô hình** - Sai. Giảm chiều chứ không phải tăng chiều.
* **Phương án C: Chọn lọc các đặc trưng quan trọng từ dữ liệu ban đầu** - Đúng một phần, vì chọn lọc đặc trưng (feature selection) là một kỹ thuật giảm chiều, nhưng không bao quát hết các phương pháp giảm chiều (ví dụ: PCA biến đổi dữ liệu chứ không chỉ chọn lọc).
* **Phương án D: Tạo ra các đặc trưng mới từ dữ liệu ban đầu** - Đúng một phần, vì một số phương pháp giảm chiều tạo ra đặc trưng mới (ví dụ: PCA), nhưng đây không phải là mục tiêu duy nhất của giảm chiều.
50 câu hỏi 60 phút