JavaScript is required

Trong học máy, để giảm số chiều của dữ liệu mà vẫn giữ được các đặc trưng quan trọng, ta thường sử dụng phương pháp nào?

A.

Principal Component Analysis (PCA)

B.

K-Means Clustering

C.

Support Vector Machine (SVM)

D.

Decision Trees

Trả lời:

Đáp án đúng: A


Phương pháp giảm số chiều dữ liệu nhằm mục đích giảm số lượng biến đầu vào trong một tập dữ liệu trong khi vẫn giữ lại thông tin quan trọng. Trong các lựa chọn được đưa ra:

- PCA (Principal Component Analysis): Là một kỹ thuật giảm chiều phổ biến. Nó tìm các thành phần chính, là các hướng mà dữ liệu có phương sai lớn nhất, và sử dụng chúng để biểu diễn dữ liệu trong một không gian có số chiều thấp hơn. - K-Means Clustering: Là một thuật toán phân cụm, không phải là một phương pháp giảm chiều. - SVM (Support Vector Machine): Là một thuật toán phân loại và hồi quy, không trực tiếp liên quan đến giảm chiều. - Decision Trees: Là một mô hình cây quyết định, có thể được sử dụng cho phân loại hoặc hồi quy, nhưng không phải là một phương pháp giảm chiều chính thống.

Do đó, PCA là phương pháp phù hợp nhất để giảm số chiều của dữ liệu trong khi vẫn giữ được các đặc trưng quan trọng.

Câu hỏi liên quan