JavaScript is required

Phát biểu nào đúng về Phương pháp phân tích thành phần chính (Principal Component Analysis-PCA: 

A.
Cho N vector dữ liệu k-chiều, tìm c (<= k) vector trực giao tốt nhất để trình diễn dữ liệu. Tập dữ liệu gốc được rút gọn thành N vector dữ liệu c chiều: c thành phần chính (chiều được rút gọn). Mỗi vector dữ liệu là tổ hợp tuyến tính của các vector thành phần chính.
B.
Cho N vector dữ liệu k-chiều, tìm c (<= k) vector đại diện để trình diễn dữ liệu. Tập dữ liệu gốc được rút gọn thành N vector dữ liệu c chiều: c thành phần chính (chiều được rút gọn). Mỗi vector dữ liệu là tổ hợp tuyến tính của các vector thành phần chính.
C.
Cho N vector dữ liệu k-chiều, tìm c (<= k) vector trực giao tốt nhất để trình diễn dữ liệu. Tập dữ liệu gốc được rút gọn thành N vector dữ liệu k chiều: k thành phần chính (chiều được rút gọn). Mỗi vector dữ liệu là tổ hợp tuyến tính của các vector thành phần chính.
D.
Cho N vector dữ liệu k-chiều, tìm c (<= k) vector để trình diễn dữ liệu. Tập dữ liệu gốc được rút gọn thành 1 vector dữ liệu c chiều: c thành phần chính (chiều được rút gọn). Mỗi vector dữ liệu là tổ hợp tuyến tính của các vector thành phần chính.
Trả lời:

Đáp án đúng: A


PCA (Principal Component Analysis) là một phương pháp giảm chiều dữ liệu. Cho N vector dữ liệu k-chiều, PCA tìm c (<= k) vector trực giao tốt nhất (các thành phần chính) để biểu diễn dữ liệu. Khi đó, tập dữ liệu gốc được rút gọn thành N vector dữ liệu c chiều, tức là mỗi vector ban đầu được biểu diễn bởi c thành phần chính. Mỗi vector dữ liệu mới (c chiều) là tổ hợp tuyến tính của các vector thành phần chính. Các vector thành phần chính này được chọn sao cho chúng nắm bắt được phương sai lớn nhất của dữ liệu. * **Phương án a** mô tả chính xác các đặc điểm này. * **Phương án b** sai vì sử dụng cụm từ "vector đại diện" thay vì "vector trực giao tốt nhất". * **Phương án c** sai vì tập dữ liệu gốc được rút gọn thành N vector dữ liệu *c* chiều chứ không phải *k* chiều. * **Phương án d** sai vì tập dữ liệu gốc được rút gọn thành *N* vector dữ liệu *c* chiều, không phải *1* vector dữ liệu *c* chiều.

Câu hỏi liên quan