JavaScript is required

Phát biểu nào sau đây không đúng đối với thuật toán phân cụm K trung bình? 

A.
Biết nhãn của từng điểm dữ liệu
B.
Cụm là tập hợp các điểm dữ liệu có vector đặc trưng gần
C.
Khoảng cách Euclid được sử dụng phổ biến nhất để xác định khoảng cách giữa các vector đặc trưng với tâm của mỗi cụm
D.
Câu a và b sai nhau
Trả lời:

Đáp án đúng: A


Thuật toán K-means là một thuật toán phân cụm dữ liệu, trong đó mục tiêu là chia n điểm dữ liệu thành k cụm, sao cho mỗi điểm thuộc về cụm gần nhất (được định nghĩa bởi khoảng cách). Phát biểu không đúng trong các lựa chọn là: a. Biết nhãn của từng điểm dữ liệu. Vì K-means là thuật toán học không giám sát (unsupervised learning), nên không yêu cầu phải biết trước nhãn của dữ liệu. Các phát biểu còn lại đều đúng: - b. Cụm là tập hợp các điểm dữ liệu có vector đặc trưng gần nhau (đúng theo định nghĩa của phân cụm). - c. Khoảng cách Euclid thường được sử dụng để xác định khoảng cách giữa các vector đặc trưng với tâm của mỗi cụm (đây là một phương pháp phổ biến).

Câu hỏi liên quan