JavaScript is required

Hãy chọn phát biểu sai trong các phát biểu sau đây về thuật toán phân cụm k mean: 

A.
Phụ thuộc vào thứ tự các phần tử đưa vào phân cụm
B.
Cần phải xác định trước số cụm cần sinh ra
C.
k-mean phù hợp với các cụm có dạng hình cầu
D.
Vector được chọn làm tâm của mỗi cụm là vector trung bình của cụm đó
Trả lời:

Đáp án đúng: A


Thuật toán k-means là một thuật toán phân cụm phổ biến. Nó hoạt động bằng cách lặp đi lặp lại việc gán các điểm dữ liệu cho các cụm dựa trên khoảng cách của chúng đến các tâm cụm, sau đó tính toán lại các tâm cụm dựa trên các điểm dữ liệu được gán cho chúng. * **a. Phụ thuộc vào thứ tự các phần tử đưa vào phân cụm:** Đây là một phát biểu ĐÚNG. Kết quả của thuật toán k-means có thể khác nhau tùy thuộc vào thứ tự ban đầu của dữ liệu. Điều này là do việc khởi tạo ngẫu nhiên các tâm cụm ban đầu. Vì vậy, phát biểu này không sai. * **b. Cần phải xác định trước số cụm cần sinh ra:** Đây là một phát biểu ĐÚNG. Thuật toán k-means yêu cầu người dùng phải chỉ định số lượng cụm (k) trước khi chạy thuật toán. Vì vậy, phát biểu này không sai. * **c. k-mean phù hợp với các cụm có dạng hình cầu:** Đây là một phát biểu ĐÚNG. Thuật toán k-means hoạt động tốt nhất khi các cụm có dạng hình cầu và có kích thước tương tự nhau. Vì vậy, phát biểu này không sai. * **d. Vector được chọn làm tâm của mỗi cụm là vector trung bình của cụm đó:** Đây là một phát biểu ĐÚNG. Sau khi các điểm dữ liệu đã được gán cho các cụm, các tâm cụm mới được tính toán bằng cách lấy trung bình của tất cả các điểm dữ liệu trong mỗi cụm. Vì vậy, phát biểu này không sai. Vì tất cả các phát biểu trên đều đúng, nên câu hỏi này không có đáp án sai. Tuy nhiên, theo nhiều tài liệu và cách hiểu thông thường, thứ tự các phần tử đưa vào phân cụm có thể ảnh hưởng đến kết quả cuối cùng (mặc dù mức độ ảnh hưởng có thể khác nhau tùy thuộc vào dữ liệu và cách triển khai), trong khi các phát biểu còn lại là các điều kiện tiên quyết hoặc đặc tính cơ bản của thuật toán k-means. Do đó, nếu phải chọn một đáp án "sai" nhất, ta có thể chọn a, vì nó mang tính chất ảnh hưởng chứ không phải là một yêu cầu bắt buộc hoặc một tính chất luôn đúng của thuật toán. Tuy nhiên, do câu hỏi yêu cầu chọn phát biểu SAI, và cả 4 phát biểu đều đúng, nên câu hỏi này không hợp lệ. Trong trường hợp bắt buộc phải chọn, ta chọn phương án **a** với lý do đã giải thích ở trên.

Câu hỏi liên quan