Thuật toán phân cụm k-mean dừng khi:
Trả lời:
Đáp án đúng: A
Thuật toán k-means là một thuật toán phân cụm lặp đi lặp lại. Nó bắt đầu bằng việc khởi tạo k tâm cụm ngẫu nhiên. Sau đó, mỗi điểm dữ liệu được gán cho tâm cụm gần nhất. Sau khi tất cả các điểm được gán, các tâm cụm được tính toán lại bằng cách lấy trung bình của tất cả các điểm trong mỗi cụm. Quá trình này lặp lại cho đến khi không có sự thay đổi đáng kể nào trong việc gán các điểm vào các cụm, tức là thuật toán hội tụ. Điều này xảy ra khi không thể gán lại bất kỳ điểm nào vào một cụm khác mà vẫn làm giảm tổng khoảng cách bình phương từ các điểm đến tâm cụm của chúng.
Phương án A chính xác vì nó mô tả chính xác điều kiện dừng của thuật toán k-means: thuật toán dừng khi không còn điểm nào có thể được gán lại vào một cụm khác mà làm giảm tổng khoảng cách bình phương.
Phương án B không đúng vì số cụm (k) là một tham số đầu vào của thuật toán, chứ không phải là điều kiện dừng. Thuật toán dừng khi đạt được sự hội tụ, không nhất thiết phải sau một số lượng vòng lặp nhất định.
Phương án C không đúng vì điều kiện dừng của thuật toán được xác định bởi sự hội tụ, chứ không phải bởi yêu cầu chủ quan của người dùng. Người dùng có thể đặt số lượng vòng lặp tối đa, nhưng điều kiện dừng chính vẫn là sự hội tụ.
Phương án D không hoàn toàn chính xác. Mặc dù tất cả các phần tử đều được gán vào k cụm trong mỗi vòng lặp, nhưng điều này không có nghĩa là thuật toán đã dừng. Thuật toán chỉ dừng khi việc gán này không còn thay đổi nữa, tức là đạt đến sự hội tụ.