JavaScript is required

Cho các điểm A(1, 1), B(2, 1), C(4, 3), D(5, 4), E(1, 0). Sử dụng thuật toán phân cụm k-mean để chia 5 điểm vào 2 cụm. Kết quả phân cụm là:

A.

C1 = {A, B, E}; C2 = {C, D}

B.

C1 = {A, C, E}; C2 = {B, D}

C.

C1 = {A, B, C}; C2 = {D, E}

D.

C1 = {A, B, D}; C2 = {C, E}

Trả lời:

Đáp án đúng: A


Thuật toán k-means là một thuật toán phân cụm, mục tiêu là chia n điểm dữ liệu thành k cụm, sao cho mỗi điểm thuộc về cụm gần nhất (được định nghĩa bằng khoảng cách, thường là khoảng cách Euclidean) với tâm của cụm đó. Để giải bài toán này một cách chính xác, cần thực hiện lặp đi lặp lại các bước sau: 1. **Khởi tạo**: Chọn ngẫu nhiên k tâm cụm ban đầu. Trong bài này, k = 2. 2. **Gán điểm**: Gán mỗi điểm dữ liệu vào cụm có tâm gần nó nhất. 3. **Cập nhật tâm**: Tính toán lại tâm của mỗi cụm bằng cách lấy trung bình cộng của tất cả các điểm trong cụm đó. 4. **Lặp lại**: Lặp lại bước 2 và 3 cho đến khi các cụm không thay đổi (hoặc thay đổi rất ít). Vì việc thực hiện thuật toán k-means bằng tay khá phức tạp và tốn thời gian (đặc biệt là việc tính toán khoảng cách Euclidean và cập nhật tâm cụm sau mỗi vòng lặp), ta cần xem xét các phương án một cách hợp lý nhất. Ta nhận thấy rằng các điểm A(1, 1), B(2, 1), E(1, 0) có tọa độ gần nhau hơn so với C(4, 3), D(5, 4). Do đó, một cách phân cụm hợp lý là C1 = {A, B, E} và C2 = {C, D}. Các phương án khác không hợp lý bằng, ví dụ: Phương án B đưa C vào cùng cụm với A và E, trong khi B và D lại ở cùng một cụm, điều này không phù hợp với vị trí tương đối của các điểm. Tương tự với các phương án C và D.

Câu hỏi liên quan