Cho các điểm A(1, 1), B(2, 1), C(4, 3), D(5, 4), E( 1, 0). Sử dụng thuật toán phân cụm k-mean để chia 5 điểm vào 2 cụm. Kết quả phân cụm là:
Trả lời:
Đáp án đúng: A
Thuật toán k-means là một thuật toán phân cụm dựa trên khoảng cách. Để giải bài toán này, chúng ta cần thực hiện các bước sau:
1. **Khởi tạo**: Chọn k tâm cụm ban đầu (trong trường hợp này, k=2). Vì không có thông tin về tâm cụm ban đầu, ta giả sử chọn ngẫu nhiên A(1, 1) và D(5, 4) làm tâm cụm ban đầu.
2. **Gán điểm vào cụm**: Tính khoảng cách Euclidean từ mỗi điểm đến các tâm cụm. Điểm nào gần tâm cụm nào hơn thì gán vào cụm đó.
* Khoảng cách từ B(2, 1) đến A(1, 1) là √((2-1)² + (1-1)²) = 1
* Khoảng cách từ B(2, 1) đến D(5, 4) là √((2-5)² + (1-4)²) = √(9+9) = √18 ≈ 4.24
=> B thuộc cụm C1={A}
* Khoảng cách từ C(4, 3) đến A(1, 1) là √((4-1)² + (3-1)²) = √(9+4) = √13 ≈ 3.61
* Khoảng cách từ C(4, 3) đến D(5, 4) là √((4-5)² + (3-4)²) = √(1+1) = √2 ≈ 1.41
=> C thuộc cụm C2={D}
* Khoảng cách từ E(1, 0) đến A(1, 1) là √((1-1)² + (0-1)²) = 1
* Khoảng cách từ E(1, 0) đến D(5, 4) là √((1-5)² + (0-4)²) = √(16+16) = √32 ≈ 5.66
=> E thuộc cụm C1={A, B}
Vậy ta có C1 = {A, B, E}, C2 = {C, D}.
3. **Tính lại tâm cụm**: Tính trung bình cộng tọa độ của các điểm trong mỗi cụm để cập nhật tâm cụm mới.
Với cách phân tích như trên, đáp án đúng là C1={A, B, E} ; C2={C, D}.
Câu hỏi liên quan

FORM.08: Bộ 130+ Biểu Mẫu Thống Kê Trong Doanh Nghiệp

FORM.07: Bộ 125+ Biểu Mẫu Báo Cáo Trong Doanh Nghiệp

FORM.06: Bộ 320+ Biểu Mẫu Hành Chính Thông Dụng

FORM.05: Bộ 330+ Biểu Mẫu Thuế - Kê Khai Thuế Mới Nhất

FORM.04: Bộ 240+ Biểu Mẫu Chứng Từ Kế Toán Thông Dụng
