JavaScript is required

Trong Orange, đối với thuật toán K-mean, tham số đầu vào nào sau đây dùng để kiểm soát trong trường hợp dữ liệu hội tụ chậm hoặc không hội tụ:

A.

Số lượng cụm (number of cluster)

B.

Khởi tạo các phần tử đại diện của cụm (Initialization)

C.

Số lần chạy (re-runs)

D.

Số lần lặp tối đa (maximum iterations)

Trả lời:

Đáp án đúng: A


Thuật toán K-means là một thuật toán lặp đi lặp lại để phân cụm dữ liệu. Trong quá trình lặp, các điểm dữ liệu được gán lại vào các cụm gần nhất, và các trung tâm cụm được cập nhật. Nếu dữ liệu hội tụ chậm hoặc không hội tụ, điều đó có nghĩa là thuật toán có thể lặp đi lặp lại mãi mà không tìm ra được một sự phân cụm ổn định. Lúc này, tham số "Số lần lặp tối đa (maximum iterations)" được sử dụng để giới hạn số lần lặp của thuật toán. Nếu thuật toán đạt đến số lần lặp tối đa mà vẫn chưa hội tụ, nó sẽ dừng lại, tránh việc lặp vô hạn. Các tham số khác không trực tiếp giải quyết vấn đề hội tụ chậm:

  • Số lượng cụm (number of cluster): Xác định số lượng cụm mà dữ liệu sẽ được chia thành.
  • Khởi tạo các phần tử đại diện của cụm (Initialization): Ảnh hưởng đến vị trí ban đầu của các trung tâm cụm, nhưng không trực tiếp kiểm soát việc lặp lại.
  • Số lần chạy (re-runs): Thực hiện thuật toán nhiều lần với các khởi tạo khác nhau và chọn kết quả tốt nhất, giúp cải thiện kết quả nhưng không trực tiếp giải quyết vấn đề hội tụ chậm trong mỗi lần chạy.

Câu hỏi liên quan