JavaScript is required

Đối với thuật toán K-Means, việc chọn số lượng cụm (clusters) thích hợp được gọi là gì?

A.

Elbow method

B.

Gradient Descent

C.

Confusion Matrix

D.

Silhouette Analysis

Trả lời:

Đáp án đúng: A


Trong thuật toán K-Means, việc chọn số lượng cụm (clusters) thích hợp là một bước quan trọng. Có nhiều phương pháp để xác định số lượng cụm tối ưu, trong đó:

- Elbow method (Phương pháp khuỷu tay): Đây là một phương pháp phổ biến để ước lượng số lượng cụm tối ưu bằng cách vẽ đồ thị sự biến thiên của tổng bình phương khoảng cách từ mỗi điểm dữ liệu đến tâm cụm gần nhất (within-cluster sum of squares - WCSS) theo số lượng cụm. Điểm "khuỷu tay" trên đồ thị (nơi sự giảm WCSS bắt đầu chậm lại đáng kể) thường được chọn làm số lượng cụm tối ưu.

- Silhouette Analysis (Phân tích Silhouette): Phương pháp này đánh giá chất lượng phân cụm bằng cách tính toán hệ số silhouette cho mỗi điểm dữ liệu. Hệ số silhouette đo lường mức độ tương đồng của một điểm với cụm của nó so với các cụm khác. Giá trị silhouette gần 1 cho thấy điểm được phân cụm tốt, giá trị gần -1 cho thấy điểm có thể được phân cụm sai, và giá trị gần 0 cho thấy điểm nằm gần ranh giới giữa các cụm.

- Gradient Descent (Độ dốc giảm dần): Đây là một thuật toán tối ưu hóa được sử dụng để tìm giá trị nhỏ nhất của một hàm số, thường được dùng trong huấn luyện mô hình học máy, nhưng không liên quan trực tiếp đến việc chọn số lượng cụm trong K-Means.

- Confusion Matrix (Ma trận nhầm lẫn): Đây là một công cụ đánh giá hiệu suất của mô hình phân loại, không liên quan đến thuật toán phân cụm K-Means.

Như vậy, trong các phương án trên, "Elbow method" và "Silhouette Analysis" là các phương pháp thường được sử dụng để chọn số lượng cụm thích hợp cho thuật toán K-Means. Tuy nhiên, Elbow method được nhắc đến phổ biến hơn trong ngữ cảnh này.

Câu hỏi liên quan