JavaScript is required

Thuật toán phân cụm nào sau đây không cần biết trước số cụm?

A.

K-mean

B.

Agnes

C.

Fuzzy C-mean

D.

DBSCAN

Trả lời:

Đáp án đúng: B


K-mean: Yêu cầu xác định trước số lượng cụm (K). Thuật toán này lặp đi lặp lại việc gán các điểm dữ liệu cho cụm gần nhất và cập nhật tâm cụm cho đến khi đạt được sự hội tụ.

Agnes (Agglomerative Nesting): Là một thuật toán phân cụm phân cấp bottom-up. Mặc dù có thể xác định số lượng cụm mong muốn sau khi thuật toán hoàn thành (dựa trên dendrogram), nhưng bản thân thuật toán không yêu cầu phải biết trước số cụm. Nó bắt đầu với mỗi điểm dữ liệu là một cụm riêng biệt và hợp nhất các cụm gần nhất cho đến khi tất cả các điểm thuộc về một cụm duy nhất.

Fuzzy C-mean: Tương tự như K-mean, Fuzzy C-mean cũng yêu cầu xác định trước số lượng cụm (C).

DBSCAN (Density-Based Spatial Clustering of Applications with Noise): Là một thuật toán phân cụm dựa trên mật độ. Nó nhóm các điểm dữ liệu gần nhau và đánh dấu các điểm nằm một mình trong các vùng có mật độ thấp là nhiễu. DBSCAN không yêu cầu biết trước số lượng cụm, mà tự động xác định số lượng cụm dựa trên các tham số như bán kính lân cận (epsilon) và số lượng điểm tối thiểu trong một lân cận (minPts).

Vậy, thuật toán phân cụm không cần biết trước số cụm là DBSCAN.

Câu hỏi liên quan