Trong Orange, đối với thuật toán phân cụm phân cấp (HAC) để có được kết quả phân cụm với số lượng cụm cụ thể ta cần làm gì?
Trả lời:
Đáp án đúng: C
Câu hỏi liên quan đến việc sử dụng thuật toán phân cụm phân cấp (HAC) trong phần mềm Orange và cách xác định số lượng cụm mong muốn.
- **Phương án A:** Chọn số lượng cụm k trên hộp thoại. Trong Orange, không có hộp thoại riêng để nhập số lượng cụm k mong muốn trước khi chạy thuật toán HAC.
- **Phương án B:** Chọn phương pháp tính khoảng cách trước khi chọn thuật toán. Việc chọn phương pháp tính khoảng cách (ví dụ: Euclidean, Manhattan) là một bước quan trọng trong HAC, nhưng nó không trực tiếp xác định số lượng cụm cuối cùng.
- **Phương án C:** Chọn đường cắt phù hợp trên cây phân cấp kết quả. Trong HAC, một cây phân cấp (dendrogram) được tạo ra, thể hiện cấu trúc phân cụm ở các mức độ khác nhau. Để có được một số lượng cụm cụ thể, ta cần "cắt" cây này ở một độ cao phù hợp. Việc này tương ứng với việc chọn một ngưỡng khoảng cách, từ đó các nhánh của cây bị cắt và tạo thành các cụm riêng biệt. Đây là phương pháp phổ biến để điều chỉnh số lượng cụm trong HAC.
- **Phương án D:** Không cần làm gì cả. Điều này không đúng, vì HAC tạo ra một cây phân cấp, và việc lựa chọn số lượng cụm cần một bước can thiệp để xác định mức cắt của cây.
Do đó, phương án C là đáp án đúng nhất.