Khi sử dụng thuật toán CLS (Concept Learning System) để xây dựng cây quyết định. Tại mỗi bước của thuật toán ta chọn thuộc tính nào trong số các thuộc tính còn lại để làm gốc phân nhánh?
Đáp án đúng: A
Trong thuật toán CLS (Concept Learning System) để xây dựng cây quyết định, mục tiêu là tìm ra thuộc tính tốt nhất để phân chia dữ liệu tại mỗi nút của cây. Thuộc tính "tốt nhất" thường là thuộc tính có khả năng phân biệt các ví dụ thuộc các lớp khác nhau một cách hiệu quả nhất. Điều này có nghĩa là chọn thuộc tính có độ phân biệt cao nhất, tức là thuộc tính mà khi chia dữ liệu theo các giá trị của nó, mỗi nhánh con sẽ chứa các ví dụ thuộc cùng một lớp hoặc có độ thuần khiết cao. Chọn thuộc tính ngẫu nhiên hoặc thuộc tính có độ phân biệt thấp sẽ không đảm bảo xây dựng được một cây quyết định hiệu quả trong việc phân loại dữ liệu. Entropy cao thường liên quan đến sự không chắc chắn và việc chọn thuộc tính có Entropy cao nhất có thể không phải lúc nào cũng dẫn đến kết quả tốt nhất trong CLS.





