JavaScript is required

Khi sử dụng thuật toán Quilan để xây dựng cây quyết định. Tại mỗi bước của thuật toán ta chọn thuộc tính nào trong số các thuộc tính còn lại để làm gốc phân nhánh? 

A.
Thuộc tính có độ phân biệt cao nhất
B.
Thuộc tính có độ phân biệt thấp nhất
C.
Thuộc tính có Entropy cao nhất
D.
Chọn ngẫu nhiên
Trả lời:

Đáp án đúng: A


Thuật toán ID3 và C4.5 (là tiền thân của Quilan) sử dụng Information Gain (độ lợi thông tin) để chọn thuộc tính tốt nhất để phân nhánh tại mỗi bước. Information Gain dựa trên Entropy. Thuộc tính nào có Information Gain cao nhất (tức là giảm Entropy nhiều nhất) sẽ được chọn. Như vậy, ta chọn thuộc tính có độ phân biệt cao nhất.

Câu hỏi liên quan