Đáp án đúng: A
Để tính P(Play Ball = No), ta cần đếm số lượng trường hợp Play Ball là 'No' và chia cho tổng số trường hợp. Giả sử bảng dữ liệu có tổng cộng 3 trường hợp và trong đó có 1 trường hợp Play Ball là 'No', vậy P(Play Ball = No) = 1/3.
Câu hỏi liên quan
Câu hỏi yêu cầu tìm kết luận sai trong các kết luận đã cho.
- Phương án A: Thuật toán Quinlan (ID3, C4.5) sử dụng Information Gain (độ lợi thông tin) hoặc Gain Ratio (tỷ lệ lợi ích) để chọn thuộc tính làm gốc cho cây quyết định, chứ không phải chọn ngẫu nhiên. Vì vậy, phương án A sai.
- Phương án B: Entropy đo độ không chắc chắn hoặc độ hỗn loạn. Entropy cao nhất khi các lớp phân bố đều, và thấp nhất khi một lớp chiếm ưu thế. Vì vậy, độ phân biệt (độ lộn xộn) cao nhất thì Entropy cao nhất chứ không phải thấp nhất. Phương án B sai.
- Phương án C: Thuật toán học khái niệm CLS không chọn ngẫu nhiên một thuộc tính để làm gốc cây quyết định. Phương án C sai.
- Phương án D: Entropy là một số biến thiên trong đoạn [0, 1]. Phương án D đúng.
Như vậy các phương án A, B, C đều sai. Tuy nhiên, đề bài chỉ yêu cầu chọn một kết luận sai nhất. Phương án B thể hiện sai lệch lớn nhất về bản chất của entropy, còn phương án A và C sai về thuật toán cụ thể. Do đó, phương án B là kết luận sai nhất.
Trong thuật toán CLS (Concept Learning System) để xây dựng cây quyết định, mục tiêu là tìm ra thuộc tính tốt nhất để phân chia dữ liệu tại mỗi nút của cây. Thuộc tính "tốt nhất" thường là thuộc tính có khả năng phân biệt các ví dụ thuộc các lớp khác nhau một cách hiệu quả nhất. Điều này có nghĩa là chọn thuộc tính có độ phân biệt cao nhất, tức là thuộc tính mà khi chia dữ liệu theo các giá trị của nó, mỗi nhánh con sẽ chứa các ví dụ thuộc cùng một lớp hoặc có độ thuần khiết cao. Chọn thuộc tính ngẫu nhiên hoặc thuộc tính có độ phân biệt thấp sẽ không đảm bảo xây dựng được một cây quyết định hiệu quả trong việc phân loại dữ liệu. Entropy cao thường liên quan đến sự không chắc chắn và việc chọn thuộc tính có Entropy cao nhất có thể không phải lúc nào cũng dẫn đến kết quả tốt nhất trong CLS.

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.