Trong Orange, biến có kiểu dữ liệu categorical là để chỉ các thuộc tính:
Đáp án đúng: B
Trong Orange, kiểu dữ liệu categorical dùng để biểu diễn các thuộc tính rời rạc. Các thuộc tính này có thể được chia thành các nhóm hoặc các loại riêng biệt, ví dụ như màu sắc (đỏ, xanh, vàng), giới tính (nam, nữ), hoặc các trạng thái (bật, tắt). Do đó, đáp án chính xác là B.
Câu hỏi liên quan
- Precision: Tỷ lệ các nhãn dự đoán đúng trên tổng số nhãn được dự đoán.
- Recall: Tỷ lệ các nhãn dự đoán đúng trên tổng số nhãn thực tế.
- F1-score: Trung bình điều hòa của Precision và Recall, là một chỉ số tổng hợp tốt.
- Accuracy: Tỷ lệ các mẫu được phân loại đúng trên tổng số mẫu (thường không phù hợp cho đa nhãn).
* Phương án A sai: a[i,i] thể hiện số lượng mẫu i được phân loại đúng vào mẫu i.
* Phương án B đúng: a[i, j] (với i khác j) thể hiện số lượng mẫu i bị phân loại nhầm vào mẫu j.
* Phương án C sai: tương tự A, a[j,j] thể hiện số lượng mẫu j được phân loại đúng vào mẫu j.
* Phương án D sai: a[j, i] thể hiện số lượng mẫu j bị phân loại nhầm vào mẫu i (ngược lại với câu hỏi).
* A. Chọn mẫu ngẫu nhiên (Random sampling): Đây là một kỹ thuật lấy mẫu, bản thân nó không trực tiếp giải quyết overfitting. Tuy nhiên, việc tạo ra các tập dữ liệu khác nhau từ việc lấy mẫu ngẫu nhiên có thể được sử dụng trong các kỹ thuật khác như cross-validation.
* B. Đánh giá chéo (k-fold cross validation): Đây là một phương pháp mạnh mẽ để đánh giá hiệu năng của mô hình một cách khách quan. Nó chia dữ liệu thành k phần, huấn luyện mô hình trên k-1 phần và kiểm tra trên phần còn lại. Quá trình này lặp lại k lần, mỗi lần một phần khác nhau được dùng làm tập kiểm tra. Kết quả là, ta có được ước lượng khách quan về hiệu năng của mô hình trên dữ liệu mới, giúp phát hiện và giảm thiểu overfitting.
* C. Hold-out: Tương tự như cross-validation, hold-out chia dữ liệu thành tập huấn luyện và tập kiểm tra. Mô hình được huấn luyện trên tập huấn luyện và đánh giá trên tập kiểm tra. Mặc dù đơn giản, hold-out có thể không đủ tin cậy nếu tập kiểm tra không đủ lớn hoặc không đại diện cho toàn bộ dữ liệu.
* D. Huấn luyện và kiểm thử trên cùng tập dữ liệu: Đây là cách làm tệ nhất vì nó không thể phát hiện overfitting. Mô hình sẽ hoạt động rất tốt trên dữ liệu nó đã thấy, nhưng rất có thể hoạt động kém trên dữ liệu mới.
Vậy, đáp án đúng là B. Đánh giá chéo (k-fold cross validation) là phương pháp tốt nhất để khắc phục tình trạng overfitting vì nó cho phép đánh giá hiệu năng của mô hình một cách khách quan trên dữ liệu chưa từng thấy.
Câu hỏi này liên quan đến các khái niệm cơ bản trong thống kê y học và đánh giá xét nghiệm chẩn đoán. Cụ thể, nó đề cập đến sai sót có thể xảy ra khi sử dụng một xét nghiệm để chẩn đoán bệnh.
Phân tích các lựa chọn:
- A. Tỷ lệ bỏ sót (False Negative Rate): Đây là tỷ lệ những người thực sự mắc bệnh nhưng xét nghiệm lại cho kết quả âm tính (không phát hiện ra bệnh). Trong trường hợp này, người đó thực sự bị lao nhưng xét nghiệm lại không phát hiện ra.
- B. Độ nhạy (Sensitivity): Độ nhạy của một xét nghiệm là khả năng xét nghiệm đó xác định chính xác những người thực sự mắc bệnh. Nó không mô tả trường hợp xét nghiệm dương tính ở người không bệnh.
- C. Tỷ lệ báo động nhầm (False Positive Rate): Đây là tỷ lệ những người thực sự không mắc bệnh nhưng xét nghiệm lại cho kết quả dương tính (báo là có bệnh). Đây chính xác là tình huống được mô tả trong câu hỏi.
- D. Độ lỗi: Đây là một thuật ngữ chung chung, không đặc tả loại sai sót cụ thể nào trong xét nghiệm.
Kết luận:
Trường hợp một người không mắc bệnh lao nhưng xét nghiệm lại cho kết quả dương tính (bị chẩn đoán là có bệnh) được gọi là tỷ lệ báo động nhầm (False Positive Rate). Vì vậy, đáp án đúng là C.

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.