Kết quả nào đúng cho đoạn code sau?
X = numpy.array([[3, 89],
[23, 17],
[92, 26],
[34, 28],
[12, 9]])print(numpy.ptp(X))
Đáp án đúng: C
Câu hỏi liên quan
Phân tích các khẳng định:
1 - Tăng số đặc trưng *không* làm tăng số mẫu huấn luyện. Đây là khẳng định đúng. Số lượng mẫu huấn luyện là số lượng các bản ghi dữ liệu có sẵn, việc tăng số lượng đặc trưng (số cột thông tin của mỗi bản ghi) không làm thay đổi số lượng bản ghi (số hàng).
2 - Tăng đặc trưng *không* làm ảnh hưởng tới hiệu năng của hệ thống. Đây là khẳng định sai. Việc tăng số lượng đặc trưng có thể ảnh hưởng đến hiệu năng của hệ thống. Nếu tăng quá nhiều đặc trưng không liên quan, có thể gây ra hiện tượng "lời nguyền chiều cao" (curse of dimensionality), làm giảm hiệu năng và độ chính xác của mô hình.
3 - Tăng đặc trưng *không* luôn luôn tăng độ chính xác của phân lớp. Đây là khẳng định đúng. Như đã nói ở trên, việc tăng quá nhiều đặc trưng không liên quan có thể làm giảm độ chính xác của mô hình. Ngoài ra, việc tăng đặc trưng có thể dẫn đến overfitting nếu số lượng mẫu huấn luyện không đủ lớn.
Vậy, các khẳng định đúng là 1 và 3.
Trường hợp xấu nhất là khi 2 trong số 3 model dự đoán sai và 1 model dự đoán đúng. Vì mỗi model có độ chính xác 70%, nên xác suất một model dự đoán đúng là 0.7 và xác suất dự đoán sai là 0.3.
Để độ chính xác của phương pháp bỏ phiếu thấp nhất, ta cần xem xét trường hợp mà sự kết hợp của các model mang lại kết quả tệ nhất. Vì mỗi model có độ chính xác là 70%, nên việc kết hợp chúng theo phương pháp bỏ phiếu sẽ không bao giờ cho kết quả tệ hơn 70% (nếu tất cả các model đều độc lập và có độ chính xác lớn hơn 50%). Nếu ít nhất 2 model đồng ý (chiếm đa số), thì kết quả sẽ là kết quả của đa số. Do đó, độ chính xác thấp nhất sẽ là khi có sự đồng thuận của ít nhất hai model.
Vì vậy, đáp án đúng là B. Lớn hơn hoặc bằng 70%.
Hàm kích hoạt cho lớp đầu ra của model phụ thuộc vào bài toán cụ thể:
- Sigmoid: Thường dùng cho bài toán phân loại nhị phân (binary classification), vì nó cho ra giá trị trong khoảng (0, 1), có thể hiểu là xác suất thuộc về một lớp nào đó.
- Softmax: Dùng cho bài toán phân loại đa lớp (multi-class classification). Nó chuyển đổi một vector các số thực thành một phân phối xác suất, với tổng các xác suất bằng 1.
- Linear/Identity: Dùng cho bài toán hồi quy (regression), khi cần giá trị đầu ra là một số thực bất kỳ.
- ReLU, Tanh: Thường dùng cho các lớp ẩn (hidden layers) để giải quyết vấn đề vanishing gradient.
Do câu hỏi không chỉ rõ loại bài toán, nhưng phương án B (Sigmoid) là phù hợp nhất trong các lựa chọn được đưa ra, đặc biệt khi ta giả định đây là bài toán phân loại nhị phân.
Phương án A sai vì nó mô tả underfitting (mô hình không đủ phức tạp để nắm bắt được cấu trúc dữ liệu).
Phương án C sai vì nó cũng mô tả trường hợp mô hình không học được gì.
Phương án D sai vì nó mô tả một mô hình lý tưởng, học tốt và tổng quát hóa tốt, không phải overfitting.

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.