25 câu hỏi 60 phút
Bài toán dự đoán là bài toán sử dụng dữ liệu trong quá khứ để ước tính hoặc dự đoán các sự kiện hoặc kết quả trong tương lai.
Như vậy, phương án b và đ đều là bài toán dự đoán, tuy nhiên phương án c "Tất cả các nhiệm vụ được đề cập" là sai vì phương án a và d không phải bài toán dự đoán. Phương án b và đ đều đúng, nhưng không có phương án nào bao trùm cả hai. Vì vậy, ta phải chọn đáp án có ý nghĩa dự đoán gần nhất, đó là dự đoán năng lực làm việc của ứng viên dựa trên CV.
Bài toán dự đoán là bài toán sử dụng dữ liệu trong quá khứ để ước tính hoặc dự đoán các sự kiện hoặc kết quả trong tương lai.
Như vậy, phương án b và đ đều là bài toán dự đoán, tuy nhiên phương án c "Tất cả các nhiệm vụ được đề cập" là sai vì phương án a và d không phải bài toán dự đoán. Phương án b và đ đều đúng, nhưng không có phương án nào bao trùm cả hai. Vì vậy, ta phải chọn đáp án có ý nghĩa dự đoán gần nhất, đó là dự đoán năng lực làm việc của ứng viên dựa trên CV.
Câu hỏi đề cập đến tình trạng mô hình học máy không thể hiện tốt trên dữ liệu huấn luyện, tức là nó không nắm bắt được các mẫu cơ bản. Tình trạng này được gọi là "thiếu trang bị" (underfitting).
Vì vậy, đáp án đúng là "Thiếu trang bị".
Việc tiền xử lý dữ liệu là một bước cực kỳ quan trọng trong quy trình xây dựng mô hình học máy. Dữ liệu "sạch" và chính xác sẽ giúp mô hình học tốt hơn, tránh bị nhiễu bởi các giá trị sai lệch, thiếu hoặc không nhất quán. Quá trình tiền xử lý bao gồm nhiều công đoạn như làm sạch dữ liệu (xử lý giá trị thiếu, loại bỏ dữ liệu trùng lặp, sửa lỗi chính tả,...), chuyển đổi dữ liệu (scaling, normalization, encoding,...), và giảm chiều dữ liệu. Vì vậy, khẳng định "Tất cả dữ liệu cần được xử lý trước để sạch sẽ và chính xác trước khi đưa vào quá trình xây dựng mô hình học máy" là hoàn toàn đúng.
Câu hỏi yêu cầu xác định nhiệm vụ nào là "vấn đề dự đoán". Vấn đề dự đoán là bài toán mà mục tiêu là đưa ra dự đoán về một sự kiện, thuộc tính hoặc giá trị nào đó trong tương lai hoặc chưa biết, dựa trên dữ liệu đã có.
Vì các đáp án a, d và đ đều là các bài toán dự đoán, đáp án b - "Tất cả các nhiệm vụ được đề cập" - là đáp án chính xác nhất.