Trả lời:
Đáp án đúng: A
Có nhiều cách để xử lý dữ liệu bị thiếu, tùy thuộc vào bản chất của dữ liệu và mục tiêu phân tích. Một số phương pháp phổ biến bao gồm:
1. **Xóa các hàng/cột chứa dữ liệu bị thiếu:** Phương pháp này đơn giản nhưng có thể dẫn đến mất mát thông tin quan trọng nếu số lượng dữ liệu bị thiếu lớn.
2. **Điền giá trị thiếu bằng các giá trị thay thế:**
* *Trung bình/Trung vị/Mode:* Sử dụng các giá trị thống kê để điền vào chỗ trống.
* *Giá trị hằng số:* Điền bằng một giá trị cụ thể (ví dụ: 0, -1).
3. **Sử dụng các thuật toán dự đoán:**
* *Hồi quy:* Dự đoán giá trị thiếu dựa trên các biến khác.
* *K-Nearest Neighbors (KNN):* Sử dụng các điểm dữ liệu gần nhất để dự đoán giá trị thiếu.
4. **Sử dụng thuật toán Machine Learning:** Sử dụng các thuật toán học máy để dự đoán giá trị thiếu dựa trên các thuộc tính khác.
Ngoài ra, còn có các phương pháp phức tạp hơn như Multiple Imputation. Do đó, có nhiều hơn 4 cách xử lý dữ liệu bị thiếu, và không có đáp án nào trong các lựa chọn là hoàn toàn chính xác. Tuy nhiên, nếu xét theo các phương pháp chính và thường được sử dụng nhất thì có thể kể đến việc xóa, điền giá trị, và dự đoán. Như vậy, đáp án gần đúng nhất trong các lựa chọn là a.3