Trả lời:
Đáp án đúng: B
Có nhiều cách để xử lý dữ liệu bị thiếu, trong đó phổ biến nhất là:
1. **Loại bỏ các dòng/cột chứa dữ liệu bị thiếu:** Cách này đơn giản nhưng có thể làm mất thông tin quan trọng nếu số lượng dữ liệu bị thiếu lớn.
2. **Điền giá trị thiếu (Imputation):** Thay thế các giá trị thiếu bằng một giá trị ước tính. Các phương pháp điền giá trị phổ biến bao gồm:
* Điền bằng giá trị trung bình (mean imputation).
* Điền bằng giá trị trung vị (median imputation).
* Điền bằng giá trị thường xuyên xuất hiện nhất (mode imputation).
* Sử dụng các thuật toán học máy để dự đoán giá trị thiếu (ví dụ: k-Nearest Neighbors, Linear Regression).
3. **Sử dụng các thuật toán có thể xử lý dữ liệu bị thiếu:** Một số thuật toán học máy có thể xử lý dữ liệu bị thiếu mà không cần phải loại bỏ hoặc điền giá trị.
Do đó, có ít nhất 3 cách xử lý dữ liệu bị thiếu. Tuy nhiên, câu hỏi có thể đang đề cập đến các cách phân loại khác nhau hoặc chi tiết hơn, nên đáp án chính xác nhất trong các lựa chọn là 'b. 3' (dù trên thực tế có nhiều hơn 3).