Tại sao việc làm sạch dữ liệu (data cleaning) lại quan trọng trong quy trình phân tích dữ liệu?
Trả lời:
Đáp án đúng:
Việc làm sạch dữ liệu (data cleaning) là một bước quan trọng trong quy trình phân tích dữ liệu vì nó giúp loại bỏ các lỗi, giá trị trùng lặp và chuẩn hóa dữ liệu. Dữ liệu "sạch" đảm bảo tính chính xác và tin cậy của các phân tích và mô hình được xây dựng dựa trên nó. Các lựa chọn khác không phải là mục đích chính của việc làm sạch dữ liệu:
- Giảm số lượng biến (A) có thể là một phần của quá trình tiền xử lý dữ liệu, nhưng không phải là mục tiêu chính của làm sạch dữ liệu.
- Xác định mối quan hệ giữa các biến (C) là mục tiêu của phân tích dữ liệu, không phải làm sạch dữ liệu.
- Tự động hóa việc lựa chọn biểu đồ (D) là một phần của trực quan hóa dữ liệu, không phải làm sạch dữ liệu.





