JavaScript is required

Khi nào thì ta cần rời rạc hóa dữ liệu?

A.

Dữ liệu bị thiếu

B.

Dữ liệu thuộc kiểu số học

C.

Dữ liệu thuộc kiểu định danh

D.

Dữ liệu thuộc kiểu nhị phân

Trả lời:

Đáp án đúng: B


Rời rạc hóa dữ liệu (discretization) là quá trình chuyển đổi dữ liệu số (numerical data) thành dữ liệu rời rạc (discrete data), thường là các khoảng hoặc các nhóm. Việc này thường được thực hiện khi: 1. **Dữ liệu thuộc kiểu số học:** Các thuật toán khai thác dữ liệu hoặc học máy nhất định hoạt động tốt hơn với dữ liệu rời rạc hơn là dữ liệu số liên tục. Việc rời rạc hóa giúp đơn giản hóa dữ liệu, giảm số lượng giá trị khác biệt và có thể cải thiện hiệu suất của mô hình. Các lựa chọn khác không đúng vì: * **Dữ liệu bị thiếu:** Xử lý dữ liệu bị thiếu là một vấn đề riêng biệt, thường được giải quyết bằng cách điền giá trị hoặc loại bỏ các bản ghi bị thiếu. * **Dữ liệu thuộc kiểu định danh:** Dữ liệu định danh (categorical data) đã là rời rạc, không cần rời rạc hóa thêm. * **Dữ liệu thuộc kiểu nhị phân:** Dữ liệu nhị phân cũng đã là rời rạc, với chỉ hai giá trị có thể (0 hoặc 1).

Câu hỏi liên quan