JavaScript is required

Khi nào thì ta cần rời rạc hóa dữ liệu?

A.

Dữ liệu bị thiếu

B.

Dữ liệu thuộc kiểu số học

C.

Dữ liệu thuộc kiểu định danh

D.

Dữ liệu thuộc kiểu nhị phân

Trả lời:

Đáp án đúng: B


Rời rạc hóa dữ liệu (discretization) là quá trình chuyển đổi dữ liệu từ dạng liên tục (ví dụ: số thực) sang dạng rời rạc (ví dụ: các khoảng giá trị hoặc các nhóm). Việc này thường được thực hiện khi dữ liệu thuộc kiểu số học (numerical data) và ta muốn chuyển nó sang dạng phù hợp hơn cho một số thuật toán học máy hoặc phân tích dữ liệu, đặc biệt là những thuật toán hoạt động tốt hơn với dữ liệu phân loại. Ví dụ, một thuật toán có thể hoạt động tốt hơn với các nhóm tuổi (trẻ, trung niên, già) thay vì độ tuổi chính xác. Các lựa chọn khác không phải là lý do chính để rời rạc hóa dữ liệu. Dữ liệu thiếu cần được xử lý bằng các phương pháp khác. Dữ liệu định danh đã là rời rạc. Dữ liệu nhị phân cũng đã là rời rạc.

Câu hỏi liên quan