Thuật toán phân lớp nào sau đây cho phép xử lý trên nhiều kiểu/loại dữ liệu khác nhau:
Đáp án đúng: B
Cây quyết định (Decision Tree) là thuật toán phân lớp có khả năng xử lý nhiều kiểu dữ liệu khác nhau (numerical, categorical,...). Khác với các thuật toán khác thường yêu cầu dữ liệu phải được chuẩn hóa hoặc chuyển đổi sang định dạng số, cây quyết định có thể trực tiếp làm việc với các thuộc tính có kiểu dữ liệu khác nhau mà không cần qua các bước tiền xử lý phức tạp.
SVM (Support Vector Machine) thường hoạt động tốt nhất với dữ liệu số và yêu cầu chuẩn hóa dữ liệu để đạt hiệu suất tối ưu.
Logistic Regression chủ yếu được sử dụng cho các bài toán phân loại nhị phân và yêu cầu dữ liệu đầu vào phải là số.
Mạng nơ-ron (Neural Networks) có thể xử lý nhiều loại dữ liệu, nhưng thường yêu cầu dữ liệu được chuẩn hóa hoặc mã hóa để đạt hiệu quả tốt nhất.