Phát biểu nào sau đây là đúng đối với thuật toán K lân cận gần nhất?
A.
Thuật toán đi tìm đầu ra của một điểm dữ liệu mới dựa trên thông tin của K điểm dữ liệu gần nhất trong tập huấn luyện
B.
Thuật toán xây dựng mô hình từ dữ liệu huấn luyện và sử dụng dữ liệu kiểm tra để đánh giá mô hình đã xây dựng trước đó
C.
Thuật toán gần như không học gì trong giai đoạn huấn luyện, mọi tính toán được thực hiện trong giai đoạn kiểm tra
D.
Câu a và b đúng
Trả lời:
Đáp án đúng: A
Thuật toán K lân cận gần nhất (K-Nearest Neighbors - KNN) là một thuật toán học máy thuộc loại học có giám sát (supervised learning) và thường được sử dụng cho các bài toán phân loại và hồi quy.
* **Phương án a đúng:** KNN dự đoán đầu ra cho một điểm dữ liệu mới dựa trên thông tin của K điểm dữ liệu gần nhất trong tập huấn luyện. Khoảng cách giữa các điểm dữ liệu thường được tính bằng các độ đo như Euclidean, Manhattan, hoặc Minkowski.
* **Phương án b sai:** Mặc dù KNN sử dụng dữ liệu huấn luyện để đưa ra dự đoán, nhưng nó không thực sự "xây dựng mô hình" theo cách các thuật toán khác như hồi quy tuyến tính hoặc cây quyết định thực hiện. KNN lưu trữ toàn bộ tập huấn luyện và sử dụng nó trực tiếp trong quá trình dự đoán.
* **Phương án c đúng:** KNN là một thuật toán "lười biếng" (lazy learner) vì nó gần như không học gì trong giai đoạn huấn luyện. Tất cả các tính toán và việc đưa ra quyết định đều được thực hiện trong giai đoạn kiểm tra, khi cần dự đoán nhãn cho một điểm dữ liệu mới.
* **Phương án d sai:** Vì phương án b sai nên phương án d cũng sai.
Vì vậy, các phương án a và c đều đúng.
Câu hỏi liên quan

FORM.08: Bộ 130+ Biểu Mẫu Thống Kê Trong Doanh Nghiệp

FORM.07: Bộ 125+ Biểu Mẫu Báo Cáo Trong Doanh Nghiệp

FORM.06: Bộ 320+ Biểu Mẫu Hành Chính Thông Dụng

FORM.05: Bộ 330+ Biểu Mẫu Thuế - Kê Khai Thuế Mới Nhất

FORM.04: Bộ 240+ Biểu Mẫu Chứng Từ Kế Toán Thông Dụng
