Trong học máy, thuật ngữ "bag-of-words" (BoW) là gì?
A.
Một phương pháp biểu diễn văn bản thành một tập hợp không có thứ tự của các từ và số lượng của chúng.
B.
Một phương pháp để giảm kích thước của dữ liệu đầu vào.
C.
Một phương pháp tạo ra các mẫu dữ liệu mới từ dữ liệu ban đầu.
D.
Một phương pháp để chia tập dữ liệu thành các tập con để đánh giá mô hình.
Trả lời:
Đáp án đúng: A
Thuật ngữ "bag-of-words" (BoW) trong học máy là một phương pháp biểu diễn văn bản. Trong phương pháp này, một đoạn văn bản (ví dụ: một câu, một đoạn văn, hoặc một tài liệu) được xem như là một tập hợp không có thứ tự của các từ, và điều quan trọng là tần suất xuất hiện của mỗi từ trong văn bản đó. Thứ tự của các từ không được xem xét đến. Vì vậy, đáp án A mô tả chính xác khái niệm này. Các đáp án B, C, và D mô tả các khái niệm khác trong học máy, không liên quan trực tiếp đến bag-of-words.
32 câu hỏi 60 phút