Trong ứng dụng về xử lý văn bản (text), người ta thường đo độ tương tự giữa hai văn bản bằng cách nào?
Trả lời:
Đáp án đúng: D
Trong xử lý văn bản, để đo độ tương tự giữa hai văn bản, người ta thường biểu diễn mỗi văn bản thành một vector trong không gian nhiều chiều. Mỗi chiều của vector có thể tương ứng với một từ hoặc một thuộc tính nào đó của văn bản. Sau đó, độ tương tự giữa hai văn bản được tính bằng cách đo góc giữa hai vector tương ứng. Hàm cosine được sử dụng phổ biến để tính góc này. Giá trị cosine càng gần 1, hai vector càng giống nhau, và do đó, hai văn bản càng tương tự. Các khoảng cách Euclid, Minkowski và Manhattan thường được dùng để đo khoảng cách (sự khác biệt) giữa hai vector, không phải độ tương tự (sự giống nhau).
Câu hỏi liên quan

FORM.08: Bộ 130+ Biểu Mẫu Thống Kê Trong Doanh Nghiệp

FORM.07: Bộ 125+ Biểu Mẫu Báo Cáo Trong Doanh Nghiệp

FORM.06: Bộ 320+ Biểu Mẫu Hành Chính Thông Dụng

FORM.05: Bộ 330+ Biểu Mẫu Thuế - Kê Khai Thuế Mới Nhất

FORM.04: Bộ 240+ Biểu Mẫu Chứng Từ Kế Toán Thông Dụng
