Cho tập L3 = {abc, abd, ade, ace} là các tập mục thường xuyên chứa 3-item. Để tạo các ứng viên chứa 4-item abcd, ta cần ghép các tập chứa 3-item nào với nhau?
Đáp án đúng: A
Câu hỏi liên quan
Trong trường hợp này, độ hỗ trợ là 25%. Điều này có nghĩa là một tập mục được coi là thường xuyên nếu nó xuất hiện trong ít nhất 25% số giao dịch. Vì chúng ta không có thông tin về cơ sở dữ liệu giao dịch, chúng ta không thể xác định tập mục thường xuyên một cách chính xác. Tuy nhiên, nếu giả sử các tập con của một tập mục không thường xuyên thì cũng không thường xuyên, và các tập cha của một tập mục thường xuyên thì cũng thường xuyên. Trong bài toán này, không có đủ thông tin để xác định đáp án chính xác, tuy nhiên nếu có thêm thông tin về cơ sở dữ liệu giao dịch thì có thể xác định được đáp án.
Thuật toán Apriori hoạt động bằng cách duyệt qua cơ sở dữ liệu nhiều lần để tìm ra các tập mục phổ biến. Mỗi lần duyệt (pass) sẽ tạo ra các ứng viên cho tập mục phổ biến (candidate itemsets) và sau đó đếm tần suất xuất hiện của chúng. Số lần duyệt CSDL phụ thuộc vào độ dài lớn nhất của tập mục phổ biến tìm được. Trong trường hợp tổng quát, số lần duyệt CSDL bằng với độ dài lớn nhất của tập mục phổ biến. Do đó, không có một con số cố định cho số lần duyệt mà nó phụ thuộc vào dữ liệu cụ thể. Tuy nhiên, các đáp án đưa ra đều là các con số cụ thể. Vì thuật toán Apriori cần duyệt CSDL ít nhất 2 lần để tìm các tập mục phổ biến (1 lần tạo itemset có độ dài 1, 1 lần tạo itemset có độ dài 2 trở lên), nên đáp án A (3 lần) có vẻ hợp lý hơn các đáp án 1, 2, 4 lần. Tuy nhiên, đề bài không có đủ thông tin để xác định chính xác đáp án. Nếu giả sử độ dài tập mục lớn nhất là k, thì số lần duyệt là k. Các đáp án A, B, C, D đều có thể đúng tuỳ vào dữ liệu.
Tuy nhiên, theo cách hoạt động cơ bản của thuật toán Apriori, ta cần:
- Duyệt 1: Đếm số lượng các item riêng lẻ để tìm ra các item phổ biến (L1).
- Duyệt 2: Tạo các cặp item từ L1 và đếm số lượng của chúng để tìm ra các cặp item phổ biến (L2).
- Tiếp tục duyệt cho đến khi không còn itemset phổ biến nào được tìm thấy.
Vì vậy, số lần duyệt ít nhất là 2. Tuy nhiên, các lựa chọn khác có thể đúng tùy thuộc vào dữ liệu. Do đó, theo cách hiểu thông thường, số lần duyệt thường lớn hơn 2. Lựa chọn A có vẻ hợp lý nhất trong các lựa chọn đã cho.
Có hai đường dẫn chứa M:
1. f -> c -> a -> m: Đường dẫn này có tần số 2. Vậy đóng góp vào cơ sở điều kiện là {f:2, c:2, a:2, m:2}
2. f -> c -> a -> b -> m: Đường dẫn này có tần số 1. Vậy đóng góp vào cơ sở điều kiện là {f:1, c:1, a:1, b:1, m:1}
Kết hợp hai đường dẫn trên, ta có cơ sở điều kiện của M là {f:2, c:2, a:2, m:2}, {f:1, c:1, a:1, b:1, m:1}.

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.