Sử dụng thuật toán Apriori để tìm các tập mục thường xuyên, số lần duyệt CSDL là:
Đáp án đúng: A
Thuật toán Apriori hoạt động bằng cách duyệt qua cơ sở dữ liệu nhiều lần để tìm ra các tập mục phổ biến. Mỗi lần duyệt (pass) sẽ tạo ra các ứng viên cho tập mục phổ biến (candidate itemsets) và sau đó đếm tần suất xuất hiện của chúng. Số lần duyệt CSDL phụ thuộc vào độ dài lớn nhất của tập mục phổ biến tìm được. Trong trường hợp tổng quát, số lần duyệt CSDL bằng với độ dài lớn nhất của tập mục phổ biến. Do đó, không có một con số cố định cho số lần duyệt mà nó phụ thuộc vào dữ liệu cụ thể. Tuy nhiên, các đáp án đưa ra đều là các con số cụ thể. Vì thuật toán Apriori cần duyệt CSDL ít nhất 2 lần để tìm các tập mục phổ biến (1 lần tạo itemset có độ dài 1, 1 lần tạo itemset có độ dài 2 trở lên), nên đáp án A (3 lần) có vẻ hợp lý hơn các đáp án 1, 2, 4 lần. Tuy nhiên, đề bài không có đủ thông tin để xác định chính xác đáp án. Nếu giả sử độ dài tập mục lớn nhất là k, thì số lần duyệt là k. Các đáp án A, B, C, D đều có thể đúng tuỳ vào dữ liệu.
Tuy nhiên, theo cách hoạt động cơ bản của thuật toán Apriori, ta cần:
- Duyệt 1: Đếm số lượng các item riêng lẻ để tìm ra các item phổ biến (L1).
- Duyệt 2: Tạo các cặp item từ L1 và đếm số lượng của chúng để tìm ra các cặp item phổ biến (L2).
- Tiếp tục duyệt cho đến khi không còn itemset phổ biến nào được tìm thấy.
Vì vậy, số lần duyệt ít nhất là 2. Tuy nhiên, các lựa chọn khác có thể đúng tùy thuộc vào dữ liệu. Do đó, theo cách hiểu thông thường, số lần duyệt thường lớn hơn 2. Lựa chọn A có vẻ hợp lý nhất trong các lựa chọn đã cho.