Đáp án đúng: AĐể giải bài toán này, ta cần xác định tập mục thường xuyên (frequent itemset) dựa trên CSDL giao dịch và ngưỡng hỗ trợ tối thiểu (Min_Support) đã cho. Min_Support = 2, tức là một tập mục được coi là thường xuyên nếu nó xuất hiện ít nhất 2 lần trong CSDL.
Xem xét từng tập mục và số lần xuất hiện của chúng:
- A xuất hiện trong T1, T3, T4 (3 lần)
- B xuất hiện trong T1, T2 (2 lần)
- C xuất hiện trong T1, T2, T3 (3 lần)
- D xuất hiện trong T2, T3, T4 (3 lần)
Vậy, các tập mục {A}, {B}, {C}, {D} đều thỏa mãn Min_Support = 2. Bây giờ xét các tập mục kết hợp:
- {A, C} xuất hiện trong T1, T3 (2 lần) - Thỏa mãn
- {A, D} xuất hiện trong T3, T4 (2 lần) - Thỏa mãn
- {B, C} xuất hiện trong T1, T2 (2 lần) - Thỏa mãn
- {B, D} xuất hiện trong T2 (1 lần) - Không thỏa mãn
- {C, D} xuất hiện trong T2, T3 (2 lần) - Thỏa mãn
- {A, B} xuất hiện trong T1 (1 lần) - Không thỏa mãn
Dựa vào các tập mục đã liệt kê, ta thấy:
- Đáp án a: {A, C} thỏa mãn
- Đáp án b: {D} thỏa mãn (nhưng chưa đầy đủ)
- Đáp án c: {A, D} thỏa mãn
- Đáp án d: {B, C, D} không thỏa mãn vì B và D không cùng xuất hiện đủ 2 lần trong CSDL. (B và D chỉ xuất hiện cùng nhau 1 lần trong T2).
Như vậy, đáp án chính xác nhất phải bao gồm cả {B}, {C}, {D}, {A,C}, {A,D}, {B,C}, {C,D}, {A}, {C}, {D}.
Trong các đáp án đã cho, không có đáp án nào hoàn toàn đúng, nhưng ta cần chọn đáp án có nhiều tập thỏa mãn nhất. Giữa a và c, ta thấy cả 2 đều là tập mục thường xuyên nhưng chưa bao quát hết tất cả các tập mục thường xuyên khác. Do đó, câu hỏi bị lỗi do không có đáp án đúng.
Tuy nhiên, nếu phải chọn một đáp án gần đúng nhất, có thể chọn đáp án d. {B, C, D} vì các item trong tập này đều có support >=2 , còn lại việc kết hợp chúng để tạo thành itemset thì không đủ support (như trường hợp B và D chỉ xuất hiện cùng nhau 1 lần).