Trả lời:
Đáp án đúng: A
Số lượng giao dịch trong cơ sở dữ liệu giao tác được xác định bằng số lượng các dòng (rows) trong bảng. Trong hình ảnh cung cấp, ta thấy bảng dữ liệu có 6 dòng. Mỗi dòng tương ứng với một giao dịch.
Do đó, số lượng giao dịch trong cơ sở dữ liệu là 6.
Câu hỏi liên quan
Lời giải:
Đáp án đúng: A
Để giải bài toán này, ta cần xác định tập mục thường xuyên (frequent itemset) dựa trên CSDL giao dịch và ngưỡng hỗ trợ tối thiểu (Min_Support) đã cho. Min_Support = 2, tức là một tập mục được coi là thường xuyên nếu nó xuất hiện ít nhất 2 lần trong CSDL.
Xem xét từng tập mục và số lần xuất hiện của chúng:
- A xuất hiện trong T1, T3, T4 (3 lần)
- B xuất hiện trong T1, T2 (2 lần)
- C xuất hiện trong T1, T2, T3 (3 lần)
- D xuất hiện trong T2, T3, T4 (3 lần)
Vậy, các tập mục {A}, {B}, {C}, {D} đều thỏa mãn Min_Support = 2. Bây giờ xét các tập mục kết hợp:
- {A, C} xuất hiện trong T1, T3 (2 lần) - Thỏa mãn
- {A, D} xuất hiện trong T3, T4 (2 lần) - Thỏa mãn
- {B, C} xuất hiện trong T1, T2 (2 lần) - Thỏa mãn
- {B, D} xuất hiện trong T2 (1 lần) - Không thỏa mãn
- {C, D} xuất hiện trong T2, T3 (2 lần) - Thỏa mãn
- {A, B} xuất hiện trong T1 (1 lần) - Không thỏa mãn
Dựa vào các tập mục đã liệt kê, ta thấy:
- Đáp án a: {A, C} thỏa mãn
- Đáp án b: {D} thỏa mãn (nhưng chưa đầy đủ)
- Đáp án c: {A, D} thỏa mãn
- Đáp án d: {B, C, D} không thỏa mãn vì B và D không cùng xuất hiện đủ 2 lần trong CSDL. (B và D chỉ xuất hiện cùng nhau 1 lần trong T2).
Như vậy, đáp án chính xác nhất phải bao gồm cả {B}, {C}, {D}, {A,C}, {A,D}, {B,C}, {C,D}, {A}, {C}, {D}.
Trong các đáp án đã cho, không có đáp án nào hoàn toàn đúng, nhưng ta cần chọn đáp án có nhiều tập thỏa mãn nhất. Giữa a và c, ta thấy cả 2 đều là tập mục thường xuyên nhưng chưa bao quát hết tất cả các tập mục thường xuyên khác. Do đó, câu hỏi bị lỗi do không có đáp án đúng.
Tuy nhiên, nếu phải chọn một đáp án gần đúng nhất, có thể chọn đáp án d. {B, C, D} vì các item trong tập này đều có support >=2 , còn lại việc kết hợp chúng để tạo thành itemset thì không đủ support (như trường hợp B và D chỉ xuất hiện cùng nhau 1 lần).
Xem xét từng tập mục và số lần xuất hiện của chúng:
- A xuất hiện trong T1, T3, T4 (3 lần)
- B xuất hiện trong T1, T2 (2 lần)
- C xuất hiện trong T1, T2, T3 (3 lần)
- D xuất hiện trong T2, T3, T4 (3 lần)
Vậy, các tập mục {A}, {B}, {C}, {D} đều thỏa mãn Min_Support = 2. Bây giờ xét các tập mục kết hợp:
- {A, C} xuất hiện trong T1, T3 (2 lần) - Thỏa mãn
- {A, D} xuất hiện trong T3, T4 (2 lần) - Thỏa mãn
- {B, C} xuất hiện trong T1, T2 (2 lần) - Thỏa mãn
- {B, D} xuất hiện trong T2 (1 lần) - Không thỏa mãn
- {C, D} xuất hiện trong T2, T3 (2 lần) - Thỏa mãn
- {A, B} xuất hiện trong T1 (1 lần) - Không thỏa mãn
Dựa vào các tập mục đã liệt kê, ta thấy:
- Đáp án a: {A, C} thỏa mãn
- Đáp án b: {D} thỏa mãn (nhưng chưa đầy đủ)
- Đáp án c: {A, D} thỏa mãn
- Đáp án d: {B, C, D} không thỏa mãn vì B và D không cùng xuất hiện đủ 2 lần trong CSDL. (B và D chỉ xuất hiện cùng nhau 1 lần trong T2).
Như vậy, đáp án chính xác nhất phải bao gồm cả {B}, {C}, {D}, {A,C}, {A,D}, {B,C}, {C,D}, {A}, {C}, {D}.
Trong các đáp án đã cho, không có đáp án nào hoàn toàn đúng, nhưng ta cần chọn đáp án có nhiều tập thỏa mãn nhất. Giữa a và c, ta thấy cả 2 đều là tập mục thường xuyên nhưng chưa bao quát hết tất cả các tập mục thường xuyên khác. Do đó, câu hỏi bị lỗi do không có đáp án đúng.
Tuy nhiên, nếu phải chọn một đáp án gần đúng nhất, có thể chọn đáp án d. {B, C, D} vì các item trong tập này đều có support >=2 , còn lại việc kết hợp chúng để tạo thành itemset thì không đủ support (như trường hợp B và D chỉ xuất hiện cùng nhau 1 lần).
Lời giải:
Đáp án đúng: A
Để xác định tập mục không thường xuyên, ta cần tính support của từng tập mục và so sánh với min_support = 2 (50%).
* {A, C, D}: Xuất hiện trong các giao dịch 1 và 3. Support = 2. Là tập mục thường xuyên.
* {A, E}: Xuất hiện trong các giao dịch 1 và 4. Support = 2. Là tập mục thường xuyên.
* {A, C}: Xuất hiện trong các giao dịch 1, 2 và 3. Support = 3. Là tập mục thường xuyên.
* {B, E}: Xuất hiện trong giao dịch 4. Support = 1. Không là tập mục thường xuyên.
Vậy đáp án đúng là d. {B,E}
* {A, C, D}: Xuất hiện trong các giao dịch 1 và 3. Support = 2. Là tập mục thường xuyên.
* {A, E}: Xuất hiện trong các giao dịch 1 và 4. Support = 2. Là tập mục thường xuyên.
* {A, C}: Xuất hiện trong các giao dịch 1, 2 và 3. Support = 3. Là tập mục thường xuyên.
* {B, E}: Xuất hiện trong giao dịch 4. Support = 1. Không là tập mục thường xuyên.
Vậy đáp án đúng là d. {B,E}
Lời giải:
Đáp án đúng: A
Để xác định luật kết hợp nào thỏa mãn điều kiện Min_Support = 2 (50%) và Min_Confidence = 50%, ta cần tính support và confidence cho từng luật.
Với luật B --> E:
Support(B, E) = 2/4 = 50% (>= Min_Support)
Confidence(B --> E) = 2/2 = 100% (>= Min_Confidence)
=> Luật B --> E thỏa mãn.
Với luật A --> D:
Support(A, D) = 1/4 = 25% (< Min_Support)
=> Luật A --> D không thỏa mãn.
Với luật A --> E:
Support(A, E) = 2/4 = 50% (>= Min_Support)
Confidence(A --> E) = 2/3 = 66.67% (>= Min_Confidence)
=> Luật A --> E thỏa mãn.
Với luật AB --> C:
Support(A, B, C) = 1/4 = 25% (< Min_Support)
=> Luật AB --> C không thỏa mãn.
Vậy, luật B-->E và A-->E thỏa mãn điều kiện đã cho.
Với luật B --> E:
Support(B, E) = 2/4 = 50% (>= Min_Support)
Confidence(B --> E) = 2/2 = 100% (>= Min_Confidence)
=> Luật B --> E thỏa mãn.
Với luật A --> D:
Support(A, D) = 1/4 = 25% (< Min_Support)
=> Luật A --> D không thỏa mãn.
Với luật A --> E:
Support(A, E) = 2/4 = 50% (>= Min_Support)
Confidence(A --> E) = 2/3 = 66.67% (>= Min_Confidence)
=> Luật A --> E thỏa mãn.
Với luật AB --> C:
Support(A, B, C) = 1/4 = 25% (< Min_Support)
=> Luật AB --> C không thỏa mãn.
Vậy, luật B-->E và A-->E thỏa mãn điều kiện đã cho.
Lời giải:
Đáp án đúng: A
Cả thuật toán FP-Growth và Apriori đều được sử dụng trong khai thác dữ liệu để tìm các tập mục (itemsets) thường xuyên trong một tập dữ liệu giao dịch. Các tập mục thường xuyên là các tập hợp các mục xuất hiện cùng nhau trong một số lượng giao dịch đủ lớn (lớn hơn một ngưỡng hỗ trợ tối thiểu nào đó).
* Apriori: Thuật toán này sử dụng phương pháp tiếp cận duyệt theo chiều rộng, tạo ra các tập ứng viên có kích thước k từ các tập thường xuyên có kích thước k-1, và sau đó tỉa bớt các tập không đủ điều kiện.
* FP-Growth: Thuật toán này xây dựng một cấu trúc cây FP (Frequent Pattern tree) để biểu diễn các giao dịch trong cơ sở dữ liệu, và sau đó khai thác cây này để tìm các tập mục thường xuyên mà không cần tạo các tập ứng viên một cách tường minh.
Do đó, đáp án a là chính xác nhất.
* Apriori: Thuật toán này sử dụng phương pháp tiếp cận duyệt theo chiều rộng, tạo ra các tập ứng viên có kích thước k từ các tập thường xuyên có kích thước k-1, và sau đó tỉa bớt các tập không đủ điều kiện.
* FP-Growth: Thuật toán này xây dựng một cấu trúc cây FP (Frequent Pattern tree) để biểu diễn các giao dịch trong cơ sở dữ liệu, và sau đó khai thác cây này để tìm các tập mục thường xuyên mà không cần tạo các tập ứng viên một cách tường minh.
Do đó, đáp án a là chính xác nhất.
Lời giải:
Đáp án đúng: A
Thuật ngữ "Data Clustering" trong tiếng Anh có nghĩa là phân cụm dữ liệu. Đây là một kỹ thuật trong khai phá dữ liệu và học máy, nhóm các đối tượng dữ liệu tương tự nhau thành các cụm (cluster). Các phương án khác có nghĩa như sau:
- Data Classification: Phân loại dữ liệu.
- Association Rule: Luật kết hợp.
- Data Mining: Khai thác dữ liệu.
- Data Classification: Phân loại dữ liệu.
- Association Rule: Luật kết hợp.
- Data Mining: Khai thác dữ liệu.
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

FORM.08: Bộ 130+ Biểu Mẫu Thống Kê Trong Doanh Nghiệp
136 tài liệu563 lượt tải

FORM.07: Bộ 125+ Biểu Mẫu Báo Cáo Trong Doanh Nghiệp
125 tài liệu585 lượt tải

FORM.06: Bộ 320+ Biểu Mẫu Hành Chính Thông Dụng
325 tài liệu608 lượt tải

FORM.05: Bộ 330+ Biểu Mẫu Thuế - Kê Khai Thuế Mới Nhất
331 tài liệu1010 lượt tải

FORM.04: Bộ 240+ Biểu Mẫu Chứng Từ Kế Toán Thông Dụng
246 tài liệu802 lượt tải

CEO.22: Bộ Tài Liệu Quy Trình Kiểm Toán, Kiểm Soát Nội Bộ Doanh Nghiệp
138 tài liệu417 lượt tải
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.
77.000 đ/ tháng