Cho tập dữ liệu X={x1, x2, x3, x4, x5} và ma trận không tương tự. Sử dụng thuật toán liên kết đầy đủ (Complete Linkage), bước đầu tiên 2 phần tử nào được chọn để gom thành 1 cụm:

Trả lời:
Đáp án đúng: A
Thuật toán liên kết đầy đủ (Complete Linkage) tìm khoảng cách lớn nhất giữa các điểm dữ liệu trong hai cụm khác nhau để quyết định việc hợp nhất. Trong bước đầu tiên, ta tìm hai phần tử có khoảng cách nhỏ nhất trong ma trận không tương tự để gom thành một cụm.
Trong ma trận đã cho, giá trị nhỏ nhất là 0.2, nằm ở vị trí (x1, x2). Điều này có nghĩa là khoảng cách giữa x1 và x2 là nhỏ nhất. Do đó, x1 và x2 sẽ được chọn để gom thành một cụm trong bước đầu tiên.
Câu hỏi liên quan
Lời giải:
Đáp án đúng: A
Khi cắt sơ đồ tại ngưỡng 1.5, ta thấy có hai vùng giá trị lớn hơn hoặc bằng 1.5. Do đó, có 2 cụm được sinh ra.
Lời giải:
Đáp án đúng: A
Đề bài yêu cầu tìm tập mục phổ biến (frequent itemset) thỏa mãn độ hỗ trợ tối thiểu (Min_Support) là 3. Điều này có nghĩa là tập mục đó phải xuất hiện ít nhất 3 lần trong cơ sở dữ liệu giao dịch.
Xét các tập mục có thể có:
- {F}: xuất hiện trong các giao dịch 1, 2, 3, 4, 5. Số lần xuất hiện là 5 >= 3. Thỏa mãn.
- {C}: xuất hiện trong các giao dịch 1, 2, 3, 4. Số lần xuất hiện là 4 >= 3. Thỏa mãn.
- {A}: xuất hiện trong các giao dịch 1, 2, 3. Số lần xuất hiện là 3 >= 3. Thỏa mãn.
- {M}: xuất hiện trong các giao dịch 1, 2, 3. Số lần xuất hiện là 3 >= 3. Thỏa mãn.
- {FC}: xuất hiện trong các giao dịch 1, 2, 3, 4. Số lần xuất hiện là 4 >= 3. Thỏa mãn.
- {FA}: xuất hiện trong các giao dịch 1, 2, 3. Số lần xuất hiện là 3 >= 3. Thỏa mãn.
- {CA}: xuất hiện trong các giao dịch 1, 2, 3. Số lần xuất hiện là 3 >= 3. Thỏa mãn.
- {FCAM}: xuất hiện trong các giao dịch 1, 2, 3. Số lần xuất hiện là 3 >= 3. Thỏa mãn.
Như vậy, có 8 tập mục phổ biến. Tuy nhiên câu hỏi lại hỏi tập mục thường xuyên có *4* mục. Do đó, chúng ta xét tập {FCAM} xuất hiện 3 lần. Do đó đáp án chính xác là FCAM:3
Xét các tập mục có thể có:
- {F}: xuất hiện trong các giao dịch 1, 2, 3, 4, 5. Số lần xuất hiện là 5 >= 3. Thỏa mãn.
- {C}: xuất hiện trong các giao dịch 1, 2, 3, 4. Số lần xuất hiện là 4 >= 3. Thỏa mãn.
- {A}: xuất hiện trong các giao dịch 1, 2, 3. Số lần xuất hiện là 3 >= 3. Thỏa mãn.
- {M}: xuất hiện trong các giao dịch 1, 2, 3. Số lần xuất hiện là 3 >= 3. Thỏa mãn.
- {FC}: xuất hiện trong các giao dịch 1, 2, 3, 4. Số lần xuất hiện là 4 >= 3. Thỏa mãn.
- {FA}: xuất hiện trong các giao dịch 1, 2, 3. Số lần xuất hiện là 3 >= 3. Thỏa mãn.
- {CA}: xuất hiện trong các giao dịch 1, 2, 3. Số lần xuất hiện là 3 >= 3. Thỏa mãn.
- {FCAM}: xuất hiện trong các giao dịch 1, 2, 3. Số lần xuất hiện là 3 >= 3. Thỏa mãn.
Như vậy, có 8 tập mục phổ biến. Tuy nhiên câu hỏi lại hỏi tập mục thường xuyên có *4* mục. Do đó, chúng ta xét tập {FCAM} xuất hiện 3 lần. Do đó đáp án chính xác là FCAM:3
Lời giải:
Đáp án đúng: A
Để xác định cơ sở điều kiện của nút M, ta cần tìm tập các mục (itemsets) có độ hỗ trợ lớn hơn hoặc bằng ngưỡng hỗ trợ tối thiểu (Min_Support = 3). Dựa vào bảng dữ liệu giao dịch, ta thấy chỉ có tập mục {C} xuất hiện 3 lần, còn các tập mục khác liên quan đến M không đạt ngưỡng này. Vì vậy, cơ sở điều kiện của nút M là C:3.
Lời giải:
Đáp án đúng: A
Để tìm luật kết hợp không thỏa mãn điều kiện đề bài, ta cần tính support và confidence cho từng luật:
* Luật a. BA --> E:
* Support(BA) = 2 (giao dịch T1 và T3 chứa BA)
* Support(BAE) = 2 (giao dịch T1 và T3 chứa BAE)
* Confidence(BA --> E) = Support(BAE) / Support(BA) = 2/2 = 1 = 100% (lớn hơn Min_Confidence = 50%)
* Support(BA) = 2 (lớn hơn Min_Support = 2)
* Luật b. BC --> E:
* Support(BC) = 2 (giao dịch T2 và T3 chứa BC)
* Support(BCE) = 1 (chỉ giao dịch T3 chứa BCE)
* Confidence(BC --> E) = Support(BCE) / Support(BC) = 1/2 = 0.5 = 50% (bằng Min_Confidence = 50%)
* Support(BC) = 2 (lớn hơn Min_Support = 2)
* Luật c. C --> E:
* Support(C) = 3 (giao dịch T2, T3 và T4 chứa C)
* Support(CE) = 1 (chỉ giao dịch T3 chứa CE)
* Confidence(C --> E) = Support(CE) / Support(C) = 1/3 = 0.33 = 33% (nhỏ hơn Min_Confidence = 50%)
* Support(C) = 3 (lớn hơn Min_Support = 2)
* Luật d. B --> C:
* Support(B) = 3 (giao dịch T1, T2 và T3 chứa B)
* Support(BC) = 2 (giao dịch T2 và T3 chứa BC)
* Confidence(B --> C) = Support(BC) / Support(B) = 2/3 = 0.66 = 66% (lớn hơn Min_Confidence = 50%)
* Support(B) = 3 (lớn hơn Min_Support = 2)
Như vậy, luật C --> E có confidence = 33%, nhỏ hơn Min_Confidence = 50%, nên luật này không thỏa mãn điều kiện đề bài.
* Luật a. BA --> E:
* Support(BA) = 2 (giao dịch T1 và T3 chứa BA)
* Support(BAE) = 2 (giao dịch T1 và T3 chứa BAE)
* Confidence(BA --> E) = Support(BAE) / Support(BA) = 2/2 = 1 = 100% (lớn hơn Min_Confidence = 50%)
* Support(BA) = 2 (lớn hơn Min_Support = 2)
* Luật b. BC --> E:
* Support(BC) = 2 (giao dịch T2 và T3 chứa BC)
* Support(BCE) = 1 (chỉ giao dịch T3 chứa BCE)
* Confidence(BC --> E) = Support(BCE) / Support(BC) = 1/2 = 0.5 = 50% (bằng Min_Confidence = 50%)
* Support(BC) = 2 (lớn hơn Min_Support = 2)
* Luật c. C --> E:
* Support(C) = 3 (giao dịch T2, T3 và T4 chứa C)
* Support(CE) = 1 (chỉ giao dịch T3 chứa CE)
* Confidence(C --> E) = Support(CE) / Support(C) = 1/3 = 0.33 = 33% (nhỏ hơn Min_Confidence = 50%)
* Support(C) = 3 (lớn hơn Min_Support = 2)
* Luật d. B --> C:
* Support(B) = 3 (giao dịch T1, T2 và T3 chứa B)
* Support(BC) = 2 (giao dịch T2 và T3 chứa BC)
* Confidence(B --> C) = Support(BC) / Support(B) = 2/3 = 0.66 = 66% (lớn hơn Min_Confidence = 50%)
* Support(B) = 3 (lớn hơn Min_Support = 2)
Như vậy, luật C --> E có confidence = 33%, nhỏ hơn Min_Confidence = 50%, nên luật này không thỏa mãn điều kiện đề bài.
Lời giải:
Đáp án đúng: A
Để tìm các luật kết hợp có độ tin cậy 100%, ta cần tính độ tin cậy cho từng luật và so sánh với ngưỡng Min_Confidence = 50%. Độ tin cậy của một luật X -> Y được tính bằng Support(X U Y) / Support(X). Với Min_Support = 2 (50%), ta chỉ xét các tập phổ biến có support lớn hơn hoặc bằng 2.
* a. {BC-->E, B-->E}:
* BC --> E: Support({B, C, E}) = 2. Support({B, C}) = 2. Confidence = 2/2 = 1 = 100%.
* B --> E: Support({B, E}) = 2. Support({B}) = 3. Confidence = 2/3 = 66.67%.
* b. A-->D: Support({A, D}) = 2. Support({A}) = 2. Confidence = 2/2 = 1 = 100%.
* c. AC--> E: Support({A, C, E}) = 2. Support({A, C}) = 2. Confidence = 2/2 = 1 = 100%.
* d. B-->C: Support({B, C}) = 2. Support({B}) = 3. Confidence = 2/3 = 66.67%.
Vậy, các luật kết hợp có độ tin cậy 100% là BC-->E, A-->D và AC-->E. Vì phương án a, b, c đều có ít nhất 1 luật có độ tin cậy 100% nên đáp án đúng nhất phải bao gồm tất cả. Tuy nhiên, phương án a liệt kê 2 luật, trong đó B-->E có độ tin cậy 66.67% < 100%. Phương án b và c chỉ có 1 luật và có độ tin cậy 100%.
Vì câu hỏi yêu cầu luật kết hợp có độ tin cậy 100%, và không có lựa chọn nào bao gồm cả A-->D và AC-->E, ta phải xem xét từng lựa chọn:
* a. {BC-->E, B-->E}: BC-->E đúng, nhưng B-->E sai.
* b. A-->D: Đúng
* c. AC--> E: Đúng
* d. B-->C: Sai.
Tuy nhiên, đề bài có vẻ thiếu sót, nên ta xét 2 trường hợp:
Trường hợp 1: Nếu chỉ chọn MỘT đáp án duy nhất, thì b. A-->D và c. AC-->E đều đúng.
Trường hợp 2: Nếu có thể chọn nhiều đáp án, thì cả b. A-->D và c. AC-->E đều là đáp án đúng.
Vì không có đáp án nào hoàn toàn chính xác và bao quát hết tất cả các luật có độ tin cậy 100%, ta chọn phương án có số lượng luật có độ tin cậy 100% nhiều nhất, trong điều kiện chỉ chọn MỘT đáp án. Như vậy, câu b và c là đúng.
Tuy nhiên, để tuân thủ yêu cầu của JSON schema, ta sẽ chọn B. A-->D
* a. {BC-->E, B-->E}:
* BC --> E: Support({B, C, E}) = 2. Support({B, C}) = 2. Confidence = 2/2 = 1 = 100%.
* B --> E: Support({B, E}) = 2. Support({B}) = 3. Confidence = 2/3 = 66.67%.
* b. A-->D: Support({A, D}) = 2. Support({A}) = 2. Confidence = 2/2 = 1 = 100%.
* c. AC--> E: Support({A, C, E}) = 2. Support({A, C}) = 2. Confidence = 2/2 = 1 = 100%.
* d. B-->C: Support({B, C}) = 2. Support({B}) = 3. Confidence = 2/3 = 66.67%.
Vậy, các luật kết hợp có độ tin cậy 100% là BC-->E, A-->D và AC-->E. Vì phương án a, b, c đều có ít nhất 1 luật có độ tin cậy 100% nên đáp án đúng nhất phải bao gồm tất cả. Tuy nhiên, phương án a liệt kê 2 luật, trong đó B-->E có độ tin cậy 66.67% < 100%. Phương án b và c chỉ có 1 luật và có độ tin cậy 100%.
Vì câu hỏi yêu cầu luật kết hợp có độ tin cậy 100%, và không có lựa chọn nào bao gồm cả A-->D và AC-->E, ta phải xem xét từng lựa chọn:
* a. {BC-->E, B-->E}: BC-->E đúng, nhưng B-->E sai.
* b. A-->D: Đúng
* c. AC--> E: Đúng
* d. B-->C: Sai.
Tuy nhiên, đề bài có vẻ thiếu sót, nên ta xét 2 trường hợp:
Trường hợp 1: Nếu chỉ chọn MỘT đáp án duy nhất, thì b. A-->D và c. AC-->E đều đúng.
Trường hợp 2: Nếu có thể chọn nhiều đáp án, thì cả b. A-->D và c. AC-->E đều là đáp án đúng.
Vì không có đáp án nào hoàn toàn chính xác và bao quát hết tất cả các luật có độ tin cậy 100%, ta chọn phương án có số lượng luật có độ tin cậy 100% nhiều nhất, trong điều kiện chỉ chọn MỘT đáp án. Như vậy, câu b và c là đúng.
Tuy nhiên, để tuân thủ yêu cầu của JSON schema, ta sẽ chọn B. A-->D
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

FORM.08: Bộ 130+ Biểu Mẫu Thống Kê Trong Doanh Nghiệp
136 tài liệu563 lượt tải

FORM.07: Bộ 125+ Biểu Mẫu Báo Cáo Trong Doanh Nghiệp
125 tài liệu585 lượt tải

FORM.06: Bộ 320+ Biểu Mẫu Hành Chính Thông Dụng
325 tài liệu608 lượt tải

FORM.05: Bộ 330+ Biểu Mẫu Thuế - Kê Khai Thuế Mới Nhất
331 tài liệu1010 lượt tải

FORM.04: Bộ 240+ Biểu Mẫu Chứng Từ Kế Toán Thông Dụng
246 tài liệu802 lượt tải

CEO.22: Bộ Tài Liệu Quy Trình Kiểm Toán, Kiểm Soát Nội Bộ Doanh Nghiệp
138 tài liệu417 lượt tải
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.
77.000 đ/ tháng