Cho tập ví dụ học như bảng. Các thuộc tính dùng để phân lớp là:
Trả lời:
Đáp án đúng: A
Câu hỏi yêu cầu xác định các thuộc tính được sử dụng để phân lớp trong tập dữ liệu cho trước. Các thuộc tính này là các cột trong bảng được sử dụng để dự đoán giá trị của cột mục tiêu (Play Ball). Nhìn vào bảng, ta thấy các thuộc tính Outlook, Temperature, Humidity và Wind được sử dụng để dự đoán giá trị Play Ball.
Câu hỏi liên quan
Lời giải:
Đáp án đúng: A
Thuật toán ILA (Incremental Learning Algorithm) chia tập dữ liệu thành các bảng con sao cho các ví dụ trong mỗi bảng con là nhất quán với nhau theo một tập các thuộc tính đã chọn. Trong trường hợp này, ta cần xem xét các thuộc tính và giá trị của chúng để xác định cách chia bảng.
Nhìn vào bảng dữ liệu, ta thấy rằng các thuộc tính A, B, C có các giá trị khác nhau. Tuy nhiên, ta có thể chia bảng thành 3 bảng con dựa trên giá trị của thuộc tính C:
* Bảng 1: C = 0 (2 dòng đầu)
* Bảng 2: C = 1 (2 dòng tiếp theo)
* Bảng 3: C = 2 (các dòng còn lại)
Như vậy, đáp án đúng là 3 bảng.
Nhìn vào bảng dữ liệu, ta thấy rằng các thuộc tính A, B, C có các giá trị khác nhau. Tuy nhiên, ta có thể chia bảng thành 3 bảng con dựa trên giá trị của thuộc tính C:
* Bảng 1: C = 0 (2 dòng đầu)
* Bảng 2: C = 1 (2 dòng tiếp theo)
* Bảng 3: C = 2 (các dòng còn lại)
Như vậy, đáp án đúng là 3 bảng.
Lời giải:
Đáp án đúng: A
Thuật toán liên kết đơn (Single Linkage) chọn hai phần tử gần nhau nhất (có khoảng cách nhỏ nhất) để gom thành một cụm ở bước đầu tiên. Trong ma trận không tương tự đã cho, ta tìm giá trị nhỏ nhất:
- Khoảng cách giữa x1 và x2 là 0.2
- Khoảng cách giữa x1 và x3 là 0.3
- Khoảng cách giữa x1 và x4 là 0.4
- Khoảng cách giữa x1 và x5 là 0.7
- Khoảng cách giữa x2 và x3 là 0.4
- Khoảng cách giữa x2 và x4 là 0.5
- Khoảng cách giữa x2 và x5 là 0.6
- Khoảng cách giữa x3 và x4 là 0.7
- Khoảng cách giữa x3 và x5 là 0.5
- Khoảng cách giữa x4 và x5 là 0.8
Giá trị nhỏ nhất là 0.2, tương ứng với cặp phần tử x1 và x2. Do đó, cặp phần tử được chọn để gom thành một cụm ở bước đầu tiên là x1 và x2.
- Khoảng cách giữa x1 và x2 là 0.2
- Khoảng cách giữa x1 và x3 là 0.3
- Khoảng cách giữa x1 và x4 là 0.4
- Khoảng cách giữa x1 và x5 là 0.7
- Khoảng cách giữa x2 và x3 là 0.4
- Khoảng cách giữa x2 và x4 là 0.5
- Khoảng cách giữa x2 và x5 là 0.6
- Khoảng cách giữa x3 và x4 là 0.7
- Khoảng cách giữa x3 và x5 là 0.5
- Khoảng cách giữa x4 và x5 là 0.8
Giá trị nhỏ nhất là 0.2, tương ứng với cặp phần tử x1 và x2. Do đó, cặp phần tử được chọn để gom thành một cụm ở bước đầu tiên là x1 và x2.
Lời giải:
Đáp án đúng: A
Để giải quyết câu hỏi này, ta cần tính độ tin cậy (confidence) của từng luật kết hợp được đưa ra trong các phương án và so sánh với ngưỡng tin cậy tối thiểu (Min_Confidence) là 50%. Công thức tính độ tin cậy là: Confidence(X → Y) = Support(X ∪ Y) / Support(X), trong đó Support là số giao dịch chứa tập mục.
a. B --> CE:
- Support({B, C, E}) = 2 (giao dịch 1 và 3)
- Support({B}) = 3 (giao dịch 1, 3 và 5)
- Confidence(B --> CE) = 2 / 3 = 0.6667 hay 66.67%
b. A --> D:
- Support({A, D}) = 3 (giao dịch 2, 4 và 5)
- Support({A}) = 4 (giao dịch 2, 4, 5 và 6)
- Confidence(A --> D) = 3 / 4 = 0.75 hay 75%
c. C --> E:
- Support({C, E}) = 3 (giao dịch 1, 3 và 4)
- Support({C}) = 4 (giao dịch 1, 3, 4 và 6)
- Confidence(C --> E) = 3 / 4 = 0.75 hay 75%
d. AB --> C:
- Support({A, B, C}) = 1 (giao dịch 6)
- Support({A, B}) = 1 (giao dịch 6)
- Confidence(AB --> C) = 1/ 1 = 1 hay 100%
Như vậy, các luật A-->D, C-->E và AB-->C có độ tin cậy lớn hơn hoặc bằng 75%. Vì trong câu hỏi chỉ hỏi luật nào có độ tin cậy = 75% nên ta chọn đáp án B và C
a. B --> CE:
- Support({B, C, E}) = 2 (giao dịch 1 và 3)
- Support({B}) = 3 (giao dịch 1, 3 và 5)
- Confidence(B --> CE) = 2 / 3 = 0.6667 hay 66.67%
b. A --> D:
- Support({A, D}) = 3 (giao dịch 2, 4 và 5)
- Support({A}) = 4 (giao dịch 2, 4, 5 và 6)
- Confidence(A --> D) = 3 / 4 = 0.75 hay 75%
c. C --> E:
- Support({C, E}) = 3 (giao dịch 1, 3 và 4)
- Support({C}) = 4 (giao dịch 1, 3, 4 và 6)
- Confidence(C --> E) = 3 / 4 = 0.75 hay 75%
d. AB --> C:
- Support({A, B, C}) = 1 (giao dịch 6)
- Support({A, B}) = 1 (giao dịch 6)
- Confidence(AB --> C) = 1/ 1 = 1 hay 100%
Như vậy, các luật A-->D, C-->E và AB-->C có độ tin cậy lớn hơn hoặc bằng 75%. Vì trong câu hỏi chỉ hỏi luật nào có độ tin cậy = 75% nên ta chọn đáp án B và C
Lời giải:
Đáp án đúng: A
Để giải quyết câu hỏi này, ta cần xem xét CSDL giao dịch đã cho và tìm tập mục (itemset) nào có độ hỗ trợ (support) tối thiểu là 50%, tức là xuất hiện ít nhất trong 2 giao dịch (vì có tổng cộng 4 giao dịch).
* {A, C}: Tập mục này xuất hiện trong giao dịch 1 và giao dịch 4. Vậy, độ hỗ trợ của {A, C} là 2, tương đương 50%.
* {A, E}: Tập mục này chỉ xuất hiện trong giao dịch 1. Độ hỗ trợ là 1, tương đương 25%.
* {A, C, D}: Tập mục này chỉ xuất hiện trong giao dịch 4. Độ hỗ trợ là 1, tương đương 25%.
* {B, C, D}: Tập mục này xuất hiện trong giao dịch 2 và giao dịch 3. Vậy, độ hỗ trợ của {B, C, D} là 2, tương đương 50%.
Vậy, tập mục {A, C} và {B, C, D} là các tập mục thường xuyên với độ hỗ trợ 50%.
Vì chỉ có thể chọn 1 đáp án, kiểm tra lại các đáp án:
* Đáp án a: {A, C}, độ hỗ trợ 50%, thỏa mãn.
* Đáp án b: {A, E}, độ hỗ trợ 25%, không thỏa mãn.
* Đáp án c: {A, C, D}, độ hỗ trợ 25%, không thỏa mãn.
* Đáp án d: {B, C, D}, độ hỗ trợ 50%, thỏa mãn.
Do đó, cả a và d đều đúng nhưng câu a xuất hiện trước. Vì các đáp án chỉ chọn 1, nên a đúng nhất.
* {A, C}: Tập mục này xuất hiện trong giao dịch 1 và giao dịch 4. Vậy, độ hỗ trợ của {A, C} là 2, tương đương 50%.
* {A, E}: Tập mục này chỉ xuất hiện trong giao dịch 1. Độ hỗ trợ là 1, tương đương 25%.
* {A, C, D}: Tập mục này chỉ xuất hiện trong giao dịch 4. Độ hỗ trợ là 1, tương đương 25%.
* {B, C, D}: Tập mục này xuất hiện trong giao dịch 2 và giao dịch 3. Vậy, độ hỗ trợ của {B, C, D} là 2, tương đương 50%.
Vậy, tập mục {A, C} và {B, C, D} là các tập mục thường xuyên với độ hỗ trợ 50%.
Vì chỉ có thể chọn 1 đáp án, kiểm tra lại các đáp án:
* Đáp án a: {A, C}, độ hỗ trợ 50%, thỏa mãn.
* Đáp án b: {A, E}, độ hỗ trợ 25%, không thỏa mãn.
* Đáp án c: {A, C, D}, độ hỗ trợ 25%, không thỏa mãn.
* Đáp án d: {B, C, D}, độ hỗ trợ 50%, thỏa mãn.
Do đó, cả a và d đều đúng nhưng câu a xuất hiện trước. Vì các đáp án chỉ chọn 1, nên a đúng nhất.
Lời giải:
Đáp án đúng: A
Để tìm tập mục thường xuyên có độ hỗ trợ cao nhất, ta cần xét độ hỗ trợ của từng tập mục trong các phương án:
a. {B, E}: Mục B xuất hiện trong 2 giao dịch (T1, T4), mục E xuất hiện trong 2 giao dịch (T3, T4). Tập {B, E} xuất hiện trong 1 giao dịch (T4). Độ hỗ trợ = 1.
b. {A, E}: Mục A xuất hiện trong 2 giao dịch (T1, T2), mục E xuất hiện trong 2 giao dịch (T3, T4). Tập {A, E} xuất hiện trong 0 giao dịch. Độ hỗ trợ = 0.
c. {A, C, D}: Mục A xuất hiện trong 2 giao dịch (T1, T2), mục C xuất hiện trong 3 giao dịch (T1, T2, T3), mục D xuất hiện trong 3 giao dịch (T1, T2, T3). Tập {A, C, D} xuất hiện trong 2 giao dịch (T1, T2). Độ hỗ trợ = 2.
d. {B, C, D}: Mục B xuất hiện trong 2 giao dịch (T1, T4), mục C xuất hiện trong 3 giao dịch (T1, T2, T3), mục D xuất hiện trong 3 giao dịch (T1, T2, T3). Tập {B, C, D} xuất hiện trong 1 giao dịch (T1). Độ hỗ trợ = 1.
Vì Min_Support = 2, ta cần chọn tập mục có độ hỗ trợ ≥ 2. Trong các phương án, chỉ có tập {A, C, D} có độ hỗ trợ = 2, đáp ứng yêu cầu này.
a. {B, E}: Mục B xuất hiện trong 2 giao dịch (T1, T4), mục E xuất hiện trong 2 giao dịch (T3, T4). Tập {B, E} xuất hiện trong 1 giao dịch (T4). Độ hỗ trợ = 1.
b. {A, E}: Mục A xuất hiện trong 2 giao dịch (T1, T2), mục E xuất hiện trong 2 giao dịch (T3, T4). Tập {A, E} xuất hiện trong 0 giao dịch. Độ hỗ trợ = 0.
c. {A, C, D}: Mục A xuất hiện trong 2 giao dịch (T1, T2), mục C xuất hiện trong 3 giao dịch (T1, T2, T3), mục D xuất hiện trong 3 giao dịch (T1, T2, T3). Tập {A, C, D} xuất hiện trong 2 giao dịch (T1, T2). Độ hỗ trợ = 2.
d. {B, C, D}: Mục B xuất hiện trong 2 giao dịch (T1, T4), mục C xuất hiện trong 3 giao dịch (T1, T2, T3), mục D xuất hiện trong 3 giao dịch (T1, T2, T3). Tập {B, C, D} xuất hiện trong 1 giao dịch (T1). Độ hỗ trợ = 1.
Vì Min_Support = 2, ta cần chọn tập mục có độ hỗ trợ ≥ 2. Trong các phương án, chỉ có tập {A, C, D} có độ hỗ trợ = 2, đáp ứng yêu cầu này.
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

FORM.08: Bộ 130+ Biểu Mẫu Thống Kê Trong Doanh Nghiệp
136 tài liệu563 lượt tải

FORM.07: Bộ 125+ Biểu Mẫu Báo Cáo Trong Doanh Nghiệp
125 tài liệu585 lượt tải

FORM.06: Bộ 320+ Biểu Mẫu Hành Chính Thông Dụng
325 tài liệu608 lượt tải

FORM.05: Bộ 330+ Biểu Mẫu Thuế - Kê Khai Thuế Mới Nhất
331 tài liệu1010 lượt tải

FORM.04: Bộ 240+ Biểu Mẫu Chứng Từ Kế Toán Thông Dụng
246 tài liệu802 lượt tải

CEO.22: Bộ Tài Liệu Quy Trình Kiểm Toán, Kiểm Soát Nội Bộ Doanh Nghiệp
138 tài liệu417 lượt tải
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.
77.000 đ/ tháng