Trả lời:
Đáp án đúng: A
Để tính P(Play Ball = 'No'), ta cần xác định số lượng ví dụ trong tập dữ liệu mà Play Ball = 'No' và chia cho tổng số lượng ví dụ trong tập dữ liệu.
Nhìn vào bảng, ta thấy có 3 ví dụ mà Play Ball = 'No'. Tổng số lượng ví dụ trong tập dữ liệu là 14.
Vậy, P(Play Ball = 'No') = 3/14.
Vì 3/14 không trùng với bất kỳ đáp án nào, đáp án đúng là:
d. Giá trị khác
Câu hỏi liên quan
Lời giải:
Đáp án đúng: A
Thuật toán liên kết đơn (Single Linkage) sử dụng khoảng cách nhỏ nhất giữa hai điểm dữ liệu thuộc hai cụm khác nhau để xác định khoảng cách giữa hai cụm. Trong trường hợp này, sau khi gộp x1 và x2 thành cụm C = {x1, x2}, ta cần tìm khoảng cách giữa cụm C và x3, x4. Khoảng cách giữa x3 và x4 vẫn là giá trị ban đầu trong ma trận không tương tự, tức là 9.
Lời giải:
Đáp án đúng: A
Trong thuật toán liên kết đầy đủ (Complete Linkage), khoảng cách giữa hai cụm được định nghĩa là khoảng cách lớn nhất giữa hai điểm bất kỳ thuộc hai cụm đó.
Trong trường hợp này, ta cần tìm khoảng cách giữa cụm C = {x1, x2} và điểm x3. Khoảng cách này sẽ là max(d(x1, x3), d(x2, x3)).
Từ ma trận khoảng cách đã cho, ta có:
- d(x1, x3) = 2
- d(x2, x3) = 1
Vậy, khoảng cách giữa cụm C và x3 là max(2, 1) = 2.
Trong trường hợp này, ta cần tìm khoảng cách giữa cụm C = {x1, x2} và điểm x3. Khoảng cách này sẽ là max(d(x1, x3), d(x2, x3)).
Từ ma trận khoảng cách đã cho, ta có:
- d(x1, x3) = 2
- d(x2, x3) = 1
Vậy, khoảng cách giữa cụm C và x3 là max(2, 1) = 2.
Lời giải:
Đáp án đúng: A
Thuật toán liên kết đơn (Single Linkage) sau khi gom cụm C1={x1, x2} sẽ tạo ra ma trận không tương tự mới P1. Ma trận này sẽ có kích thước giảm đi một chiều so với ma trận ban đầu, do hai điểm x1 và x2 đã được gom thành một cụm. Ma trận ban đầu có kích thước 5x5 (tương ứng với 5 điểm dữ liệu), sau khi gom hai điểm vào một cụm, ma trận mới sẽ có kích thước 4x4 (tương ứng với cụm C1 và các điểm x3, x4, x5). Vậy đáp án đúng là cấp 4.
Lời giải:
Đáp án đúng: B
Câu hỏi này kiểm tra kiến thức về thuật toán Apriori và FP-Growth trong khai phá luật kết hợp. Cần hiểu rõ ưu điểm và nhược điểm của từng thuật toán để đưa ra nhận xét đúng.
* Thuật toán Apriori: Sử dụng phương pháp sinh ứng viên và kiểm tra. Nó tạo ra các tập mục ứng viên từ các tập mục phổ biến có kích thước k-1, sau đó quét cơ sở dữ liệu để đếm số lần xuất hiện của các tập mục ứng viên và xác định các tập mục phổ biến.
* Thuật toán FP-Growth: Sử dụng cấu trúc cây FP-tree để biểu diễn cơ sở dữ liệu giao dịch. Nó không cần sinh ứng viên như Apriori, mà xây dựng cây FP-tree và khai thác các tập mục phổ biến trực tiếp từ cây.
Phân tích các đáp án:
* a. Với cùng số lượng giao dịch như nhau, thời gian thực thi thuật toán FP-Growth luôn ít hơn thời gian thực thi thuật toán Apriori: Nhận định này đúng. FP-Growth thường nhanh hơn Apriori vì nó không cần sinh ứng viên tốn kém.
* b. Thuật toán Apriori thực hiện nhanh hơn thuật toán FP-Growth: Nhận định này sai, trái ngược với thực tế.
* c. Khi số lượng giao tác rất nhỏ, thời gian thực thi của 2 thuật toán FP-Growth và Apriori là tương đương: Nhận định này đúng. Với số lượng giao tác rất nhỏ, chi phí xây dựng cây FP-tree của FP-Growth có thể lớn hơn lợi ích mà nó mang lại, khiến thời gian thực thi tương đương với Apriori.
* d. Thuật toán FP-Growth thực hiện nhanh hơn thuật toán Apriori: Nhận định này đúng. FP-Growth thường nhanh hơn Apriori, đặc biệt với dữ liệu lớn.
Như vậy, đáp án sai là B.
* Thuật toán Apriori: Sử dụng phương pháp sinh ứng viên và kiểm tra. Nó tạo ra các tập mục ứng viên từ các tập mục phổ biến có kích thước k-1, sau đó quét cơ sở dữ liệu để đếm số lần xuất hiện của các tập mục ứng viên và xác định các tập mục phổ biến.
* Thuật toán FP-Growth: Sử dụng cấu trúc cây FP-tree để biểu diễn cơ sở dữ liệu giao dịch. Nó không cần sinh ứng viên như Apriori, mà xây dựng cây FP-tree và khai thác các tập mục phổ biến trực tiếp từ cây.
Phân tích các đáp án:
* a. Với cùng số lượng giao dịch như nhau, thời gian thực thi thuật toán FP-Growth luôn ít hơn thời gian thực thi thuật toán Apriori: Nhận định này đúng. FP-Growth thường nhanh hơn Apriori vì nó không cần sinh ứng viên tốn kém.
* b. Thuật toán Apriori thực hiện nhanh hơn thuật toán FP-Growth: Nhận định này sai, trái ngược với thực tế.
* c. Khi số lượng giao tác rất nhỏ, thời gian thực thi của 2 thuật toán FP-Growth và Apriori là tương đương: Nhận định này đúng. Với số lượng giao tác rất nhỏ, chi phí xây dựng cây FP-tree của FP-Growth có thể lớn hơn lợi ích mà nó mang lại, khiến thời gian thực thi tương đương với Apriori.
* d. Thuật toán FP-Growth thực hiện nhanh hơn thuật toán Apriori: Nhận định này đúng. FP-Growth thường nhanh hơn Apriori, đặc biệt với dữ liệu lớn.
Như vậy, đáp án sai là B.
Lời giải:
Đáp án đúng: A
Data Mining là một bước trong quá trình Khai phá tri thức (Knowledge Discovery in Databases - KDD). KDD là một quy trình bao gồm nhiều bước, trong đó Data Mining là một bước quan trọng để trích xuất thông tin có giá trị từ dữ liệu. Các bước khác trong KDD bao gồm làm sạch dữ liệu, chuyển đổi dữ liệu, chọn lọc dữ liệu và đánh giá tri thức.
Các phương án khác sai vì:
- b. Data Mining và KDD không đồng nghĩa; Data Mining là một phần của KDD.
- c. Data Mining không chỉ giới hạn ở việc tìm kiếm thông tin trên Internet.
- d. Tiền xử lý dữ liệu là bước chuẩn bị dữ liệu, không phải là tìm kiếm thông tin.
Các phương án khác sai vì:
- b. Data Mining và KDD không đồng nghĩa; Data Mining là một phần của KDD.
- c. Data Mining không chỉ giới hạn ở việc tìm kiếm thông tin trên Internet.
- d. Tiền xử lý dữ liệu là bước chuẩn bị dữ liệu, không phải là tìm kiếm thông tin.
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

FORM.08: Bộ 130+ Biểu Mẫu Thống Kê Trong Doanh Nghiệp
136 tài liệu563 lượt tải

FORM.07: Bộ 125+ Biểu Mẫu Báo Cáo Trong Doanh Nghiệp
125 tài liệu585 lượt tải

FORM.06: Bộ 320+ Biểu Mẫu Hành Chính Thông Dụng
325 tài liệu608 lượt tải

FORM.05: Bộ 330+ Biểu Mẫu Thuế - Kê Khai Thuế Mới Nhất
331 tài liệu1010 lượt tải

FORM.04: Bộ 240+ Biểu Mẫu Chứng Từ Kế Toán Thông Dụng
246 tài liệu802 lượt tải

CEO.22: Bộ Tài Liệu Quy Trình Kiểm Toán, Kiểm Soát Nội Bộ Doanh Nghiệp
138 tài liệu417 lượt tải
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.
77.000 đ/ tháng