JavaScript is required
Danh sách đề

150+ câu hỏi trắc nghiệm Khai phá dữ liệu đầy đủ đáp án và lời giải - Đề 2

50 câu hỏi 60 phút

Thẻ ghi nhớ
Luyện tập
Thi thử
Nhấn để lật thẻ
1 / 50

Data Mining được định nghĩa là gì?

A.

Là một quy trình tìm kiếm, phát hiện các tri thức mới, tiềm ẩn, hữu dụng trong cơ sở dữ liệu lớn

B.

Khai phá dữ liệu

C.

Khai khoáng dữ liệu

D.

Tìm kiếm thông tin trên Internet

Đáp án
Đáp án đúng: A
Data Mining, hay còn gọi là khai phá dữ liệu, là một quy trình tìm kiếm và khám phá các mẫu thông tin ẩn, tiềm ẩn và hữu ích từ một lượng lớn dữ liệu. Các tri thức này có thể được sử dụng để dự đoán, phân loại, phân cụm và đưa ra quyết định trong nhiều lĩnh vực khác nhau. Như vậy, đáp án A mô tả chính xác nhất định nghĩa của Data Mining.

Danh sách câu hỏi:

Câu 1:

Data Mining được định nghĩa là gì?

Lời giải:
Đáp án đúng: A
Data Mining, hay còn gọi là khai phá dữ liệu, là một quy trình tìm kiếm và khám phá các mẫu thông tin ẩn, tiềm ẩn và hữu ích từ một lượng lớn dữ liệu. Các tri thức này có thể được sử dụng để dự đoán, phân loại, phân cụm và đưa ra quyết định trong nhiều lĩnh vực khác nhau. Như vậy, đáp án A mô tả chính xác nhất định nghĩa của Data Mining.

Câu 2:

Hiện nay, Data Mining đã được ứng dụng trong:

Lời giải:
Đáp án đúng: A
Data Mining là quá trình khám phá tri thức từ các tập dữ liệu lớn. Nó được ứng dụng rộng rãi trong nhiều lĩnh vực, và các hệ quản trị CSDL (Database Management System - DBMS) lớn như SQL Server thường tích hợp các công cụ và thuật toán Data Mining để hỗ trợ phân tích dữ liệu.

* A. Hệ quản trị CSDL SQL Server: SQL Server có các công cụ tích hợp cho Data Mining, cho phép người dùng thực hiện các tác vụ như phân tích cụm, dự đoán, v.v.
* B. Hệ quản trị CSDL Access: Access là một hệ quản trị CSDL nhỏ, chủ yếu được sử dụng cho các ứng dụng cá nhân hoặc nhóm nhỏ, và không có các tính năng Data Mining mạnh mẽ như SQL Server.
* C. Hệ quản trị CSDL Foxpro: Foxpro là một hệ quản trị CSDL đã lỗi thời và không còn được sử dụng rộng rãi. Nó không có các tính năng Data Mining.
* D. Microsoft Word 2010: Microsoft Word là một phần mềm soạn thảo văn bản, không liên quan đến Data Mining.
Lời giải:
Đáp án đúng: A
Để xác định tập mục thường xuyên, chúng ta cần thông tin về tập dữ liệu giao dịch và giá trị Min_support. Tuy nhiên, câu hỏi không cung cấp những thông tin này. Do đó, không thể xác định đáp án chính xác. Theo lý thuyết, một tập mục được coi là thường xuyên nếu số lần xuất hiện của nó trong tập dữ liệu lớn hơn hoặc bằng Min_support. Nếu không có thông tin về dữ liệu và Min_support, ta không thể kết luận tập nào là thường xuyên.
Lời giải:
Đáp án đúng: A
Tập mục thường xuyên là tập mục có số lần xuất hiện (support) lớn hơn hoặc bằng ngưỡng tối thiểu cho trước. Để xác định tập nào không phải là tập mục thường xuyên, ta cần biết thêm thông tin về tập dữ liệu giao dịch và ngưỡng hỗ trợ tối thiểu. Tuy nhiên, vì không có thông tin này, chúng ta không thể xác định chắc chắn đáp án. Giả sử ngưỡng hỗ trợ tối thiểu cao hơn số lần xuất hiện của {A, E}, {A, C}, và {B, E} nhưng vẫn thấp hơn số lần xuất hiện của {D}, thì các tập {A, E}, {A, C}, và {B, E} sẽ không phải là tập mục thường xuyên. Tuy nhiên, nếu không có dữ liệu về số lần xuất hiện, ta không thể loại trừ bất kỳ tập nào một cách chắc chắn. Câu hỏi này thiếu thông tin quan trọng để đưa ra câu trả lời chính xác.
Lời giải:
Đáp án đúng: A
Thuật toán Apriori hoạt động bằng cách tìm các tập mục phổ biến, tức là các tập mục xuất hiện trong cơ sở dữ liệu với tần suất tối thiểu cho trước (support). Ở lần duyệt đầu tiên, thuật toán đếm tần suất xuất hiện của từng mục riêng lẻ (1-itemsets). Các mục có tần suất thấp hơn ngưỡng support sẽ bị loại bỏ. Nếu {A} và {D} có tần suất thấp hơn ngưỡng support ở lần duyệt đầu tiên, chúng sẽ bị loại bỏ.

Câu 6:

Luật kết hợp nào có độ tin cậy = 100%?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 7:

Cho FP-Tree như hình vẽ, có mấy đường đi kết thúc ở nút m?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 8:

Cho FP-Tree như hình vẽ, có mấy đường đi kết thúc ở nút p?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 9:

Hai thuật toán FP-Growth và Apriori dùng để:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 10:

Phương pháp nào không phải là phương pháp phân lớp?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 11:

Cho tập ví dụ học như bảng. Các thuộc tính dùng để phân lớp là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 16:

Một số bài toán điển hình trong khai phá dữ liệu là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 17:

Khai phá dữ liệu có lợi ích gì?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 18:

Phát biểu nào sau đây là đúng?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 19:

Cho cơ sở dữ liệu giao dịch gồm N giao dịch (bản ghi). I là tập chứa tất cả các mục (item) trong CSDL. X, Y là tập chứa các mục thuộc I. Độ tin cậy của luật kết hợp X Y được định nghĩa là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 20:

Cho cơ sở dữ liệu giao dịch gồm N giao dịch (bản ghi). I là tập chứa tất cả các mục (item) trong CSDL. X, Y là tập chứa các mục thuộc I. Độ hỗ trợ của luật kết hợp X Y được định nghĩa là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 22:

Cho CSDL giao dịch như hình vẽ, cây điều kiện FP của A là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 23:

Cho A, B, C, là các item và A-->BC là luật kết hợp thỏa mãn độ hỗ trợ tối thiểu Min_Sup và độ tin cậy tối thiểu Min_Conf. Ta thấy rằng luật kết hợp AB-->C cũng thỏa mãn điều kiện về độ hỗ trợ tối thiểu và độ tin cậy tối thiểu vì:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 28:

Các luật kết hợp nào có độ tin cậy = 100%:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 30:

Tập nào là tập mục thường xuyên với độ hỗ trợ là 70%:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 31:

Cho FP-Tree như hình vẽ, cơ sở điều kiện của nút P là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 32:

Cho FP-Tree như hình vẽ, cơ sở điều kiện của nút a là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 33:

Hãy cho biết Refund=No, MarSt = Single, TaxInc=140K thì kết luận có giá trị gì?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 34:

Cho tập ví dụ học như bảng. Entropy của thuộc tính Outlook là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 37:

Kết luận nào trong các kết luận sau là sai:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 38:

Kết luận C gồm 2 giá trị Yes và No. Entropy(C) = 0 nói nên điều gì:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 40:

Thuật toán Quilan là thuật toán dùng để:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 43:

Độ đo khoảng cách trong không gian Ơclit là độ đo:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 44:

Trong thuật toán phân cụm k-mean, sau khi chọn được k điểm làm tâm, phần tử x sẽ được gán vào cụm C sao cho:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 45:

Cho các điểm A(1, 1), B(2, 1), C(4, 3), D(5, 4), E(1, 0). Sử dụng thuật toán phân cụm k-mean để chia 5 điểm vào 2 cụm. Kết quả phân cụm là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 46:

k-Mean phù hợp với các cụm có hình dạng nào sau đây?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 47:

Hãy chọn phát biểu sai trong các phát biểu sau đây về thuật toán phân cụm k-mean:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 49:

Cho sơ đồ ngưỡng không tương tự như hình vẽ. Cắt sơ đồ tại ngưỡng bằng 2.5, các cụm sinh ra là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 50:

Cho sơ đồ ngưỡng không tương tự như hình vẽ. Cắt sơ đồ tại ngưỡng bằng 5, các cụm sinh ra là:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP