JavaScript is required
Danh sách đề

200+ câu hỏi trắc nghiệm Data mining có lời giải chi tiết - Đề 3

50 câu hỏi 60 phút

Thẻ ghi nhớ
Luyện tập
Thi thử
Nhấn để lật thẻ
1 / 50
Phát biểu nào sau đây là đúng ?
A.
Data Mining là một bước trong quá trình khai phá tri thức-KDD
B.
Thuật ngữ Data Mining đồng nghĩa với thuật ngữ Knowledge Discovery from Databases
C.
Data Mining là quá trình tìm kiếm thông tin có ích trên Internet
D.
Tiền xử lí dữ liệu là qua trình tìm kiếm thông tin có ích từ cơ sở dữ liệu lớn
Đáp án
Đáp án đúng: A
Data Mining là một bước trong quá trình Khai phá tri thức (Knowledge Discovery in Databases - KDD). KDD là một quy trình bao gồm nhiều bước, trong đó Data Mining là một bước quan trọng để trích xuất thông tin có giá trị từ dữ liệu. Các bước khác trong KDD bao gồm làm sạch dữ liệu, chuyển đổi dữ liệu, chọn lọc dữ liệu và đánh giá tri thức.

Các phương án khác sai vì:
- b. Data Mining và KDD không đồng nghĩa; Data Mining là một phần của KDD.
- c. Data Mining không chỉ giới hạn ở việc tìm kiếm thông tin trên Internet.
- d. Tiền xử lý dữ liệu là bước chuẩn bị dữ liệu, không phải là tìm kiếm thông tin.

Danh sách câu hỏi:

Câu 1:

Phát biểu nào sau đây là đúng ?
Lời giải:
Đáp án đúng: A
Data Mining là một bước trong quá trình Khai phá tri thức (Knowledge Discovery in Databases - KDD). KDD là một quy trình bao gồm nhiều bước, trong đó Data Mining là một bước quan trọng để trích xuất thông tin có giá trị từ dữ liệu. Các bước khác trong KDD bao gồm làm sạch dữ liệu, chuyển đổi dữ liệu, chọn lọc dữ liệu và đánh giá tri thức.

Các phương án khác sai vì:
- b. Data Mining và KDD không đồng nghĩa; Data Mining là một phần của KDD.
- c. Data Mining không chỉ giới hạn ở việc tìm kiếm thông tin trên Internet.
- d. Tiền xử lý dữ liệu là bước chuẩn bị dữ liệu, không phải là tìm kiếm thông tin.
Lời giải:
Đáp án đúng: A
Độ hỗ trợ (support) của một tập mục X trong CSDL giao dịch là tỷ lệ các giao dịch chứa tập mục X.

Trong hình, tập mục X = {A, M} xuất hiện trong các giao dịch T1 và T4. Tổng số giao dịch là 5. Vậy độ hỗ trợ của X là 2/5 = 40%.

Vậy đáp án đúng là d. 2 (40%).

Câu 3:

Thuật toán Apriori có nhược điểm chính là: 
Lời giải:
Đáp án đúng: A
Thuật toán Apriori, mặc dù hiệu quả trong việc tìm kiếm các tập phổ biến, nhưng lại gặp phải vấn đề lớn về hiệu suất khi làm việc với các bộ dữ liệu lớn. Quá trình tạo và kiểm tra các ứng viên tập phổ biến đòi hỏi nhiều bộ nhớ và thời gian tính toán. Đặc biệt, việc duyệt qua cơ sở dữ liệu nhiều lần để đếm tần suất xuất hiện của các ứng viên trở thành một gánh nặng đáng kể.

* Phương án a đúng: Tốn nhiều bộ nhớ và thời gian do phải duyệt CSDL nhiều lần để đếm các tập phổ biến ứng viên. Điều này đặc biệt đúng với các mẫu lớn, làm cho thuật toán trở nên kém hiệu quả.
* Phương án b sai: Apriori tìm được các tập thường xuyên, đó là mục tiêu chính của thuật toán.
* Phương án c sai: Kết quả của thuật toán Apriori được ứng dụng rộng rãi trong các bài toán thực tế như phân tích giỏ hàng, gợi ý sản phẩm, v.v.
* Phương án d sai: Mặc dù có một số khái niệm cần nắm vững, thuật toán Apriori không quá phức tạp và tương đối dễ hiểu về mặt logic.

Câu 4:

Cho FP-Tree như hình vẽ, có mấy đường đi kết thúc ở nút p 
Cho FP-Tree như hình vẽ, có mấy đường đi kết thúc ở nút p a. 2 đường đi  b. 1 đường đi  c. 3 đường đi   (ảnh 1)
Lời giải:
Đáp án đúng: A
Phân tích FP-Tree ta thấy có 2 đường đi kết thúc ở nút p:

1. Đường đi từ gốc đến nút p qua các nút: f, c, a, m, p
2. Đường đi từ gốc đến nút p qua các nút: c, b, p

Vậy đáp án đúng là a. 2 đường đi

Câu 5:

Phương pháp nào không phải là phương pháp phân lớp: 
Lời giải:
Đáp án đúng: A
Câu hỏi yêu cầu xác định phương pháp *không* thuộc về phân lớp (classification) trong lĩnh vực học máy hoặc khai phá dữ liệu. Các phương pháp b, c, d (Cây quyết định, Bayes, Mạng Nơ-ron) đều là các thuật toán phổ biến và được sử dụng rộng rãi cho bài toán phân lớp. Phương án a, "Chia các đối tượng thành từng lớp để giảng dạy", mô tả một hoạt động sư phạm thông thường, không liên quan đến các thuật toán phân lớp trong học máy.

Câu 6:

Gom cụm (clustering) gì: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 8:

Quá trình khai phá tri thức trong CSDL (KDD) có thể phân chia thành các giai đoạn sau: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 9:

Làm sạch dữ liệu (Data Cleaning) là quá trình: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 10:

Một số ứng dụng tiềm năng của Khai phá dữ liệu: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 11:

Thuật ngữ Big Data có nghĩa là: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 12:

Thuật ngữ BioInfomatics có nghĩa là 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 13:

Phát biểu nào sau đây là đúng 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 14:

Các bài toán thuộc làm sạch dữ liệu là: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 15:

Cho cơ sở dữ liệu giao dịch gồm N giao dịch (bản ghi). I là tập chứa tất cả các mục (item) trong CSDL. X là một tập chứa các mục thuộc I. Giao dịch hỗ trợ X là giao dịch chứa tất cả các mục có trong X. Độ hỗ trợ của tập mục X được định nghĩa là:
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 19:

Có thể sử dụng phân lớp dựa trên mạng Nơron nhân tạo. Vậy mạng Nơron nhân tạo là gì? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 20:

Độ phân biệt (độ lộn xộn) của kết luận C với thuộc tính A được tính theo công thức: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 21:

Kết luận nào trong các kết luận sau là sai: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 22:

Entropy là một đại lượng có miền giá trị là: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 24:

Sự bùng nổ của dữ liệu trong những năm gần đây có nhiều nguyên nhân, trong đó có những nguyên nhân sau (chọn đáp án đúng nhất): 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 25:

Phương pháp Xếp thùng - Binning là phương pháp: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 26:

Cho tập dữ liệu được xếp theo giá: 4, 8, 9, 15, 21, 21, 24, 25, 26, 28, 29, 34. Chia tập dữ liệu trên thành 3 thùng theo chiều sâu. Kết quả chia thùng làm trơn theo trung bình là: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 27:

Phương pháp xếp thùng phân hoạch cân bằng theo bề rộng là:
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 28:

Cho X không là tập mục thường xuyên thì với mọi tập Y chứa X ta có kết luận: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 29:

Cho tập mục thường xuyên X={A, B, C, D}, từ tập X có thể sinh ra bao nhiêu luật kết hợp: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 30:

Cho 3 điểm x, y, z. Độ đo khoảng cách d phải thỏa mãn các điều kiện nào:
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 31:

Khi chọn đại diện cho cụm, có thể chọn các đại diện sau:
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 32:

Cho tập ví dụ học như bảng. Có bao nhiêu thuộc tính để phân lớp ?

Cho tập ví dụ học như bảng. Có bao nhiêu thuộc tính để phân lớp ?  a. 4 thuộc tính b. 3 thuộc tính c. 5 thuộc (ảnh 1)
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 33:

Cho tập ví dụ học như bảng. Các thuộc tính dùng để phân lớp là:Cho tập ví dụ học như bảng. Các thuộc tính dùng để phân lớp là:   a. Outlook, Temperature, Humidity, Wind  (ảnh 1)
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 42:

Cho tập ví dụ học như bảng. Entropy của kết luận C= Play Ball là: 
Cho tập ví dụ học như bảng. Entropy của kết luận C= Play Ball là:  a. Entropy(C)=1 b. Entropy(C)=3 (ảnh 1)
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 43:

Cho tập ví dụ học như bảng. Entropy của thuộc tính Outlook là: 
Cho tập ví dụ học như bảng. Entropy của thuộc tính Outlook là:  a. Giá trị khác b. Entropy(Outlook)=1  (ảnh 1)
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 50:

Cho đồ thị như hình vẽ. Nhận xét nào sau đây là sai: Cho đồ thị như hình vẽ. Nhận xét nào sau đây là sai:  a. Với cùng số lượng giao dịch như nhau, thời gian  (ảnh 1)
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP