JavaScript is required
Danh sách đề

200+ câu hỏi trắc nghiệm Data mining có lời giải chi tiết - Đề 1

50 câu hỏi 60 phút

Thẻ ghi nhớ
Luyện tập
Thi thử
Nhấn để lật thẻ
1 / 50
Data Mining được định nghĩa là gì ? 
A.
Là một quy trình tìm kiếm, phát hiện các tri thức mới, tiềm ẩn, hữu dụng trong cơ sở dữ liệu lớn
B.
Khai phá dữ liệu
C.
Khai khoáng dữ liệu
D.
Tìm kiếm thông tin trên Internet
Đáp án
Đáp án đúng: A
Data Mining, hay còn gọi là khai phá dữ liệu, là một quy trình sử dụng các kỹ thuật từ nhiều lĩnh vực như thống kê, trí tuệ nhân tạo và học máy để khám phá ra các mẫu, xu hướng và thông tin hữu ích tiềm ẩn trong các tập dữ liệu lớn. Mục tiêu là biến dữ liệu thô thành tri thức có giá trị, hỗ trợ việc ra quyết định. Do đó, đáp án a là chính xác nhất. Các đáp án b và c chỉ là các tên gọi khác của Data Mining.

Danh sách câu hỏi:

Câu 1:

Data Mining được định nghĩa là gì ? 
Lời giải:
Đáp án đúng: A
Data Mining, hay còn gọi là khai phá dữ liệu, là một quy trình sử dụng các kỹ thuật từ nhiều lĩnh vực như thống kê, trí tuệ nhân tạo và học máy để khám phá ra các mẫu, xu hướng và thông tin hữu ích tiềm ẩn trong các tập dữ liệu lớn. Mục tiêu là biến dữ liệu thô thành tri thức có giá trị, hỗ trợ việc ra quyết định. Do đó, đáp án a là chính xác nhất. Các đáp án b và c chỉ là các tên gọi khác của Data Mining.

Câu 2:

Thuật ngữ Data Mining dịch ra tiếng Việt có nghĩa là:
Lời giải:
Đáp án đúng: A
Thuật ngữ "Data Mining" trong tiếng Anh dịch sang tiếng Việt có nghĩa là "Khai phá dữ liệu" hoặc "Khai thác dữ liệu". Đây là quá trình tìm kiếm và khám phá ra các mẫu, xu hướng, và thông tin hữu ích từ một lượng lớn dữ liệu. Các phương án b, c, d là các khái niệm cụ thể hơn liên quan đến Data Mining, nhưng không phải là nghĩa trực tiếp của thuật ngữ này.
Lời giải:
Đáp án đúng: D
Giải thuật Apriori tìm các tập mục phổ biến bằng cách duyệt qua cơ sở dữ liệu nhiều lần.

Ở lần duyệt đầu tiên (1-itemsets), thuật toán tính support (tần suất xuất hiện) của từng mục đơn lẻ. Một mục được giữ lại nếu support của nó lớn hơn hoặc bằng min_support, và bị loại bỏ nếu support nhỏ hơn min_support.

Trong CSDL giao dịch đã cho:

* Support(A) = 1 (xuất hiện 1 lần)
* Support(B) = 3 (xuất hiện 3 lần)
* Support(C) = 3 (xuất hiện 3 lần)
* Support(D) = 1 (xuất hiện 1 lần)

Vì min_support = 2, các mục A và D có support nhỏ hơn min_support nên bị loại bỏ.
Lời giải:
Đáp án đúng: A
Để tìm tập mục thường xuyên với độ hỗ trợ 70% (tức là 0.7), trước hết cần xác định số giao dịch tối thiểu mà một tập mục phải xuất hiện. Vì có tổng cộng 4 giao dịch, nên độ hỗ trợ tối thiểu là 0.7 * 4 = 2.8, làm tròn lên là 3 giao dịch. Do đó, một tập mục được coi là thường xuyên nếu nó xuất hiện ít nhất trong 3 giao dịch.

* {A, E}:
* A xuất hiện trong các giao dịch T1, T2, T3.
* E xuất hiện trong các giao dịch T1, T2.
* {A, E} xuất hiện trong T1 và T2, tức là độ hỗ trợ là 2/4 = 50%, không đạt yêu cầu.
* {A, C, D}:
* A xuất hiện trong các giao dịch T1, T2, T3.
* C xuất hiện trong các giao dịch T1, T3, T4.
* D xuất hiện trong các giao dịch T1, T3, T4.
* {A, C, D} xuất hiện trong T1 và T3, tức là độ hỗ trợ là 2/4 = 50%, không đạt yêu cầu.
* {B, C, D}:
* B xuất hiện trong các giao dịch T2, T4.
* C xuất hiện trong các giao dịch T1, T3, T4.
* D xuất hiện trong các giao dịch T1, T3, T4.
* {B, C, D} xuất hiện trong T4, tức là độ hỗ trợ là 1/4 = 25%, không đạt yêu cầu.

Do đó, không có tập mục nào có độ hỗ trợ ít nhất là 70%.
Lời giải:
Đáp án đúng: A
Để giải quyết câu hỏi này, ta cần kiểm tra support và confidence của từng luật kết hợp:

* Min_Support = 2 (50%): Một luật kết hợp phải xuất hiện ít nhất trong 2 giao dịch.
* Min_Confidence = 50%: Confidence(A → B) = Support(A∪B) / Support(A) >= 50%

a. A → C:
* Support(A∪C) = 2 (giao dịch 1, 2)
* Support(A) = 4 (giao dịch 1, 2, 3, 4)
* Confidence(A → C) = 2/4 = 50%

Vậy luật này thỏa mãn cả support và confidence.

b. A → D:
* Support(A∪D) = 1 (giao dịch 3)
Vì support < Min_Support nên luật này không thỏa mãn.

c. A → E:
* Support(A∪E) = 1 (giao dịch 4)
Vì support < Min_Support nên luật này không thỏa mãn.

d. AB → C:
* Support(AB∪C) = 1 (giao dịch 1)
Vì support < Min_Support nên luật này không thỏa mãn.

Vậy, chỉ có đáp án a thỏa mãn cả support và confidence.
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 7:

Cho FP-Tree như hình vẽ, có mấy đường đi kết thúc ở nút m 
Cho FP-Tree như hình vẽ, có mấy đường đi kết thúc ở nút m    a. 2 đường đi  b. 1 đường đi  c. 3 đường đi (ảnh 1)
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 11:

Các loại đặc trưng của dữ liệu:
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 12:

Một số thách thức lớn trong quá trình khai phá dữ liệu là (chọn đáp án đúng nhất): 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 13:

Khai phá dữ liệu có lợi ích gì?
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 14:

Khi xử lý thiếu giá trị của các bản ghi dữ liệu, phương pháp ‘Bỏ qua bản ghi có giá trị thiếu’ chỉ thích hợp khi: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 16:

Cho A, B, C, là các item và A-->BC là luật kết hợp thỏa mãn độ hỗ trợ tối thiểu Min_Sup và độ tin cậy tối thiểu Min_Conf. Ta thấy rằng luật kết hợp AB-->C cũng thỏa mãn điều kiện về độ hỗ trợ tối thiểu và độ tin cậy tối thiểu vì:
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 17:

Phát biểu nào sau đây là đúng:
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 18:

Khi sử dụng thuật toán Quilan để xây dựng cây quyết định. Tại mỗi bước của thuật toán ta chọn thuộc tính nào trong số các thuộc tính còn lại để làm gốc phân nhánh? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 19:

Độ đo khoảng cách trong không gian Ơclit là độ đo: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 20:

Cho 2 điểm trong mặt phẳng toạ độ Oxy, cho 2 điểm A(x1, y1), B(x2, y2). Khoảng cách Ơclit giữa 2 điểm này là: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 22:

Trong thuật toán phân cụm k-mean, sau khi chọn được k điểm làm tâm, phần tử x sẽ được gán vào cụm C sao cho: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 23:

Hãy chọn phát biểu sai trong các phát biểu sau đây về thuật toán phân cụm k mean: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 24:

Tiến trình Khai phá tri thức – KDD gồm các bước như sau:
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 25:

Một số chiến lược rút gọn dữ liệu là: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 26:

Phát biểu nào đúng về Phương pháp phân tích thành phần chính (Principal Component Analysis-PCA: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 27:

Rời rạc hóa là: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 28:

Cho L là tập mục thường xuyên, S là tập con của L thì với mọi tập con S’ của S ta có: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 29:

Ý tưởng chính của thuật toán Apriori là: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 33:

Phát biểu nào đúng về thuật toán liên kết đơn: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 42:

Cho FP-Tree như hình vẽ, mũi tên nét đứt biểu thị cho:

Cho FP-Tree như hình vẽ, mũi tên nét đứt biểu thị cho:   a. Con trỏ xuất phát từ bảng đầu mục, trỏ vào nút (ảnh 1)
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 43:

Cho FP-Tree như hình vẽ, cơ sở điều kiện của nút P là:Cho FP-Tree như hình vẽ, cơ sở điều kiện của nút P là:  a. {f:2, c:2, a:2, m:2} và {c:1, b:1} b. {f:3, c:3, a:3, m:2}  (ảnh 1)
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 49:

Cho đồ thị như hình vẽ, đồ thị trên biểu diễn gì ?

Cho đồ thị như hình vẽ, đồ thị trên biểu diễn gì ?  a. So sánh giữa Thời gian thực thi (tính bằng giây) của 2 (ảnh 1)
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 50:

Cho đồ thị như hình vẽ. Từ đồ thị ta thấy:Cho đồ thị như hình vẽ. Từ đồ thị ta thấy:  a. Với cùng ngưỡng của độ hỗ trợ, thời gian thực thi của  (ảnh 1)
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP