Cho cụm C gồm các điểm A(1, 1), B(2, 4), C(6, 1). Giả sử tâm của cụm là vector trung bình. Tâm của cụm là:
Trả lời:
Đáp án đúng: A
Để tìm tâm của cụm C, ta tính vector trung bình của các điểm A(1, 1), B(2, 4), C(6, 1).
Tâm mC = ((1 + 2 + 6)/3; (1 + 4 + 1)/3) = (9/3; 6/3) = (3; 2)
Câu hỏi liên quan
Lời giải:
Đáp án đúng: A
Câu hỏi yêu cầu xác định khoảng cách giữa x3 và x4 sau khi thực hiện một bước trong thuật toán liên kết đơn (Single Linkage). Thuật toán liên kết đơn sử dụng khoảng cách nhỏ nhất giữa hai điểm dữ liệu thuộc hai cụm khác nhau để xác định khoảng cách giữa hai cụm đó. Tuy nhiên, ở đây ta mới chỉ gom x1 và x2 thành một cụm, và câu hỏi hỏi khoảng cách giữa x3 và x4. Do đó, việc gom cụm này không ảnh hưởng đến khoảng cách ban đầu giữa x3 và x4. Nhìn vào ma trận không tương tự đã cho, ta thấy khoảng cách giữa x3 và x4 là 0.
Lời giải:
Đáp án đúng: A
Thuật toán Complete Linkage (Liên kết đầy đủ) định nghĩa khoảng cách giữa hai cụm là khoảng cách lớn nhất giữa hai điểm bất kỳ thuộc hai cụm đó.
Như vậy, khoảng cách giữa cụm C = {x1, x2} và x3 sẽ là max(d(x1, x3), d(x2, x3)).
Để trả lời câu hỏi này, ta cần có ma trận không tương tự (dissimilarity matrix) để biết giá trị d(x1, x3) và d(x2, x3). Vì ma trận này không được cung cấp trong đề bài, ta không thể tính toán chính xác khoảng cách giữa cụm C và x3. Do đó, không thể xác định đáp án đúng trong các lựa chọn A, B, C, D chỉ dựa trên thông tin đã cho.
Vì không có ma trận khoảng cách, nên không có đáp án đúng trong các đáp án đã cho.
Như vậy, khoảng cách giữa cụm C = {x1, x2} và x3 sẽ là max(d(x1, x3), d(x2, x3)).
Để trả lời câu hỏi này, ta cần có ma trận không tương tự (dissimilarity matrix) để biết giá trị d(x1, x3) và d(x2, x3). Vì ma trận này không được cung cấp trong đề bài, ta không thể tính toán chính xác khoảng cách giữa cụm C và x3. Do đó, không thể xác định đáp án đúng trong các lựa chọn A, B, C, D chỉ dựa trên thông tin đã cho.
Vì không có ma trận khoảng cách, nên không có đáp án đúng trong các đáp án đã cho.
Lời giải:
Đáp án đúng: A
Đề bài yêu cầu xác định các cụm (cluster) được tạo ra khi cắt sơ đồ tại ngưỡng 1.5. Điều này có nghĩa là chúng ta cần xem xét giá trị của các điểm dữ liệu (x1, x2, x3, x4, x5) so với ngưỡng 1.5 để gom chúng vào các cụm. Dựa trên sơ đồ ngưỡng (không được cung cấp hình ảnh, nhưng hiểu là các điểm gần nhau trên sơ đồ sẽ có giá trị tương tự nhau):
* C1 = {x1, x2}: Giả định rằng x1 và x2 có giá trị gần nhau và nhỏ hơn 1.5, do đó chúng thuộc cùng một cụm.
* C2 = {x3}: Giả định rằng x3 có giá trị khác biệt và cũng nhỏ hơn 1.5 nhưng đủ khác biệt để tạo thành cụm riêng, hoặc có giá trị lớn hơn 1.5 rất nhiều so với x1 và x2.
* C3 = {x4}: Giả định rằng x4 có giá trị khác biệt so với các điểm khác, và nhỏ hơn 1.5, hoặc lớn hơn 1.5 rất nhiều so với x1, x2, x3.
* C4 = {x5}: Giả định rằng x5 có giá trị khác biệt so với các điểm khác, và nhỏ hơn 1.5, hoặc lớn hơn 1.5 rất nhiều so với x1, x2, x3, x4.
Trong các phương án, phương án A có vẻ phù hợp với cách các điểm được nhóm lại dựa trên giá trị của chúng so với ngưỡng 1.5, mặc dù không có hình ảnh sơ đồ để tham khảo trực quan. Tuy nhiên các phương án khác không hợp lý vì x4 và x5 có vẻ có giá trị khác biệt so với x1, x2, x3 và tạo thành các cụm riêng biệt.
* C1 = {x1, x2}: Giả định rằng x1 và x2 có giá trị gần nhau và nhỏ hơn 1.5, do đó chúng thuộc cùng một cụm.
* C2 = {x3}: Giả định rằng x3 có giá trị khác biệt và cũng nhỏ hơn 1.5 nhưng đủ khác biệt để tạo thành cụm riêng, hoặc có giá trị lớn hơn 1.5 rất nhiều so với x1 và x2.
* C3 = {x4}: Giả định rằng x4 có giá trị khác biệt so với các điểm khác, và nhỏ hơn 1.5, hoặc lớn hơn 1.5 rất nhiều so với x1, x2, x3.
* C4 = {x5}: Giả định rằng x5 có giá trị khác biệt so với các điểm khác, và nhỏ hơn 1.5, hoặc lớn hơn 1.5 rất nhiều so với x1, x2, x3, x4.
Trong các phương án, phương án A có vẻ phù hợp với cách các điểm được nhóm lại dựa trên giá trị của chúng so với ngưỡng 1.5, mặc dù không có hình ảnh sơ đồ để tham khảo trực quan. Tuy nhiên các phương án khác không hợp lý vì x4 và x5 có vẻ có giá trị khác biệt so với x1, x2, x3 và tạo thành các cụm riêng biệt.
Lời giải:
Đáp án đúng: A
Thuật ngữ "Data Mining" trong tiếng Anh dịch sang tiếng Việt có nghĩa là "Khai phá dữ liệu" hoặc "Khai thác dữ liệu". Các phương án khác như "Khai phá luật kết hợp", "Khai phá tập mục thường xuyên", "Khai phá tri thức từ dữ liệu lớn" là các khía cạnh hoặc kỹ thuật cụ thể hơn trong lĩnh vực Data Mining, chứ không phải là bản dịch trực tiếp của thuật ngữ này.
Lời giải:
Đáp án đúng: A
KDD (Knowledge Discovery in Databases) là một quy trình phức tạp bao gồm nhiều bước, trong đó khai phá dữ liệu (data mining) chỉ là một bước. KDD tập trung vào việc khám phá tri thức hữu ích và tiềm năng từ các cơ sở dữ liệu lớn, bao gồm các bước tiền xử lý dữ liệu, lựa chọn thuật toán khai phá, diễn giải và đánh giá kết quả. Đáp án A mô tả chính xác mục tiêu của KDD.
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy
89 tài liệu310 lượt tải

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin
125 tài liệu441 lượt tải

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông
104 tài liệu687 lượt tải

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán
103 tài liệu589 lượt tải

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp
377 tài liệu1030 lượt tải

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
99 tài liệu1062 lượt tải
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.
77.000 đ/ tháng