Năng lực của hệ thống theo đuổi và thực hiện được các mục đích, mục tiêu đúng đắn là định nghĩa của:
Trả lời:
Đáp án đúng: D
Tính hiệu lực (Effectiveness) thể hiện năng lực của hệ thống trong việc theo đuổi và thực hiện các mục tiêu, mục đích đã đề ra một cách đúng đắn. Nó tập trung vào việc 'làm đúng việc'. Tính tối ưu liên quan đến việc sử dụng nguồn lực hiệu quả nhất, tính bền vững nói đến khả năng duy trì hoạt động lâu dài, còn tính hiệu quả là về việc đạt được kết quả mong muốn với nguồn lực tối thiểu.
Câu hỏi liên quan
Lời giải:
Đáp án đúng: C
Quy trình khai thác dữ liệu (Data Mining) thường bao gồm các bước sau:
1. Data Understanding (Hiểu dữ liệu): Bước này liên quan đến việc thu thập dữ liệu, khám phá dữ liệu ban đầu để hiểu rõ hơn về nó, xác định các vấn đề về chất lượng dữ liệu và có được những hiểu biết sâu sắc ban đầu về dữ liệu.
2. Data Preparation (Chuẩn bị dữ liệu): Bước này bao gồm việc làm sạch dữ liệu (xử lý các giá trị thiếu, loại bỏ nhiễu), biến đổi dữ liệu (ví dụ: chuẩn hóa dữ liệu, rời rạc hóa dữ liệu) và tích hợp dữ liệu (kết hợp dữ liệu từ nhiều nguồn khác nhau) để chuẩn bị cho quá trình khai thác.
3. Data Mining (Khai thác dữ liệu): Đây là bước chính, trong đó các thuật toán khai thác dữ liệu được áp dụng để tìm kiếm các mẫu, mối quan hệ, xu hướng ẩn chứa trong dữ liệu. Các kỹ thuật khai thác dữ liệu phổ biến bao gồm: phân loại, hồi quy, phân cụm, luật kết hợp, v.v.
4. Evaluation (Đánh giá): Kết quả khai thác dữ liệu cần được đánh giá để đảm bảo rằng chúng hữu ích và có ý nghĩa. Bước này có thể bao gồm việc đánh giá độ chính xác của mô hình, kiểm tra tính hợp lệ của các luật kết hợp và đánh giá xem các cụm có ý nghĩa hay không. Nếu kết quả không đạt yêu cầu, cần quay lại các bước trước để điều chỉnh.
Trong các lựa chọn đã cho, "Data Mining" thực sự là một *bước* trong quy trình, chứ không phải là một hoạt động *ngoài* quy trình. Do đó, nó không phù hợp để loại trừ. Các lựa chọn còn lại, "Data Understanding", "Data Preparation" và "Evaluation", đều là các bước riêng biệt và quan trọng trong quy trình khai thác dữ liệu.
1. Data Understanding (Hiểu dữ liệu): Bước này liên quan đến việc thu thập dữ liệu, khám phá dữ liệu ban đầu để hiểu rõ hơn về nó, xác định các vấn đề về chất lượng dữ liệu và có được những hiểu biết sâu sắc ban đầu về dữ liệu.
2. Data Preparation (Chuẩn bị dữ liệu): Bước này bao gồm việc làm sạch dữ liệu (xử lý các giá trị thiếu, loại bỏ nhiễu), biến đổi dữ liệu (ví dụ: chuẩn hóa dữ liệu, rời rạc hóa dữ liệu) và tích hợp dữ liệu (kết hợp dữ liệu từ nhiều nguồn khác nhau) để chuẩn bị cho quá trình khai thác.
3. Data Mining (Khai thác dữ liệu): Đây là bước chính, trong đó các thuật toán khai thác dữ liệu được áp dụng để tìm kiếm các mẫu, mối quan hệ, xu hướng ẩn chứa trong dữ liệu. Các kỹ thuật khai thác dữ liệu phổ biến bao gồm: phân loại, hồi quy, phân cụm, luật kết hợp, v.v.
4. Evaluation (Đánh giá): Kết quả khai thác dữ liệu cần được đánh giá để đảm bảo rằng chúng hữu ích và có ý nghĩa. Bước này có thể bao gồm việc đánh giá độ chính xác của mô hình, kiểm tra tính hợp lệ của các luật kết hợp và đánh giá xem các cụm có ý nghĩa hay không. Nếu kết quả không đạt yêu cầu, cần quay lại các bước trước để điều chỉnh.
Trong các lựa chọn đã cho, "Data Mining" thực sự là một *bước* trong quy trình, chứ không phải là một hoạt động *ngoài* quy trình. Do đó, nó không phù hợp để loại trừ. Các lựa chọn còn lại, "Data Understanding", "Data Preparation" và "Evaluation", đều là các bước riêng biệt và quan trọng trong quy trình khai thác dữ liệu.
Lời giải:
Đáp án đúng: D
Thuộc tính "Loại khách hàng" với các giá trị "VIP", "Premium" và "Economic" là thuộc tính rời rạc. Các giá trị này thuộc về một tập hợp hữu hạn và không liên tục.
* Liên tục: Dữ liệu liên tục có thể nhận bất kỳ giá trị nào trong một phạm vi nhất định (ví dụ: chiều cao, cân nặng).
* Rời rạc: Dữ liệu rời rạc chỉ có thể nhận một số giá trị nhất định (ví dụ: số lượng sản phẩm, loại khách hàng).
* Xếp hạng/thứ tự: Dữ liệu xếp hạng có một thứ tự tự nhiên giữa các giá trị (ví dụ: mức độ hài lòng: rất không hài lòng, không hài lòng, trung bình, hài lòng, rất hài lòng).
* Định danh: Dữ liệu định danh được sử dụng để phân biệt các đối tượng khác nhau (ví dụ: mã khách hàng, số điện thoại).
* Liên tục: Dữ liệu liên tục có thể nhận bất kỳ giá trị nào trong một phạm vi nhất định (ví dụ: chiều cao, cân nặng).
* Rời rạc: Dữ liệu rời rạc chỉ có thể nhận một số giá trị nhất định (ví dụ: số lượng sản phẩm, loại khách hàng).
* Xếp hạng/thứ tự: Dữ liệu xếp hạng có một thứ tự tự nhiên giữa các giá trị (ví dụ: mức độ hài lòng: rất không hài lòng, không hài lòng, trung bình, hài lòng, rất hài lòng).
* Định danh: Dữ liệu định danh được sử dụng để phân biệt các đối tượng khác nhau (ví dụ: mã khách hàng, số điện thoại).
Lời giải:
Đáp án đúng: C
Tiền xử lý dữ liệu là quá trình chuẩn bị dữ liệu thô để làm cho nó phù hợp hơn với các mô hình học máy và các thuật toán khai thác dữ liệu. Các bước chính trong tiền xử lý dữ liệu bao gồm: làm sạch dữ liệu (xử lý các giá trị bị thiếu, loại bỏ nhiễu), chuyển đổi dữ liệu (ví dụ: chuẩn hóa, rời rạc hóa), và rút gọn dữ liệu (ví dụ: giảm chiều dữ liệu, chọn lọc đặc trưng). Thu thập dữ liệu là một bước riêng biệt, xảy ra trước giai đoạn tiền xử lý. Vì vậy, "Thu thập dữ liệu" không phải là một bước của tiền xử lý dữ liệu.
Lời giải:
Đáp án đúng: B
Có nhiều cách để xử lý dữ liệu bị thiếu, tùy thuộc vào bản chất của dữ liệu và mục đích phân tích. Tuy nhiên, có 3 cách phổ biến nhất:
1. Loại bỏ các bản ghi/thuộc tính chứa giá trị thiếu: Cách này đơn giản nhưng có thể dẫn đến mất thông tin quan trọng nếu số lượng giá trị thiếu lớn.
2. Điền giá trị thiếu (Imputation): Thay thế giá trị thiếu bằng một giá trị ước tính. Các phương pháp điền giá trị bao gồm sử dụng giá trị trung bình, trung vị, mode, hoặc các mô hình dự đoán.
3. Sử dụng các thuật toán máy học có khả năng xử lý dữ liệu thiếu: Một số thuật toán có thể hoạt động hiệu quả ngay cả khi có dữ liệu thiếu.
Do đó, đáp án chính xác nhất là 3.
1. Loại bỏ các bản ghi/thuộc tính chứa giá trị thiếu: Cách này đơn giản nhưng có thể dẫn đến mất thông tin quan trọng nếu số lượng giá trị thiếu lớn.
2. Điền giá trị thiếu (Imputation): Thay thế giá trị thiếu bằng một giá trị ước tính. Các phương pháp điền giá trị bao gồm sử dụng giá trị trung bình, trung vị, mode, hoặc các mô hình dự đoán.
3. Sử dụng các thuật toán máy học có khả năng xử lý dữ liệu thiếu: Một số thuật toán có thể hoạt động hiệu quả ngay cả khi có dữ liệu thiếu.
Do đó, đáp án chính xác nhất là 3.
Lời giải:
Đáp án đúng: B
Rời rạc hóa dữ liệu (discretization) là quá trình chuyển đổi dữ liệu số (numerical data) thành dữ liệu rời rạc (discrete data), thường là các khoảng hoặc các nhóm. Việc này thường được thực hiện khi:
1. Dữ liệu thuộc kiểu số học: Các thuật toán khai thác dữ liệu hoặc học máy nhất định hoạt động tốt hơn với dữ liệu rời rạc hơn là dữ liệu số liên tục. Việc rời rạc hóa giúp đơn giản hóa dữ liệu, giảm số lượng giá trị khác biệt và có thể cải thiện hiệu suất của mô hình.
Các lựa chọn khác không đúng vì:
* Dữ liệu bị thiếu: Xử lý dữ liệu bị thiếu là một vấn đề riêng biệt, thường được giải quyết bằng cách điền giá trị hoặc loại bỏ các bản ghi bị thiếu.
* Dữ liệu thuộc kiểu định danh: Dữ liệu định danh (categorical data) đã là rời rạc, không cần rời rạc hóa thêm.
* Dữ liệu thuộc kiểu nhị phân: Dữ liệu nhị phân cũng đã là rời rạc, với chỉ hai giá trị có thể (0 hoặc 1).
1. Dữ liệu thuộc kiểu số học: Các thuật toán khai thác dữ liệu hoặc học máy nhất định hoạt động tốt hơn với dữ liệu rời rạc hơn là dữ liệu số liên tục. Việc rời rạc hóa giúp đơn giản hóa dữ liệu, giảm số lượng giá trị khác biệt và có thể cải thiện hiệu suất của mô hình.
Các lựa chọn khác không đúng vì:
* Dữ liệu bị thiếu: Xử lý dữ liệu bị thiếu là một vấn đề riêng biệt, thường được giải quyết bằng cách điền giá trị hoặc loại bỏ các bản ghi bị thiếu.
* Dữ liệu thuộc kiểu định danh: Dữ liệu định danh (categorical data) đã là rời rạc, không cần rời rạc hóa thêm.
* Dữ liệu thuộc kiểu nhị phân: Dữ liệu nhị phân cũng đã là rời rạc, với chỉ hai giá trị có thể (0 hoặc 1).
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy
89 tài liệu310 lượt tải

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin
125 tài liệu441 lượt tải

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông
104 tài liệu687 lượt tải

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán
103 tài liệu589 lượt tải

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp
377 tài liệu1030 lượt tải

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
99 tài liệu1062 lượt tải
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.
77.000 đ/ tháng