Trong Orange, biến có kiểu dữ liệu categorical là để chỉ các thuộc tính:
Trả lời:
Đáp án đúng: B
Trong Orange, biến kiểu categorical (phân loại) dùng để biểu diễn các thuộc tính rời rạc. Các thuộc tính này thường đại diện cho các nhóm, loại hoặc nhãn khác nhau, không mang tính liên tục hay định lượng. Ví dụ: màu sắc (đỏ, xanh, vàng), giới tính (nam, nữ), hoặc loại sản phẩm (điện tử, quần áo, thực phẩm).
Câu hỏi liên quan
Lời giải:
Đáp án đúng: C
Đánh giá ngoài (external evaluation) so sánh kết quả phân cụm với một "ground truth", tức là một tập các nhãn đã biết trước. Mục tiêu là đánh giá xem các cụm tìm được có khớp với cấu trúc thực tế của dữ liệu hay không. Vì câu hỏi đề cập đến việc so sánh kết quả giữa *các* mô hình, nghĩa là ta đang so sánh với một chuẩn mực hoặc một kết quả mong muốn nào đó, nên đây là đánh giá ngoài. Đánh giá trong (internal evaluation) chỉ dựa trên dữ liệu và kết quả phân cụm mà không so sánh với bất kỳ thông tin bên ngoài nào.
Lời giải:
Đáp án đúng: C
Phân tích:
Câu hỏi yêu cầu xác định công cụ thống kê mô tả nào phù hợp để tổng hợp dữ liệu đa chiều.
Giải thích các lựa chọn:
- a. Subtotal: Subtotal (Tổng cộng theo nhóm) chủ yếu dùng để tính tổng, trung bình, hoặc các phép tính khác cho các nhóm dữ liệu trong một cột. Nó không mạnh mẽ trong việc tổng hợp dữ liệu theo nhiều chiều khác nhau.
- b. Consolidate: Consolidate (Kết hợp) được sử dụng để tổng hợp dữ liệu từ nhiều nguồn khác nhau vào một vị trí duy nhất. Mặc dù có thể tổng hợp dữ liệu, nhưng không phải là công cụ chính để tạo ra các báo cáo tổng hợp đa chiều linh hoạt.
- c. PivotTable: PivotTable (Bảng tổng hợp) là một công cụ rất mạnh mẽ để tổng hợp và phân tích dữ liệu theo nhiều chiều khác nhau. Nó cho phép người dùng kéo và thả các trường dữ liệu vào các vùng khác nhau (hàng, cột, giá trị) để tạo ra các báo cáo tổng hợp linh hoạt và tương tác.
- d. Tất cả đều sai: Phương án này không đúng vì có một đáp án đúng ở trên.
Kết luận:
PivotTable là công cụ phù hợp nhất để tổng hợp dữ liệu đa chiều.
Lời giải:
Đáp án đúng: C
Công cụ được sử dụng để dự đoán xu hướng tăng/giảm của mã chứng khoán dựa trên thông tin giá cả và lượng cổ phiếu mua/bán của các ngày trước đó thường là các phương pháp phân tích kỹ thuật. Trong các lựa chọn được đưa ra:
* Trung bình trượt (Moving Average): Là một công cụ phân tích kỹ thuật phổ biến, giúp làm mịn dữ liệu giá và xác định xu hướng bằng cách tính trung bình giá trong một khoảng thời gian nhất định.
* San bằng mũ (Exponential Smoothing): Là một phương pháp dự báo chuỗi thời gian, gán trọng số giảm dần theo cấp số nhân cho các quan sát cũ hơn. Nó nhạy hơn với những thay đổi gần đây so với trung bình trượt đơn giản.
* Hồi quy (Regression): Là một kỹ thuật thống kê được sử dụng để mô hình hóa mối quan hệ giữa các biến. Trong bối cảnh này, hồi quy có thể được sử dụng để dự đoán giá cổ phiếu dựa trên các yếu tố khác nhau, bao gồm cả giá và khối lượng giao dịch trong quá khứ.
Vì cả ba phương pháp đều có thể được sử dụng để dự đoán xu hướng, tuy nhiên, trong bối cảnh câu hỏi, trung bình trượt và san bằng mũ được sử dụng phổ biến hơn để phân tích xu hướng giá cả và khối lượng giao dịch trong quá khứ một cách trực tiếp.
* Trung bình trượt (Moving Average): Là một công cụ phân tích kỹ thuật phổ biến, giúp làm mịn dữ liệu giá và xác định xu hướng bằng cách tính trung bình giá trong một khoảng thời gian nhất định.
* San bằng mũ (Exponential Smoothing): Là một phương pháp dự báo chuỗi thời gian, gán trọng số giảm dần theo cấp số nhân cho các quan sát cũ hơn. Nó nhạy hơn với những thay đổi gần đây so với trung bình trượt đơn giản.
* Hồi quy (Regression): Là một kỹ thuật thống kê được sử dụng để mô hình hóa mối quan hệ giữa các biến. Trong bối cảnh này, hồi quy có thể được sử dụng để dự đoán giá cổ phiếu dựa trên các yếu tố khác nhau, bao gồm cả giá và khối lượng giao dịch trong quá khứ.
Vì cả ba phương pháp đều có thể được sử dụng để dự đoán xu hướng, tuy nhiên, trong bối cảnh câu hỏi, trung bình trượt và san bằng mũ được sử dụng phổ biến hơn để phân tích xu hướng giá cả và khối lượng giao dịch trong quá khứ một cách trực tiếp.
Lời giải:
Đáp án đúng: B
Có nhiều cách để xử lý dữ liệu bị thiếu, trong đó phổ biến nhất là:
1. Loại bỏ các dòng/cột chứa dữ liệu bị thiếu: Cách này đơn giản nhưng có thể làm mất thông tin quan trọng nếu số lượng dữ liệu bị thiếu lớn.
2. Điền giá trị thiếu (Imputation): Thay thế các giá trị thiếu bằng một giá trị ước tính. Các phương pháp điền giá trị phổ biến bao gồm:
* Điền bằng giá trị trung bình (mean imputation).
* Điền bằng giá trị trung vị (median imputation).
* Điền bằng giá trị thường xuyên xuất hiện nhất (mode imputation).
* Sử dụng các thuật toán học máy để dự đoán giá trị thiếu (ví dụ: k-Nearest Neighbors, Linear Regression).
3. Sử dụng các thuật toán có thể xử lý dữ liệu bị thiếu: Một số thuật toán học máy có thể xử lý dữ liệu bị thiếu mà không cần phải loại bỏ hoặc điền giá trị.
Do đó, có ít nhất 3 cách xử lý dữ liệu bị thiếu. Tuy nhiên, câu hỏi có thể đang đề cập đến các cách phân loại khác nhau hoặc chi tiết hơn, nên đáp án chính xác nhất trong các lựa chọn là 'b. 3' (dù trên thực tế có nhiều hơn 3).
1. Loại bỏ các dòng/cột chứa dữ liệu bị thiếu: Cách này đơn giản nhưng có thể làm mất thông tin quan trọng nếu số lượng dữ liệu bị thiếu lớn.
2. Điền giá trị thiếu (Imputation): Thay thế các giá trị thiếu bằng một giá trị ước tính. Các phương pháp điền giá trị phổ biến bao gồm:
* Điền bằng giá trị trung bình (mean imputation).
* Điền bằng giá trị trung vị (median imputation).
* Điền bằng giá trị thường xuyên xuất hiện nhất (mode imputation).
* Sử dụng các thuật toán học máy để dự đoán giá trị thiếu (ví dụ: k-Nearest Neighbors, Linear Regression).
3. Sử dụng các thuật toán có thể xử lý dữ liệu bị thiếu: Một số thuật toán học máy có thể xử lý dữ liệu bị thiếu mà không cần phải loại bỏ hoặc điền giá trị.
Do đó, có ít nhất 3 cách xử lý dữ liệu bị thiếu. Tuy nhiên, câu hỏi có thể đang đề cập đến các cách phân loại khác nhau hoặc chi tiết hơn, nên đáp án chính xác nhất trong các lựa chọn là 'b. 3' (dù trên thực tế có nhiều hơn 3).
Lời giải:
Đáp án đúng: B
Trong Orange, biến có kiểu dữ liệu categorical (phân loại) dùng để chỉ các thuộc tính rời rạc. Các thuộc tính này biểu diễn các nhóm hoặc các loại, ví dụ như màu sắc (đỏ, xanh, vàng), giới tính (nam, nữ), hoặc loại sản phẩm (A, B, C). Chúng không mang ý nghĩa số học và không thể thực hiện các phép tính toán học trực tiếp trên chúng. Vì vậy, đáp án đúng là "Rời rạc".
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy
89 tài liệu310 lượt tải

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin
125 tài liệu441 lượt tải

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông
104 tài liệu687 lượt tải

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán
103 tài liệu589 lượt tải

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp
377 tài liệu1030 lượt tải

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
99 tài liệu1062 lượt tải
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.
77.000 đ/ tháng