Giả sử chúng ta muốn xây dựng a mô hình phân loại, a tập hợp các thể hiện dữ liệu được sử dụng để phù hợp với các tham số (quá trình học) được gọi là ...
Trả lời:
Đáp án đúng: C
Tập huấn luyện (training set) là tập hợp các mẫu dữ liệu được sử dụng để huấn luyện mô hình học máy. Trong quá trình huấn luyện, mô hình sẽ học cách ánh xạ các đặc trưng đầu vào đến nhãn đầu ra dựa trên các mẫu dữ liệu trong tập huấn luyện. Các phương án khác không liên quan đến quá trình huấn luyện mô hình.
Câu hỏi liên quan
Lời giải:
Đáp án đúng: A
Khi mô hình học máy không thể nắm bắt được mẫu cơ bản bên trong dữ liệu, điều này có nghĩa là mô hình quá đơn giản và không đủ phức tạp để biểu diễn mối quan hệ trong dữ liệu. Tình trạng này được gọi là "thiếu trang bị" (underfitting).
* Thiếu trang bị (Underfitting): Xảy ra khi mô hình quá đơn giản để nắm bắt các mối quan hệ phức tạp trong dữ liệu. Nó thường dẫn đến hiệu suất kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
* Trang bị quá mức (Overfitting): Xảy ra khi mô hình quá phức tạp và học cả nhiễu trong dữ liệu huấn luyện. Nó thường dẫn đến hiệu suất rất tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra.
Trong trường hợp này, vì mô hình không thể nắm bắt được mẫu cơ bản, nên nó đang bị thiếu trang bị.
* Thiếu trang bị (Underfitting): Xảy ra khi mô hình quá đơn giản để nắm bắt các mối quan hệ phức tạp trong dữ liệu. Nó thường dẫn đến hiệu suất kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
* Trang bị quá mức (Overfitting): Xảy ra khi mô hình quá phức tạp và học cả nhiễu trong dữ liệu huấn luyện. Nó thường dẫn đến hiệu suất rất tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra.
Trong trường hợp này, vì mô hình không thể nắm bắt được mẫu cơ bản, nên nó đang bị thiếu trang bị.
Lời giải:
Đáp án đúng: B
Câu hỏi đề cập đến việc lựa chọn các thuộc tính mô tả phù hợp để cải thiện hiệu suất của mô hình dự đoán. Quá trình này được gọi là "Kỹ thuật tính năng" (Feature Engineering).
* a. Trực quan hóa dữ liệu: Là quá trình biểu diễn dữ liệu bằng đồ thị, biểu đồ để dễ dàng phân tích và hiểu dữ liệu hơn, không trực tiếp liên quan đến việc lựa chọn thuộc tính.
* b. Kỹ thuật tính năng: Là quá trình chọn, biến đổi và tạo ra các thuộc tính mới từ dữ liệu hiện có để cải thiện hiệu suất của mô hình học máy.
* c. Dự đoán tính năng: Không phải là một thuật ngữ phổ biến trong phân tích dữ liệu.
* d. Tiền xử lý dữ liệu: Bao gồm nhiều bước như làm sạch dữ liệu, xử lý dữ liệu thiếu, chuyển đổi dữ liệu, nhưng không chỉ tập trung vào việc lựa chọn thuộc tính để cải thiện hiệu suất mô hình.
Do đó, đáp án chính xác là Kỹ thuật tính năng.
* a. Trực quan hóa dữ liệu: Là quá trình biểu diễn dữ liệu bằng đồ thị, biểu đồ để dễ dàng phân tích và hiểu dữ liệu hơn, không trực tiếp liên quan đến việc lựa chọn thuộc tính.
* b. Kỹ thuật tính năng: Là quá trình chọn, biến đổi và tạo ra các thuộc tính mới từ dữ liệu hiện có để cải thiện hiệu suất của mô hình học máy.
* c. Dự đoán tính năng: Không phải là một thuật ngữ phổ biến trong phân tích dữ liệu.
* d. Tiền xử lý dữ liệu: Bao gồm nhiều bước như làm sạch dữ liệu, xử lý dữ liệu thiếu, chuyển đổi dữ liệu, nhưng không chỉ tập trung vào việc lựa chọn thuộc tính để cải thiện hiệu suất mô hình.
Do đó, đáp án chính xác là Kỹ thuật tính năng.
Lời giải:
Đáp án đúng: D
Câu hỏi này đề cập đến việc tìm kiếm các mẫu (patterns) trong dữ liệu.
* a. Phát hiện đối tượng: Liên quan đến việc xác định và định vị các đối tượng cụ thể trong hình ảnh hoặc video. Không trực tiếp liên quan đến việc tìm kiếm các mẫu tổng quát trong dữ liệu.
* b. Học máy: Một lĩnh vực của trí tuệ nhân tạo, tập trung vào việc cho phép máy tính học từ dữ liệu mà không cần được lập trình rõ ràng. Học máy có thể được sử dụng để tìm kiếm các mẫu trong dữ liệu, nhưng nó là một khái niệm rộng hơn.
* c. Khoa học dữ liệu: Một lĩnh vực liên ngành sử dụng các phương pháp khoa học, quy trình, thuật toán và hệ thống để trích xuất kiến thức và hiểu biết sâu sắc từ dữ liệu ở nhiều dạng khác nhau. Khoa học dữ liệu bao gồm cả việc tìm kiếm các mẫu, nhưng nó cũng bao gồm các khía cạnh khác như làm sạch dữ liệu, trực quan hóa dữ liệu, v.v.
* d. Khai thác dữ liệu: Quá trình khám phá các mẫu trong các tập dữ liệu lớn liên quan đến các phương pháp ở giao điểm của học máy, thống kê và hệ thống cơ sở dữ liệu. Đây là đáp án chính xác nhất vì nó tập trung cụ thể vào việc khám phá các mẫu ẩn trong dữ liệu.
Vì vậy, đáp án đúng là d. Khai thác dữ liệu
* a. Phát hiện đối tượng: Liên quan đến việc xác định và định vị các đối tượng cụ thể trong hình ảnh hoặc video. Không trực tiếp liên quan đến việc tìm kiếm các mẫu tổng quát trong dữ liệu.
* b. Học máy: Một lĩnh vực của trí tuệ nhân tạo, tập trung vào việc cho phép máy tính học từ dữ liệu mà không cần được lập trình rõ ràng. Học máy có thể được sử dụng để tìm kiếm các mẫu trong dữ liệu, nhưng nó là một khái niệm rộng hơn.
* c. Khoa học dữ liệu: Một lĩnh vực liên ngành sử dụng các phương pháp khoa học, quy trình, thuật toán và hệ thống để trích xuất kiến thức và hiểu biết sâu sắc từ dữ liệu ở nhiều dạng khác nhau. Khoa học dữ liệu bao gồm cả việc tìm kiếm các mẫu, nhưng nó cũng bao gồm các khía cạnh khác như làm sạch dữ liệu, trực quan hóa dữ liệu, v.v.
* d. Khai thác dữ liệu: Quá trình khám phá các mẫu trong các tập dữ liệu lớn liên quan đến các phương pháp ở giao điểm của học máy, thống kê và hệ thống cơ sở dữ liệu. Đây là đáp án chính xác nhất vì nó tập trung cụ thể vào việc khám phá các mẫu ẩn trong dữ liệu.
Vì vậy, đáp án đúng là d. Khai thác dữ liệu
Lời giải:
Đáp án đúng: B
Câu hỏi này kiểm tra kiến thức về các lĩnh vực liên quan đến phân tích dữ liệu và xây dựng mô hình dự đoán.
* Học máy (b) là lĩnh vực tập trung vào việc phát triển các thuật toán cho phép máy tính học từ dữ liệu mà không cần được lập trình rõ ràng. Trong học máy, mô hình dự đoán thường được xây dựng bằng cách huấn luyện trên một tập dữ liệu quan sát được. Đây là đáp án chính xác nhất.
* Hệ thống quản lý quan hệ khách hàng (a) là một hệ thống được sử dụng để quản lý tương tác của công ty với khách hàng hiện tại và tiềm năng. Nó không trực tiếp liên quan đến việc xây dựng mô hình dự đoán từ dữ liệu quan sát được.
* Khoa học dữ liệu (c) là một lĩnh vực rộng hơn bao gồm việc thu thập, xử lý, phân tích và diễn giải dữ liệu. Học máy là một phần quan trọng của khoa học dữ liệu, nhưng khoa học dữ liệu không phải lúc nào cũng liên quan đến việc xây dựng mô hình dự đoán từ dữ liệu quan sát được một cách trực tiếp.
* Khai thác dữ liệu (d) là quá trình khám phá các mẫu và thông tin hữu ích từ các tập dữ liệu lớn. Mặc dù khai thác dữ liệu có thể liên quan đến việc xây dựng mô hình dự đoán, nhưng nó không phải là lĩnh vực duy nhất mà mô hình dự đoán được xây dựng từ dữ liệu quan sát được.
* Học máy (b) là lĩnh vực tập trung vào việc phát triển các thuật toán cho phép máy tính học từ dữ liệu mà không cần được lập trình rõ ràng. Trong học máy, mô hình dự đoán thường được xây dựng bằng cách huấn luyện trên một tập dữ liệu quan sát được. Đây là đáp án chính xác nhất.
* Hệ thống quản lý quan hệ khách hàng (a) là một hệ thống được sử dụng để quản lý tương tác của công ty với khách hàng hiện tại và tiềm năng. Nó không trực tiếp liên quan đến việc xây dựng mô hình dự đoán từ dữ liệu quan sát được.
* Khoa học dữ liệu (c) là một lĩnh vực rộng hơn bao gồm việc thu thập, xử lý, phân tích và diễn giải dữ liệu. Học máy là một phần quan trọng của khoa học dữ liệu, nhưng khoa học dữ liệu không phải lúc nào cũng liên quan đến việc xây dựng mô hình dự đoán từ dữ liệu quan sát được một cách trực tiếp.
* Khai thác dữ liệu (d) là quá trình khám phá các mẫu và thông tin hữu ích từ các tập dữ liệu lớn. Mặc dù khai thác dữ liệu có thể liên quan đến việc xây dựng mô hình dự đoán, nhưng nó không phải là lĩnh vực duy nhất mà mô hình dự đoán được xây dựng từ dữ liệu quan sát được.
Lời giải:
Đáp án đúng: D
Hồi quy là một phương pháp trong học máy thuộc nhóm học tập có giám sát. Trong học tập có giám sát, chúng ta có một tập dữ liệu đã được gán nhãn (label), và mục tiêu là xây dựng một mô hình có thể dự đoán nhãn cho các dữ liệu mới dựa trên các đặc trưng (features) của chúng. Hồi quy được sử dụng khi nhãn là một giá trị liên tục (ví dụ: dự đoán giá nhà, dự đoán nhiệt độ).
* Học tập không giám sát: Không sử dụng dữ liệu đã gán nhãn.
* Lựa chọn tính năng: Là quá trình chọn ra các tính năng quan trọng nhất từ tập dữ liệu.
* Học tăng cường: Là một loại học máy, trong đó một "agent" học cách đưa ra quyết định trong một môi trường để tối đa hóa phần thưởng tích lũy.
* Học tập không giám sát: Không sử dụng dữ liệu đã gán nhãn.
* Lựa chọn tính năng: Là quá trình chọn ra các tính năng quan trọng nhất từ tập dữ liệu.
* Học tăng cường: Là một loại học máy, trong đó một "agent" học cách đưa ra quyết định trong một môi trường để tối đa hóa phần thưởng tích lũy.
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

FORM.08: Bộ 130+ Biểu Mẫu Thống Kê Trong Doanh Nghiệp
136 tài liệu563 lượt tải

FORM.07: Bộ 125+ Biểu Mẫu Báo Cáo Trong Doanh Nghiệp
125 tài liệu585 lượt tải

FORM.06: Bộ 320+ Biểu Mẫu Hành Chính Thông Dụng
325 tài liệu608 lượt tải

FORM.05: Bộ 330+ Biểu Mẫu Thuế - Kê Khai Thuế Mới Nhất
331 tài liệu1010 lượt tải

FORM.04: Bộ 240+ Biểu Mẫu Chứng Từ Kế Toán Thông Dụng
246 tài liệu802 lượt tải

CEO.22: Bộ Tài Liệu Quy Trình Kiểm Toán, Kiểm Soát Nội Bộ Doanh Nghiệp
138 tài liệu417 lượt tải
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.
77.000 đ/ tháng