JavaScript is required
Danh sách đề

120+ câu hỏi trắc nghiệm Lý thuyết môn Học máy kèm đáp án chi tiết - Đề 2

50 câu hỏi 60 phút

Thẻ ghi nhớ
Luyện tập
Thi thử
Nhấn để lật thẻ
1 / 50
L1.X. (Các) lý do của việc trang bị quá mức? 
A.
Mô hình quá phức tạp
B.
Phương sai cao và độ lệch thấp
C.
Tất cả các lý do được đề cập
D.
Quá nhiều tiếng ồn trong dữ liệu huấn luyện
Đáp án
Đáp án đúng: D

Câu hỏi này liên quan đến hiện tượng "quá khớp" (overfitting) trong machine learning. Quá khớp xảy ra khi mô hình học quá sát dữ liệu huấn luyện, bao gồm cả nhiễu, dẫn đến khả năng khái quát hóa kém trên dữ liệu mới.

  • a. Mô hình quá phức tạp: Mô hình phức tạp có nhiều tham số, dễ dàng "ghi nhớ" dữ liệu huấn luyện, bao gồm cả nhiễu. Điều này làm tăng khả năng quá khớp.
  • b. Phương sai cao và độ lệch thấp: Đây là đặc điểm của mô hình bị quá khớp. Phương sai cao nghĩa là mô hình rất nhạy cảm với sự thay đổi nhỏ trong dữ liệu huấn luyện. Độ lệch thấp nghĩa là mô hình khớp rất tốt với dữ liệu huấn luyện.
  • d. Quá nhiều tiếng ồn trong dữ liệu huấn luyện: Nhiễu (noise) trong dữ liệu huấn luyện có thể là các điểm dữ liệu sai lệch hoặc không liên quan. Mô hình học cả nhiễu sẽ dẫn đến quá khớp.

Vì cả ba lý do trên đều góp phần vào việc trang bị quá mức, đáp án đúng là c.

Danh sách câu hỏi:

Câu 1:

L1.X. (Các) lý do của việc trang bị quá mức? 
Lời giải:
Đáp án đúng: C

Câu hỏi này liên quan đến hiện tượng "quá khớp" (overfitting) trong machine learning. Quá khớp xảy ra khi mô hình học quá sát dữ liệu huấn luyện, bao gồm cả nhiễu, dẫn đến khả năng khái quát hóa kém trên dữ liệu mới.

  • a. Mô hình quá phức tạp: Mô hình phức tạp có nhiều tham số, dễ dàng "ghi nhớ" dữ liệu huấn luyện, bao gồm cả nhiễu. Điều này làm tăng khả năng quá khớp.
  • b. Phương sai cao và độ lệch thấp: Đây là đặc điểm của mô hình bị quá khớp. Phương sai cao nghĩa là mô hình rất nhạy cảm với sự thay đổi nhỏ trong dữ liệu huấn luyện. Độ lệch thấp nghĩa là mô hình khớp rất tốt với dữ liệu huấn luyện.
  • d. Quá nhiều tiếng ồn trong dữ liệu huấn luyện: Nhiễu (noise) trong dữ liệu huấn luyện có thể là các điểm dữ liệu sai lệch hoặc không liên quan. Mô hình học cả nhiễu sẽ dẫn đến quá khớp.

Vì cả ba lý do trên đều góp phần vào việc trang bị quá mức, đáp án đúng là c.

Câu 2:

Câu nào KHÔNG đúng về bài toán phân loại và dự đoán? 
Lời giải:
Đáp án đúng: C

Câu hỏi yêu cầu tìm phát biểu KHÔNG đúng về bài toán phân loại và dự đoán.

a. Trong phân loại, đầu ra là một giá trị rời rạc. Đây là phát biểu ĐÚNG. Phân loại gán một đối tượng vào một trong số các lớp (categories) đã định trước, là các giá trị rời rạc.

b. Trong dự đoán, đầu ra có thể là giá trị liên tục hoặc giá trị rời rạc. Đây là phát biểu ĐÚNG. Dự đoán có thể là hồi quy (giá trị liên tục) hoặc phân loại (giá trị rời rạc).

c. Nhiệm vụ dự đoán về cơ bản là phân loại. Đây là phát biểu SAI. Dự đoán bao gồm cả phân loại và hồi quy, không chỉ là phân loại.

d. Phân loại là một nhiệm vụ dự đoán. Đây là phát biểu ĐÚNG. Vì phân loại là một dạng của dự đoán (dự đoán lớp của đối tượng).

Vậy, đáp án KHÔNG đúng là 'Nhiệm vụ dự đoán về cơ bản là phân loại.'

Câu 3:

L1.X. Nếu a mô hình học máy phù hợp tốt trên tập huấn luyện nhưng hoạt động kém trên tập kiểm tra thì mô hình đó sẽ bị ...
Lời giải:
Đáp án đúng: C

Câu hỏi này liên quan đến khái niệm overfitting (quá khớp) và underfitting (khớp thiếu) trong machine learning.

  • Underfitting (Khớp thiếu): Xảy ra khi mô hình quá đơn giản để nắm bắt được cấu trúc dữ liệu bên dưới. Mô hình có hiệu suất kém cả trên tập huấn luyện và tập kiểm tra.
  • Overfitting (Quá khớp): Xảy ra khi mô hình học quá kỹ dữ liệu huấn luyện, bao gồm cả nhiễu. Điều này dẫn đến hiệu suất rất tốt trên tập huấn luyện nhưng hiệu suất kém trên tập kiểm tra, vì mô hình không thể khái quát hóa tốt cho dữ liệu mới.

Trong trường hợp này, mô hình hoạt động tốt trên tập huấn luyện (tức là đã học kỹ dữ liệu huấn luyện) nhưng lại hoạt động kém trên tập kiểm tra (tức là không khái quát hóa tốt). Đây chính là dấu hiệu của overfitting.

Do đó, đáp án đúng là: c. vấn đề trang bị quá mức

Câu 4:

(Các) lý do của việc trang bị không phù hợp? 
Lời giải:
Đáp án đúng: C

Câu hỏi này liên quan đến các nguyên nhân dẫn đến việc trang bị (mô hình) không phù hợp trong học máy hoặc các hệ thống tương tự. Chúng ta cần xem xét từng đáp án để xác định lý do chính xác.

  • a. Mô hình quá đơn giản: Một mô hình quá đơn giản (underfitting) có thể không nắm bắt được các mối quan hệ phức tạp trong dữ liệu, dẫn đến hiệu suất kém.
  • b. Không đủ dữ liệu đào tạo: Khi không có đủ dữ liệu đào tạo, mô hình có thể không học được các đặc trưng quan trọng, dẫn đến hiệu suất kém.
  • c. Tất cả các yếu tố đều đúng: Đây là một khả năng, nhưng cần xem xét kỹ các yếu tố khác.
  • d. Độ lệch cao và phương sai thấp: Độ lệch cao (high bias) thường xảy ra khi mô hình quá đơn giản và không khớp với dữ liệu. Phương sai thấp (low variance) có nghĩa là mô hình nhất quán trên các tập dữ liệu khác nhau, nhưng nếu độ lệch cao, nó vẫn sẽ hoạt động kém.
  • đ. Tập dữ liệu huấn luyện không được làm sạch, chứa tiếng ồn: Dữ liệu nhiễu (noise) có thể làm cho mô hình học các mẫu không chính xác, dẫn đến hiệu suất kém.

Trong các lựa chọn trên, tất cả các yếu tố (mô hình quá đơn giản, không đủ dữ liệu, độ lệch cao/phương sai thấp, dữ liệu nhiễu) đều có thể dẫn đến việc trang bị không phù hợp. Do đó, đáp án "c. Tất cả các yếu tố đều đúng" là đáp án chính xác nhất.

Câu 5:

Phân cụm là a ví dụ của ... 
Lời giải:
Đáp án đúng: C

Phân cụm (clustering) là một kỹ thuật trong học máy (machine learning) thuộc loại học không giám sát (unsupervised learning). Trong học không giám sát, thuật toán được cung cấp dữ liệu mà không có nhãn (labels) hoặc kết quả đầu ra mong muốn trước. Mục tiêu của thuật toán là tìm ra các cấu trúc ẩn, nhóm các điểm dữ liệu tương tự lại với nhau dựa trên một số tiêu chí (ví dụ: khoảng cách, mật độ).

  • Lựa chọn tính năng (Feature Selection): Là quá trình chọn ra một tập hợp con các thuộc tính (features) quan trọng nhất từ dữ liệu ban đầu. Nó không liên quan trực tiếp đến việc nhóm các điểm dữ liệu.
  • Học tăng cường (Reinforcement Learning): Là một loại học máy trong đó một tác nhân (agent) học cách đưa ra các quyết định trong một môi trường để tối đa hóa một phần thưởng tích lũy. Nó không liên quan đến việc phân nhóm dữ liệu.
  • Học tập không giám sát (Unsupervised Learning): Là loại học máy mà thuật toán học từ dữ liệu không có nhãn. Phân cụm là một ví dụ điển hình của học không giám sát.
  • Học tập có giám sát (Supervised Learning): Là loại học máy mà thuật toán học từ dữ liệu có nhãn. Mục tiêu là học một hàm ánh xạ đầu vào tới đầu ra dựa trên dữ liệu huấn luyện có nhãn.

Vì vậy, đáp án đúng là C: Học tập không giám sát.

Câu 6:

L1.X. A vấn đề hồi quy xuất ra ... 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 8:

Khi mô hình học máy không thể nắm bắt được mẫu cơ bản bên trong dữ liệu. Người ta nói rằng nó đang phải chịu đựng 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 11:

Trong ... , a mô hình dự đoán thường được xây dựng bằng cách huấn luyện a tập hợp dữ liệu được quan sát 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 12:

Hồi quy là a ví dụ của ... 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 14:

Chọn phát biểu đúng về số dư? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 16:

Trong học máy, tập dữ liệu được xử lý trước thường được chia thành các tập con trong quá trình tìm kiếm mô hình “tốt”. Các tập hợp con này là ... 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 21:

Theo bài giảng, giả thuyết h(z] = sigmoid(z) = 1/[1+e^(-z)] (z = Theta_0+ Theta_1*x), chọn phát biểu đúng? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 25:

Mặc dù hồi quy logistic có từ "hồi quy" trong tên của nó, nhưng nó chủ yếu được sử dụng cho vấn đề phân loại. 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 28:

Mô hình được huấn luyện chủ yếu được sử dụng để dự đoán kết quả đầu ra của...
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 31:

Vấn đề mà một mô hình học máy thường gặp phải là gì? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 33:

Hồi quy là một ví dụ của... Lựa chọn: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 34:

Vấn đề phân loại đầu ra ... Lựa chọn: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 35:

Câu nào sau đây KHÔNG đúng về vấn đề phân loại và dự đoán? Lựa chọn: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 36:

Quá trình giảm số chiều của tập đặc trưng được gọi là ... Lựa chọn:
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 37:

Trong ..., một mô hình dự đoán thường được xây dựng bằng cách huấn luyện một tập dữ liệu quan sát. Lựa chọn: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 38:

Gom cụm là một ví dụ về ... Lựa chọn: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 41:

Những nguyên nhân của overfitting là gì? Lựa chọn: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 42:

Loại tập dữ liệu nào thường cần thiết để xây dựng một mô hình học máy như một quy trình 'hoàn chỉnh'? Lựa chọn: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 44:

L1.X. Những loại tập dữ liệu nào thường cần thiết để xây dựng mô hình học máy dưới dạng quy trình 'hoàn thành'? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 45:

Sự khác biệt cơ bản giữa học có giám sát (supervised) và không giám sát (unsupervised) là gì? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 46:

Trong ứng dụng về xử lý văn bản (text), người ta thường đo độ tương tự giữa hai văn bản bằng cách nào? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 47:

Đâu KHÔNG phải là thuật toán dùng để thu giảm số chiều dữ liệu? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 48:

Thuật toán học máy nào sau đây thường KHÔNG dùng cho bài toán phân lớp (classification): 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 49:

Phát biểu nào sau đây SAI đối với phép phân tích thành phần chính (principal component analysis - PCA)? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 50:

Thuật toán nào sử dụng ý tưởng "Tìm đường phân chia sao cho lề của hai lớp cách đều đường phân chia đó"? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP