JavaScript is required
Danh sách đề

120+ câu hỏi trắc nghiệm Lý thuyết môn Học máy kèm đáp án chi tiết - Đề 3

25 câu hỏi 60 phút

Thẻ ghi nhớ
Luyện tập
Thi thử
Nhấn để lật thẻ
1 / 25
Nhiệm vụ nào sau đây được coi là a bài toán dự đoán?
A.
A ứng dụng quét a hình ảnh và cần quyết định xem hình ảnh đó có chứa thú cưng hay không
B.
A ứng dụng cần dự đoán năng lực làm việc của ứng viên dựa trên CV của ứng viên
C.
Tất cả các nhiệm vụ được đề cập
D.
Robot được cung cấp a số thông tin về thế giới và cần thực hiện hành động tốt nhất tiếp theo
E.
đ. Dự báo sự gián đoạn chuỗi cung ứng dựa trên thông tin thị trường
Đáp án
Đáp án đúng: D

Bài toán dự đoán là bài toán sử dụng dữ liệu trong quá khứ để ước tính hoặc dự đoán các sự kiện hoặc kết quả trong tương lai.

  • Phương án a: Ứng dụng quét ảnh và xác định ảnh có chứa thú cưng hay không là một bài toán phân loại (classification), không phải dự đoán.
  • Phương án b: Dự đoán năng lực làm việc của ứng viên dựa trên CV là một bài toán dự đoán, vì ta sử dụng thông tin quá khứ (CV) để ước tính khả năng làm việc trong tương lai.
  • Phương án d: Robot cần thực hiện hành động tốt nhất tiếp theo dựa trên thông tin hiện tại là một bài toán ra quyết định (decision making) hoặc điều khiển (control), không phải dự đoán.
  • Phương án đ: Dự báo sự gián đoạn chuỗi cung ứng dựa trên thông tin thị trường là một bài toán dự đoán, sử dụng dữ liệu thị trường hiện tại và quá khứ để dự đoán các vấn đề gián đoạn trong tương lai.

Như vậy, phương án b và đ đều là bài toán dự đoán, tuy nhiên phương án c "Tất cả các nhiệm vụ được đề cập" là sai vì phương án a và d không phải bài toán dự đoán. Phương án b và đ đều đúng, nhưng không có phương án nào bao trùm cả hai. Vì vậy, ta phải chọn đáp án có ý nghĩa dự đoán gần nhất, đó là dự đoán năng lực làm việc của ứng viên dựa trên CV.

Danh sách câu hỏi:

Câu 1:

Nhiệm vụ nào sau đây được coi là a bài toán dự đoán?
Lời giải:
Đáp án đúng: C

Bài toán dự đoán là bài toán sử dụng dữ liệu trong quá khứ để ước tính hoặc dự đoán các sự kiện hoặc kết quả trong tương lai.

  • Phương án a: Ứng dụng quét ảnh và xác định ảnh có chứa thú cưng hay không là một bài toán phân loại (classification), không phải dự đoán.
  • Phương án b: Dự đoán năng lực làm việc của ứng viên dựa trên CV là một bài toán dự đoán, vì ta sử dụng thông tin quá khứ (CV) để ước tính khả năng làm việc trong tương lai.
  • Phương án d: Robot cần thực hiện hành động tốt nhất tiếp theo dựa trên thông tin hiện tại là một bài toán ra quyết định (decision making) hoặc điều khiển (control), không phải dự đoán.
  • Phương án đ: Dự báo sự gián đoạn chuỗi cung ứng dựa trên thông tin thị trường là một bài toán dự đoán, sử dụng dữ liệu thị trường hiện tại và quá khứ để dự đoán các vấn đề gián đoạn trong tương lai.

Như vậy, phương án b và đ đều là bài toán dự đoán, tuy nhiên phương án c "Tất cả các nhiệm vụ được đề cập" là sai vì phương án a và d không phải bài toán dự đoán. Phương án b và đ đều đúng, nhưng không có phương án nào bao trùm cả hai. Vì vậy, ta phải chọn đáp án có ý nghĩa dự đoán gần nhất, đó là dự đoán năng lực làm việc của ứng viên dựa trên CV.

Câu 2:

Khi mô hình học máy không thể nắm bắt được mẫu cơ bản bên trong dữ liệu. Người ta nói rằng nó đang phải chịu đựng 
Lời giải:
Đáp án đúng: A

Câu hỏi đề cập đến tình trạng mô hình học máy không thể hiện tốt trên dữ liệu huấn luyện, tức là nó không nắm bắt được các mẫu cơ bản. Tình trạng này được gọi là "thiếu trang bị" (underfitting).

  • Thiếu trang bị (Underfitting): Xảy ra khi mô hình quá đơn giản để nắm bắt được sự phức tạp của dữ liệu. Nó không thể hiện tốt trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
  • Trang bị quá mức (Overfitting): Xảy ra khi mô hình quá phức tạp và học cả những nhiễu trong dữ liệu huấn luyện. Nó thể hiện tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra.

Vì vậy, đáp án đúng là "Thiếu trang bị".

Lời giải:
Đáp án đúng: B
Trong quá trình xây dựng mô hình phân loại, việc điều chỉnh siêu tham số (hyperparameters) là rất quan trọng để đạt được hiệu suất tốt nhất. Để làm được điều này, chúng ta cần một tập dữ liệu riêng biệt, không phải là tập huấn luyện (training set) được sử dụng để huấn luyện mô hình ban đầu, cũng không phải là tập kiểm thử (test set) được sử dụng để đánh giá hiệu suất cuối cùng của mô hình. Tập dữ liệu này được gọi là tập xác nhận (validation set).

Giải thích các lựa chọn:
- a. bộ nhớ đệm: Không liên quan đến việc điều chỉnh siêu tham số.
- b. bộ xác nhận: Đúng. Tập xác nhận được sử dụng để đánh giá mô hình trong quá trình huấn luyện và điều chỉnh siêu tham số.
- c. bộ thử nghiệm: Sai. Tập kiểm thử chỉ được sử dụng một lần duy nhất sau khi mô hình đã được huấn luyện và điều chỉnh hoàn chỉnh để đánh giá hiệu suất cuối cùng.
- d. tập huấn luyện: Sai. Tập huấn luyện được sử dụng để huấn luyện mô hình, không phải để điều chỉnh siêu tham số.
Lời giải:
Đáp án đúng: A

Việc tiền xử lý dữ liệu là một bước cực kỳ quan trọng trong quy trình xây dựng mô hình học máy. Dữ liệu "sạch" và chính xác sẽ giúp mô hình học tốt hơn, tránh bị nhiễu bởi các giá trị sai lệch, thiếu hoặc không nhất quán. Quá trình tiền xử lý bao gồm nhiều công đoạn như làm sạch dữ liệu (xử lý giá trị thiếu, loại bỏ dữ liệu trùng lặp, sửa lỗi chính tả,...), chuyển đổi dữ liệu (scaling, normalization, encoding,...), và giảm chiều dữ liệu. Vì vậy, khẳng định "Tất cả dữ liệu cần được xử lý trước để sạch sẽ và chính xác trước khi đưa vào quá trình xây dựng mô hình học máy" là hoàn toàn đúng.

Câu 5:

Nhiệm vụ nào sau đây được coi là a vấn đề dự đoán? 
Lời giải:
Đáp án đúng: B

Câu hỏi yêu cầu xác định nhiệm vụ nào là "vấn đề dự đoán". Vấn đề dự đoán là bài toán mà mục tiêu là đưa ra dự đoán về một sự kiện, thuộc tính hoặc giá trị nào đó trong tương lai hoặc chưa biết, dựa trên dữ liệu đã có.

  • a. A ứng dụng cần dự đoán năng lực làm việc của ứng viên dựa trên CV của ứng viên: Đây là một vấn đề dự đoán, vì ứng dụng phải dự đoán năng lực làm việc (một thuộc tính chưa biết) dựa trên thông tin từ CV (dữ liệu đã có).
  • c. Robot được cung cấp a số thông tin về thế giới và cần thực hiện hành động tốt nhất tiếp theo: Đây là một dạng bài toán ra quyết định hoặc lập kế hoạch, không nhất thiết chỉ là dự đoán. Robot cần cân nhắc nhiều yếu tố để chọn hành động, không chỉ là dự đoán kết quả của hành động.
  • d. Dự báo sự gián đoạn chuỗi cung ứng dựa trên thông tin thị trường: Đây là một vấn đề dự đoán, vì mục tiêu là dự đoán (dự báo) sự gián đoạn (một sự kiện trong tương lai) dựa trên thông tin thị trường (dữ liệu đã có).
  • đ. A ứng dụng quét a hình ảnh và cần quyết định xem hình ảnh đó có chứa thú cưng hay không: Đây là một vấn đề phân loại, một dạng của bài toán dự đoán. Ứng dụng dự đoán lớp (có thú cưng/không có thú cưng) cho hình ảnh.

Vì các đáp án a, d và đ đều là các bài toán dự đoán, đáp án b - "Tất cả các nhiệm vụ được đề cập" - là đáp án chính xác nhất.

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 7:

Theo bài giảng, nếu ta sử dụng hai đặc điểm để dự đoán giá nhà (ví dụ: price = Theta_0 + Theta_1*x_1 + Theta_2*x_2) thì đồ thị của hàm chi phí là ... 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 9:

L3. Giá trị trung bình của a tập dữ liệu nhất định được gọi là... 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 10:

Đầu ra được dự đoán bởi mô hình hồi quy logistic là ...: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 11:

Trong mô hình hồi quy logistic, hàm nào sẽ chia tỷ lệ giá trị đầu ra thành (0,1)? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 13:

Nếu chúng ta sử dụng hơn 3 đặc trưng để huấn luyện mô hình hồi quy logistic, thì hình thức của ranh giới quyết định là ... 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 14:

Một bài toán hồi quy trả về kết quả là... 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 15:

CRISP-DM là gì? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 17:

Nguyên nhân gây dưới khớp là gì? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 18:

Câu nào sau đây là SAI về vấn đề dự đoán? Lựa chọn: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 19:

Trong hồi quy logistic, đo lường nào thường được sử dụng để xác định mô hình "phù hợp nhất" cho dữ liệu? Chọn một:
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 21:

Phát biểu nào sau đây không đúng đối với thuật toán phân cụm K trung bình? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 22:

Phát biểu nào sau đây là đúng đối với máy vector (SVM) lề mềm? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 23:

Từ "Naïve" trong thuật toán học máy Naïve Bayes có ý nghĩa là các thuộc tính của dữ liệu đầu vào ... 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 24:

Chọn phát biểu đúng về tập lồi (convex sets), hàm lồi (convex functions) và tối ưu lồi (convex optimization)? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP