Thuật toán K-means thuộc loại bài toán nào sau đây?

Học có giám sát

Học không giám sát

Học tăng cường

Học bán giám sát

Trả lời:

Đáp án đúng: B

Thuật toán K-means là một thuật toán phân cụm, tức là nó cố gắng nhóm các điểm dữ liệu thành các cụm dựa trên sự tương đồng của chúng. Trong quá trình này, thuật toán không được cung cấp bất kỳ nhãn hoặc thông tin trước nào về các nhóm. Do đó, nó thuộc loại bài toán học không giám sát, vì học không giám sát là loại học máy mà thuật toán tự tìm ra cấu trúc ẩn trong dữ liệu mà không cần nhãn.

100+ câu hỏi trắc nghiệm Học máy đáp án và lời giải minh họa - Phần 1

50 câu hỏi 60 phút

Bắt đầu thi

Câu hỏi liên quan

Câu 33:

Trong mạng nơ-ron, layer nào thường được sử dụng để giảm kích thước của đầu vào?

Lời giải:

Đáp án đúng: C

Pooling layer thường được sử dụng để giảm kích thước của đầu vào trong mạng nơ-ron. Các layer khác có chức năng khác: Activation layer áp dụng hàm kích hoạt, Dropout layer ngăn chặn overfitting, và Dense layer là fully connected layer.

Câu 34:

Trong mạng nơ-ron, hàm activation function nào thường được sử dụng để xử lý các vấn đề phân loại nhị phân?

Lời giải:

Đáp án đúng: A

Hàm Sigmoid thường được sử dụng trong các bài toán phân loại nhị phân vì nó cho ra giá trị trong khoảng (0, 1), có thể được hiểu là xác suất thuộc về một trong hai lớp. Các hàm Tanh, ReLU và Leaky ReLU ít được sử dụng trực tiếp cho đầu ra của bài toán phân loại nhị phân hơn (mặc dù có thể được sử dụng trong các lớp ẩn).

Câu 35:

Trong học máy, để giảm thiểu hiện tượng overfitting, ta có thể thực hiện các biện pháp nào sau đây?

Lời giải:

Đáp án đúng: C

Overfitting occurs when a model learns the training data too well, resulting in good performance on the training data but poor performance on new data. To reduce overfitting, we can apply the following measures:

- Add more training data: The more data, the more opportunity the model has to learn more general features rather than just memorizing the existing training data.
- Use regularization techniques: Such as L1, L2 regularization, dropout, and early stopping.
- Reduce model complexity: By reducing the number of parameters, layers, or neurons in the neural network.
- Use a large batch size: Using a larger batch size can help reduce noise during training, which can help the model generalize better and reduce overfitting.

Analysis of the options:

- A. Use a large batch size: Correct. A large batch size tends to reduce overfitting compared to a small batch size.
- B. Use a small learning rate: A small learning rate mainly affects the learning speed and does not directly reduce overfitting. It can help the model converge better but does not address the root cause of overfitting.
- C. Add more training data: Correct. Adding more training data helps the model learn more general features and reduces overfitting.
- D. Increase the number of epochs: Increasing the number of epochs can increase overfitting if there are no other control measures, as the model will have more opportunities to memorize the training data.

Since both A and C are correct, but the question only asks for one answer. In this case, C is often considered one of the most basic and effective approaches to reducing overfitting. However, in the context of the options given, using a large batch size is also a valid method for minimizing overfitting. Therefore, both A and C can be considered correct.

However, based on experience and practical implementation, adding more training data (C) is often a more effective solution than just adjusting the batch size (A). Therefore, option C is somewhat "stronger" in solving overfitting.

Therefore, both A and C could be correct answers. However, C is the more appropriate choice.

Câu 36:

Trong mạng nơ-ron hồi quy (RNN), đối với bài toán dự đoán chuỗi thời gian, đặc điểm chính của mạng LSTM (Long Short-Term Memory) là gì?

Lời giải:

Đáp án đúng: B

LSTM (Long Short-Term Memory) là một loại mạng nơ-ron hồi quy (RNN) được thiết kế để giải quyết vấn đề biến mất gradient (vanishing gradient) trong quá trình huấn luyện các chuỗi dài. Đặc điểm chính của LSTM là khả năng ghi nhớ thông tin dài hạn nhờ vào cơ chế cổng (gates) cho phép mạng học cách lưu trữ, truy xuất và quên thông tin một cách chọn lọc. Do đó, đáp án B là chính xác. Các đáp án khác không phải là đặc điểm nổi bật nhất của LSTM so với các kiến trúc RNN khác.
- A: RNN thông thường cũng có khả năng hiểu thông tin ngắn hạn.
- C: LSTM có thể xử lý chuỗi có độ dài biến đổi, nhưng đây không phải là đặc điểm *chính* so với các RNN khác.
- D: LSTM có thể giúp giảm overfitting trong một số trường hợp, nhưng đây không phải là đặc điểm cốt lõi của nó so với các RNN khác, đặc biệt là khi so sánh với các kỹ thuật regularization khác.

Câu 37:

Trong mạng nơ-ron nhân tạo, hàm activation nào được sử dụng phổ biến nhất cho lớp ẩn?

Lời giải:

Đáp án đúng: C

Giải thích:

Trong các mạng nơ-ron nhân tạo, mỗi hàm activation có những ưu điểm và nhược điểm riêng. Tuy nhiên, hàm ReLU (Rectified Linear Unit) hiện nay được sử dụng phổ biến nhất cho các lớp ẩn vì những lý do sau:

Khắc phục vấn đề vanishing gradient: ReLU giúp giảm thiểu vấn đề vanishing gradient, một vấn đề lớn trong các mạng nơ-ron sâu, đặc biệt là khi sử dụng các hàm như sigmoid hoặc tanh. Gradient của ReLU là 1 cho các giá trị dương, giúp lan truyền gradient hiệu quả hơn qua các lớp.
Tính toán hiệu quả: ReLU có phép tính đơn giản (max(0, x)), giúp giảm đáng kể chi phí tính toán so với các hàm phức tạp hơn như sigmoid hoặc tanh.
Sự thưa thớt (Sparsity): ReLU tạo ra sự thưa thớt trong mạng nơ-ron bằng cách đưa các nơ-ron về trạng thái không hoạt động (output = 0) khi input âm. Điều này có thể giúp mạng học các đặc trưng quan trọng hơn và giảm overfitting.

Mặc dù sigmoid và tanh từng được sử dụng phổ biến, chúng dễ bị vanishing gradient hơn. Softmax thường được sử dụng cho lớp đầu ra trong các bài toán phân loại đa lớp.

Câu 38:

Trong mạng nơ-ron tích chập (CNN), tầng nào thường được sử dụng để giảm kích thước không gian của dữ liệu đầu vào?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 39:

Giả sử x là tập dữ liệu hai chiều (samples, features). Cần chuẩn hóa các giá trị của đặc trưng về dạng có giá trị trung bình bằng 0 (a mean of 0) và có độ lệch chuẩn bằng 1 (a standard deviation of 1). Phương án nào dưới đây đáp ứng yêu cầu?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 40:

Đâu không phải là thuộc tính của module?

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 41:

Xác định kết quả cho đoạn code sau:

import collections

c = collections.Counter()

print(c.most_common(1))

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 42:

Đâu là kết quả của đoạn code sau?

colors = {1: 'blue', 2: 'red', 3: 'green'}

itm = colors.items()

print(itm)

Lời giải:

Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Đồ Án Tốt Nghiệp Trí Tuệ Nhân Tạo Và Học Máy

ĐĂNG KÝ GÓI THI VIP

Truy cập hơn 100K đề thi thử và chính thức các năm
2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
Tải toàn bộ tài liệu trên TaiLieu.VN
Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.

Thuật toán K-means thuộc loại bài toán nào sau đây?

100+ câu hỏi trắc nghiệm Học máy đáp án và lời giải minh họa - Phần 1

Câu hỏi liên quan

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu

ĐĂNG KÝ GÓI THI VIP