JavaScript is required

Trong mạng nơ-ron hồi quy (RNN), đối với bài toán dự đoán chuỗi thời gian, đặc điểm chính của mạng LSTM (Long Short-Term Memory) là gì?

A.

Khả năng hiểu được thông tin ngắn hạn

B.

Khả năng ghi nhớ thông tin dài hạn

C.

Khả năng xử lý chuỗi với độ dài biến đổi

D.

Khả năng giảm thiểu hiện tượng overfitting

Trả lời:

Đáp án đúng: B


LSTM (Long Short-Term Memory) là một loại mạng nơ-ron hồi quy (RNN) được thiết kế để giải quyết vấn đề biến mất gradient (vanishing gradient) trong quá trình huấn luyện các chuỗi dài. Đặc điểm chính của LSTM là khả năng ghi nhớ thông tin dài hạn nhờ vào cơ chế cổng (gates) cho phép mạng học cách lưu trữ, truy xuất và quên thông tin một cách chọn lọc. Do đó, đáp án B là chính xác. Các đáp án khác không phải là đặc điểm nổi bật nhất của LSTM so với các kiến trúc RNN khác. - A: RNN thông thường cũng có khả năng hiểu thông tin ngắn hạn. - C: LSTM có thể xử lý chuỗi có độ dài biến đổi, nhưng đây không phải là đặc điểm *chính* so với các RNN khác. - D: LSTM có thể giúp giảm overfitting trong một số trường hợp, nhưng đây không phải là đặc điểm cốt lõi của nó so với các RNN khác, đặc biệt là khi so sánh với các kỹ thuật regularization khác.

Câu hỏi liên quan