JavaScript is required

Trong học máy, "momentum" là gì?

A.

Một phương pháp để tối ưu hóa các tham số của mô hình.

B.

Một kỹ thuật tối ưu hóa cho mô hình học sâu.

C.

Một hệ số giúp điều chỉnh tốc độ học của mô hình trong quá trình lan truyền ngược.

D.

Một phương pháp để chuyển đổi dữ liệu đầu vào thành dạng phù hợp cho mạng neural.

Trả lời:

Đáp án đúng: C


Momentum trong học máy, đặc biệt là trong tối ưu hóa các mô hình học sâu, là một kỹ thuật giúp tăng tốc quá trình hội tụ và tránh bị mắc kẹt trong các cực trị địa phương. Nó hoạt động bằng cách thêm một phần của vectơ cập nhật từ bước trước vào vectơ cập nhật hiện tại. Điều này giống như việc một quả bóng lăn xuống một ngọn đồi; nó sẽ tích lũy vận tốc (momentum) và tiếp tục di chuyển theo hướng đó, ngay cả khi độ dốc thay đổi. Vì vậy, đáp án B là chính xác nhất. Đáp án A đúng một phần nhưng không đầy đủ, vì momentum là một *kỹ thuật* trong tối ưu hóa, chứ không phải một phương pháp tối ưu hóa hoàn toàn độc lập. Đáp án C sai vì momentum là một *hệ số* điều chỉnh ảnh hưởng của các gradient trước đó, chứ không phải tốc độ học (learning rate) trực tiếp. Đáp án D sai vì nó mô tả một phương pháp tiền xử lý dữ liệu, không liên quan đến momentum.

Câu hỏi liên quan