JavaScript is required

"Reinforcement learning" thường được sử dụng trong ngữ cảnh nào?

A.

Học có giám sát

B.

Học không giám sát

C.

Học củng cố

D.

Học bán giám sát

Trả lời:

Đáp án đúng: C


"Reinforcement learning" trong tiếng Anh có nghĩa là "học củng cố". Đây là một phương pháp học máy, trong đó một tác nhân (agent) học cách đưa ra quyết định bằng cách thực hiện các hành động trong một môi trường để tối đa hóa phần thưởng tích lũy. Do đó, đáp án chính xác là C. Học củng cố

Câu hỏi liên quan