reinforcement1 [RL]Lecture 1 : RL 수업소개(introduction) Reinforcement는 머신러닝뿐만 아니라 여러 영역에서 사용된다. 대표적인 경우가 훈련시킬 때이다. 예를 들어, positive reinforcement는 강아지가 잘 했을 경우 상을 주는 방법이다. 사람의 경우에도 과거의 경험으로 인해서 환경과 직접적 상호작용을 하면서 학습을 한다. 즉, 수년간의 칭찬이나 꾸중 등이 누적되어서 삶을 사는 법을 배운다. 구체적으로 말하자면 reinforcement learning은 environment라는 환경, 세상이 있고, actor라는 어떤 행동을 하게 되는 주체가 있다. 이 actor가 어떤 행동을 할 때마다 환경이 달라지고, 이것을 observation이나 state라고 한다. 일련의 행동이 끝나고 나서 운이 좋으면 reward를 받을 수 있다. Reinf.. 2020. 1. 15. 이전 1 다음