모두의딥러닝2 [DLBasic]Lecture 2. Linear Regression Linear Regression은 Machine Learning에서 실제로 많이 사용된다. 저번 시간에 설명했던 것과 같이 어떤 학생의 공부한 시간별 시험 성적이 0~100점까지의 연속적인 넓은 범위 안에서의 한 값이라고 한다면 Regression을 사용한다. 이것은 이미 주어진 데이터들로 학습을 하는 것이니 Supervised Learning에 속한다. 데이터를 가지고 학습을 하는 과정은 Training이라고 하고, regression으로 모델을 하나 만들고 나서 regression을 사용해서 공부 시간을 주고 시험 점수를 예측하게 할 수 있다. 위의 표는 Training Data의 예이고, Regression Model을 만들어보자. x는 예측하기 위한 기본적인 자료, Feature이라고 하고, y는.. 2020. 1. 15. [RL]Lecture 1 : RL 수업소개(introduction) Reinforcement는 머신러닝뿐만 아니라 여러 영역에서 사용된다. 대표적인 경우가 훈련시킬 때이다. 예를 들어, positive reinforcement는 강아지가 잘 했을 경우 상을 주는 방법이다. 사람의 경우에도 과거의 경험으로 인해서 환경과 직접적 상호작용을 하면서 학습을 한다. 즉, 수년간의 칭찬이나 꾸중 등이 누적되어서 삶을 사는 법을 배운다. 구체적으로 말하자면 reinforcement learning은 environment라는 환경, 세상이 있고, actor라는 어떤 행동을 하게 되는 주체가 있다. 이 actor가 어떤 행동을 할 때마다 환경이 달라지고, 이것을 observation이나 state라고 한다. 일련의 행동이 끝나고 나서 운이 좋으면 reward를 받을 수 있다. Reinf.. 2020. 1. 15. 이전 1 다음