본문 바로가기

전체 글120

[RL]Lecture 1 : RL 수업소개(introduction) Reinforcement는 머신러닝뿐만 아니라 여러 영역에서 사용된다. 대표적인 경우가 훈련시킬 때이다. 예를 들어, positive reinforcement는 강아지가 잘 했을 경우 상을 주는 방법이다. 사람의 경우에도 과거의 경험으로 인해서 환경과 직접적 상호작용을 하면서 학습을 한다. 즉, 수년간의 칭찬이나 꾸중 등이 누적되어서 삶을 사는 법을 배운다. 구체적으로 말하자면 reinforcement learning은 environment라는 환경, 세상이 있고, actor라는 어떤 행동을 하게 되는 주체가 있다. 이 actor가 어떤 행동을 할 때마다 환경이 달라지고, 이것을 observation이나 state라고 한다. 일련의 행동이 끝나고 나서 운이 좋으면 reward를 받을 수 있다. Reinf.. 2020. 1. 15.
Binary Search in C++(Recursive and Iterative) 이진 탐색을 재귀함수, 반복 함수로 c++로 구현해본다. Binary Search by Recursive function in C++ 기본적으로 이진 탐색은 대상을 한 번 비교를 할 때마다 나머지 반을 무시한다. ① x를 가운데 원소와 비교한다. ② x가 가운데 원소와 같을 때, 가운데 index를 반환한다. ③ 만약 x가 가운데 원소보다 클 때, x는 가운데 원소 바로 다음의 오른쪽 subarray에 있을 수 있다. ④ 그렇지 않다면, x는 가운데 값보다 더 작은 것이고, 왼쪽 subarray에서 다시 찾는다. ● Recursive ⊙ BinarySearch 함수 -line 6: 오른쪽에 원소가 하나라도 있을 때 반복한다. -line 8: int형 변수 mid에는 가운데 원소의 인덱스를 저장한다. -l.. 2019. 9. 22.
Errors in C/C++ Error란 사용자에 의한 illegal operation으로 프로그램의 비정상적 작동을 초래한다. 프로그래밍 에러는 종종 프로그램이 컴파일되거나 실행될 때까지 발견되지 않는다. 일부 에러들은 프로그램이 컴파일되거나 실행되는 것을 막는다. 그러므로 에러들은 컴파일하거나 실행하기 전에 제거되어야한다. 가장 흔한 에러들은 넓게 다음과 같이 분류될 수 있다. ● Syntax Errors(구문 오류) C/C++의 구문을 작성할 때 규칙을 어겼을 때 발생하는 에러. 이 컴파일 에러는 코드가 컴파일되기 전에 반드시 고쳐져야할 무언가가 있다고 암시한다. 이런 종류의 모든 에러들은 컴파일러에 의해 발견되며 그러므로 "compite-time errors"라고 알려져 있다. 가장 흔한 syntax error는 ① miss.. 2019. 9. 22.
Lecture 1 1-1. Introduction What is Machine Learning machine learning이 정확히 뭔지 well accepted definition이 없다. ● Machine Learning definition ⊙ Author Samuel(1959) - Informal, order definition -Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed. 체커스를 그 자신은 잘 못하지만 컴퓨터가 수많은 게임을 하면서 학습해서 더 잘하게 되었다. ⊙ Tom Mitchell(1988) - 최신 definition -Problem: A comput.. 2019. 9. 22.