본문 바로가기

AI73

[CS231n] 11. Detection and Segmentation 이번 시간에는 이미지에서 딥러닝을 사용한 Detection & Segmentation을 알아보도록 하겠다. YOLO와 SSD의 공통점을 알아보도록 하겠다. 거의 같은 시기에 나왔고, 모두 feed forward를 오로지 한 방향으로 수행하는 네트워크들이다. 주요 아이디어는 각 Task를 따로 계산하지 말고 하나의 regression 문제로 풀어보자는 것이다. 거대한 CNN을 통과하면 모든 것을 담은 예측값이 한 번에 나오는 형태이다. 먼저, 입력 이미지가 있으면 이미지를 7x7 grid같이 큼지막하게 나눈다. 각 grid cell 내부에는 base Bounding Box가 존재할 것이고, 위의 예시의 경우에는 길쭉한 모양, 넓찍한 모양, 정사각형으로 3가지이다. 실제로는 3개 이상을 사용한다고 한다. 이.. 2020. 2. 16.
[CS231n] 2. Image Classification 저번 시간의 컴퓨터 비전, 그 역사, 수업의 전반적인 내용 소개 시간에 이어서 이번 시간에는 image classification에 대해서, 그리고 앞으로 배우게 될 알고리즘들이 실생활에서 어떻게 적용되는지 심도있게 살펴보도록 하겠다. 초반 강의들에서는 주로 큰 개념들을 다루고, 나머지 강의들에서는 조금 더 깊은 내용들과 다양한 알고리즘들의 세부 매커니즘을 위주로 다룰 것이다. 앞으로 신경망 모델을 구현하기 위해서 python과 numpy를 많이 사용하게 될텐데 관련 튜토리얼은 http://cs231n.github/io/python-numpy-tutorial/ 에서 찾아볼 수 있다. Numpy는 vectorized 연산을 효율적으로 할 수 있게 도와주고 방대한 양의 계산을 코드 몇 줄로 간단히 가능하게 .. 2020. 1. 31.
[CS231n] 1. Introduction to Convolutional Neural Network CS231n 수업은 스탠포트 대학교의 수업을 녹화한 것으로 컴퓨터 비전에 대한 많은 내용을 담고 있다. 앞으로 이 수업의 내용을 정리해서 올리도록 하겠다 컴퓨터 비전이란 무엇일까? 인터넷의 트래픽 중 80%의 지분이 바로 비디오 데이터이고, 이것은 사진 등의 다른 데이터들을 모두 제외한 것이다. 이렇게 인터넷의 데이터 대부분이 시각 데이터이므로 시각 데이터들을 잘 활용할 수 있는 알고리즘을 잘 개발하는 것이 매우 중요해졌다. 시각 데이터는 암흑물질(dark matter)이라고 불릴만큼 해석하기가 매우 까다롭다. (암흑 물질 : 우주 대부분의 질량을 차지하고 있는 물질) 이렇게 시각 데이터가 너무 많기 때문에 자동으로 시각데이터를 이해하고 분석하는 알고리즘을 개발하는 것이 중요해졌다. 컴퓨터 비전은 다양한.. 2020. 1. 29.
[3분 딥러닝] 4. 패션 아이템을 구분하는 DNN 저번 시간에 이어서 Fashion MINIST 데이터셋 안의 패션 아이템들을 구분하는 데 사용되는 DNN에 대해서 알아보도록 하겠다. ※ 4.1 Fashion MNIST 데이터셋 알아보기 딥러닝에서는 모델만큼이나 데이터셋이 중요한데, 데이터셋은 우리가 풀고자 하는 문제를 정의하는 것이기 때문이다. 저번 시간에 다뤘던 MNIST 손글씨 데이터와 달리 Fashion MNIST 데이터셋은 숫자를 인식하는 것에서 더 넘어서서 패션 아이템들을 구분할 수 있다. Fashion MNIST는 28 x 28 픽셀의 70,000개의 흑백 이미지로, 신발, 드레스, 가방 등 10개의 카테고리로 존재한다. 원래는 이런 데이터를 받으면 데이터를 가공하고 파이프라인을 직접 만들어야하는데, 파이토치의 토치비전이 자동으로 내려받고 .. 2020. 1. 28.