본문 바로가기

데이터마이닝2

[DataMining] 1-2. Data Mining Tasks 저번 시간에는 데이터 마이닝이 무엇인지, 왜 필요한지에 대해 배웠다. 이번 시간에는 데이터 마이닝들이 수행하는 작업들에 대해 배워보도록 하겠다. ● Classification (Predictive) - 분류는 지도학습에 해당한다. - 분류하는 모델을 찾아야하는데, input으로 들어가는 attribute가 있고, output으로 나오는 attribute는 class attribute라고 한다. - 분류한 뒤 그 결과가 맞는지 틀리는지는 일정한 시간이 지난 다음에 알 수 있는 경우가 있다. 예를 들어, 신용카드 회사에 고객이 정보를 신청하면 자신의 인적사항을 적으면 보통, 우수, 불량 고객인지 처음에 정하는데 정말 그런지는 한 달 뒤 정도에 알 수 있다. - training set이라는 기록들의 모음이 주.. 2020. 4. 27.
[DataMining] 1-1 . Introduction to Data Mining DataMining 카테고리에서는 데이터마이닝에 대한 개념을 정리하도록 하겠다. ● Why Mine Data? ① Commercial ViewPoint - web data, e-commerce(전자상거래), 백화점과 상점에서 구매한 내역들, 은행과 신용카드 거래내역 등 많은 데이터들이 저장되어지고 있다. - 컴퓨터들이 점점 싸지고 더 처리 성능이 발전되어간다. - 시장 경제가 심화되어서 매출 증대 목적으로 더 나은 고객 서비스를 제공하려고 한다. ② Scientific ViewPoint - 상업적 데이터뿐만 아니라 과학적 데이터도 많이 쌓인다. - 데이터가 수집되고 저장되는 것이 매우 빠른 속도로 이루어진다. (GB/hour) → 인공위성에서의 원격 센서 데이터 → 하늘을 관찰하는 천문 관측 데이터 → .. 2020. 4. 27.