👀 지도학습, 비지도학습, 강화학습
Machine Learning의 대표적인 방법 3가지에 대해 알아본다
✔ 지도학습 (Supervised Learning)
정답을 알려주며 학습시키는 것
- 회귀 (Regression)
데이터들의 특징을 기준으로 연속된 값을 예측하는 방법. 결과 값은 실수 값을 가질 수 있다
e.g. 주택 가격 예측
- 분류 (Classification)
데이터를 정해진 라벨에 따라 분류하는 방법. 두가지 선택지의 이진 분류와 그 이상의 선택지를 가진 다중 분류가 존재
e.g. 스팸메일 분류 (스팸메일이다 vs 아니다)
✔ 비지도학습 (Unsupervised Learning)
정답 라벨이 없는 데이터를 비슷한 특징끼리 군집화 하여 결과를 예측하는 방법. 지도 학습에서 적절한 특징을 찾아내기 위한 전처리 방법으로 비지도 학습이 이용되기도 함
- 군집화 (Clustering): 서로 비슷해 보이는 데이터를 그룹으로 생성. E.g. 새 사진 모음으로 종을 구분
- 이상 탐지 (Anomaly Detection): 특이한 패턴을 감지하는 것. E.g. 고객의 구매 행동에서 특이한 패턴을 감지해 사기거래를 탐지
- 연성 (Association): 데이터 샘플의 특징을 다른 특징과 연관짓는 것. E.g. 쇼핑카트에 옷을 넣으면 다른 연관되는 옷들을 추천
- 오토인코더 (Autoencoder): 입력 데이터를 요약한 뒤 요약된 코드로부터 입력 데이터를 재생성하는 방법. E.g. 이미지의 더러운 버전, 깔끔한 버전을 오토인코딩 함으로써 노이즈를 제거 및 이미지의 품질 개선
✔ 강화학습 (Reinforcement Learning)
자신이 한 행동에 대한 보상을 받으며 학습하는 것. 그 보상을 극대화하기 위해 노력함으로써 정답에 가까운 답을 찾아가는 것.
정해진 규칙이 알려지지 않은 게임 환경( Environment)에서 플레이어(Agent)가 현재 상태(State)에서 높은 점수(Reward)를 얻는 방법을 찾아가며 행동(Action)하는 학습 방법을 통해 전략 형성. 단, 행동을 위한 행동 목록은 사전에 정의가 필요. E.g. 구글의 알파고