[Standalone DL] #2 - 01 ML Basic
Definition
- A Field of sstudy that gives computer the ability to learn without being explicitly programmed
- 직접 rule-base (수백개의 if-else 문 등) 없이 implicit하게 짜도 스스로 학습을 해낸다
Categories
ML and others
- 학습법 : supervised, unsupervised, reinforcement learning
unsupervised learning
- x만 있는 경우 활용할 수 있는 학습 방법. 비슷한 것끼리 묶은 후 사람이 라벨링을 해주는 방식
reinforcement learning
- x, y가 주어지지 않음
- 현재 자신의 state + environment가 input, 어떠한 action이 output → state update → …
- reward function을 통해, state가 나아진다면 action에 대해 reward 제공
- output space : continuous, discrete
Regression Problem
목표 : 다양한 function들을 try하며, 가장 잘 fitting하는 것을 찾는 것
- nonlinear하게 데이터가 분포되어 있다면 - nonlinear regression
- nonlinear - ml에서도, dl에서도 가능함. ml에서는 한계가 있기에 dl로 가는 추세
Classification Problem
목표 : 다양한 데이터들을 특정한 기준을 가지고 분류하는 것
- decision boundary를 학습하게 됨
- linear regression이라면, 구분할 때 0.5=0.5로 확률이 같은 지점들을 모아보면 line이 됨
Clustering Problem
목표 : 알아서 grouping이 되도록 하는 것
- instance 내 similarity, distance를 정의해서 비슷한 애들끼리 모은다는 점이 핵심
- dl을 통해 100-300차원의 벡터로 뽑아서 similarity 등을 계산함
- 방법은 다양함 (k-Means, EM 등) . dl로 가면 더 복잡한 분포들에 대해서 더 깔끔하게 처리 가능함
Dimensionality Reduction Problem
차원의 저주
- 고차원에서 계산되는 유클리안 distance는 점점 의미가 없어짐
- 데이터의 정보를 손실하지 않기 위해 저차원으로 보내려는, dimension을 낮추려는 노력을 함
ML Problems
Feature & Data Representation
Case 1. 3차원
Case 2. 784차원
- 784차원 상에서의 유클리드 distance 값을 계산해볼 수 있음 - but 고차원의 저주로 인해 5-5 사이의 거리보다 5-0 사이의 거리가 더 적게 될 수도 있음
- 이때, dimensionality reduction을 통해 x를 784차원 → 3차원으로 보내는 알고리즘 을 만든다 !