2016/3/12
오늘부터 인공지능 할 거
감사합니다 T-Robotics, 삼성SDS
자료조사 한 거 정리하자.
1. Machine learning
1. Machine learning의 3가지의 요소
1) Task
: 목표
2) Experience
: data
3) Performance measure
: 성능점수
2. Task
1) Classification
: discrete 하다. -> ex) 손으로 쓴 숫자 인식(0,1,2,3,4,5,6,7,8,9)
2) Regression
: continuous 하다. -> ex) 연속적인 함수 예측 y=3x+4
3) Clustering
: 둘 다 아니다.
* Supervised(지도 학습)
: 미리 답이 정해져 있다는 것
Classsification -> 0은 0이다. 1은 1이다 ........
뭔 뜻이냐? 내가 일그러진 0을 써도 답은 어쨌든 0
Algorithm:
k-Nearest Neighbors, Bayesian Network, Support Vector Machine
Regression -> y=3x+4, x가 1이면 y=7, x=2이면 y=10
Algorithm:
Linear regression, Lasso
Unsupervised(자율 학습)
: 미리 답이 정해져 있지 않다는 것
Algorithm:
K-Means, fuzzy, Meanshift
3. Experience
: data가 task를 잘 설명할 수 있는가?
-> ex) 포물선 운동을 설명하려면 x, y에 대한 data가 있어야 한다.
뭔 뜻이냐? 만약 x 값밖에 없으면? 그냥 x 축에서 왔다갔다거린다는 것
만약 x,y,z 값이 있으면? 쓸데없이 함수 복잡해짐
4. Performance measure
1) Classification
: 0,1 loss function -> Error가 발생할 때마다 +1
2) Regression
: L2 loss function -> 값이 내가 설정한 Model에서 얼만큼 떨어져 있는가?
3) Clustering
: 중심을 잡아서 L2 loss function을 적용
5. Machine Learning Process
1) Select a parametric / nonparametric model
2) Set a performance measurement including regularization term
3) Training data (optimizing parameters) until validation error increases
4) Evaluate the final performance using test set
다시 보니까 설명이 부족한듯?
(1),(2),(3) Feedback System 이용한듯
6. Machine Learning Process(2)
1) Regularization
조건
: Setting한 Model이 현재의 data set을 잘 설명 가능해야 함
Setting한 Model이 미래의 보이지 않는 data set을 잘 예측해야 함
* Overfitting
: 현재의 data를 예측하기 위해 모델을 너무 복잡하게 만드는 것
대책
Maximum a Posteriori(MAP)
주어진 data를 training set, validation set으로 나눈다.
training set: Model 최적화를 위한 data set(80%)
validation set: Model이 validation set을 잘 예측하는 가?
2) Nonparametric model
: Support Vector Machine, Gaussian Process Regression
Dimension reduction
: Principal Component Analysis
Principal Axis를 찾아 나머지 axis를 Principal Axis를 투영시킨다.
3) Least Square Problem
Ax = b -> x = (A의 역행렬)B
pseudo inverse
이런 경우가 적용이 되지 않을 때 -> 언제? A가 커서 역행렬 구하기 쉽지 않을 때
-> Optimization
4) Optimization
1. Set a cost function
2. Apply an optimization
Error가 더이상 줄어들지 않을 때까지
Gradient Descent Method(기울기로)
- Local Minimal Problem이 있을 수 있다
이게 뭐냐?
이런 거