728x90
학습의 분류
- 지도학습 (데이터에 label<답>을 할당한다)
- classification(분류) : label이 이산적인 경우
- Regression(회귀) : label이 연속적인 경우
- 비지도학습 (데이터에 label을 할당하지 않는다)
- Clustering(군집) : 컴퓨터 스스로 특성만을 조사하여 같은 특성을 갖는 데이터끼리 묶는 경우
classification(분류)
- 특성 간의 상관관계를 파악하는 것이 중요하다.
- 특성이 2개에서 그 이상으로 갈 수록 컴퓨터가 데이터를 구분하기 어려워진다.
- Curse of dimensionality problem(차원의 저주)
- 차원(특성의 개수)이 높을 수록, 특성에 따른 분류가 어려워지는 현상이다.
- 따라서, 컴퓨터가 특성을 쉽게 파악할 수 있도록 불필요한 차원을 줄여줘야한다.
- PCA(Principal Component Analysis)
- Manifold learning
- Curse of dimensionality problem(차원의 저주)
Perceptron(퍼셉트론)
- 선형 판별 모델 (1958)
- 선형 결정 표면을 3개의 직선으로 정확히 나눌 수 있다.
퍼셉트론을 이용한 지도학습 원리
- 입력되는 데이터 중 하나를 랜덤하게 골라 선형관계식을 통해 weight(가중치)와 bias(편향)을 인가한 값을 도출한다.
- Stochastic method(확률적 방법) 를 통해 데이터를 고른다.
- 확률적 경사하강법
- Stochastic method(확률적 방법) 를 통해 데이터를 고른다.
- 실제 답과 계산 값을 비교하여, 잘못 분류된 데이터 중 임의로 하나를 선택해 올바르게 분류되도록 가중치를 update 한다.
- 위 과정을 반복하여 최종학습(분류)를 완성한다.
- Test data로 학습한 결과를 테스트한다.
- 학습이 overfitting 되었다면 test가 실패할 확률이 높다.
- SVM(Support Vector Machine): 학습할 때 여유를 최대화 할 수 있도록 경계면을 설정함
- 학습이 overfitting 되었다면 test가 실패할 확률이 높다.
퍼셉트론 선형 이진 분류의 선형적 한계
- 선형적으로 분리가 불가능한 데이터일 경우, 퍼셉트론 알고리즘이 수렵하지 않는다.
- 다층구조로 해결한다.
- 분류의 확률적인 출력값을 제공하지 않는다.
- 시그모이드를 사용한다.
- K>2 개의 분류 문제에 대한 일반화가 어렵다.
반응형
'공부 > 프로그래밍' 카테고리의 다른 글
딥러닝 Tensorflow | 최적화 이론 (0) | 2021.02.04 |
---|---|
딥러닝 Tensorflow | Keras training model.fit() 오류 (0) | 2021.02.04 |
딥러닝 Tensorflow | Optimization, Training with Keras (0) | 2021.02.04 |
딥러닝 Tensorflow | fully-connected (0) | 2021.02.03 |
딥러닝 Tensorflow | layer, feature extraction - convolution (0) | 2021.02.03 |