본문 바로가기

공부/프로그래밍

딥러닝 Tensorflow | Perceptron

현정리 2021. 2. 4. 16:29

728x90

학습의 분류

지도학습 (데이터에 label<답>을 할당한다)
- classification(분류) : label이 이산적인 경우
- Regression(회귀) : label이 연속적인 경우
비지도학습 (데이터에 label을 할당하지 않는다)
- Clustering(군집) : 컴퓨터 스스로 특성만을 조사하여 같은 특성을 갖는 데이터끼리 묶는 경우

classification(분류)

특성 간의 상관관계를 파악하는 것이 중요하다.
특성이 2개에서 그 이상으로 갈 수록 컴퓨터가 데이터를 구분하기 어려워진다.
- Curse of dimensionality problem(차원의 저주)
  - 차원(특성의 개수)이 높을 수록, 특성에 따른 분류가 어려워지는 현상이다.
  - 따라서, 컴퓨터가 특성을 쉽게 파악할 수 있도록 불필요한 차원을 줄여줘야한다.
    - PCA(Principal Component Analysis)
    - Manifold learning

Perceptron(퍼셉트론)

선형 판별 모델 (1958)
선형 결정 표면을 3개의 직선으로 정확히 나눌 수 있다.

퍼셉트론을 이용한 지도학습 원리

입력되는 데이터 중 하나를 랜덤하게 골라 선형관계식을 통해 weight(가중치)와 bias(편향)을 인가한 값을 도출한다.
- Stochastic method(확률적 방법) 를 통해 데이터를 고른다.
  - 확률적 경사하강법
실제 답과 계산 값을 비교하여, 잘못 분류된 데이터 중 임의로 하나를 선택해 올바르게 분류되도록 가중치를 update 한다.
위 과정을 반복하여 최종학습(분류)를 완성한다.
Test data로 학습한 결과를 테스트한다.
- 학습이 overfitting 되었다면 test가 실패할 확률이 높다.
  - SVM(Support Vector Machine): 학습할 때 여유를 최대화 할 수 있도록 경계면을 설정함

퍼셉트론 선형 이진 분류의 선형적 한계

선형적으로 분리가 불가능한 데이터일 경우, 퍼셉트론 알고리즘이 수렵하지 않는다.
- 다층구조로 해결한다.
분류의 확률적인 출력값을 제공하지 않는다.
- 시그모이드를 사용한다.
K>2 개의 분류 문제에 대한 일반화가 어렵다.

저작자표시 비영리 변경금지

'공부 > 프로그래밍' 카테고리의 다른 글

딥러닝 Tensorflow \| 최적화 이론 (0)	2021.02.04
딥러닝 Tensorflow \| Keras training model.fit() 오류 (0)	2021.02.04
딥러닝 Tensorflow \| Optimization, Training with Keras (0)	2021.02.04
딥러닝 Tensorflow \| fully-connected (0)	2021.02.03
딥러닝 Tensorflow \| layer, feature extraction - convolution (0)	2021.02.03

티스토리툴바