본문 바로가기

공부/프로그래밍

딥러닝 Tensorflow | Perceptron

728x90

학습의 분류

 

 

  • 지도학습 (데이터에 label<답>을 할당한다)
    • classification(분류) : label이 이산적인 경우
    • Regression(회귀) : label이 연속적인 경우
  • 비지도학습 (데이터에 label을 할당하지 않는다)
    • Clustering(군집) : 컴퓨터 스스로 특성만을 조사하여 같은 특성을 갖는 데이터끼리 묶는 경우

classification(분류)

 

  • 특성 간의 상관관계를 파악하는 것이 중요하다.
  • 특성이 2개에서 그 이상으로 갈 수록 컴퓨터가 데이터를 구분하기 어려워진다.
    • Curse of dimensionality problem(차원의 저주)
      • 차원(특성의 개수)이 높을 수록, 특성에 따른 분류가 어려워지는 현상이다.
      • 따라서, 컴퓨터가 특성을 쉽게 파악할 수 있도록 불필요한 차원을 줄여줘야한다.
        • PCA(Principal Component Analysis)
        • Manifold learning

Perceptron(퍼셉트론)

 

  • 선형 판별 모델 (1958)
  • 선형 결정 표면을 3개의 직선으로 정확히 나눌 수 있다.

퍼셉트론을 이용한 지도학습 원리

 

  • 입력되는 데이터 중 하나를 랜덤하게 골라 선형관계식을 통해 weight(가중치)와 bias(편향)을 인가한 값을 도출한다.
    • Stochastic method(확률적 방법) 를 통해 데이터를 고른다.
      • 확률적 경사하강법
  • 실제 답과 계산 값을 비교하여, 잘못 분류된 데이터 중 임의로 하나를 선택해 올바르게 분류되도록 가중치를 update 한다.
  • 위 과정을 반복하여 최종학습(분류)를 완성한다.
  • Test data로 학습한 결과를 테스트한다.
    • 학습이 overfitting 되었다면 test가 실패할 확률이 높다.
      • SVM(Support Vector Machine): 학습할 때 여유를 최대화 할 수 있도록 경계면을 설정함

퍼셉트론 선형 이진 분류의 선형적 한계

 

  • 선형적으로 분리가 불가능한 데이터일 경우, 퍼셉트론 알고리즘이 수렵하지 않는다. 
    • 다층구조로 해결한다.
  • 분류의 확률적인 출력값을 제공하지 않는다.
    • 시그모이드를 사용한다.
  • K>2 개의 분류 문제에 대한 일반화가 어렵다.

 


 

반응형