Development/AI

머신러닝 기초다지기, 지도 학습이란?

고고마코드 2021. 12. 17. 16:51
반응형

자연어처리 공부를 하며 남기는 기록


지도 학습

지도학습이란 샘플에 대응하는 정답을 예측하는 학습 방법 중 하나이다.

훈련 데이터로부터 하나의 함수(예측 모델)가 유추되고, 예측 모델에 대한 평가를 통해 가중치를 최적화하며 정확도를 높인다.


훈련 데이터

정답을 예측하기 위해 샘플이 되는 데이터이다.
일반적인 알고리즘에서는 Input(입력)과 같은 말이며 'x'로 표기한다.

  • 레이블
    훈련데이터에 상응하며 예측되는 대상이다.
    '정답'과 같은 말이며 'y'로 표기한다.


  • 예측 모델
    모델은 x를 받아 y를 예측하는 함수이다.
    즉, 훈련데이터로 정답을 예측한다.


  • 가중치
    훈련 데이터를 잘 예측하기 위해서, 추가적인 제약 조건을 만족시키기 위해서 사용한다.
    즉, 정확도를 높이기 위해서 사용한다.
    '파라미터'와 같은 말이며 'w'로 표기한다.


  • 예측
    예측 모델이 추측하는 정답이다.
    '햇'표기를 사용한다.


  • 손실 함수
    훈련 데이터에 대한 예측이 정답과 얼마나 떨어져 있는지 비교하는 함수
    정답과 예측이 주어지면 손실 함수는 '손실'이라고 부르는 값을 계산한다. 손실이 낮을수록 정답 예측을 더 잘하는 모델이다.
    손실 함수는 'L'로 표기한다.


반응형