반응형
자연어처리 공부를 하며 남기는 기록
지도 학습
지도학습이란 샘플에 대응하는 정답을 예측하는 학습 방법 중 하나이다.
훈련 데이터로부터 하나의 함수(예측 모델)가 유추되고, 예측 모델에 대한 평가를 통해 가중치를 최적화하며 정확도를 높인다.
훈련 데이터
정답을 예측하기 위해 샘플이 되는 데이터이다.
일반적인 알고리즘에서는 Input(입력)과 같은 말이며 'x'로 표기한다.
레이블
훈련데이터에 상응하며 예측되는 대상이다.
'정답'과 같은 말이며 'y'로 표기한다.
예측 모델
모델은 x를 받아 y를 예측하는 함수이다.
즉, 훈련데이터로 정답을 예측한다.
가중치
훈련 데이터를 잘 예측하기 위해서, 추가적인 제약 조건을 만족시키기 위해서 사용한다.
즉, 정확도를 높이기 위해서 사용한다.
'파라미터'와 같은 말이며 'w'로 표기한다.
예측
예측 모델이 추측하는 정답이다.
'햇'표기를 사용한다.
손실 함수
훈련 데이터에 대한 예측이 정답과 얼마나 떨어져 있는지 비교하는 함수
정답과 예측이 주어지면 손실 함수는 '손실'이라고 부르는 값을 계산한다. 손실이 낮을수록 정답 예측을 더 잘하는 모델이다.
손실 함수는 'L'로 표기한다.
반응형
'Development > AI' 카테고리의 다른 글
자연어 처리(NLP) 개념 잡기 (3) - 정제, 정규화, 불용어 (0) | 2022.01.09 |
---|---|
자연어 처리(NLP) 개념 잡기 (2) - 표제어, 어간 (0) | 2022.01.08 |
자연어 처리(NLP) 개념 잡기 (1) - 말뭉치, 토큰화 (0) | 2022.01.04 |
파이토치로 배우는 자연어 처리 - 리뷰 (0) | 2021.12.23 |
파이토치로 텐서 기본 조작하기 (Manipulating Tensor with PyTorch) (0) | 2021.12.18 |