Minwoo Dev.
[Machine Learning] 과적합(Overfitting) 본문
728x90
반응형
SMALL
과적합(Overfitting)
과적합은 모델이 데이터에 지나치게 적합된 상태를 의미한다.
우리는 학습 데이터를 가지고 모델을 학습시킨다.
학습된 모델이 학습을 잘 할수록 좋을 것이라 생각하겠지만 실제로는 그렇지 않다.
위 사진에서 왼쪽 그림은 데이터들에 대해 과하게 학습된 상태이다.
우리는 항상 같은 데이터로 결과를 구하지 않는다.
기존에 만들 때 사용한 데이터는 학습에만 사용되고, 실제로 해당 모델을 사용할 때에는 다른 데이터가 입력으로 들어가게된다.
따라서 데이터가 과적합되었다는 것은 학습 데이터에 모델이 과하게 적합되었다는 것으로, 새로운 데이터를 사용한다면 성능이 좋지 않음을 의미한다.
위 사진을 보면 좀 더 이해가 쉬울 것이다.
이 사진에서는 Underfit, Optimal, Overfit에 대해서 그림으로 표현해두었다.
Underfiit은 모델이 데이터를 잘 나타내지 못하는 상태이고, Optimal은 적절한 상태, 너무 과적합하지 않은, 적당히 데이터를 잘 나타내는 모델을 의미한다.
AI모델에 새로운 데이터를 넣어 사용할 것이기 때문에 우리는 Optimal의 그림처럼 AI 모델을 만들어야 한다.
과적합 방지 방법
- 정규화(Regularization)
- 교차 검증(Cross Validation)
TIP
- Underfitting은 나서는 안된다. (Underfit이 난다면 그 모델은 쓰레기.)
- Overfiitting이 나는 것이 Underfitting이 나는 것보다 낫다.
- 처음부터 적당히 맞게 된다면 좋겠지만 아닌 경우라면 Overfitting이 되도록 먼저 만들고, 적합을 조금씩 줄여나가자.
728x90
반응형
LIST
'AI' 카테고리의 다른 글
[Machine Learning] L1, L2 정규화(Normalization), Lasso, Ridge, 엘라스틱넷(Elastic Net) (2) | 2024.11.06 |
---|---|
[Machine Learning] K-Fold 교차 검증(K-Fold Cross Validation) (0) | 2024.11.04 |
[Machine Learning] 다항 회귀(Polynomial Regression) (0) | 2024.11.02 |
[Machine Learning] 다중 선형 회귀(Multiple Linear Regression) (1) | 2024.11.02 |
[Machine Learning] 회귀(Regression)란, 단순 선형회귀(Simple Linear Regression) (0) | 2024.10.27 |