Minwoo Dev.

[Machine Learning] 과적합(Overfitting) 본문

AI

[Machine Learning] 과적합(Overfitting)

itisminu 2024. 11. 4. 11:43
728x90
반응형
SMALL

과적합(Overfitting)

 

과적합은 모델이 데이터에 지나치게 적합된 상태를 의미한다.

 

사진 출처 - elice

우리는 학습 데이터를 가지고 모델을 학습시킨다.

학습된 모델이 학습을 잘 할수록 좋을 것이라 생각하겠지만 실제로는 그렇지 않다.

 

위 사진에서 왼쪽 그림은 데이터들에 대해 과하게 학습된 상태이다.

 

우리는 항상 같은 데이터로 결과를 구하지 않는다.

기존에 만들 때 사용한 데이터는 학습에만 사용되고, 실제로 해당 모델을 사용할 때에는 다른 데이터가 입력으로 들어가게된다.

 

사진 출처 - elice

따라서 데이터가 과적합되었다는 것은 학습 데이터에 모델이 과하게 적합되었다는 것으로, 새로운 데이터를 사용한다면 성능이 좋지 않음을 의미한다.

 

사진 출처 - https://yngie-c.github.io/machine%20learning/2020/04/30/training_test_reg/

위 사진을 보면 좀 더 이해가 쉬울 것이다. 

 

이 사진에서는 Underfit, Optimal, Overfit에 대해서 그림으로 표현해두었다.

 

Underfiit은 모델이 데이터를 잘 나타내지 못하는 상태이고, Optimal은 적절한 상태, 너무 과적합하지 않은, 적당히 데이터를 잘 나타내는 모델을 의미한다.

 

AI모델에 새로운 데이터를 넣어 사용할 것이기 때문에 우리는 Optimal의 그림처럼 AI 모델을 만들어야 한다.

 

 

과적합 방지 방법

  • 정규화(Regularization)
  • 교차 검증(Cross Validation)

 

 


TIP

  • Underfitting은 나서는 안된다. (Underfit이 난다면 그 모델은 쓰레기.)
  • Overfiitting이 나는 것이 Underfitting이 나는 것보다 낫다.
  • 처음부터 적당히 맞게 된다면 좋겠지만 아닌 경우라면 Overfitting이 되도록 먼저 만들고, 적합을 조금씩 줄여나가자.
728x90
반응형
LIST