미누에요

[Machine Learning] 혼동 행렬(Confusion Matrix), 정확도(Accuracy), 정밀도(Precision), 재현율(Recall) 본문

AI

[Machine Learning] 혼동 행렬(Confusion Matrix), 정확도(Accuracy), 정밀도(Precision), 재현율(Recall)

미누라니까요 2024. 12. 23. 12:06
728x90
반응형
SMALL

혼동 행렬(Confusion Matrix)

 

혼동 행렬은 분류 모델에서 예측 값과 실제 값을 비교하여 성능을 평가하기 위해 사용하는 개념이다.

출처 - https://www.google.com/url?sa=i&url=https%3A%2F%2Fgeetanshsharma2018.medium.com%2Fconfusion-matrix-what-is-it-and-its-applications-4d8b0b958edb&psig=AOvVaw2boc-8zv5pMaWskk07xw7C&ust=1735008164727000&source=images&cd=vfe&opi=89978449&ved=0CBcQjhxqFwoTCIivpp_vvIoDFQAAAAAdAAAAABAZ

 

처음 본다면 Positive에 Positive가 뭐고 Positive에 Negative는 뭔가 싶을 수 있다.

 

우선 우리는 True ClassPredicted Class에 주목해야한다.

True Class실제 클래스를 의미하고, Predicted Class 예측한 클래스를 의미한다.

즉, True Class는 정답지의 값이고, Predicted Class는 우리가 만든 모델이 예측한 값이다.

 

위 혼동행렬을 가지고 우리는 TP, FP, FN, TN으로 나눌 수 있다.

 

True Positive(TP)

실제로 Positive인 값을 모델이 Positive로 예측

 

False Positive(FP)

실제로 Negative인 값을 모델이 Positive로 예측

 

False Negative(FN)

실제로 Positive인 값을 모델이 Negative로 예측

 

True Negative(TN)

실제로 Negative인 값을 모델이 Negative로 예측

 

 

 

이러한 척도를 통해 우리는 정확도(Accuracy), 정밀도(Precision) ,재현율(Recall)을 나타낼 수 있다.

 

정확도(Accuracy)

전체 데이터 중에서 제대로 분류된 데이터의 비율을 의미한다.

즉, 모델이 얼마나 정확하게 분류하는지를 나타내는 척도로 사용된다.

분류 모델의 평가 방법 중 가장 일반적으로 사용된다.

 

 

 

 

정밀도(Precision)

우리가 만든 모델이 Positive라고 분류한 것들 중에서 실제로 Positive인 데이터의 비율을 의미한다.

  • Negative가 중요할때!!
  • 실제로 Negative인 데이터를 Positive라고 판단하면 큰일나는 경우 사용된다.

 

 

재현율(Recall)

실제로 Positive라고 분류한 것들 중에서 모델이 실제로 Positive로 분류한 데이터의 비율을 의미한다.

  • Positive가 중요할 때!!
  • 실제로 Positive인 데이터를 Negative라고 판단하면 안되는 경우 사용하게 된다.
728x90
반응형
LIST