Minwoo Dev.

[Machine Learning] 회귀(Regression)란, 단순 선형회귀(Simple Linear Regression) 본문

AI

[Machine Learning] 회귀(Regression)란, 단순 선형회귀(Simple Linear Regression)

itisminu 2024. 10. 27. 23:22
728x90
반응형
SMALL

회귀(Regression)

 

회귀(Regression)은 기계학습 중 지도학습에 속한다.

 

 

“회귀”라는 단어는 무언가 어려워보이게 만드는 마법이 있다.

하지만 이 단어 말고 다른 단어로 아주 잘 설명해낼 수 있다.

 

회귀(Regression)은 여러 점들로 그래프를 그려내는 것

 

나는 회귀(Regression)을 여러 점들로 그래프를 그리는 행위라고 이야기한다.

그도 그럴것이, 회귀는 주어진 데이터를 가장 잘 나타낼 수 있는 그래프를 그리는 것이기 때문이다.

 

 

만약, 우리가 지금 추위 지수에 따른 칼국수집 매출이라는 데이터를 가지고 있다면, 추위 지수에 따라 매출이 아래와 같은 양상을 띌 것이다.

 

우리는 저런 데이터를 가지고 선을 그을 수 있다.

 

 

아마 이런 식으로 긋게 될 것이다.

이런 산점도 형식의 데이터를 가지고 이를 가장 잘 나타내는 선을 그리는 것이 회귀(Regression) 모델의 주 목적이다.

 

이러한 선은 선형일수도 있지만 비선형일수도 있다. (곡선일수도 있다는 말이다.)

 

기본 회귀 모델 식

가장 기본적인 선형 형태의 회귀 모델을 본다면, 식은 아래처럼 나올 것이다.

y = b0 + b1 * x

 

우리는 데이터들을 가지고 b0, b1의 최적 값을 찾아낸다.

b0, b1값이 최적의 값이라면 해당 선, y = b0 + b1 * x는 우리의 데이터를 가장 잘 나타내는 형태일 것이다.

 

선을 잘 그었는지 아닌지를 판단할 때는 Loss 라는 개념이 사용된다.

 

 

Loss 

Loss 가 무엇인가, 말 그대로 “손실”이다.

회귀 모델에서의 Loss 함수는 그래프로 봤을 때, 각 데이터인 점들과 우리가 만들어낸 모델인 선의 거리 차이를 의미한다.

 

못 만든 모델일수록 점들과 선의 거리 차이가 클 것이다.

못 만든 회귀 모델(This Model Sucks)

 

하지만, 최적의 값이라면 해당 점들과 선의 거리 차이가 적을 것이다.

잘 학습된 회귀 모델(Well Trained Regression Model)

 

결론적으로, 이 Loss가 가장 작아지는 방향으로 모델을 구현해야한다.

그럼 데이터들(점들)과 가장 잘 어울리는 선이 완성될 것이다.

 

 

단순 선형회귀(Simple Linear Regression)

우리가 위에서 본 회귀(Regression)은 단순 선형 회귀이다.

 

추위 지수(X)에 따라 칼국수 집의 매출(y)를 예측한 것이니 당연히 선형 그래프가 나오는 것이다.

변수가 추위 지수 하나이기 때문이다.

이러한 단순한 회귀 모델을 단순 선형회귀(Simple Linear Regression)라 한다.

특징

  • 가장 기초적, 하지만 여전히 많이 사용
  • 입력값이 1개인 경우에만 사용 가능
  • 두 변수 간의 관계를 직관적으로 해석하고자 하는 경우 활용

 

 

 

 

 

이 글은 LG AIMERS 5기 온라인 AI 실습 교육을 진행하며 개인적으로 정리한 게시글입니다.
728x90
반응형
LIST