Minwoo Dev.
[Machine Learning] 회귀(Regression)란, 단순 선형회귀(Simple Linear Regression) 본문
[Machine Learning] 회귀(Regression)란, 단순 선형회귀(Simple Linear Regression)
itisminu 2024. 10. 27. 23:22회귀(Regression)
“회귀”라는 단어는 무언가 어려워보이게 만드는 마법이 있다.
하지만 이 단어 말고 다른 단어로 아주 잘 설명해낼 수 있다.
회귀(Regression)은 여러 점들로 그래프를 그려내는 것
나는 회귀(Regression)을 여러 점들로 그래프를 그리는 행위라고 이야기한다.
그도 그럴것이, 회귀는 주어진 데이터를 가장 잘 나타낼 수 있는 그래프를 그리는 것이기 때문이다.
만약, 우리가 지금 추위 지수에 따른 칼국수집 매출이라는 데이터를 가지고 있다면, 추위 지수에 따라 매출이 아래와 같은 양상을 띌 것이다.
우리는 저런 데이터를 가지고 선을 그을 수 있다.
아마 이런 식으로 긋게 될 것이다.
이런 산점도 형식의 데이터를 가지고 이를 가장 잘 나타내는 선을 그리는 것이 회귀(Regression) 모델의 주 목적이다.
이러한 선은 선형일수도 있지만 비선형일수도 있다. (곡선일수도 있다는 말이다.)
기본 회귀 모델 식
가장 기본적인 선형 형태의 회귀 모델을 본다면, 식은 아래처럼 나올 것이다.
y = b0 + b1 * x
우리는 데이터들을 가지고 b0, b1의 최적 값을 찾아낸다.
b0, b1값이 최적의 값이라면 해당 선, y = b0 + b1 * x는 우리의 데이터를 가장 잘 나타내는 형태일 것이다.
선을 잘 그었는지 아닌지를 판단할 때는 Loss 라는 개념이 사용된다.
Loss
Loss 가 무엇인가, 말 그대로 “손실”이다.
회귀 모델에서의 Loss 함수는 그래프로 봤을 때, 각 데이터인 점들과 우리가 만들어낸 모델인 선의 거리 차이를 의미한다.
못 만든 모델일수록 점들과 선의 거리 차이가 클 것이다.
하지만, 최적의 값이라면 해당 점들과 선의 거리 차이가 적을 것이다.
결론적으로, 이 Loss가 가장 작아지는 방향으로 모델을 구현해야한다.
그럼 데이터들(점들)과 가장 잘 어울리는 선이 완성될 것이다.
단순 선형회귀(Simple Linear Regression)
우리가 위에서 본 회귀(Regression)은 단순 선형 회귀이다.
추위 지수(X)에 따라 칼국수 집의 매출(y)를 예측한 것이니 당연히 선형 그래프가 나오는 것이다.
변수가 추위 지수 하나이기 때문이다.
이러한 단순한 회귀 모델을 단순 선형회귀(Simple Linear Regression)라 한다.
특징
- 가장 기초적, 하지만 여전히 많이 사용
- 입력값이 1개인 경우에만 사용 가능
- 두 변수 간의 관계를 직관적으로 해석하고자 하는 경우 활용
이 글은 LG AIMERS 5기 온라인 AI 실습 교육을 진행하며 개인적으로 정리한 게시글입니다.
'AI' 카테고리의 다른 글
[Machine Learning] 다항 회귀(Polynomial Regression) (0) | 2024.11.02 |
---|---|
[Machine Learning] 다중 선형 회귀(Multiple Linear Regression) (1) | 2024.11.02 |
[AI] F1 score (0) | 2024.09.08 |
[AI] AI 대회 진행방식, 참고사항 (1) | 2024.09.07 |
[Machine Learning] Reinforcement Learning(강화학습) (0) | 2024.07.27 |