무지개타고

회귀모형은 수학 방정식이 아니라고 본문

Population

회귀모형은 수학 방정식이 아니라고

OnRainbow 2014. 1. 17. 22:23
간단한 예제를 이용해 엑셀에서 단순회귀모형을 구해보자



LinEst 함수로 회귀계수를 추정해야 겠지만,
이번엔 그냥 분산형 차트 그린 후 추세선 기능을 이용해 단순회귀모형을 구하련다.
언제도 얘기했지만 추세선 기능으로 추정된 회귀계수는 정밀도가 떨어져 정확하지 않다.
그래서 LinEst 함수로 구해야 한다고 했고.



여기서!!!
창조적 발상(?)으로 중학교 때인가 배웠던 방정식 떠올리며
X를 추정한답시고 역함수 구하는 이들이 있는데...



결론을 먼저 얘기하면...
틀렸다.
다르다가 아니라 틀렸다!!!

그네들이 떠올린 것은 수학에서는 맞을지 모르지만
통계학에서 단연코 틀렸다.

나부터도 회귀모형 즉 회귀방정식을 Y = b0 + b1X 라고 간단히 써버리는 습관이 있지만
정확하게는 Y = b0 + b1X + ε 이다.
이때 오차항 ε ~ i.i.d N(0,σ²) 으로 가정한다.



때문에 창조적 발상(?)으로  방정식 떠올리며 역함수 구해봤자
틀린 답만 구하게 되는 것이다.



그럼 X를 추정해야 될 땐 어쩌라고???

간단하다.
독립변수와 종속변수를 뒤바꿔서 구하면 된다.



아직도 수학과 통계학의 차이를 못 느끼겠다면
앞서 구한 추세선의 계수를 갖고 X에 대한 역함수를 구해
나중에 구한 추세선의 회귀계수와 비교해 보길.
그리고 어느 방식이 잔차제곱합이 더 작은지 비교해 보길.



Comments