무지개타고

역시 LinEst 함수가 왕입니다요 본문

Population

역시 LinEst 함수가 왕입니다요

OnRainbow 2009. 8. 20. 10:35
월 초에 감기로 보건소 다녀온 후 신종 인플루엔자 소식에 좀더 관심 갖게 되었다.
그래서 간단히 계산해 봤다.

몇몇 기사 검색를 통해 신종 인플루엔자 누적확진환자수를 확인했다.



이 중 8월 자료, 즉 관찰값 3개 갖고 단순회귀분석과 로지스틱 회귀분석을 돌렸다.
그리고 로그변환 회귀분석도 하나.



점 3개로 사기치긴 뭐하지만...
회귀계수와 결정계수를 구한 후 추정치를 계산한다.



뭐지? 오류 표시는.
로그변환 회귀분석분에서 LinEst 함수를 계열과 LogEst 함수 계열 간에 차이 발생.

e2 셀 (로그_LinEst)
=EXP(SUMPRODUCT(LINEST(LN($B$3:$B$5),$A$3:$A$5,TRUE,FALSE),A2^{1,0}))

f2 셀 (로그_Trend)
=EXP(TREND(LN($B$3:$B$5),$A$3:$A$5,A2,TRUE))

g2 셀 (LogEst)
=PRODUCT(LOGEST($B$3:$B$5,$A$3:$A$5,TRUE,FALSE)^(A2^{1,0}))

h2 셀 (Growth)
=GROWTH($B$3:$B$5,$A$3:$A$5,A2,TRUE)

뭘 잘 못 했나?

곰곰히 생각한 결과...
LogEst 함수 계열은 Exp 함수가 먼저 계산되고 이후 더하기를 하는 것으로 파악했다.
이때 계산된 값이 너무 작거나 반대로 너무 커서 엑셀 처리 범위를 벗어난 결과로 여겨진다.

이에반해 LinEst 함수는 더하기를 먼저 한 후 Exp 함수를 계산하였기에
원하는 결과가 나온 것으로 여겨진다.

이는 기존 독립변수인 날짜를 임의에 숫자로 변경한 후, 서로 같은 결과가 나오는지를 보면
대충 확인 가능할 것으로 판단된다.



파악한 계산 방식이 100% 맞다고 까지는 확신하긴 어렵지만...
다행히 LinEst 함수 계열과 LogEst 함수 계열의 결과가 서로 같게 나왔다.
즉 LogEst 함수에 보다 LinEst 함수가 유용하다는 반증이라 우겨볼만 하다.

LinEst 함수 계열과 LogEst 함수 계열의 궁금증은 이쯤에서 접고...

앞서 점 3개로 구한 회귀모형을 갖고 이후를 추정하여
질병관리본부에서 제공하는 누적확진환자수와 비교하니
단순회귀 보다는 로지스틱에 좀더 가까우려 하는 움직임을 보이고 있다.

로지스틱의 경우 계산상으론 8월 말까지 신종 인플루엔자 누적확진환자수는
약 3,280명 까지 늘어나게 된다.

보건 당국이 좀더 적극적으로 대응하길 바라는데...
어찌 될지 걱정이다. -_-a


※ 주의 : 자료 인용 및 처리 과정에 오류가 있을 수 있습니다.

Comments