무지개타고

유튜브에 올라온 엑셀에서 로지스틱 회귀분석 사용법 따라하기 본문

Program

유튜브에 올라온 엑셀에서 로지스틱 회귀분석 사용법 따라하기

OnRainbow 2011. 4. 15. 00:55
언제도 한번 봤듯이, 이 듣보잡 블로그를 방문하는 유입어 중
회귀분석과 관련된 검색어가 제법 된다.
그래봤자 추세선, LinEst, LogEst, Trend 정도지만.
그리고 로지스틱 회귀분석도 의외로 조금 된다.

그런데 로지스틱 회귀분석은 비선형모형이고,
이를 지원하는 엑셀 함수가 따로 있는 것도 아니라 조금 복잡하다.
로지스틱 회귀분석 이론을 알고 있다면 그닥 어려울건 없겠지만...

미력한 재주이나 엑셀 갖고 로지스틱 회귀분석하는 방법을 몇번 소개한 적이 있는데,
유튜브를 검색하면 로지스틱 회귀분석을 엑셀에서 돌리는 사용법을 알려주는 동영상이 있다.
아무래도 글 보다는 동영상이 사용법 익히기는 좀더 수월하지 않을까 해서 참고하면 좋을듯.



위에 동영상에 나온 예제를 따라해 보자.
자료가 충분히 많고 집단으로 묶을 수 있다면 선형모형으로 변환 후 처리가 가능한데,
예제에 나온 방법은 로지스틱 회귀분석을 엑셀의 해찾기 기능을 활용해 구한 방법이다.
그렇다고 이 결과를 100% 확신하기엔 위험(?)이 뒤따른다.
아무래도 해찾기 기능으로 얻은 결과이기 때문.
(참고로 개인적으론 해찾기 기능은 엑셀 보단 오픈오피스 캘크가 좀더 효과적)



e13 셀 (로짓)
=$G$7+$G$8*$C13+$G$9*$D13

f13 셀 (e^로짓)
=EXP(E13)

g13 셀 (P=e^로짓/(1+e^로짓))
=F13/(1+F13)

h13 셀 (P^Y*(1-P)^(1-Y))
=G13^$B13*(1-G13)^(1-$B13)

h33 셀 (우도함수)
=SUM(H13:H32)

i13 셀 (추정Y)
=N(G13>0.5)



이렇게 구한 결과 추정치가 적절한지 위해 판별률을 구하면...



p15 셀 (검토)
=SUMPRODUCT(($B$13:$B$32=$O15)*($I$13:$I$32=P$14))

통계 패키지 프로그램인 SAS 또는 SPSS가 없으니 돌려보진 못 하지만...
어떤 결과가 나올까?

Comments