목록회귀분석 (14)
무지개타고
음... 직선 그래프를 중학교 때 배웠나? 아무튼 옛날옛적을 잠시 떠올려 보자. (x,y) 좌표값을 갖는 관찰값이 두 개 있다고 하자. 그랬을 때 두 관찰값을 서로 잇는 짝대기를 그리자. 두 점을 잇는 짝대기를 긋기 위해선, 기울기와 절편을 계산해야 한다. 이정도는 아직 기억하고 있고, 잊었어도 대충 머리 굴려보면 나온다. 엑셀의 xy 분산형 차트에서는 '추세선' 기능으로 짝대기를 손 쉽게 구할 수 있다. 그리고 언제나 말하듯 정확한 값을 얻으려면 직접 계산해야 한다고 했는데, Slope(기울기), Intercept(절편) 함수를 이용하면 된다. 단 회귀모형의 검증은 생략하겠다. 여기서 잠시 짬을 내서 Intercept 함수 도움말을 보면 아래와 같은 내용이 나온다. 뭔소린지 모르겠으나, 확실한건 앞서 ..
지수형(?) 회귀분석 결과 적절한 회귀모형 선택과 검증을 마쳤다면 필요에 따라 추정치를 계산해야 한다. 그런데 앞서 소개한 추정치 계산 방식은 좀 너저분 한게 사실이다. 그래서인지 엑셀은 Growth 함수를 따로 제공하고 있다. g2 셀 (Growth_Y) =GROWTH($B$2:$B$9,$A$2:$A$9^{3,4},A2^{3,4},TRUE) 또는 =GROWTH($B$2:$B$9,$C$2:$D$9,C2:D2,TRUE) 여기서 궁금증, LinEst 함수는 짝꿍이 없나? 한번도 보이지 않던데... 물론 있다. Trend 함수라고. LinEst는 Trend, LogEst는 Growth. 앞에서 처럼 LinEst 함수를 통해 추정치를 계산했듯이, Trend 함수를 이용해 결과를 얻을 수 있다. 이건 숙제~~~
지식iN에 올라온 질문이다. 예제는 아래와 같다. 엑셀에서 분산형 차트를 선택한 후 추세선을 구한다. 이렇게 구한 회귀계수를 이용해 추정치를 계산한다. 그런데 그래프로 나타내니 추정치가 관찰값과 너무 동떨어져 나타났단다. 뭐가 문제일까? 계산된 회귀계수와 차트에 나타난 회귀계수 간에 차이가 있으나 이는 엑셀의 오류라기 보단 표시형식의 제약 때문이다. 회귀계수가 길게 나왔다고 해서 제한된 영역에 모두 표기할 수는 없기에 회귀계수의 표시형식을 지수로 나타낸 것 뿐이다. 때문에 정확한 결과를 얻고자 한다면 반드시 함수를 이용해 회귀계수나 추정치를 계산해야 한다. 그런데 어느 분이 올린 답변을 보니, 뭐라뭐라 하며 이는 "근사식"이라고 한다. 훨~~~ 아마도 비전공자에게 쉽게 말하기 위해 그랬을 수 있지만, 통..
상반기도 마무리 됐으니 영화관 입장권 통합전산망의 자료를 참고해 상반기 결산 좀 해 보자. ※ 주의 : 자료 인용 및 처리 과정에 오류가 있을 수 있습니다. c28 셀 (동일기간(YTD)) =SUMPRODUCT(($B$2:$B$25=$B28)*(ROW($B$2:$B$25)-ROW($B$1)
다음의 스카이뷰에서 따온 그림이다. 성미 급한 정도가 보통이 아닌데... 과연 얼마나 정지선을 지키고 있을까? 다음의 스카이뷰를 이용해 정지선 준수 여부를 파악하려는데... 스카이뷰에 그림만으로는 교통신호를 확인하기 어렵기에 교통신호 추정이 가능한 교차로를 대상으로, 교차로 진입 차선에서의 정지선 준수 정도를 내 맘대로 취합하련다. 여기서 조사 대상 지역은 노원구와 송파구를 택했는데... 노원구는 내 거주지역이고, 송파구를 택한 이유는 노원구 만큼 인구가 많은 지역이라서다. 그러나 두 지역에 큰 차이점 중 하나는 노원구는 2007년 현재 재정자립도가 28.8% 이나 송파구는 74.9% 로, 두 지역 간에 재정자립도는 약 45%p나 차이 난다. 그리고 노원구 처럼 아파트 밀집 지역을 찾으려 했으나, 송파구..
아파트 게시판에 글이 하나 붙어있다. 보아하니 단위면적당 난방비를 인근 아파트 단지와 비교한 내용이다. 아마도 우리 아파트는 난방비 절약을 위해 부단한 노력을 하고 있다는 것을 알아 달라는 정도 되지 않을까 하는데... 이를 갖고 엑셀에서 회귀분석을 돌려보자. 이때 자료가 얼마 없기에 회귀모형의 검정은 생략하고, 종속변수는 '평당 난방비', 독립변수는 '세대수' '평당 온수비' '준공년수' 몽땅 집어넣어 회귀분석을 돌렸다. 그 결과 추정된 회귀계수는 아래와 같다. 만약 회귀모형이 유의미하다고 했을 때, 추정된 회귀계수 만큼 종속변수에 영향을 주게 되는데 여기서 문제가 하나 있다. 변수별로 측정 단위가 서로 다르다는 것. 득 측정 단위가 서로 다르므로 어느 독립변수가 더 많은 영향을 주는지 말하기 어렵게 ..