목록추정 (4)
무지개타고
수요예측, 얘는 경제학일까? 통계학일까? 모르긴해도 적어도 통계학은 아니다. 통계학은 현상을 관찰하고 이를 기술/추정하는 학문이다. 때문에 아직 건설하지도 않는 사회간접자본이 있다고 가정하고 반영할 수 없다. 물론 여러 사례를 취합해 추정은 가능하나, 그러나 이는 특정 사업을 지칭하는게 아닌 평균이다. 언제도 얘기했지만 통계학에서 추정한다는 것은 평균을 구한다는 것과 동격이다. 그런데 최근 박원순 서울시장이 상당히 의미심장한 발언을 했다. - 박원순, "통행량 당초 40% 불과..시정硏에 손배소 검토중" 해석하면... 현실과 동떨어진 수요예측으로 재정적자 초래하게 됐으니 책임져!!! 이렇게 상식적인 시장이나 도지사 봤어? 지금까지 나온 숱한 수요예측 오류 기사 중에서 지자체장이 보고서 작성자 거론하긴 처..
두 달 걸렸다. 괜한 호기심에 부동산 실거래가 사이트에서 노원구 아파트 매매 자료 불러들여 씨름한지도. 맨땅에 헤딩 수차례 하고나니, 조금 정리가 됐다. 이에 살짝~ 정리해볼까 한다. 출처 : 국토부 부동산 실거래가 사이트 지역 : 노원구 기간 : 2006년 1월 ~ 2011년 12월 대상 : 아파트 매매 ※ 주의 : 이하 자료 인용 및 처리에 오류가 있을 수 있습니다. 처음엔 간편하게 선형회귀모형으로 처리했다. 그런데 안정된 동(洞)이 있는 반면, 점점 벌어지는 동(洞)도 있고... 즉 모형이 부적절하다는 반증. 이거 잡느라 액세스로 작성한 DB를 세 번 정도 뒤집어야 했다. 선형회귀모형에서 로그변환 회귀모형으로 변경. 부동산에 '부'자도 모르는지라, 논문을 검색해보니 내가 설정한 모형의 부류(?)를 ..
음... 직선 그래프를 중학교 때 배웠나? 아무튼 옛날옛적을 잠시 떠올려 보자. (x,y) 좌표값을 갖는 관찰값이 두 개 있다고 하자. 그랬을 때 두 관찰값을 서로 잇는 짝대기를 그리자. 두 점을 잇는 짝대기를 긋기 위해선, 기울기와 절편을 계산해야 한다. 이정도는 아직 기억하고 있고, 잊었어도 대충 머리 굴려보면 나온다. 엑셀의 xy 분산형 차트에서는 '추세선' 기능으로 짝대기를 손 쉽게 구할 수 있다. 그리고 언제나 말하듯 정확한 값을 얻으려면 직접 계산해야 한다고 했는데, Slope(기울기), Intercept(절편) 함수를 이용하면 된다. 단 회귀모형의 검증은 생략하겠다. 여기서 잠시 짬을 내서 Intercept 함수 도움말을 보면 아래와 같은 내용이 나온다. 뭔소린지 모르겠으나, 확실한건 앞서 ..
시장규모라는게 쭉쭉 늘어나는 엿가락이 아닌 이상 언젠가는 정체되기 마련이지만, IT통계포탈에서 이동전화 가입자 자료를 보면 엿가락인거 같기도 하다? ※ 주의 : 이후 자료 인용 및 처리 과정에 오류가 있습니다. -_- 음... 위 자료를 갖고 사기 치고 싶은 맘이 굴뚝 같다. 오픈오피스의 캘크에 있는 해 찾기 기능을 이용해 최소 오차제곱합을 만족하는 년도별 추정치를 구해봤다. 그중 '로지스틱', '곰페르츠', '지수' 또 '로지스틱'은 해 찾기 기능으로 계산된 결과고 '단순', '로그변환'은 회귀분석으로 구한 결과다. 따라서 '단순', '로그변환'을 제외한 나머지 방법은 해 찾기 기능의 활약(?)에 영향을 받게 된다는 것. 음... 모르는건 함부로 갖다 붙이는게 아닌데... -_-;; 그냥 재미다. 한번..