목록통계 (14)
무지개타고
우리나라에서 가장 큰 조사 규모일거다. 통계청 예산안에 소개되기론 약 1808억 이란다. 뭐가? 인구주택총조사!!! ※ 주의 : 자료 인용에 오류가 있을 수 있습니다. 인구주택총조사는 5년 마다 진행되는데, 올해가 그해다. 2010년 11월 1일 조사 시작이란다. 아무쪼록 열화와 같은 성원을 보내주기 바란다. 인구주택총조사 홈페이지에서 '자주묻는질문'에 재미난 글이 올라와 있던데, 만약 나라면... 당신이 성실히 응답한 만큼 만, 믿을 만 하다고 했을거다. 너무 적나라했나??? 명박이 이후 바보 된 먹물들 덕분에 통계가 망신창이가 된 느낌인데... 그래도 수고 해 주기 바란다.
언제나 말하듯 통계란 상식에서 출발한다. 사람이 개를 물어야 할 까닭은 없듯이 말이다. 아래 기사를 대충 정리하면... 차도폭이 좁은 도로일수록 보행자 교통사고가 많이 나타나더라 정도이다. - 좁은 도로일수록 보행자 교통사고 많다 도로가 좁을수록 보행자와 마추질 접점(?)이 상대적으로 많기에 보행자 교통사고가 좀더 많이 발생할 개연성이 있어보인다. 그러나 간과할 수 없는 것이... 차도가 아무리 좁아도 보행자와 차가 만나는 접점은 크게 증가하지 않는다는 것. 따라서 차도폭별 보행자 수와 교통량 등을 비교하며 보행자 교통사고 자료를 봐야만 좀더 의미 있는 분석이 되지 않을까 한다. 참고로 국토해양통계누리에서 도로등급별차로현황을 보면 포장도 중에서 2차로가 차지하는 비율이 73.8%다. 그런데 2차로 비율은..
지난번에 참고한 논문에 보면 몇가지 가설 검정을 실시했다. 강현철 외 4명, 2008년, "RDD 전화조사와 주요 결과", 조사연구, 9권1호. 논문 내용은 우리나라 조사회사들이 진행하는 전화조사의 대표성과 편의에 대한 내용이다. 결론을 얘기하면, 결과가 서로 다르다... -_- 이런 결과를 볼 때 마다 느끼는건 조사회사는 도무지 뭐하는 회사인지 모르겠다는거... 아무튼 자세한 내용은 논문을 참고하기 바라고, 여기선 조사회사가 관행적으로 자행하는 척도 문제에 대해서 접근하겠다. 조사회사가 관행적으로 자행하는 척도 문제? 다름아닌 리커트 척도 얘기다. 위 논문에 나온 통계를 갖고 예제를 만들어 봤다. 어제는 χ²-검정을 다뤘는데, 문항이 5개인 리커트 척도이기에 5점 척도로 대표값을 부여하고, 두 집단이므..
익히 알고 있듯이, 엑셀에서 Sum 함수는 더하는 함수다. Count 함수는 빈도를 헤아리는 함수다. 그리고 Average 함수는 평균을 구해준다. 물론 평균을 구하는 방식은 다양하나 주로 이용하는 산술평균을 보면 평균 = 합 ÷ 빈도 와 같다. 만일 확률변수 X의 분포(확률) 함수를 알고 있다면, X의 평균은 μ = E(X) = ∑ x·f(x) 또는 ∫x·f(x)dx 이다. 여기서 엑셀의 함수 마법사를 잠시 보자. 위키피디아에서 검색하면 Average 와 Mean 이 있다. 소실적을 떠올려보면 Mean 이라 했지, Average 라고는 하지 않았던거로 기억된다. 왜지? 음... 이런 심오한 얘기는 넘에게서 듣기 바란다. 내게도 알려주면 고맙고... ^^;; 아무튼 위 함수 마법사에 보면... Sum 함..
뭐 좀 검색하다가 눈에 띈 논문에 결론 부분이다. 허명회 등 (2004)의 연구에서 전화조사의 문제점으로 지적 되었던 표본 왜곡이 해결 되지 않고 여전히 문제점으로 남아 있다. 김세용 외 1명, 2009, "전화조사의 체계적 편향 - 2007년 대통령선거 여론조사에 대한 메타분석", 응용통계연구, 22권 2호. 일전에 주먹구구로 17대 대선 관련 여론조사의 정확도를 얘기했지만, 예전이나 지금이나 이 정도가 우리나라 조사회사의 현주소일 것이다. 애석하지만... 그리고 "여전히 문제점"이란 대목에서 조사회사는 크게 반성해야 할 것이다. 반성 한다면 통계에 대한 똥칠 그만 하고 대안을 강구해라. 그러나 암만 생각해도... 조사회사는 '통계의 무덤'이라는 생각이 가면 갈수록 확고해진다. -_-
노원구 소재 초등학교를 구글닥스의 지도 가젯을 이용해 나타냈는데... 주소 확인에 문제가 있는지 총 42개교 중에서 34개교만 찍혔다. 그리고 동일한 자료를 갖고 비즈니스 GIS(www.biz-gis.com)가 제공하는 비즈콩을 이용해 나타내면 총 42개교 중 39개교만 찍혔다. 음... 구글닥스의 지도 가젯 보다 비즈콩에서 더 많은 위치를 확인할 수 있었으나 총계와는 다르다? 참고한 자료가 부정확 했거나, 서비스에 문제가 있거나 둘 중 하나겠다. 그건 그렇고... 비즈콩에서는 밀도 기능을 제공하기에 이 기능을 이용해 봤다. GIS에 대한 지식이 없다보니 밀도가 어떤 방식으로 계산되어 적용되는진 모르지만 뭔가 그럴싸 해 보인다. 그런데 '학생수'를 동일한 값, 즉 상수 1로 했을 때도 동일한 밀도 그림을..