목록Population (130)
무지개타고
아래와 같은 기사, 전혀 가치 없다. 당첨번호를 알려준다는 업체와 마찬가지로... - 로또 최다 1등 당첨번호는 '1' '37' 얘기는 대충 이렇다. 매회 당첨번호를 집계해서, 1~45 번호 각각에 대해 추출 빈도를 구했더니 1, 37 번호가 가장 많이 추출되었다는거다. 그래서 어쩌라고? 나눔로또6/45 사이트에서 1~349회 까지의 당첨번호 파일을 참고해 따라해 봤다. ※ 주의 : 해당 자료는 인용 및 처리 과정에 오류가 있을 수 있습니다. 어제 까지의 당첨결과를 갖고 각각의 번호에 대해 추출 빈도를 구했다. 평균적으로 각각의 번호는 46.53회가 나와야 하는데, 37, 3, 17 순으로 추출 빈도가 높게 나왔다. 그렇다면 만약에 3, 17, 37 번호가 동시에 포함된 경우는 몇번이나 있었을까? 즉 5..
지식iN에 올라온 질문이다. 예제는 아래와 같다. 엑셀에서 분산형 차트를 선택한 후 추세선을 구한다. 이렇게 구한 회귀계수를 이용해 추정치를 계산한다. 그런데 그래프로 나타내니 추정치가 관찰값과 너무 동떨어져 나타났단다. 뭐가 문제일까? 계산된 회귀계수와 차트에 나타난 회귀계수 간에 차이가 있으나 이는 엑셀의 오류라기 보단 표시형식의 제약 때문이다. 회귀계수가 길게 나왔다고 해서 제한된 영역에 모두 표기할 수는 없기에 회귀계수의 표시형식을 지수로 나타낸 것 뿐이다. 때문에 정확한 결과를 얻고자 한다면 반드시 함수를 이용해 회귀계수나 추정치를 계산해야 한다. 그런데 어느 분이 올린 답변을 보니, 뭐라뭐라 하며 이는 "근사식"이라고 한다. 훨~~~ 아마도 비전공자에게 쉽게 말하기 위해 그랬을 수 있지만, 통..
기상청 사이트에 있는 관측 지점별 자료를 참고해 구글 닥스의 모션차트로 나타내 봤다. ※ 주의 : 자료 인용 및 처리에 오류가 있을 수 있습니다. 일단 2008년 7월 자료. 아쉽게도 모션차트에선 한글을 지원하지 않아 양넘글을 이용. 위에서 "Size"를 "Rainfall"로 바꿔주면 좀더 재밌는 그림이 나온다. 그리고 "Play" 단추가 그냥 있는게 아니니, 아직 눌러보지 않았다면 한번 눌러보기 바란다. 덧붙여 축을 이리저리 바꿔보면 좀더 재밌을 것이다. 이번엔 2009년 7월. 이제 보름 밖에 지나지 않아서 조금 허전하지만... 작년에는 중순 이후로 많이 내렸다면, 올해는 초순 부터 내리고 있다. 그리고 강수량도 전년에 비해 많다. 작년 7월 총강수량을 상회하는 관측지점이 15일 현재 59 곳으로 7..
뭐 좀 검색하다가 눈에 띈 논문에 결론 부분이다. 허명회 등 (2004)의 연구에서 전화조사의 문제점으로 지적 되었던 표본 왜곡이 해결 되지 않고 여전히 문제점으로 남아 있다. 김세용 외 1명, 2009, "전화조사의 체계적 편향 - 2007년 대통령선거 여론조사에 대한 메타분석", 응용통계연구, 22권 2호. 일전에 주먹구구로 17대 대선 관련 여론조사의 정확도를 얘기했지만, 예전이나 지금이나 이 정도가 우리나라 조사회사의 현주소일 것이다. 애석하지만... 그리고 "여전히 문제점"이란 대목에서 조사회사는 크게 반성해야 할 것이다. 반성 한다면 통계에 대한 똥칠 그만 하고 대안을 강구해라. 그러나 암만 생각해도... 조사회사는 '통계의 무덤'이라는 생각이 가면 갈수록 확고해진다. -_-
통계청 블로그 기자단의 역할이 뭔지 모르나... 은 뭔가 어색하다. 제목만 봐서는... 여행지별 일자별 강수확률 같은걸 보여주거나, SGIS 등을 활용해 장마전선의 일자별 움직임 같은걸 보여주지 않을까 했는데... 내용은 엉뚱하게도 실내 장소 소개. -_- 비가 오는데 그럼 실외로 갈라고? 즉 이 아니라 가 내용에 부합해 보인다. 그리고 이는 통계를 몰라도 누구나 알 수 있는 상식(?)이다. 비 사이로 막가면 된다.
혹 엑셀에 관심 있는 이라면 한번쯤 찾아봤을 MS Excel MVP 수상자 목록. 그런데 기대와는 달리, MVP들이 자유형식으로 내용을 작성해서 국적을 제대로 확인하기 어려웠다. 즉 기대하지 마시라. 발로 정리한 것이니... 사진제출 사례수 제출 79 미제출 10 사진을 갖고 성별을 구분했다. 성별 사례수 남자 74 여자 5 음... 월등히 남자가 많다. 엉뚱하지만 이 목록을 굳이 확인한 이유는... MVP의 출신지를 알아보기 위해서였다. 그러나 기대가 너무 컸다. -_- 아래는 소개된 자료를 바탕으로 이것저것 추정한 출신지이다. 출신지 사례수 일본 10 미국 9 영국 8 독일 7 한국 7 캐나다 5 이탈리아 2 프랑스 2 네덜란드 1 러시아 1 인도 1 중국 1 체코 1 태국 1 포르투칼 1 호주 1 ..
상반기도 마무리 됐으니 영화관 입장권 통합전산망의 자료를 참고해 상반기 결산 좀 해 보자. ※ 주의 : 자료 인용 및 처리 과정에 오류가 있을 수 있습니다. c28 셀 (동일기간(YTD)) =SUMPRODUCT(($B$2:$B$25=$B28)*(ROW($B$2:$B$25)-ROW($B$1)
언제쯤에야 이런 식에 기사가 사라질지 걱정이다. -여성 73% “軍 제대자 지원 필요” 기사 첫머리가 이렇다. 우리 국민 10명 가운데 9명꼴로 의무적으로 군복무를 마친 제대군인에 대해 유·무형의 지원이 필요하다고 생각하는 것으로 나타났다. 거짓말이다. 좀 지나치다면, 적어도 과장되었다. 이는 기사 본문에 나오는 조사대상과 모순 된다. 지난 3월16일∼28일 현역 군인 및 미입대자, 수도권 남녀 대학생등 모두 1050명을 대상으로 실시했다 즉 현역 군인 및 미입대자 그리고 수도권 소재 대학의 남·여 대학생이 조사대상이다. 그런데 "우리 국민"이란다? 통계를 오용하는 모양새가, 숨은 저의를 의심하지 않을 수 없다. 아래는 다른 언론사의 기사다. 어디에도 "우리 국민"이라 하지 않았다. - 병사·대학생 88..