목록도수분포표 (2)
무지개타고

한국마사회 사이트를 둘러보니 경주 기록이 상당히 많다. 그리고 경주별 배당률 정보도 있어서 저번에 못한 복승식 전략을 구상해 봤다. 참고로 마사회에서는 승식별 평균 배당률 정보를 제공하고 있다. 복승식 평균 배당률은 31.7로 나왔다. 위에서 최고 배당률은 이상치이므로 의미가 없고... 보통은 고등학교 때 배운 정규분포를 떠올리며 아래 그림처럼 배당률은 평균을 중심으로 종 모양으로 분포하겠구나~ 라고 생각하기 쉬운데... 자료의 분포가 매번 종 모양의 정규분포를 따르는 것은 아니기 때문에 직접 도수분포표를 작성하며 그래프를 그려봐야 분포의 형태를 제대로 알게 된다. (이 때문에 통계학 개론 처음 시작에 도수분포표 작성법부터 배운다.) 최근 1년 동안의 복승식 배당률을 정리해 구해보면 아래와 같다. 적어도..
몇번 인용한 한국의 산하에 등록한 산 정보를 참고해 간단한 도수분포표와 히스토그램, 그리고 도수분포표로 계산된 평균과 분산을 이용해 누적정규분포를 그려 봤다. ※ 주의 : 인용 및 처리 과정에 오류가 있을 수 있습니다. 음... 누적상대빈도와 누적정규분포 간에 차이가 느껴진다. 계급간격을 좀더 좁혀 보면 어떨까? 계급간격이 좁을수록 좀더 차이는 줄어드는거 같아 보이는데... 그래도 차이는 있어 보인다. 이에 SPSS를 이용해 정규성 검정을 돌려봤더니, 정규성을 만족하지 않는 것으로 나타났다. 이는 당연한 결과다. 정규분포는 기본적으로 평균이 높고, 평균을 중심으로 대칭인 특징을 갖고 있는데... 히스토그램을 암만 봐도 평균은 치우쳐 있고 대칭도 아니게 보이기 때문이다. 그리고 이는 복잡한 수식이나 히스토..