목록SUMPRODUCT (26)
무지개타고
더하기를 갖고 많이도 우려먹었다. 엑사모에 올라온 질문을 갖고 또 우려먹으련다. 얘기는 대충 이렇다. 제품별로 판매량이 날짜별로 집계되는데... 각각의 제품별을 구성하는 부품도 덩달아 몇개나 출고 됐는지를 집계하고 잡다는 것. '단순 더하기'의 수식을 원했다면, 아마도 질문 자체를 않았겠지? b10 셀 (단순 더하기) =$F3*B$3+$G3*B$4+$H3*B$5 그래서 좀 봤다. 참조하는 '제품별 부품구성' 표를... 훑어보니 제품과 부품의 배치 순서가 동일하다??? MMult 함수가 딱이다. f10 셀 (MMult 더하기(순서:동일)) =MMULT($F3:$H3,B$3:B$5) 그러나 순서가 동일하길 바라는건 욕심일게다. 아니나 다를까, 순서가 동일하지 않는 경우를 되묻던데... 이 경우에도 MMult..
아래 논문에 다음과 같은 표가 첨부되어 있다. 강현철 외 4명, 2008년, "RDD 전화조사와 주요 결과", 조사연구, 9권1호. χ²-검정 결과를 보여주고 있는데, 확인사살(?)해 보자. 참고로 해당 논문에 보면, 가중치를 적용했다고 하니 위에 보이는 것 처럼 빈도가 정수가 아닌 실수일 가능성이 99.9%다. 즉 소소한 차이가 발생될 수 있다는 얘기. 자료를 확인사살(?) 하겠다하니, 행여나 겁먹지 않을까 하는데... 그럴거 없다. 그리고 통계 전용 프로그램이 없어도 된다. 오픈오피스 캘크나 엑셀에서도 이 정도는 처리 할 수 있다. χ²-검정은 범주형 자료 즉 빈도를 분석하는데 매우 애용되는 분석방법이다. (χ²-검정에 대한 자세한 내용은 별도 확인 바람.) 다행히 χ²-검정 이론을 알고 있으니 직접..
관심이 끌리는 질문이다. 오튜에 올라온 질문인데 내 맘대로 정리하면 대충 이렇다. 시점별로 값이 있는데 전체 합계의 80%를 점유하는 기간(시작~종료)을 알고 싶다는 것. 물론 기간은 짧을 수록 좋다. 그리고 자료는 종 모양으로 분포하고 최고점을 중심으로 한다는 것. 질문이 유용해 보인다. 그래서 허접대마왕(?)이 나가신다. 으~~ㅁ ㅎㅎㅎ 이야기(?) 전개는 대략 세 가지. - 피라미드 - 정규분포 응용 - 이동누적점유율 자료가 종 모양을 이루고, 최고점이 중심이라고 해서 처음 떠올린 이야기는 '피라미드'였다. 그리고 종 모양의 대명사, 정규분포를 응용해 보기로 하고 '정규분포 응용'을 구상했다. 그런데 만일 분포가 일정하지 않다면? 모르긴해도 뭔가 많이 불안한 결과가 나올거 같다. 그래서 시점의 이동..
음... 그닥 반갑지 않다. 그러나 이를 알면서도 블로그까지 찾아와 물어본 심정, 십분 이해는 된다. 그리고 내가 저지른 원죄(?)도 있고... 아는 만큼만 처리해 봤다. 일용직 노동자 임금을 시급으로 계산한단다. 그러나 임금 적용 방식은 너무나 다양해 통일된 처리 방법을 찾긴 어렵다. 따라서 각자 알맞게 적용해야 한다. 그런데 예전에 작성한 예제를 보니... 뭔 생각을 했는지, 아주 제한된 처리만 반영하고 있었다. 즉 경우에 따라 맞고 틀리고... 미친년 널을 뛴다. -_-;; 그래서 다시 구성해 봤다. 이번엔 허접한 재주가 티나지 않았으면 좋겠는데... 근무 조건은 대충 아래와 같다. 정상근무 시간대와 휴식 시간대 및 야근 시간대 그리고 특별수당. 휴식 시간이 왜 정상근무 시간에 포함되지 않는게 관례..
지난 서울 아파트 관리비 총계 자료를 갖고 집단 간 차이 검정을 하련다. 25개 구를 모두 포함하긴 거시기 하니... 내 사는 노원구, 노원구와 비슷한 인구를 자랑하는 송파구. (그러나 송파구는 재정자립도 상위에 속하는 반면 노원구는 재정자립도 하위에 속한다.) 그리고 평균이 가장 낮았던 성동구. 언제나 내 맘대로 선정 끝. 이제 각 구별로 무작위로 단지를 몇개 추출해 관리비 총계를 정리하면... 음... 무작위로 추출한 관리비 총계가 노원이 높게 나왔군. -_- 그러나 무작위 추출에 조작은 결코 없시요~ 아무튼... 인자가 하나고 인자의 수준이 세 개인 일원배치법을 적용해 분산분석표를 작성하면... 위 결과를 얻기 위한 수식 중 주요한 것 몇개만 보면... b22 셀 (처리 제곱합) =SUMPRODUC..
오튜에 올라온 질문인데... 언제나 처럼 내 맘대로 정리해 봤다. 이때 조건은 대충 이렇다. '값' 필드에서 '10 초과'하는 목록만 빈도를 구하려 한다는 것. 이와 유사한 처리를 언제 한번 훑어봤는데... 그런데 추가된 조건이 생각만큼 만만하지 않고, 그 전 수식에 계륵도 많고 해서 수식을 다시 구하면... 집계① 은 조건이 고려되지 않은 상태에서 유일 목록을 구성한 것이다. 그리고 집계② 는 조건이 반영된 유일 목록을 '빈도'순으로 나열한 것이다. g3 셀 (집계① 구분) =INDEX($A$2:$A$20,MATCH(0,COUNTIF(G$2:G2,$A$2:$A$20),0)) j3 셀 (집계② 구분) =IF(SUM(N((FREQUENCY(MATCH($A$2:$A$20,$A$2:$A$20,0),MATCH(..
월 초에 감기로 보건소 다녀온 후 신종 인플루엔자 소식에 좀더 관심 갖게 되었다. 그래서 간단히 계산해 봤다. 몇몇 기사 검색를 통해 신종 인플루엔자 누적확진환자수를 확인했다. 이 중 8월 자료, 즉 관찰값 3개 갖고 단순회귀분석과 로지스틱 회귀분석을 돌렸다. 그리고 로그변환 회귀분석도 하나. 점 3개로 사기치긴 뭐하지만... 회귀계수와 결정계수를 구한 후 추정치를 계산한다. 뭐지? 오류 표시는. 로그변환 회귀분석분에서 LinEst 함수를 계열과 LogEst 함수 계열 간에 차이 발생. e2 셀 (로그_LinEst) =EXP(SUMPRODUCT(LINEST(LN($B$3:$B$5),$A$3:$A$5,TRUE,FALSE),A2^{1,0})) f2 셀 (로그_Trend) =EXP(TREND(LN($B$3:$..
일전에 LinEst 함수에 대해 잠깐 살펴봤는데, 이번엔 LogEst 함수를 살짝 들춰보련다. 그리고 예제는 앞서 지식iN 것을 참고하는데, 지난 번과는 달리 다중회귀모형을 이용하련다. 지난 번 회귀모형은 단순 지수형(?) 회귀모형이다. 이는 엑셀에서 지원하는 추세선 기능으로 손 쉽게 구할 수 있었다. 표시 정밀도(?)는 떨어지지만. 그러나 이번엔 다항 지수형(?) 회귀모형으로 구상했다. 이에 독립변수로 X의 세제곱(X^3)과 네제곱(X^4)을 이용하겠다. 이제 회귀계수와 결정계수를 구한다. 이때 LinEst 함수와 LogEst 함수를 각각 이용한다. 단 회귀모형의 검증은 생략하겠다. 어째 비슷한거 같기도 하고, 다른 것 같기도 하고... 그래 보인다. 사용된 수식을 살짝 들여다보면... LinEst(L..