목록SUMPRODUCT (26)
무지개타고
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/8aNiG/btqAD0jPOWk/JauaRuIjM3QD9b51M12930/img.png)
유튜브 추천 목록에 뜬금없이 '로또 번호 추출' 관련 동영상이 올라와 있어서 또 누가 사기치고 있구나 생각하며, 도대체 어떻게 사기치는지 궁금해 몇몇 영상들을 들여다 봤다. 별 얘기 없더라. 어떤 넘은 지난 회차에 회원 누구들이 추천한 번호가 각각 몇 개씩 맞았습니다~ 딴 넘은 분석을 어떻게 했습니다~ 이라는 걸로 장황하게 한참 얘기하다가 결론은 로또 맞을 때 까지 열심히 연구합시다~ 이번에는 안 맞았지만... 내가 알려주지! 로또의 당첨 갯수는 초기하분포(HyperGeometric distribution)를 따라. 뭔지 모르지만 앞에 '초'字가 붙어 있는거 봐서는 아주 뭔가 특별한 특수 경우에 해당 되는 느낌이 들지? 그러라고 '초'字가 붙었다고 보면 돼~ 아무튼... 초기하분포를 따라. 못 믿겠어? ..
아주 초보적인 방법이 아른거려 간단히 주기(Time Period) 연산 방법을 만들어 봤다. 일단 Sin 함수를 하나 만들고... c3 셀 =ROUND(SIN(RADIANS($B3*C$2)),5) 그리고 등차수열의 합 공식을 차용. 이 공식을 뒤집으면 초보적이나마 주기를 구할 수 있을 것 같다. c29 셀 (합, Sn) =SUMPRODUCT((C$3:C$22C$5:C$24)*($B$4:$B$23)) c30 셀 (빈도, n) =SUMPRODUCT((C$3:C$22C$5:C$24)) c31 셀 (초항, a1, 배열수식) =MIN(IF((C$3:C$22C$5:C$24),$B$4:$B$23)) c32 셀 (주기, d) =2*(C29/C30-C31)/(C30-1) 그러나 아쉽게도... 임의의 난수를 가미해서 si..
명절이 다가왔다. 김도 구웠고, 만두도 빚었고, 다음엔 고구마전을 만들어야 한단다. 차례상에 이것저것 올려놓으려니 덩달아 바빠지는데... 삼겹살에 콜라로 어찌 않되나??? 아래와 같은 판매목록이 있다고 할 때, 고객ID A001, A003은 수량이 부족했는지 추가로 구매해 갔다고 하고 집계를 해보자. 보통은 품목별로 집계하는데 빅데이터 시대(?)에 걸맞게 ID별로도 집계해 보자. 여기서 유일ID 빈도는 중복된 ID를 하나로 처리해 빈도를 구하겠다는 것. f3 셀 (ID*품목별 수량) =SUMPRODUCT(($A$3:$A$22=$E3)*($B$3:$B$22=F$2)*($C$3:$C$22)) f11 셀 (유일ID 빈도) =COUNTIF(F$3:F$10,">0") 그리고 이를 이용해 교차품목별 유일ID 빈도를..
언제도 한번 봤듯이, 이 듣보잡 블로그를 방문하는 유입어 중 회귀분석과 관련된 검색어가 제법 된다. 그래봤자 추세선, LinEst, LogEst, Trend 정도지만. 그리고 로지스틱 회귀분석도 의외로 조금 된다. 그런데 로지스틱 회귀분석은 비선형모형이고, 이를 지원하는 엑셀 함수가 따로 있는 것도 아니라 조금 복잡하다. 로지스틱 회귀분석 이론을 알고 있다면 그닥 어려울건 없겠지만... 미력한 재주이나 엑셀 갖고 로지스틱 회귀분석하는 방법을 몇번 소개한 적이 있는데, 유튜브를 검색하면 로지스틱 회귀분석을 엑셀에서 돌리는 사용법을 알려주는 동영상이 있다. 아무래도 글 보다는 동영상이 사용법 익히기는 좀더 수월하지 않을까 해서 참고하면 좋을듯. 위에 동영상에 나온 예제를 따라해 보자. 자료가 충분히 많고 집..
가십성 조사다. 즉 큰 의미를 부여하는건 자살골이라는 얘기. - 스마트폰 보유 직장인 82%, 트위터 삼매경에 빠지다 아무튼... 위 기사를 읽다가 궁금한게 생겼다. 여타 항목은 비율로 보여주면서 유독 트위터 이용율만 빠져있다. 물론 트위터 비이용자의 빈도를 제공했으니 따로 계산하면 된다. 그런데 만일 이 정보가 제공되지 않았다면? 다른 정보를 통해 원하는 정보를 얻을 수 있다. 물론 다른 정보가 필요로 하는 정보여야 하지만... 다행히 여기선 필요로 하는 정보가 있으니 간단히 계산해 보자. 사실 계산이랄 것도 없다. ※ 주의 : 자료 인용 및 처리에 오류가 있을 수 있습니다. b2 셀 (트위터 이용률 전체) =SUMPRODUCT(B7:B8,B3:B4) 그 결과 해당 사이트 회원 중 직장인의 61.5%가..
순차적으로 배열된 자료를 갖고, 출현당 상승일 즉 평균 상승일을 구하는 수식을 생각해 봤다. ※ 주의 : 자료 인용에 오류가 있을 수 있습니다. c3 셀 (상승일) =N(B3>B2) d3 셀 (출현) =N(C2C3)*C3 그런데 이 방법이 싫다면? 싫은 이유는 결과를 얻기 위해 다른 열에 계산 결과를 보여줘야 하기 때문이다. 따라서 필요한건 뭐!!! 더하기로 한 방에 끝내자. 그러나 수식이 그닥 맘에 들지 않는다. 다른 방법이 있을거 같은데... -_-a b26 셀 (총상승일) =SUMPRODUCT(N(B2:B221,FREQUENCY(MMULT(1*(((MMULT(((B$2:B$22
단순히 회귀분석 모형 선택시 절편이 있는 경우와 절편이 없는 경우를 선택하는 옵션 정도로만 지레짐작 하고 그냥 넘겨 버렸다. 그러나 왠걸? 엑셀의 추세선 기능에서 절편이 없는 경우 결정계수 R²가 잘못 계산되는 것 아닌가!!! (엑셀2010 베타판이라서 양넘 글이다.) 간단한 예제를 갖고 뭐가 문제인지 살펴보자. 이를 추세선 기능을 활용해 하나는 절편이 있는 경우, 다른 하나는 절편이 없는 경우를 선택해 차트에 함께 나타내면... 절편이 없는 경우 결정계수 R²에 붉은 칠을 했다. 먼가 이유가 있을 것이다. 위 예제를 갖고 직접 계산하면 결과는 아래 처럼 나온다. 그런데 절편이 없는 경우는 결정계수가 두 종류로 계산해 놨네? 결정계수1과 결정계수2가 있는데... 절편이 없는 경우 결정계수2는 앞서 구한 ..
구글닥스의 스프레드시트에서 재미난 함수가 눈에 띄었다. 함수 이름이 Query 다. SQL에서 사용하는 쿼리 보단 기능이 딸리지만, 그래도 신기하다. 언제나 느끼지만 구글의 도움말은 기계로 번역했는지 영~ 아니다. -_- - 함수 : Query 함수 어떤 자료 목록이 있고 이를 집계하는 작업을 진행한다고 하자. 보통 일정한 양식을 구성하고 그에 따라 집계 결과를 보여주게 되는데... 먼저 예제에 사용된 색에 대해 간단한 설명이 필요하겠다. 회색 계열 - 임의로 입력 푸른색 계열 - 함수로 작성 노 랑색 계열 - 결과값을 얻기 위해 함수로 작성 초록색 계열 - 기존에 알고 있던 함수 표제 분홍색 계열 - Query 함수 표제 말이 좀 복잡해 보여도 예제를 보면 안다. 엑셀에서 함수를 이용해 f3:f5 나타..