본문 바로가기
반응형

루비페이퍼15

통계학 & R 프로그램 스터디 14일차 ::0.000012%의 꿈, 로또(1) :: 로또 당첨 확률 구하기 <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 14일차 - 0.000012%의 꿈, 로또, - 로또 당첨 확률 구하기 로또 당첨 확률 로또 당첨 확률을 구하려면 먼저 45개의 숫자 중 6개를 뽑는 방법의 가짓수를 구해야 한다. 고등학교 통계 시간에 배운 조합 Combination을 써보면 다음과 같이 구할 수 있다. $${}_{45}{\rm C}_{6} = \frac{45 \times 44 \times 43 \times 42 \times 41 \times 40}{6 \times 5 \times 4 \times 3 \times 2 \times 1} = 8,145,060$$ 8,145,060개의 번호 중에서 곡 하나는 당첨 번호가 나오므로 내가 산 복권이 당첨될 가능성은 $$\frac{1}{8,145,060} \sim 0... 2018. 2. 13.
통계학 & R 프로그램 스터디 13일차 :: 먹고 싶은 거 먹어, 난 짜장 :: 범주형 변수, 파이 차트, 막대그래프 <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 13일차 - 먹고 싶은 거 먹어, 난 짜장 - 범주형 변수, 파이 차트, 막대그래프 예전에 3일차 스터디를 진행할 때 ( 통계학 & R 프로그램 스터디 3일차 - 데이터의 표현 ) 변수의 종류에 따라서 확인할 수 있는 차이도 다르고, 계산할 수 있는 기술 통계량도 다르다는 언급을 했었다. 연속형 변수와 범주형 변수에 대해 간단히 설명하자면 아래와 같다. 연속형 변수 : 몸무게처럼 값이 한없이 다양한 변수. 순서를 정하거나 값들을 더해서 통계량을 계산한다.범주형 변수 : 성별처럼 관측치들이 정해진 몇 개의 값 중에서 하나를 가지는 변수, 값이 같은 관측치들을 묶어 개수를 센다. 연속형 변수는 다양한 값을 가질 수 있으나 범주형 변수는 정해진 값 중에서 하나를 선택해야 한다. .. 2018. 2. 13.
통계학 & R 프로그램 스터디 12일차 :: 물수능과 불수능 :: 표준화(3) - 표준화 예제, 수능 표준점수, IQ 지능지수 <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 12일차 - 물수능과 불수능 :: 표준화(3) - 표준화 예제 - 수능 표준점수, IQ 지능지수 지난 번 두 번에 스터디에 걸쳐서 데이터의 표준화에 대해서 공부했다. 통계학 & R 프로그램 스터디 10일차 :: 물수능과 불수능 :: 표준화(1) - 중심화 통계학 & R 프로그램 스터디 11일차 :: 물수능과 불수능 :: 표준화(2) - 척도화 오늘은 표준화를 조금 더 구체적인 예를 통해 확실히 이해해보도록 하자! 표준화 예제 2011년 불수능에서 수학의 평균은 47.8, 표준편차는 19.7이다. 2015년 물수능에서는 평균이 55.4, 표준편차는 28.5이다. (책에는 이렇게 소개되었는데 확인은 못해봤다..ㅋ) 이를 바탕으로 수능을 치른 학생 1,000명의 가상 성적을 히스.. 2018. 2. 9.
통계학 & R 프로그램 스터디 11일차 :: 물수능과 불수능 :: 표준화(2) - 척도화 <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 11일차 - 물수능과 불수능 :: 표준화(2) - 척도화 지난번에는 데이터의 표준화의 첫단계인 중심화 Centering에 대해서 스터디를 했다. (통계학 & R 프로그램 스터디 10일차 :: 물수능과 불수능 :: 표준화(1) - 중심화 ) 오늘은 그에 이어서 척도화 Scaling에 대해 스터디를 진행할 예정이다. 오늘은 지난 번과 조금 다른 예를 가지고 왔다. 원래 점수 $$6, 10, 15, 18, 19, 22$$ 에 2배를 해서 새로운 변수 $y$를 만들었다. $$12, 20, 30, 36, 38, 44$$ 이전 과정을 복습할 겸 중심화를 해보자. 먼저 평균을 구해보면 $$m = \frac{12 + 20 + 30 + 36 + 38 + 44}{6} = 30$$ 30인 것을.. 2018. 2. 8.
통계학 & R 프로그램 스터디 10일차 :: 물수능과 불수능 :: 표준화(1) - 중심화 <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 10일차 - 물수능과 불수능 :: 표준화(1) - 중심화 매년 11월이 되면 수능 시험이 치러진다. 그때마다 언론을 통해 수능 시험에 대한 평가(?)가 이뤄지며 이번 수능이 "물수능"이었냐? 아니면 "불수능"이었나?가 초미의 관심사가 된다. 난이도 조절을 실패했느냐, 성공했느냐... 변별력을 위한 시험을 만든다는 것 자체가 참으로 안타까운 일이 아닐 수 없다. 어쨌든 각 시험 마다 이런 유불리가 나타날 수 밖에 없고, 한 시험에서도 선택과목을 무엇을 선택하느냐에 따라 유불리가 더 크게 나타날 수 밖에 없다. 상대적으로 쉽다고 알려진 시험을 봐서 높은 점수를 받는 것과 어렵다고 알려진 시험을 봐서 그보다는 조금 낮은 점수를 받았을 때, 누가 더 잘 한 것인가를 어떻게 판단할 .. 2018. 2. 7.
반응형