본문 바로가기
반응형

프로그램5

통계학 & R 프로그램 스터디 15일차 ::0.000012%의 꿈, 로또(2) :: 확률을 활용한 로또 당첨 번호 예측이 가능할까? <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 15일차 - 0.000012%의 꿈, 로또, - 확률을 활용하여 로또 복권 당첨 번호를 예측할 수 있을까? 확률 모르거나 아직 일어나지 않은 어떤 불확실한 것, 통계에서는 이것을 사건 Event 이라고 부른다.어떤 불확실한 정도를 0부터 1 사이의 숫자로 표현한 것을 확률 Probability 이라고 한다.우리는 이 소수에 100을 곱한 백분율(%)이 더 친근한데 확률 0%는 불가능, 100%는 필연을 의미한다. 고등학교 수학 교과서에서의 표현은? 우리나라 고등학교 수학 교과서에서는 이 용어들을 이렇게 표현하기도 한다. 주사위나 동전을 던지는 것과 같이 같은 조건에서 여러 번 반복할 수 있고, 그 결과가 우연에 의하여 좌우되는 실험이나 관찰을 시행이라고 한다. 그리고 어떤 .. 2018. 2. 14.
통계학 & R 프로그램 스터디 11일차 :: 물수능과 불수능 :: 표준화(2) - 척도화 <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 11일차 - 물수능과 불수능 :: 표준화(2) - 척도화 지난번에는 데이터의 표준화의 첫단계인 중심화 Centering에 대해서 스터디를 했다. (통계학 & R 프로그램 스터디 10일차 :: 물수능과 불수능 :: 표준화(1) - 중심화 ) 오늘은 그에 이어서 척도화 Scaling에 대해 스터디를 진행할 예정이다. 오늘은 지난 번과 조금 다른 예를 가지고 왔다. 원래 점수 $$6, 10, 15, 18, 19, 22$$ 에 2배를 해서 새로운 변수 $y$를 만들었다. $$12, 20, 30, 36, 38, 44$$ 이전 과정을 복습할 겸 중심화를 해보자. 먼저 평균을 구해보면 $$m = \frac{12 + 20 + 30 + 36 + 38 + 44}{6} = 30$$ 30인 것을.. 2018. 2. 8.
통계학 & R 프로그램 스터디 4일차 - 순서대로 한줄서기(1) 사분위수, 상자그림 <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 4일차 - 순서대로 한줄서기(1) 사분위수, 상자그림 아이돌 서바이벌 프로그램 이라는 프로그램이 있다. 101명의 연습생이 경쟁하고, 시청자 투표를 통해 선정된 11명이 프로젝트 그룹으로 데뷔하기도 했다. (사실 솔직히 난 한 번도 본적이 없다....경쟁 프로그램 자체를 별로 좋아하지 않는다...) 아마도 101명의 연습생들이 다양한 미션(?)을 수행하고, 점수를 매겨서 점수 순서대로 11명을 뽑았겠지. 결국 줄 세우기.... 정렬과 순서 통계량 여기 10개의 숫자들을 가정해보자. $$4~~~5~~~3~~~8~~~9~~~7~~~0~~~1~~~2~~~6$$ 작은 숫자부터 오름 차순으로 줄을 세워보면 다음과 같다. $$0~~~1~~~2~~~3~~~4~~~5~~~6~~~7~~~8.. 2018. 1. 31.
통계학 & R 프로그램 스터디 3일차 - 데이터의 표현 <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 3일차 - 데이터의 표현 데이터를 분석하기 위해서 통계는 우리가 가진 데이터로 적당한 계산을 하고 값을 만들어 낸다. 이론적인 배경을 이해하기 위해서 간단한 수식들을 설명할 예정이다. 이해를 돕기 위해 수식에 대한 몇 가지 약속을 다음과 같이 정한다. 변수의 개수 $p$, 관측치의 개수 $n$ 데이터의 크기는 변수와 관측치의 개수로 결정된다. 일반적으로 데이터에서 변수의 개수를 알파벳 $p$, 관측치의 개수를 알파벳 $n$으로 표현한다. 이전에 나왔던 예시를 바탕으로 내 식대로 이해를 해 본다면, 앞의 표는 변수가 3개 (이름, 성별 몸무게), 관측치의 개수는 5개 (A, B, C, D, E)이다. 따라서 $$p = 3$$ $$n = 5$$ 라고 할 수 있겠다. 데이터의 크.. 2018. 1. 30.
통계학 & R 프로그램 스터디 2일차 - 데이터의 구성, 데이터와 데이터의 공간 <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 2일차 - 데이터의 구성, 데이터와 데이터의 공간 '이토록 쉬운 통계&R' 100일 프로젝트 2일째 날이다. 이전에는 100일 프로젝트가 무엇이고, 이 어떤 책인지를 간략히 소개했다. ( 통계학 & R 프로그램 스터디 1일차 - 100일 프로젝트 및 책 소개 ) 오늘은 본격적으로 스터디를 시작한 첫 날이다. 데이터의 구성 / 데이터와 데이터의 공간에 대해서 스터디를 진행했다. 데이터의 구성먼저 아래의 표를 살펴보자. 이름, 성별, 몸무게라는 3가지 관점으로 5명을 관찰하여 표를 정리했다. 이 표를 보면 세 번째 열(세로줄)은 몸무게라는 이름으로 5개의 칸(행)이 있다. 몸무게라는 고정된 관점으로 보면 5명은 서로 다른 값을 갖는다. (물론 표본에 따라 같은 값을 가질 수도 .. 2018. 1. 29.
반응형