본문 바로가기
반응형

루비페이퍼15

통계학 & R 프로그램 스터디 9일차 - 분산 n으로 나눌까? n-1로 나눌까? <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 9일차 - 더치페이와 N빵(3) :: 분산!! n으로 나눌까? n-1로 나눌까? 통계 관련된 책들을 보면 어떤 책은 분산을 $n$으로 나눠서 계산을 하고 어떤 책은 $n-1$로 나눠서 계산한다. 도대체 뭐가 맞는 걸까? 이것은 무엇이 맞고 틀리냐의 문제가 아니다. 분산을 계산하는 샘플을 무엇으로 선택하느냐에 따라 차이가 생긴다. 모집단 전체로 분산을 구하느냐? 임의로 추출한 표본집단으로 분산을 구하느냐?에 따라 계산 방법이 달라진다. 그렇다면 왜 두 경우에 계산 방법이 달라질까? * 수식 압박에 주의하세요..ㅎㅎ TeX이 변환되는 데 시간이 조금 걸릴 수 있습니다. 조금만 기다려주세요~~ 모집단에서 크기가 $n$인 표본 $X_1$, $X_2$, $\cdots$, $X_n$을.. 2018. 2. 6.
통계학 & R 프로그램 스터디 8일차 :: 엑셀 평균, 분산, 표준편차 함수 (var vs varp, stdev vs stdevp) <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 8일차 - 더치페이와 N빵(2) :: 엑셀, 평균, 분산, 표준편차 - 엑셀, 스프레드시트, 구글 시트 활용법, 평균, 분산, 표준편차 함수 - var 와 varp의 차이는? stdev 와 stdevp의 차이는? 오늘 스터디도 책에는 나오지 않는 내용이다. 엑셀(스프레드시트, 구글 시트) 프로그램을 활용하여 간단하게 평균과 분산, 표준편차를 구해보려고 한다. 이미 알고 있는 average, var, stdev 함수에 대한 간략한 소개를 포함하여 기타 몇 가지 함수를 더 자세히 스터디하려 한다. 평균 Average, Averagea, Averageif 엑셀에서 평균을 구하는 함수는 average 함수이다. 사용법도 간단하다. 사용법 : AVERAGE(value1, [value.. 2018. 2. 5.
통계학 & R 프로그램 스터디 6일차 - 순서대로 한줄서기(3) 엑셀, 스프레드시트를 활용하여 복습하기 <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 6일차 - 순서대로 한줄서기(3) 엑셀,스프레드시트를 활용하여 복습하기 오늘 스터디는 약간의 쉬어가기 단계이다. 교과 외(?) 과정으로 지금까지 학습했던 내용들을 구글 시트(스프레드시트, 엑셀)를 활용하여 복습할 예정이다. 엑셀에서 활용할 수 있는 몇 가지 함수들을 개인적으로 찾아서 정리하는 정도로 생각하면 될 듯하다. 통계 스터디에 관련한 내용이므로 구글 시트 Google Sheet 나 엑셀 Microsoft Excel 의 기술적인 사용법을 다루지는 않을 예정이다. 사분위수와 관련된 여러 함수들 사분위수를 다루기 위해서는 최솟값(0%), Q1(25%), 중앙값(50%), Q3(75%), 최댓값(100%), 이렇게 총 5개의 값들을 찾아야 한다. 데이터가 몇 개 되지 않을 .. 2018. 2. 2.
통계학 & R 프로그램 스터디 5일차 - 순서대로 한줄서기(2) 히스토그램 <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 5일차 - 순서대로 한줄서기(2) 히스토그램 4일차 스터디에서는 순서대로 한줄서기를 통해 사분위수 Quartile 와 다섯 숫자 요약 Five number summary, 그리고 상자 그림 Boxplot 에 대해서 공부했다. 많은 데이터들의 패턴을 한눈에 파악하는 방법으로 상자 그림도 유용하다. 하지만 패턴 파악에 아주 좋은 방법을 이미 어릴적에 학교에 다닐 때 배운 적이 있다. 그것은 바로 히스토그램 Histogram!!! 지난 스터디때 사용했던 가상의 연습생 점수표를 다시 가져왔다. 이 데이터를 바탕으로 히스토그램을 그려보자. 히스토그램을 그리기 위해 구간을 나누고 각 구간에 포함되는 관측치의 개수를 세어 도수분포표 Frequency distribution table 를.. 2018. 2. 1.
통계학 & R 프로그램 스터디 4일차 - 순서대로 한줄서기(1) 사분위수, 상자그림 <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 4일차 - 순서대로 한줄서기(1) 사분위수, 상자그림 아이돌 서바이벌 프로그램 이라는 프로그램이 있다. 101명의 연습생이 경쟁하고, 시청자 투표를 통해 선정된 11명이 프로젝트 그룹으로 데뷔하기도 했다. (사실 솔직히 난 한 번도 본적이 없다....경쟁 프로그램 자체를 별로 좋아하지 않는다...) 아마도 101명의 연습생들이 다양한 미션(?)을 수행하고, 점수를 매겨서 점수 순서대로 11명을 뽑았겠지. 결국 줄 세우기.... 정렬과 순서 통계량 여기 10개의 숫자들을 가정해보자. $$4~~~5~~~3~~~8~~~9~~~7~~~0~~~1~~~2~~~6$$ 작은 숫자부터 오름 차순으로 줄을 세워보면 다음과 같다. $$0~~~1~~~2~~~3~~~4~~~5~~~6~~~7~~~8.. 2018. 1. 31.
반응형