본문 바로가기
반응형

분산5

통계학 & R 프로그램 스터디 18일차 ::부전자전, 유전 연결고리 :: 상관관계, 공분산이란 무엇인가? <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 18일차 - 부전자전, 유전 연결고리 - 상관관계, 공분산이란 무엇인가? 이전 스터디에서 아빠와 아들 키의 유전과 연결하여 산점도에 대해 간략히 살펴보았다. 통계학 & R 프로그램 스터디 17일차 ::부전자전, 유전 연결고리 :: 산점도란 무엇인가? 이 때, 관측치가 중심에서 멀리 떨어져 있을 수록 얼마나 큰 영향력을 갖게 되는지 한눈에 확인할 새로운 방법이 필요하다고 했는데, 오늘은 그 내용을 살펴본다. 상관관계 관측치가 중심에서 멀리 떨어져 있다는 것은 평균에서 멀리 떨어져 있다는 것을 의미한다. 따라서 평균에서 멀리 떨어져 있는 관측치가 더 큰 영향력을 갖도록 해야 한다. 어떤 방법으로? 아빠 키의 평균으로부터의 거리와 아들 키의 평균으로부터의 거리를 계산해서 두 값을.. 2018. 4. 2.
통계학 & R 프로그램 스터디 11일차 :: 물수능과 불수능 :: 표준화(2) - 척도화 <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 11일차 - 물수능과 불수능 :: 표준화(2) - 척도화 지난번에는 데이터의 표준화의 첫단계인 중심화 Centering에 대해서 스터디를 했다. (통계학 & R 프로그램 스터디 10일차 :: 물수능과 불수능 :: 표준화(1) - 중심화 ) 오늘은 그에 이어서 척도화 Scaling에 대해 스터디를 진행할 예정이다. 오늘은 지난 번과 조금 다른 예를 가지고 왔다. 원래 점수 $$6, 10, 15, 18, 19, 22$$ 에 2배를 해서 새로운 변수 $y$를 만들었다. $$12, 20, 30, 36, 38, 44$$ 이전 과정을 복습할 겸 중심화를 해보자. 먼저 평균을 구해보면 $$m = \frac{12 + 20 + 30 + 36 + 38 + 44}{6} = 30$$ 30인 것을.. 2018. 2. 8.
통계학 & R 프로그램 스터디 9일차 - 분산 n으로 나눌까? n-1로 나눌까? <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 9일차 - 더치페이와 N빵(3) :: 분산!! n으로 나눌까? n-1로 나눌까? 통계 관련된 책들을 보면 어떤 책은 분산을 $n$으로 나눠서 계산을 하고 어떤 책은 $n-1$로 나눠서 계산한다. 도대체 뭐가 맞는 걸까? 이것은 무엇이 맞고 틀리냐의 문제가 아니다. 분산을 계산하는 샘플을 무엇으로 선택하느냐에 따라 차이가 생긴다. 모집단 전체로 분산을 구하느냐? 임의로 추출한 표본집단으로 분산을 구하느냐?에 따라 계산 방법이 달라진다. 그렇다면 왜 두 경우에 계산 방법이 달라질까? * 수식 압박에 주의하세요..ㅎㅎ TeX이 변환되는 데 시간이 조금 걸릴 수 있습니다. 조금만 기다려주세요~~ 모집단에서 크기가 $n$인 표본 $X_1$, $X_2$, $\cdots$, $X_n$을.. 2018. 2. 6.
통계학 & R 프로그램 스터디 8일차 :: 엑셀 평균, 분산, 표준편차 함수 (var vs varp, stdev vs stdevp) <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 8일차 - 더치페이와 N빵(2) :: 엑셀, 평균, 분산, 표준편차 - 엑셀, 스프레드시트, 구글 시트 활용법, 평균, 분산, 표준편차 함수 - var 와 varp의 차이는? stdev 와 stdevp의 차이는? 오늘 스터디도 책에는 나오지 않는 내용이다. 엑셀(스프레드시트, 구글 시트) 프로그램을 활용하여 간단하게 평균과 분산, 표준편차를 구해보려고 한다. 이미 알고 있는 average, var, stdev 함수에 대한 간략한 소개를 포함하여 기타 몇 가지 함수를 더 자세히 스터디하려 한다. 평균 Average, Averagea, Averageif 엑셀에서 평균을 구하는 함수는 average 함수이다. 사용법도 간단하다. 사용법 : AVERAGE(value1, [value.. 2018. 2. 5.
통계학 & R 프로그램 스터디 7일차 - 더치페이와 N빵(1) :: 평균, 분산, 표준편차 <이토록 쉬운 통계 & R> 통계학 & R 프로그램 스터디 7일차 - 더치페이와 N빵(1) :: 평균, 분산, 표준편차 드디어! 통계의 기본 중에 기본인 평균, 분산, 표준편차에 대한 이야기가 시작된다. 평균, 분산, 표준편차에 대한 기본 개념과 정의에 대해서 간략하게 정리해보자. 평균 어떤 변수의 합계가 고정되어 있을 때, 모든 관측치가 똑같이 나눠 가질 수 있는 값을 평균 Mean 이라고 한다. 변수 $x$의 평균은 모든 관측치의 값을 다 더한 다음 관측치의 개수 $n$으로 나눠 계산한다. $$\overline{x} = \frac{\sum_{i = 1}^{n}x_i}{n} = \frac{1}{n}\sum_{i=1}^{n}x_i$$ 분산 분산 Variance은 평균에서 떨어져 있는 거리를 숫자로 계산하기 위한 여러 가지 시도들 중.. 2018. 2. 3.
반응형