본문 바로가기
개인 공부/통계 & R

통계학 & R 프로그램 스터디 12일차 :: 물수능과 불수능 :: 표준화(3) - 표준화 예제, 수능 표준점수, IQ 지능지수 <이토록 쉬운 통계 & R>

by 새봄아빠 2018. 2. 9.

통계학 & R 프로그램 스터디 12일차 

- 물수능과 불수능 :: 표준화(3) - 표준화 예제 <이토록 쉬운 통계 & R>

- 수능 표준점수, IQ 지능지수




지난 번 두 번에 스터디에 걸쳐서 데이터의 표준화에 대해서 공부했다. 

오늘은 표준화를 조금 더 구체적인 예를 통해 확실히 이해해보도록 하자!


 


표준화 예제

2011년 불수능에서 수학의 평균은 47.8, 표준편차는 19.7이다. 2015년 물수능에서는 평균이 55.4, 표준편차는 28.5이다. (책에는 이렇게 소개되었는데 확인은 못해봤다..ㅋ) 이를 바탕으로 수능을 치른 학생 1,000명의 가상 성적을 히스토그램으로 다음과 같이 표시해보았다. (물론 내가 아니라 책이....ㅋ)


<출처 : 이토록 쉬운 통계 & R, 루비페이퍼, 55쪽>


히스토그램을 살펴보면 2015년은 수능의 난이도가 낮아서 고득점 학생 분포가 많은 편이고, 2011년에는 2015년보다 평균도 낮고 평균쪽에 많이 몰려 있으며 고득점자가 적게 분포되어 있다.


여기서 예를 들어 2011년(불수능)에 80점을 받은 학생과 2015년(물수능)에 100점을 받은 학생 중에서 어느 쪽이 상대적으로 잘한 것일까?


앞에서 스터디한 표준화로 계산을 해보자.


$$Z = \frac{X - m}{\sigma}$$


2011년

$$ \frac{80점 - 47.8점}{19.7점} = 1.63$$


2015년

$$ \frac{100점 - 55.4점}{28.5점} = 1.56$$


여기에서 1.63과 1.56은 평균을 0, 표준편차를 1로 했을 때의 값으로 이해할 수 있다. 1.63이 1.56에 비해 평균으로 부터 조금 더 먼 쪽이라고 이해할 수 있다. 다시 말해 0을 기준으로 조금 더 오른 쪽에 있으니 상대적으로 더 높은 점수를 받은 것으로 이해할 수 있다.



아래 그림은 1,000명의 점수에 표준화를 하고 두 해를 나란히 히스토그램으로 그린 것이다.



<출처 : 이토록 쉬운 통계 & R, 루비페이퍼, 56쪽>


어떤가? 이전 그림에 비해 두 해의 결과를 비교하기에 더 수월해 보인다. 게다가 표준화 이후 두 해의 그림이 비슷한 형태로 바뀌었다.


그리고 하나 더!


2011년 시험에서 100점에 가까운 점수를 받은 학생들은 2.5라는 높은 값을 갖게 되는데, 난이도가 높은 시험에서 고득점을 받았을 경우에 표준점수가 높아지는 것이 이 이유 때문이다.


 


표준화의 사용 

수능 점수

실제 수능에서는 표준화를 통해 표준 점수를 계산한다. 100점 만점으로 시험을 치르는 국어, 영어, 수학의 경우에는 이렇게 계산된 값에 20을 곱하고 100을 더해서 표준점수를 만든다.


$$표준점수=20(또는10)\times(\frac{수험생의 원점수 − 수험생이 속한 집단의 원점수 평균}{수험생이 속한 집단의 원점수 표준편차})+100(또는50)$$


참고 : 수능 표준점수 계산법, 표준점수의 의미는?


이 계산을 통하면 평균은 0에서 100점으로 바뀌고, 표준점수는 1에서 20배 늘어난 20이 된다. 따라서 표준점수가 100점 근처이면 원점수가 평균점수 근처라고 해석할 수 있고(상위 50% 정도) 원점수를 거의 100점 가까이 맞으면 표준점수는 보통 140점 전후로 나온다. 표준점수가 140점 정도라는 것은 표준화한 값이 2정도가 나온다는 의미이고 이것은 $2\sigma$를 의미하여 거의 상위 97~98%를 의미한다. (표준정규분포표를 읽을 줄 안다면.....) 그리고 시험의 난이도나 점수분포에 따라 똑같이 원점수 100점을 맞아도 표준점수는 달라진다.


만점이 50점인 탐구, 한국사의 경우에는 표준화된 점수에 10을 곱하고 50을 더해서 평균을 50으로, 표준편차를 10으로 만든다. 그래야 100점 만점인 시험과 최대한 동등한 조건으로 비교할 수 있겠다.



지능지수 IQ

그리고 책에서는 표준화의 개념을 IQ 점수나 옷 사이즈의 신체 치수를 정하는데도 쓰인다고 소개하고 있다. 그냥 그렇구나 라고 생각하지 말고 조금 더 스터디해보자.


<인터넷 어딘가에서 다운 받음. 내 아이큐가 138이 아님...>


아이큐 100이라는 것은 아이큐를 검사한 사람들의 평균 정도의 지능지수를 가지고 있다고 이해하면 된다. 아이큐가 두자리라고 해서 문제가 있는게 아니다. 평균보다 조금 못 미칠 뿐..... 그게 뭐 어쩌라고!! 그래프를 봐도 알겠지만 80에서 120 정도에 대부분의 사람들이 분포되어 있다. (혈압인가?)


예전에 모 대선후보가 자신을 소개할 때 IQ 430의 천재 정치인이라고 하던데, 이런 계산 결과가 나오는게 가능은 한 걸까? IQ 테스트의 모든 항목을 다 맞아도 저 점수가 나올 수 있을지 의문이다. (검사지 계산 방식을 모르니 불가능한거라고 확정할 수도 없고!!!) 


"표준편차(Standard Deviation, SD) 15는 웩슬러(WAIS) 검사, 16은 스탠포드-비네 검사, 24는 레이븐스 검사에서 사용된다. 편차지능에서 표준편차에 특별한 언급이 없으면 표준편차 16을 따르는 것이 일반적이다. 이에 대한 이유는 불분명하지만, 최초로 편차지능의 개념을 도입한 지능검사가 스탠포드-비네 검사이기 때문일 것이다." <위키피디아>


라고 하니 430이 나오려면 표준편차 16으로 가정하고 간단한 역연산을 통해 


$$100 + 16 \times x = 430$$


$x$ 값(표준화값)이 20정도 나오는데.... 4가 거의 최대라고 생각한다면.....


"이론상으로, 편차지능에서 가능한 가장 높은 지수는 IQ 207이다. 이는 6.66시그마이고, 확률은 1,000억 분의 1이다. 참고로 1,000억 명은 5만 년 전부터 태어난 현생 인류(호모 사피엔스 사피엔스)를 시작으로, 현재까지 태어난 모든 인류의 수를 합한 것이다. 그러므로 1,000억 분의 1이라는 의미는 지금껏 지구에 존재했던 전 인류 중에서 최고인 사람을 의미한다. 하지만 현재 세계 어디에서도 이러한 지능을 측정하는 방법은 없다." <위키피디아>



그리고 지능지수 상위 2% 자격이 되어야 가입이 가능하다는 멘사. "상위 2.3%는 2시그마의 수치인데, IQ로 표시할 때 이 수치는 100+2시그마로 나타난다. 즉 이 경우 시그마의 기준 단위가 15일 경우는 100+(15×2)=130이고, 24일 경우는 100+(24×2)=148이다."


어쨌든 나(우리)와는 상관없는 이야기다. 다들 힘냅시다!!



사이트 도구로 만들어본 IT4EDU 사이트

블로그 소식을 한 눈에!


http://sites.google.com/view/it4edu



 

 



댓글0