본문 바로가기
개인 공부/통계 & R

통계학 & R 프로그램 스터디 15일차 ::0.000012%의 꿈, 로또(2) :: 확률을 활용한 로또 당첨 번호 예측이 가능할까? <이토록 쉬운 통계 & R>

by 새봄아빠 2018. 2. 14.

통계학 & R 프로그램 스터디 15일차 

- 0.000012%의 꿈, 로또, <이토록 쉬운 통계 & R>

- 확률을 활용하여 로또 복권 당첨 번호를 예측할 수 있을까?


 


확률

모르거나 아직 일어나지 않은 어떤 불확실한 것, 통계에서는 이것을 사건 Event 이라고 부른다.

어떤 불확실한 정도를 0부터 1 사이의 숫자로 표현한 것을 확률 Probability 이라고 한다.

우리는 이 소수에 100을 곱한 백분율(%)이 더 친근한데 확률 0%는 불가능, 100%는 필연을 의미한다.




고등학교 수학 교과서에서의 표현은?

우리나라 고등학교 수학 교과서에서는 이 용어들을 이렇게 표현하기도 한다.


주사위나 동전을 던지는 것과 같이 같은 조건에서 여러 번 반복할 수 있고, 그 결과가 우연에 의하여 좌우되는 실험이나 관찰을 시행이라고 한다. 그리고 어떤 시행에서 일어날 수 있는 모든 경우의 집합을 표본공간이라 하고, 그 부분집합을 사건이라고 한다.


예를 들어 한 개의 주사위를 던지는 행위는 시행이고, 이 시행에서 일어날 수 있는 눈의 수의 모든 경우는 1, 2, 3, 4, 5, 6이므로 표본공간을 $S$라고 하면


$$S = \{1, 2, 3, 4, 5, 6\}$$


이다. 이때 홀수의 눈이 나오는 경우를 집합 $A$라고 하면


$$A = \{1, 3, 5\}$$


와 같이 나타낼 수 있고, $A \subset S$이다.


따라서 위 시행에서 홀수의 눈이 나오는 경우인 집합 $A$는 하나의 사건이 된다. 또한, 사건 $A$가 일어난다는 것은 이 시행에서 1, 3, 5의 눈 중에서 하나가 나오는 것을 말한다.


어떤 시행에서 사건 $A$가 일어날 가능성을 수로 나타낸 것이 사건 $A$가 일어날 확률이고, 이것을 기호로


$${\rm P}(A)$$


와 같이 나타낸다.


한 개의 주사위를 던지면 1, 2, 3, 4, 5, 6의 눈 중에서 하나가 나오고, 이 6개의 눈 중에서 어떤 눈이 나올 것인가는 우연에 의하여 정해진다. 정육면체 모양의 주사위에서는 각각의 눈이 나올 가능성이 같다고 기대할 수 있으므로, 각 눈이 나올 확률은 $1/6$이라고 할 수 있다.


일반적으로 어떤 시행에서 일어날 수 있는 모든 경우의 수가 $n$이고, 각 경우는 일 어날 가능성이 모두 같은 정도로 기대된다고 할 때, 사건 $A$가 일어나는 경우의 수가 $r$이면 사건 $A$가 일어날 확률 ${\rm P}(A)$는


$${\rm P}(A)= \frac{r}{n}$$


이다. 이와 같이 정의된 확률을 수학적 확률이라고 한다.



이론적 확률과 경험적 확률

논리적으로 혹은 수리적으로 계산한 확률을 이론적 확률 Theoretical Probability 이라고 한다. 이론적 확률은 누가 계산하든 동일한 값이 나온다.

사건을 직접 관찰하거나 모의 실험 Simulation을 통해서 계산된 확률을 경험적 확률 Expirical Probability이라고 한다. 동전을 던지거나 가위바위보를 하는 경우처럼 계산할 때마다 다른 값이 나올 수도 있다.



 



확률을 활용한 로또 당첨 번호 예측

선택한 숫자 중에 하나만 이번 주 당첨 번호에 포함될 확률을 생각해보자. 전체 45개 숫자 중에서 당첨 번호는 6개이므로 각각의 번호가 추첨 번호에 있을 확률은 $6/45$, 약 13.3%이다. 실제로는 어떨까?


아래 그림은 2016년에 있었던 총 53번의 로또 추첨에서 각 번호가 몇 번이나 나왔는지 정리한 것이다. (저자가 고생하셨네....)


<출처 : 이토록 쉬운 통계 & R, 루비페이퍼, 67쪽>



33번 공은 무려 15번이나 나왔다. 경험적 확률로 계산해보면 $15/53$, 약 28.3%로 이론적 확률은 13.3%의 2배가 넘는다. 반면 9번 공은 고작 1번 나왔다. 확률은 $1/53$ 밖에 안된다.


이를 한 눈에 보기 위해 각 번호가 추첨된 횟수를 막대그래프로 그려보면 아래 그림과 같다.


<출처 : 이토록 쉬운 통계 & R, 루비페이퍼, 68쪽>



각 번호의 입장에서 매번 13.3%의 확률로 53번의 기회가 있었다. 그렇다면 확률 0.133과 기회 53번을 곱하면 약 7.07이므로, 각 번호가 1년 동안 7번 정도는 나올 것으로 기대할 수 있다. 이렇게 확률을 고려했을 때 평균적으로 나올 것 같은 값을 기대값 Expectation이라고 한다.


그래서인지 막대 그래프를 그려보면 기대값만큼 7번 추첨된 숫자들이 12개나 되는 것을 확인할 수 있다. 물론 그보다 더 많은 혹은 더 적은 빈도로 나온 숫자들도 있다. 9번이나 13번 공처럼 특이하게 나오는 경우도 물론 있다.


이런 정보들을 바탕으로 앞으로 로또를 구입할 때엔 어떤 방법으로 번호를 선택하는 것이 좋을까?


  1. 33번이 잘 나오니까, 이번에도 나올 거야! 33번을 선택하자.
  2. 9번이 너무 안 나왔으니까 이젠 나올 때가 됐지! 9번!
  3. 9번이든 33번이든 상관없으니 당첨만 됐으면 좋겠다. 찍자!


책에는 나름의 합리적 결정에 대해 나왔지만 여기서는 언급하지 않겠다. 알아서 판단하시길...ㅋ




로또 번호는 예측 가능하다?

2012년에 한 방송 프로그램에서 소위 말하는 로또 전문가(?)를 데려다가 이들의 적중률을 실험해보았다. 실험의 방식은 이러했다.


  • 다섯명의 전문가가 각자 100장씩 구입한다. (총 500장)
  • 전문가들끼리 합의를 해서 100장을 구입한다. (총 100장)
  • 자동 추첨으로 100장을 구입한다. (총 100장)

이런 방식으로 2주간 실험을 진행하여 총 1400장의 로또를 구입했다. 결과는 어떠했을까?


이 중에서 4등이 1개, 5등은 20개 당첨되었다. 4등 당첨 비율은 0.07%, 5등 당첨 비율은 1.4%이다. 이론적인 당첨 확률은 4등이 0.1%, 5등은 2%이다. 로또 전문가라는 말이 무색하게 참으로 실망스러운 결과인 것은 확실하다.



어떤 근거로 로또 1등 예측이 가능하다고 주장하는지 모르겠다. 제외수, 필터링, 궁합수, 당첨번호 랜덤워크 시스템 등의 정체불명의 용어를 사용하지만 이론적 확률로써는 근거없는 말이다. 경험적 확률로써는.... 잘 모르겠다...ㅋ




사이트 도구로 만들어본 IT4EDU 사이트

블로그 소식을 한 눈에!


http://sites.google.com/view/it4edu



 

 



댓글0