확률과 통계

초기하분포(Hypergeometric Distribution)

SunB3an 2024. 10. 6. 20:34

초기하분포, 초기하 확률함수는 이름만 들었을 때 골 때릴 것 같다.

왜 초기하라고 명명하는지에 대해서는

https://hsm-edu.tistory.com/863

 

[손으로 푸는 확률분포] 초기하분포 (6) 이름에 '초기하'가 붙은 이유

(6) 이름의 유래이름에 '초기하'가 붙은 이유 초기하분포라는 이름이 어떻게 붙여졌는지 알기 위해서는 시간을 거슬러 올라가야합니다. 초기하분포는 초기하함수로부터 이름이 붙여졌고, 초기

hsm-edu.tistory.com

에 자세히 나와있다. 한 줄 설명을 남기자면 '기하급수의 일반화 버전'이기 때문이라고 한다.


초기하 함수를 쉽게 설명하는 방법은 

아래와 같은 벤다이어그램으로 설명하는 것이다.

N = 전체 경우의 수, K = 성공하는 경우의 수, X = 시행하는 경우 중 성공하는 경우의 수, n = 시행하는 경우의 수

라고 생각하면 편하다. 

 

예를 들자.

1부터 100의 수가 적혀있는 100개의 공에서 20개를 뽑자. 그 중 홀수를 5개 뽑는 확률을 구할 때 초기하분포를 활용한다.

N = 100, k =  50, n= 20, x = 5이다.

베르누이 분포에서 시행을 n으로 늘린 것을 이항분포라고 한다. 

이항분포에서 독립이 아닌 경우를 초기하분포라고 할 수 있다.

추가적으로 독립이 아닌 대표적인 경우는 비복원 추출이다. 공을 뽑고 그것을 넣지 않고 제외한다면 다음 시행에서 확률은 변할 수밖에 없다. 

 

평균과 분산에 대한 증명은 따로 하지 않겠습니다. 

 

정리

베르누이 확률분포: 독립, 변하지 않는 확률, 1번의 시행

이항분포: 독립, 변하지 않는 확률, n번의 시행

초기하분포: 종속, 변하지 않는 확률, n번의 시행