초기하분포(Hypergeometric Distribution)
초기하분포, 초기하 확률함수는 이름만 들었을 때 골 때릴 것 같다.
왜 초기하라고 명명하는지에 대해서는
https://hsm-edu.tistory.com/863
[손으로 푸는 확률분포] 초기하분포 (6) 이름에 '초기하'가 붙은 이유
(6) 이름의 유래이름에 '초기하'가 붙은 이유 초기하분포라는 이름이 어떻게 붙여졌는지 알기 위해서는 시간을 거슬러 올라가야합니다. 초기하분포는 초기하함수로부터 이름이 붙여졌고, 초기
hsm-edu.tistory.com
에 자세히 나와있다. 한 줄 설명을 남기자면 '기하급수의 일반화 버전'이기 때문이라고 한다.
초기하 함수를 쉽게 설명하는 방법은
아래와 같은 벤다이어그램으로 설명하는 것이다.
N = 전체 경우의 수, K = 성공하는 경우의 수, X = 시행하는 경우 중 성공하는 경우의 수, n = 시행하는 경우의 수
라고 생각하면 편하다.
예를 들자.
1부터 100의 수가 적혀있는 100개의 공에서 20개를 뽑자. 그 중 홀수를 5개 뽑는 확률을 구할 때 초기하분포를 활용한다.
N = 100, k = 50, n= 20, x = 5이다.
베르누이 분포에서 시행을 n으로 늘린 것을 이항분포라고 한다.
이항분포에서 독립이 아닌 경우를 초기하분포라고 할 수 있다.
추가적으로 독립이 아닌 대표적인 경우는 비복원 추출이다. 공을 뽑고 그것을 넣지 않고 제외한다면 다음 시행에서 확률은 변할 수밖에 없다.
평균과 분산에 대한 증명은 따로 하지 않겠습니다.
정리
베르누이 확률분포: 독립, 변하지 않는 확률, 1번의 시행
이항분포: 독립, 변하지 않는 확률, n번의 시행
초기하분포: 종속, 변하지 않는 확률, n번의 시행