본문 바로가기
데이터 사이언스

기초통계학 11 | 표집분포, 중심극한정리, 이항분포의 정규근사

by 잡레시피 2025. 1. 7.

 

 

 

 

 

1. 표집분포

 

 

1. 표집분포 (Sampling Distribution)

- 모집단에서 표본을 여러 번 추출하여 각 표본에서 계산된 통계량이 분포하는 모습을 나타냄

 

 

 

2. 표준오차 (Standard Error, SE)

- 표본통계량의 표집분포의 표준편차

 

 

 

3. 지수족 (Exponential Family)

- 확률분포의 일반화된 클래스로, 다양한 통계적 분포를 포함하며

  모수 추정과 충분통계량 등의 중요한 특성을 가짐

- 포아송분포, 이항분포 등 여러 분포를 포함

 

 

 

4. 큰수의 법칙 (Law of large number, 대수의 법칙)

- 독립적인 확률변수의 평균이 표본의 크기가 커짐에 따라 모집단의 평균에 점점 가까워진다는 원리

  즉, 샘플 크기가 커지면 샘플평균이 모집단의 평균에 수렴함

 

 

 

 


 

 

2. 중심극한정리

 

 

1. 중심극한정리 (Central limit thorem, CLT)

- 독립적이고 동일한 분포를 따르는 확률변수들의 합이나 평균이

  모집단의 분포가 무엇이든 상관없이 충분히 샘플 크기가 크다면 정규분포에 근사함

 

 

 


 

 

3. 이항분포의 정규근사

 

 

1. 이항분포의 정규근

- 이항분포는 시행횟수 n과 성공확률 p에 따른 분포로

  n이 충분히 크고 p가 0과 1사이에 있을 때 정규분포로 근사할 수 있음

- 정규분포 평균은 np, 분산은 np(1-p)이며,

  근사는 np ≥ 5 와 n(1-p) ≥ 5 일 때 적합함

- 연속성 수정(continuity correction)을 적용하면

  이산적인 이항분포를 연속적인 정규분포로 더 정확히 근사가능

 

 

 

2. 연속성 수정(Continuity correction)

- 이산형 확률분포를 연속형 확률분포로 근사할 때 발생할 수 있는 오차를 줄이기 위해 사용하는 방법

- 주로 이항분포를 정규분포로 근사할 때 사용

 

 

 

반응형