1. 표집분포
1. 표집분포 (Sampling Distribution)
- 모집단에서 표본을 여러 번 추출하여 각 표본에서 계산된 통계량이 분포하는 모습을 나타냄
2. 표준오차 (Standard Error, SE)
- 표본통계량의 표집분포의 표준편차
3. 지수족 (Exponential Family)
- 확률분포의 일반화된 클래스로, 다양한 통계적 분포를 포함하며
모수 추정과 충분통계량 등의 중요한 특성을 가짐
- 포아송분포, 이항분포 등 여러 분포를 포함
4. 큰수의 법칙 (Law of large number, 대수의 법칙)
- 독립적인 확률변수의 평균이 표본의 크기가 커짐에 따라 모집단의 평균에 점점 가까워진다는 원리
즉, 샘플 크기가 커지면 샘플평균이 모집단의 평균에 수렴함
2. 중심극한정리
1. 중심극한정리 (Central limit thorem, CLT)
- 독립적이고 동일한 분포를 따르는 확률변수들의 합이나 평균이
모집단의 분포가 무엇이든 상관없이 충분히 샘플 크기가 크다면 정규분포에 근사함
3. 이항분포의 정규근사
1. 이항분포의 정규근사
- 이항분포는 시행횟수 n과 성공확률 p에 따른 분포로
n이 충분히 크고 p가 0과 1사이에 있을 때 정규분포로 근사할 수 있음
- 정규분포 평균은 np, 분산은 np(1-p)이며,
근사는 np ≥ 5 와 n(1-p) ≥ 5 일 때 적합함
- 연속성 수정(continuity correction)을 적용하면
이산적인 이항분포를 연속적인 정규분포로 더 정확히 근사가능
2. 연속성 수정(Continuity correction)
- 이산형 확률분포를 연속형 확률분포로 근사할 때 발생할 수 있는 오차를 줄이기 위해 사용하는 방법
- 주로 이항분포를 정규분포로 근사할 때 사용
'데이터 사이언스' 카테고리의 다른 글
기초통계학 10 | 정규분포, 확률표본, 통계량 (0) | 2025.01.07 |
---|---|
기초통계학 9 | 포아송분포, 기하분포, 음이항분포, 다항분포 (0) | 2025.01.07 |
기초통계학 8 | 분산, 표준편차, 결합분포와 주변분포, 베르누이 시행과 확률변수 (0) | 2025.01.07 |
기초통계학 7 | 확률변수, 확률질량함수, 확률밀도함수, 기댓값 (0) | 2025.01.06 |
기초통계학 6 | 확률, 조건부확률, 독립사건, 베이즈정리 (0) | 2025.01.05 |