1. 통계적 추론
1. 통계적 추론
- 표본 데이터로 모집단에 대한 결론 도출 과정
- 분포 가정 유무 / 모수 처리 방식 / 추론 목적로 통계적 추론 분류 가능
2. 분포 가정 유무에 따른 통계적 추론 분류
① 모수적 추론 (Parametric Inference)
- 모집단이 특정 확률분포를 따른다고 가정
- 데이터가 적어도 정확한 추론 가능
- 분포 가정이 맞지 않을 경우 신뢰성 저하
- t-검정, ANOVA · · ·
ex) 정규분포 : 2개의 모수
→ 평균 μ, 분산 σ²
② 비모수적 추론 (Non-Parametric Inference)
- 모집단의 분포에 대한 가정 없이 데이터 분석
- 다양한 데이터에 유연하게 대응
- 데이터 양이 많아야 정확도가 높아지고, 계산량이 많아질 수 있음
- 순위(Rank), 커널밀도추정 · · ·
3. 모수 처리 방식에 따른 통계적 추론
① 베이지안 추론 (Bayesian Inference)
- 베이즈 정리(Bayes' Theorem)을 기반으로 데이터로 확률을 갱신하는 통계적 추론 방법
- 기존의 사전지식과 새로운 데이터를 결합하여 사후확률을 계산함
- 고차원 문제에서는 계산량이 많아질 수 있음
② 베이즈 정리 (Bayes' Theorem)
- 사전확률과 새로운 데이터로 사후확률을 계산하는 수학적 정리
- 어떤 사건 A가 주어졌을 때, 다른 사건 B가 발생할 확률
4. 추론 목적에 따른 통계적 추론
① 추정 (Estimation)
- 모집단의 모수를 추정
① - 1) 점추정 (Point Estimation) : 모집단의 모수의 값 추정
① - 2) 구간추정 (Interval Estimation) : 모수를 포함할 것으로 기대되는 구간을 확률적으로 구함
② 가설검정 (Testing Hypotheses)
- 모수에 대한 가설을 설정하고, 데이터를 기반으로 참인지 검증하는 방법
2. 추정법과 점추정량
1. 점추정 (Point Estimation)
- 모집단의 모수를 하나의 값으로 추정
① 적률법 (Method of Moments)
- 표본의 적률(표본의 평균, 분산 등)으로 모수 추정
- 이론적 적률과 표본 적률을 같게 만드는 방식으로 모수 계산
- 계산이 간단하고 직관적이라, 복잡한 분포에서도 비교적 쉽게 적용가능함
② 최대가능도추정법
- 모수에 대해 우도(Likelihood)=가능도 를 최대화하는 값 추정
- 주어진 데이터가 가장 잘 설명되는 모수값을 찾는 방법
③ 최소제곱법
- 관측값과 예측값 간 오차 제곱합을 최소화하는 방식으로 모수 추정
- 주로 회귀분석에서 사용
2. 좋은 점추정량이 가져야 할 성질
① 일치성 (Consistency)
- 표본 크기 n이 커질수록 점추정량이 모수에 수렴하는 성질
(= 표본이 커지면 추정량이 정확하게 모수 값을 추정함)
② 비편향성 (Unbiasedness)
- 추정량의 기댓값이 모수와 일치하는 성질
- 추정량이 편향되지 않고, 평균값이 진짜 모수를 정확하게 반영함
③ 효율성 (Efficiency)
- 효율성은 같은 모수를 추정하는 여러 추정량 중에서
분산이 가장 작은 추정량
- 효율적인 추정량은 동일한 표본 크기에서 최소 오차를 가짐
3. 구간추정과 신뢰추정
1. 구간추정 (Interval Estimation)
- 특정 값 하나를 추정하는 점추정과 달리 모수의 범위를 제시함
- 신뢰구간 (Confidence Interval, CI)를 사용함
2. 신뢰구간 (Confidence Interval, CI)
- 주어진 신뢰수준에 대해 모수가 포함될 확률이 얼마나 되는지 나타내는 구간
- 95% 신뢰구간 : 해당 구간에 모수가 포함될 확률이 95%라는 의미
3. 신뢰수준 (Confidence Level)
- 주어진 구간 내에 모수가 포함될 확률
- 추정이 얼마나 신뢰할 수 있는지를 나타내는 지표
4. 중심축량 (Pivotal Quantity, 주축량)
- 모수 추정을 위한 중요한 수학적 도구
- 주어진 확률분포에서 모수의 추정량이 중심이 되는 통계량
- 실제 모평균이 포함될 범위 계산
5. 단측신뢰구간 (One-Sided Confidence Interval)
- 모수에 대한 추정값이 한 방향으로만 제한되는 구간
6. 빈도론자(Frequentist) 관점
- 통계적 추론을 할 때, 확률을 상대빈도(반복되는 실험에서의 발생 빈도)로 정의하는 접근법
- 확률을 장기적으로 반복되는 실험에서 특정 사건이 발생할 비율로 봄
'Data Science > statistics' 카테고리의 다른 글
기초통계학 14 | 모평균 · 모분산 · 모비율 (0) | 2025.01.11 |
---|---|
기초통계학 13 | 가설검정 · 검정통계량 · 유의수준 · 검정력 · 유의확률 (0) | 2025.01.11 |
기초통계학 11 | 표집분포 · 중심극한정리 · 이항분포의 정규근사 (0) | 2025.01.07 |
기초통계학 10 | 정규분포 · 확률표본 · 통계량 (0) | 2025.01.07 |
기초통계학 9 | 포아송분포 · 기하분포 · 음이항분포 · 다항분포 (0) | 2025.01.07 |