본문 바로가기
Data Science/statistics

기초통계학 12 | 통계적 추론 · 추정법 · 점추정량 · 구간추정 · 신뢰구간

by 잡레시피 2025. 1. 10.

 

 

 

 

 

1. 통계적 추론

 

 

1. 통계적 추론

- 표본 데이터로 모집단에 대한 결론 도출 과정

- 분포 가정 유무 / 모수 처리 방식 / 추론 목적로 통계적 추론 분류 가능

 

 

 

2. 분포 가정 유무에 따른 통계적 추론 분류

 

 

① 모수적 추론 (Parametric Inference)

- 모집단이 특정 확률분포를 따른다고 가정

- 데이터가 적어도 정확한 추론 가능

- 분포 가정이 맞지 않을 경우 신뢰성 저하

- t-검정, ANOVA · · ·

 

ex) 정규분포 : 2개의 모수

→ 평균 μ, 분산 σ²

 

 

② 비모수적 추론 (Non-Parametric Inference)

- 모집단의 분포에 대한 가정 없이 데이터 분석

- 다양한 데이터에 유연하게 대응

- 데이터 양이 많아야 정확도가 높아지고, 계산량이 많아질 수 있음

- 순위(Rank), 커널밀도추정 · · ·

 

 

 

3. 모수 처리 방식에 따른 통계적 추론

 

 

① 베이지안 추론 (Bayesian Inference)

- 베이즈 정리(Bayes' Theorem)을 기반으로 데이터로 확률을 갱신하는 통계적 추론 방법

- 기존의 사전지식과 새로운 데이터를 결합하여 사후확률을 계산함

- 고차원 문제에서는 계산량이 많아질 수 있음

 

 

② 베이즈 정리 (Bayes' Theorem)

- 사전확률과 새로운 데이터로 사후확률을 계산하는 수학적 정리

- 어떤 사건 A가 주어졌을 때, 다른 사건 B가 발생할 확률

 

 

 

4. 추론 목적에 따른 통계적 추론

 

 

① 추정 (Estimation)

- 모집단의 모수를 추정

 

① - 1) 점추정 (Point Estimation) : 모집단의 모수의 값 추정

① - 2) 구간추정 (Interval Estimation) : 모수를 포함할 것으로 기대되는 구간을 확률적으로 구함

 

 

② 가설검정 (Testing Hypotheses)

- 모수에 대한 가설을 설정하고, 데이터를 기반으로 참인지 검증하는 방법

 

 

 

 


 

 

 

2. 추정법과 점추정량

 

 

 

1. 점추정 (Point Estimation)

- 모집단의 모수를 하나의 값으로 추정

 

 

① 적률법 (Method of Moments)

- 표본의 적률(표본의 평균, 분산 등)으로 모수 추정

- 이론적 적률과 표본 적률을 같게 만드는 방식으로 모수 계산

- 계산이 간단하고 직관적이라, 복잡한 분포에서도 비교적 쉽게 적용가능함

 

 

② 최대가능도추정법

- 모수에 대해 우도(Likelihood)=가능도 를 최대화하는 값 추정

- 주어진 데이터가 가장 잘 설명되는 모수값을 찾는 방법

 

 

③ 최소제곱법

- 관측값과 예측값 간 오차 제곱합을 최소화하는 방식으로 모수 추정

- 주로 회귀분석에서 사용

 

 

 

2. 좋은 점추정량이 가져야 할 성질

 

 

① 일치성 (Consistency)

- 표본 크기 n이 커질수록 점추정량이 모수에 수렴하는 성질

(= 표본이 커지면 추정량이 정확하게 모수 값을 추정함)

 

 

② 비편향성 (Unbiasedness)

- 추정량의 기댓값이 모수와 일치하는 성질

- 추정량이 편향되지 않고, 평균값이 진짜 모수를 정확하게 반영함

 

 

③ 효율성 (Efficiency)

- 효율성은 같은 모수를 추정하는 여러 추정량 중에서

  분산이 가장 작은 추정량

- 효율적인 추정량은 동일한 표본 크기에서 최소 오차를 가짐

 

 

 

 

 


 

 

 

 

3. 구간추정과 신뢰추정

 

 

1. 구간추정 (Interval Estimation)

- 특정 값 하나를 추정하는 점추정과 달리 모수의 범위를 제시함

- 신뢰구간 (Confidence Interval, CI)를 사용함

 

 

 

2. 신뢰구간 (Confidence Interval, CI)

- 주어진 신뢰수준에 대해 모수가 포함될 확률이 얼마나 되는지 나타내는 구간

- 95% 신뢰구간 : 해당 구간에 모수가 포함될 확률이 95%라는 의미

 

 

 

3. 신뢰수준 (Confidence Level)

- 주어진 구간 내에 모수가 포함될 확률

- 추정이 얼마나 신뢰할 수 있는지를 나타내는 지표

 

 

 

4. 중심축량 (Pivotal Quantity, 주축량)

- 모수 추정을 위한 중요한 수학적 도구

- 주어진 확률분포에서 모수의 추정량이 중심이 되는 통계량

- 실제 모평균이 포함될 범위 계산

 

 

 

5. 단측신뢰구간 (One-Sided Confidence Interval)

- 모수에 대한 추정값이 한 방향으로만 제한되는 구간 

 

 

 

6. 빈도론자(Frequentist) 관점

- 통계적 추론을 할 때, 확률을 상대빈도(반복되는 실험에서의 발생 빈도)로 정의하는 접근법

- 확률을 장기적으로 반복되는 실험에서 특정 사건이 발생할 비율로 봄

 

 

 

 

반응형