1. 회귀모형의 형태
- 회귀모형
- 독립변수와 종속변수 간 관계를 수식으로 나타낸 통계적 모델
- 데이터를 분석하고 미래를 예측하거나 추정함 - 회귀모형의 주요형태
1) 선형회귀모형 (Linear Regression Model)
- 독립변수가 1개이고, 종속변수와 독립변수 간 관계가 직선으로 표현됨
2) 다중 회귀모형 (Multiple Linear Regression)
- 여러 독립변수로 종속변수 설명 - 적합회귀직선 (Fitted Regression Line)
- 관찰된 데이터를 기반으로 회귀계수를 추정해 도출한 직선
- 모집단의 실제 회귀직선을 근사하는 역할
- 회귀계수 : 독립변수가 종속변수에 미치는 영향을 나타내는 값
- 최소제곱법 : 관찰된 데이터와 적합회귀직선 간 오차를 최소화하는 방법
- 잔차 : 관측값에서 예측값을 뺀 값 - 절편
- 독립변수(X)가 모두 0일 때 종속변수(Y)의 예상값 - 예측값의 평균
- 여러 예측값들의 평균으로, 주어진 데이터에 대한 평균적인 예측
- 주어진 독립변수 값들이 종속변수에 미치는 평균적인 영향
4. 새로운 예측값에 대한 추론
- 새로운 독립변수 값에 대해 예측값을 추정할 수 있음
- 예측값의 신뢰구간
- 특정 신뢰수준에서 예측값이 포함될 범위를 계산함 - 예측값의 예측구간
- 예측값이 아닌 새로운 관측값에 대해 예측하는구간
- 예측구간은 예측값보다 넓음 = 새로운 관측값이 예측값과 다를 수 있음
5. 잔차검진 (Residual Diagnostics)
- 모델에서 예측한 값과 실제 관측값의 차이
- 잔차를 분석하여 모델의 적합도를 평가하고 모델의 가정이 잘 만족되는지 확인 가능
- 정규성
- 등분산성
- 독립성
반응형
'Data Science > statistics' 카테고리의 다른 글
기초통계학 19 | 다중공선성 · 상대적 영향력 · 변수선택 (0) | 2025.01.19 |
---|---|
기초통계학 17 | 분산분석표 · 분산분석 검진 · 다중비교 · 선형대비 (0) | 2025.01.19 |
기초통계학 16 | 분산분석 용어와 개념 · 고정효과모형 · 변량효과모형 (0) | 2025.01.19 |
기초통계학 15 | 독립표본 · 대응표본 (0) | 2025.01.19 |
기초통계학 14 | 모평균 · 모분산 · 모비율 (0) | 2025.01.11 |