1. 확률변수 (Random Variable)
1. 확률변수 (Random Variable)
- 표본공간에서 정의된 실함수 (Real-valued Function)
(확률실험 결과를 숫자로 표현)
2. 확률실험
- 정의역이 표본공간 Ω 이고, 공역이 실수인 함수
- 불확실성을 가지는 사회적·자연적 현상을 일종의 확률실험으로 이해
3. 이산확률변수 (Discrete random variable)
- 셀 수 있을 정도로 한정된 개수의 값만 나오는 확률변수
즉, 몇 가지 특정 값만 가능한 변수
ex) 동전 던지기의 표본공간 (Ω) : {앞면,뒷면}
4. 연속확률변수 (Continuous random variable)
- 값이 연속적으로 나올 수 있는 확률변수
- 셀 수 없이 많은 값을 가짐
ex) 시간, 키
2. 확률질량함수, 확률밀도함수
1. 확률분포 (Probability Distribution)
- 확률변수가 가질 수 있는 값과 그 값이 나올 확률을 나타내는 함수나 규칙
- 확률분포는 모집단을 숫자로 표시했을 때의 형태임 → 모집단의 확률 구조
2. 확률분포표 (Probability distribution table)
- 확률변수와 확률을 표로 정리한 것
ex) 동전 세 번 던지기 : 앞면의 수
X | 0 | 1 | 2 | 3 |
P(X=x) | 1/8 | 3/8 | 3/8 | 1/8 |
3. 모집단의 확률구조를 표시하는 방법
- 이산확률변수 : 확률질량함수, 누적분포함수, · · ·
- 연속확률변수 : 확률밀도함수, 누적분포함수, · · ·
4. 확률질량함수 (Probability mass function)
- 이산확률변수가 특정 값을 가질 확률을 나타내는 함수
f(x) = P ( X = x )
5. 기하분포 (Geometric distribution)
- 처음으로 성공이 나올 때까지 시행 횟수를 확률적으로 나타내는 이산확률분포
6. 누적분포함수 (Cumulative distribution function)
- 확률변수 X가 특정 값 x 이하일 확률을 나타내는 함수
- 즉, 어떤 값까지의 누적 확률을 계산
7.확률밀도함수 (Probability density function)
- 연속확률변수에 대한 확률을 나타내는 함수
8. 확률변수의 변환 (Transformation)
- 확률변수 X에 특정함수를 적용해 새로운 확률변수 Y를 만드는 과정
- 기존 확률변수 값을 변형하여 새로운 분포를 얻는 것
- 이산확률변수 변환 : 변환된 Y의 확률질량함수를 계산
ex) 주사위의 눈 : X = {1, 2, 3, 4, 5, 6}
① 변환 전 확률변수 : P(X=x) = 1/6
② 변환 후 확률변수 : Y = 2X
⇒ Y = {2, 4, 6, 8, 10, 12}
③ 확률 P(Y=y) 구하기
∴ P(Y=y) → P(X=y/2)
- 연속확률변수의 변환 : 변환된 확률밀도함수를 구할 때 변환공식 사용
3. 기댓값 (Expectation, Expected value)
1. 확률변수의 기댓값 (Expected value)
- 확률변수가 어떤 값을 가질 때, 그 값들의 평균 = 모평균(Population mean)
- 확률변수의 대표적인 값
'데이터 사이언스' 카테고리의 다른 글
기초통계학 9 | 포아송분포, 기하분포, 음이항분포, 다항분포 (0) | 2025.01.07 |
---|---|
기초통계학 8 | 분산, 표준편차, 결합분포와 주변분포, 베르누이 시행과 확률변수 (0) | 2025.01.07 |
기초통계학 6 | 확률, 조건부확률, 독립사건, 베이즈정리 (0) | 2025.01.05 |
기초통계학 5 | 확률, 경우의 수, 통계적 확률 (0) | 2025.01.05 |
기초통계학 4 | 분할표, 비교그림, 산점도, 공분산 & 상관계수 (0) | 2025.01.04 |