본문 바로가기
데이터 사이언스

기초통계학 7 | 확률변수, 확률질량함수, 확률밀도함수, 기댓값

by 잡레시피 2025. 1. 6.

 

 

 

 

 

1. 확률변수 (Random Variable)

 

 

1. 확률변수 (Random Variable)

- 표본공간에서 정의된 실함수 (Real-valued Function)

(확률실험 결과를 숫자로 표현)

 

 

 

2. 확률실험

- 정의역이 표본공간 Ω 이고, 공역이 실수인 함수

- 불확실성을 가지는 사회적·자연적 현상을 일종의 확률실험으로 이해

 

 

 

 

 

3. 이산확률변수 (Discrete random variable)

- 셀 수 있을 정도로 한정된 개수의 값만 나오는 확률변수

  즉, 몇 가지 특정 값만 가능한 변수

 

ex) 동전 던지기의 표본공간 (Ω) : {앞면,뒷면}

 

 

 

4. 연속확률변수 (Continuous random variable)

- 값이 연속적으로 나올 수 있는 확률변수

- 셀 수 없이 많은 값을 가짐

 

ex) 시간, 키

 

 

 

 


 

 

 

2. 확률질량함수, 확률밀도함수

 

1. 확률분포 (Probability Distribution)

- 확률변수가 가질 수 있는 값과 그 값이 나올 확률을 나타내는 함수나 규칙

- 확률분포는 모집단을 숫자로 표시했을 때의 형태임 → 모집단의 확률 구조

 

 

 

2. 확률분포표 (Probability distribution table)

- 확률변수와 확률을 표로 정리한 것

 

ex) 동전 세 번 던지기 : 앞면의 수

X 0 1 2 3
P(X=x) 1/8 3/8 3/8 1/8

 

 

 

3. 모집단의 확률구조를 표시하는 방법

- 이산확률변수 : 확률질량함수, 누적분포함수,  · · ·

- 연속확률변수 : 확률밀도함수, 누적분포함수, · · ·

 

 

 

4. 확률질량함수 (Probability mass function)

- 이산확률변수가 특정 값을 가질 확률을 나타내는 함수

f(x) = P ( X = x )

 

 

 

5. 기하분포 (Geometric distribution)

- 처음으로 성공이 나올 때까지 시행 횟수를 확률적으로 나타내는 이산확률분포

 

 

 

6. 누적분포함수 (Cumulative distribution function)

- 확률변수 X가 특정 값 x 이하일 확률을 나타내는 함수

- 즉, 어떤 값까지의 누적 확률을 계산

 

 


7.확률밀도함수 (Probability density function)

- 연속확률변수에 대한 확률을 나타내는 함수

 

 

 

8. 확률변수의 변환 (Transformation)

- 확률변수 X에 특정함수를 적용해 새로운 확률변수 Y를 만드는 과정

- 기존 확률변수 값을 변형하여 새로운 분포를 얻는 것

 

- 이산확률변수 변환 : 변환된 Y의 확률질량함수를 계산

 

ex) 주사위의 눈 : X = {1, 2, 3, 4, 5, 6}

 

① 변환 전 확률변수 : P(X=x) = 1/6

② 변환 후 확률변수 : Y = 2X

⇒ Y = {2, 4, 6, 8, 10, 12}

③ 확률 P(Y=y) 구하기

 

∴ P(Y=y) → P(X=y/2)

 

- 연속확률변수의 변환 : 변환된 확률밀도함수를 구할 때 변환공식 사용 

 

 

 


 

 

 

 

3. 기댓값 (Expectation, Expected value)

 

 

1. 확률변수의 기댓값 (Expected value)

- 확률변수가 어떤 값을 가질 때, 그 값들의 평균 = 모평균(Population mean)

- 확률변수의 대표적인 값

 

 

 

 

 

 

 

 

 

 

 

 

 

반응형