본문 바로가기
데이터 사이언스

기초통계학 8 | 분산, 표준편차, 결합분포와 주변분포, 베르누이 시행과 확률변수

by 잡레시피 2025. 1. 7.

 

 

 

 

1. 분산과 표준편차

 

 

1. 모분산 (Population variance)

- 모집단의 데이터들이 평균에서 얼마나 떨어져 있는지를 나타내는 분산을 측정하는 값

 

 

 

2. 이산균일분포 

- 유한한 개수의 값들이 있고, 모든 같은 확률로 나타나는 분포

 

 

 

 


 

 

 

2. 결합분포와 주변분포

 

 

1. 결합분포 (Joint Distribution)

- 2개 이상의 확률 변수가 동시에 발생할 확률을 나타내는 분포

 

 

① 이산형 결합분포 (Discrete Joint Distribution)

- 2개 이상의 이산형 확률변수가 특정값을 동시에 가질 확률을 나타냄

 

 

② 연속형 결합분포 (Continuous Joint Distribution)

- 2개 이상의 연속형 확률변수가 특정 범위 내에서 동시에 나타날 가능성을 나타내는 확률밀도함수

 

 

③ 주변분포 (Marginal Distribution)

- 결합분포에서 한 변수의 분포만을 따로 나타낸 것,

  다른 변수의 영향을 모두 포함하여 나타냄

 

 

 

2. 독립 확률변수

- 두 확률변수 X와 Y의 값이 서로 영향을 전혀 미치지 않는 관계

 

 

 

3. 결합확률분포표

- 두 이산형 확률변수 X와 Y가 각각 특정값을 가질 대의 결합확률을 표 형태로 정리한 것

 

 

 

 

 


 

 

 

3. 베르누이 시행과 확률변수 

 

 

 

1. 베르누이 시행 (Bernoulli trial)

- 두 가지 가능한 결과(성공, 실패) 중 하나만 발생하는 단일 실험

- 각 실험은 독립적이고 성공확률은 일정함

 

 

 

2. 베르누이 확률변수

- 2가지 가능한 값을 가지는 이산형 확률변수

 

 

 

3. 이항분포 (Binomial Distribution)

- 독립적인 두가지 결과(성공, 실패)가 반복되는 실험에서

  성공이 발생한 횟수를 나타내는 확률분포

 

 

 

4. 초기하분포 (Hypergeometric Distribution)

- 복원하지 않고 샘플을 추출할 때 사용되는 확률분포

  즉, 서로 다른 집단에서 원소를 추출하고 

  각 집단에서 특정 조건을 만족하는 원소의 개수를 추정하는 데 사용

 

 

5. 품질관리 - Operating Characteristic(OC) curve

- 품질관리에서 수용검사(Acceptance Sampling) 시스템을 평가하는데 사용되는 도구

- 특정 검사 시스템이 불량품을 거를 확률을 시각적으로 나타내며,

  불량품의 비율(불량률)과 검사통과 확률 사이의 관계를 보여줌

 

 

 

 

 

 

 

 

 

 

반응형