1. 분산과 표준편차
1. 모분산 (Population variance)
- 모집단의 데이터들이 평균에서 얼마나 떨어져 있는지를 나타내는 분산을 측정하는 값
2. 이산균일분포
- 유한한 개수의 값들이 있고, 모든 같은 확률로 나타나는 분포
2. 결합분포와 주변분포
1. 결합분포 (Joint Distribution)
- 2개 이상의 확률 변수가 동시에 발생할 확률을 나타내는 분포
① 이산형 결합분포 (Discrete Joint Distribution)
- 2개 이상의 이산형 확률변수가 특정값을 동시에 가질 확률을 나타냄
② 연속형 결합분포 (Continuous Joint Distribution)
- 2개 이상의 연속형 확률변수가 특정 범위 내에서 동시에 나타날 가능성을 나타내는 확률밀도함수
③ 주변분포 (Marginal Distribution)
- 결합분포에서 한 변수의 분포만을 따로 나타낸 것,
다른 변수의 영향을 모두 포함하여 나타냄
2. 독립 확률변수
- 두 확률변수 X와 Y의 값이 서로 영향을 전혀 미치지 않는 관계
3. 결합확률분포표
- 두 이산형 확률변수 X와 Y가 각각 특정값을 가질 대의 결합확률을 표 형태로 정리한 것
3. 베르누이 시행과 확률변수
1. 베르누이 시행 (Bernoulli trial)
- 두 가지 가능한 결과(성공, 실패) 중 하나만 발생하는 단일 실험
- 각 실험은 독립적이고 성공확률은 일정함
2. 베르누이 확률변수
- 2가지 가능한 값을 가지는 이산형 확률변수
3. 이항분포 (Binomial Distribution)
- 독립적인 두가지 결과(성공, 실패)가 반복되는 실험에서
성공이 발생한 횟수를 나타내는 확률분포
4. 초기하분포 (Hypergeometric Distribution)
- 복원하지 않고 샘플을 추출할 때 사용되는 확률분포
즉, 서로 다른 집단에서 원소를 추출하고
각 집단에서 특정 조건을 만족하는 원소의 개수를 추정하는 데 사용
5. 품질관리 - Operating Characteristic(OC) curve
- 품질관리에서 수용검사(Acceptance Sampling) 시스템을 평가하는데 사용되는 도구
- 특정 검사 시스템이 불량품을 거를 확률을 시각적으로 나타내며,
불량품의 비율(불량률)과 검사통과 확률 사이의 관계를 보여줌
'데이터 사이언스' 카테고리의 다른 글
기초통계학 10 | 정규분포, 확률표본, 통계량 (0) | 2025.01.07 |
---|---|
기초통계학 9 | 포아송분포, 기하분포, 음이항분포, 다항분포 (0) | 2025.01.07 |
기초통계학 7 | 확률변수, 확률질량함수, 확률밀도함수, 기댓값 (0) | 2025.01.06 |
기초통계학 6 | 확률, 조건부확률, 독립사건, 베이즈정리 (0) | 2025.01.05 |
기초통계학 5 | 확률, 경우의 수, 통계적 확률 (0) | 2025.01.05 |