본문 바로가기
데이터 사이언스

기초통계학 5 | 확률, 경우의 수, 통계적 확률

by 잡레시피 2025. 1. 5.

 

 

 

 

 

 

 

1. 확률 (Probability)

 

 

1. 확률

- 특정 사건이 발생할 가능성을 수치로 표현

- 불확실성 : 모든 결과는 알 수 있지만, 어떤 사건이 발생할 지 확실하게 예측할 수 없음

 

 

 

2. 확률의 범위

- 모든 가능한 사건의 확률을 더하면 항상 1

 

0 ≤ P(A) ≤ 1

  • 0: 사건이 절대 발생하지 않음.
  • 1: 사건이 반드시 발생.

 

 

3. 확률실험 (Random Experiment)

- 결과를 사전에 예측할 수 없지만,

  가능한 모든 결과를 알 수 있는 실험이나 관찰

- 확률을 언급하려면 확률실험이 전제되어야 하고,

  표본공간과 사건이 설정되어야 함

 

 

① 무작위성 (Randomness)

- 실험결과가 불확실하고 사전에 특정 결과를 정확히 예측불가

 

ex) 동전 던지기에서 앞/면 중 뭐가 나올지 모름

 

 

② 표본공간 (Sample Space, Ω)

- 가능한 모든 결과를 표본공간(Sample Space)으로 정의가능

 

ex) 주사위 굴리기의 표본공간 : S = {1, 2, 3, 4, 5, 6}

 


사건 (Event, E)

- 표본공간의 부분집합으로, 특정 조건에 해당하는 결과의 집합

 

ex) 주사위에서 짝수가 나오는 사건 : E = {2, 4, 6}

ex) 3번 

 

 

반복 가능성

- 동일 조건에서 실험을 여러번 반복 가능

 

 

 

4. 집합연산 정의와 법칙

 

 

① 합사건 (Union)

- 두 집합 A와 B에 속한 모든 원소의 집합

 

 AB = {xxA 또는 xB})

 

 

② 교집합 (Intersection)

-  A와 B 두 집합에 모두 속한 원소의 집합

 

AB = {xxA 그리고 xB}

 

 

③ 여집합 (Complement)

- 전체집합 U에서 A에 속하지 않은 원소의 집합

 

Aᶜ = {xxU 그리고 x  A}

 

 

④ 차집합 (Difference)

- 집합 A에 속하지만, 집합 B에는 속하지 않는 원소의 집합

 

AB = {xxA 그리고 x  B}

 

 

⑤ 배반사건 (Disjoint, Mutually exclusive)

- 임의의 두 사건 A 와 B가 공통부분이 없음

  즉, 동시에 발생할 수 없는 경우

 

 AB=

 

 

⑥ 교환법칙 (Commutative Law)

- 2개의 연산을 할 때 연산순서를 바꿔도 결과가 변하지 않는 법칙

 

AB=BA

AB=BA

 

 

⑦ 분배법칙 (Distributive Law)

- 연산이 다른 연산을 분배할 때 적용

- 합집합과 교집합 간 분배법칙 성립

 

- 합집합에 대한 분배법칙 : A(BC)=(AB)(AC)

- 교집합에 대한 분배법칙 : A(BC)=(AB)(AC)

 

 

⑧ 결합법칙 (Associative Law)

- 연산순서를 바꿔도 결과가 변하지 않는 법칙

 

- 합집합에 대한 결합법칙 : (AB)C=A(BC)

- 교집합에 대한 결합법칙 : (AB)C=A(BC)

 

 

⑨ 드모르간법칙 (De Morgan's Law)

- 여집합에 대한 연산을 다른 연산으로 변환 

 

- 합집합에 대한 결합법칙 : (AB)  =A B 

- 교집합에 대한 결합법칙 :  (A ∩ B)  =Aᶜ ∪ B 

 

 

 

 

2. 경우의 수 

 

 

1. 고전적 확률

- 모든 결과의 발생가능성이 동등할 때, 사건이 일어날 확률을 구함

 

 

사건 A가 일어날 수 있는 경우의 수 = 사건 A의 원소개수

전체 가능한 경우의 수 = 표본공간의 원소개수

 

 

 

2. 연속표본공간

- 무수히 많은 결과가 가능한 표본공간

- 발생가능성이 동일한 상황을 선이나 평면 등을 이용

- 사건 A가 발생한다는 것은 내에서 무작위로 한 점을 선택할 때 이 점이 영역 A에 있다는 의미

 

ex) 0°C에서 100°C 사이의 온도 측정 → 온도는 실수값으로 나올 수 있기 때문에 연속 표본공간에 해당

온도는 23.5°C, 23.51°C와 같이 세밀하게 표현가능

 

 

 

3. 경우의 수 (The number of cases)

- 어떤 사건이나 상황에서 발생할 수 있는 모든 가능한 결과의 개수

- 표본공간과 사건에 있는 원소의 개수

- 기본 법칙은 곱셈법칙(Multiplication rule)

 

 

 

4. 곱셈법칙 (Multiplication rule)

- 서로 독립적인 사건에서 가능한 경우의 수

 

경우의 수 = A의 경우의 수 X B의 경우의 수 X · · · 

 

 

 

5. 순열 (Permutation)

- 어떤 객체를 특정 순서대로 배열하는 경우의 수 계산

 

 

 

6. 중복순열 (Permutation with  Repetition)

- 중복이 허용된 경우, n개의 요소 중 k개를 선택해 순서대로 배열하는 경우의 수 계산

 

 

7. 조합 (Combination)

- 순서가 중요하지 않은 경우, n개의 객체 중에서 k개를 선택하는 경우의 수 계산

 

 

 

8. 중복조합 (Combination with repetition)

- 중복이 허용되는 경우, n개의 객체 중에서 k개를 선택하는 경우의 수 계산

 

 

 

9. 복원 추출 (With Replacement)

- 선택한 요소를 다시 원래 집합에 포함시킨 후 다음 선택을 수행하는 방식

- 같은 요소를 여러번 선택가능

 

ex) 동전 던지기

 

 

 

10. 비복원 추출 (Without Replacement)

- 선택한 요소를 다시 원래 집합에 포함시키지 않음

- 같은 요소는 한 번만 선택가능

 

ex) 복권번호 추첨

 

 

 

 

3. 통계적 확률

 

 

 

1. Birthday problem

- 1년을 365일이라고 가정할 때, k명이 가질 수 있는 생일의 경우의 수

 

ex) 

① k명이 가질 수 있는 생일의 경우의 수

 

Ω = 365 X 365 X · · · X 365 = 365

 

 

② 모든 사람이 생일이 다를 확률

1~365 숫자 중 k개를 비복원 추출

 

365 X 364 X · · · X (365 - k + 1) = 365! / (365-k)!

 

 

 

 

 

2. 상대도수의 극한개념

- 실험을 반복할수록 사건의 상대도수가 실제 확률값에 가까워지는 것

- 확률의 극한 : 실험을 반복함에 따라 상대도수가 점점 일정한 값에 수렴하는 성질(해당 사건의 이론적 확률로 수렴)

- 실험을 무한히 반복한다는 것은 표본이 결국 모집단이 됨 → 통계적 확률 (Statistical probability)

- 확률은 모집단이 어떤 형태로 구성되어 있는지를 보여줌

 

 

 

3. 몬테카를로 모의실험 (Monte Carlo simulation)

- 실제 실험을 반복할 수 없는 상황에서 

  무작위 수를 생성하고 결과를 추정하는 방식으로 계산

- 컴퓨터 시뮬레이션으로 많은 수의 실험을 가상으로 반복하여

  문제의 해답을 근사적으로 도출함

 

ex) 일기예보, 물리학 실험, 게임이론

 

 

 

4. 콜모고로프 - 공리적 확률 (Probability Axioms)

 

 

① 전체확률 공리(Normalization Axiom)

- 표본공간 Ω에 대한 확률은 항상 1이어야 한다

→ P(Ω) = 1

 

② 비부정성 공리 (Non-negativity Axiom)

- 어떤 사건 A에 대해 사건의 확률은 항상 0 이상이다 (= 확률이 음수일 수 없다)

→ 0 ≤ P(A)  ≤ 1, A⊂ Ω

 

③ 가산성 공리 (Additivity Axiom)

- 두 사건이 배반적인 경우(즉, 동시에 일어날 수 없는 경우),

  사건들의 합의 확률은 각 사건들의 확률의 합과 같다 

 

 

5. 확률측도 (Probability measure, P)

- 사건에 확률을 할당하는 함수

 

 

 

반응형