본 글은 네이버 부스트코스에서 제공하는 하버드 확률론 기초: Statistics 110 강의를 기초로 정리하였습니다.
Birthday Problem
K people, find a probability that 2 have same birthdays
어떤 파티에 속한 여러 명의 사람들 중, 두 사람의 생일이 같을 확률
여기서 고려해볼 수 있는 요소는 다음과 같다.
- 최소한 몇 명의 사람이 있어야 50%의 확률로 두 명의 생일이 같을 수 있을지
- 윤년을 포함할 것인지 말 것인지
2월 29일을 제외하고 365일이 모두 동일한 확률을 가지며 각 출생은 독립이라 가정
365일이 모두 동일한 확률을 가정하는 이유는, 실제로 나라와 계절 등에 따라 어느 정도의 차이가 존재하기 때문
만약 k>365라면, 이때의 확률은 1
비둘기 집의 원리 pigeonhole princeple
n+1개의 물건을 n개의 상자에 넣을 때 적어도 어느 한 상자에는 두 개 이상의 물건이 들어 있다는 원리
+ 상자보다 점의 개수가 많으면 여러 개의 점이 들어간 박스가 존재할 수 있다.
365개의 박스 각각에 일자가 표시되어 있다고 하자. 아래와 같이 각 박스에 생일자를 배치할 수 있다.
| Jan 1 OOO |
Jan 2 O |
Jan 3 O |
··· | Dec 31 O O |
이때, 충돌이 발생할 수 있다. 두 가지 이상을 한 곳에 저장하려 할 때 생기는 문제이며, 전산학에서 중요한 부분.
만약 k ≤365라면,
여사건 P(no match)을 통해 확률을 계산한다. 첫 번째 사람은 365일 중 하루, 두 번째 사람은 첫 번째 사람의 생일을 제외한 364일 중 하루, ···, k번째 사람은 (365-(k-1)) 을 제외한 날 중 하루가 가능하다. 참고로 k=1일 때는 한 사람으로 구성된 집단이므로, 비교할 대상이 없어 P(no match) = 1 과 같다.

근사를 통해 값을 계산하면 다음과 같다. 한 집단에서 두 사람의 생일이 같을 확률이 50% 이상이기 위해서는 최소한 23명으로 구성되어야 함을 알 수 있다. 23명 중 2명을 고르는 경우의 수는 (23*22)/2 = 253 으로 계산된다.

Non-naive definition
가장 큰 우연은 우연할 일이 없는 상태.
통계학에서는 가장 기본적인 문제에 대해 생각하는 것이 중요하며, 확률이 실제로 무슨 의미인지 이해해야 한다.
확률 공간의 두 가지 정리
1. 공집합인(불가능한) 사건은 0의 확률, 발생할 것이 확실한 사건은 항상 1의 확률을 가진다.

2. 합사건의 확률은 다음과 같으며, 이때 A_1, A_2, ···는 모두 겹치지 않는 서로소여야 한다.

Properties of Probability
위의 두 정리를 기반으로 하는 확률의 몇 가지 특성


포함배제의 원리





몽마르트 문제 de Montmort's problem (matching problem)
카드게임에서 시작된 문제로, 1부터 n까지의 숫자가 각각 표시된 n장의 카드 뭉치를 섞고 한 장씩 뒤집을 때, 카드를 뒤집을 때마다 1, 2, ···, n을 센다. 카드에 적힌 숫자와 뒤집으며 센 숫자가 같으면 승리한다. 즉, j번째 카드에 j가 적혀있는 경우가 최소 한 번은 존재할 확률.



'Academic > Statistics' 카테고리의 다른 글
| 확률론 기초: Statistics 110 _ Monty Hall 문제와 심슨의 역설 (1) | 2025.09.16 |
|---|---|
| 확률론 기초: Statistics 110 _ 조건부 확률과 전확률정리 (0) | 2025.09.15 |
| 확률론 기초: Statistics 110 _ 조건부 확률 (0) | 2025.09.15 |
| 확률론 기초: Statistics 110 _ 해석을 통한 문제풀이 및 확률의 공리 (0) | 2025.09.15 |
| 확률론 기초: Statistics 110 _ 확률과 셈 원리 (0) | 2025.09.15 |