본 글은 네이버 부스트코스에서 제공하는 하버드 확률론 기초: Statistics 110 강의를 기초로 정리하였습니다.
Conditioning
조건을 부여하는 것 Conditioning은 통계학의 핵심이며, 확률변수 Random variables와 그 분포에 관련이 있다.
도박꾼의 파산 문제 Gambler's Ruin
도박꾼의 파산
문제
도박꾼 A와 도박꾼 B는 각 라운드에서 1달러씩 걸며 동일한 경기를 반복하고 있다. 둘 중 한 명이 파산하면 게임은 종료되는데, A가 게임을 이길 확률, 다시 말해 B가 파산해 게임이 종료될 확률은?
→ 유사한 문제에 대응할 수 있도록 패턴을 파악하는 것이 중요하다.
사건 정의와 가정
사건 정의
p: 한 라운드에서 A가 이길 확률
q: 1-p
가정
(1) 매 라운드는 독립적이다.
(2) A는 i 달러, B는 (N-i) 달러로 시작하고, 한 도박꾼이 N달러를 가질 때까지 게임이 진행된다.
- i는 [0, N]에서 임의로 배치되고 이동 단위는 정수 1의 값을 가진다. p는 i가 양의 방향으로 움직일 확률에 해당한다.
- i가 0 또는 N에 위치하면 게임은 종료된다.
풀이
$P_i=P(A\ wins\ game|A\ starts\ at\ 1\ dollar)$라고 하자
A가 승리하는 사건을 첫 라운드의 결과로 분할해 생각하면 조건으로 설정하면
- 첫 라운드에서 A가 p의 확률로 승리하면 자금은 (i+1) 달러 + 그 이후 A가 승리할 확률은 $P_{i+1}$
- 첫 라운드에서 A가 q의 확률로 패배하면 자금은 (i-1) 달러 + 그 이후 A가 승리할 확률은 $P_{i-1}$
전체 확률의 법칙을 적용하면
$P_i$ = P(A 승리 | 첫 라운드 A 승리)·P(첫 라운드 A 승리) + P(A 승리 | 첫 라운드 A 패배)·P(첫 라운드 A 패배)
$$P_i=pP_{i+1}+qP_{i-1}, \ 1 \leq i\leq N-1$$
계차방정식: 이산적인 시간에서만 관측 가능
$P_i=x^i$라고 가정하자
$$x^i=px^{i+1}+qx^{i-1}\\px^2-x+q=0$$
$$x=\frac{1\pm \sqrt{1-4pq} }{2p}$$
$1-4pq=1-4p(1-p)=(2p-1)^2$ 이므로,
$$x=\frac{1\pm \sqrt{1-4pq}}{2p}=\frac{1 \pm |2p-1|}{2p} \in \ \big\{{1,\frac qp}\big\}$$
$$P_i=A\times 1^i+B(\frac qp)^i,\ if \ p \neq q$$
$p \neq q$인 경우
$P_0=0$을 대입하면, $0=A+B$
$P_N=1$을 대입하면, $1=A(1-\frac qp)^N$
$$1=A(1-(\frac qp)^N) \Rightarrow A=\frac 1{1-(\frac qp)^N}$$
$$P_i=A+B(\frac qp)^i=A(1-(\frac qp)^i)=\frac 1{1-(\frac qp)^N}(1-(\frac qp)^i)=\frac {1-(\frac qp)^i}{1-(\frac qp)^N}$$
따라서
$$P_i=\frac {1-( \frac qp)^i}{1-(\frac qp)^N}$$
$p<q$이면, $P_i$는 상대적으로 커지고, $p>q$이면, $P_i$는 작아진다.
A와 B가 승리할 확률이 서로 다를 때,
A가 승리할 확률이 작다면 A가 N달러에 먼저 도달할 확률이 커지고, A가 승리할 확률이 크다면 A가 N 달러에 먼저 도달할 확률이 작아진다.
$p=q=\frac 12$인 경우
극한을 취하면
$$P_i=\lim _{x \rightarrow 1} \frac{1-x^i}{1-x^N}$$
로피탈의 정리에 따라
$$P_i=\frac iN$$
따라서 p와 q가 동일한, 공정한 경우에는
$$P_i=\frac iN ,\ if\ p=q=\frac 12$$
게임이 영원히 지속될 확률은 어떻게 되는가
$p=q$로 공정한 경우, 아래 공식에 따라 게임은 결국 종료된다.
$$P_i+P_{N-i}=\frac iN + \frac {N-i}N=1$$
$p \neq q$로 공정하지 않을 경우,
$i=N-i,\ p=0.49,\ P$ 를 A가 승리할 확률이라고 하면,
$$P=\begin{cases}0.40 & N=20\\0.12 & N=100\\0.02 & N=200\end{cases} $$
초기 보유 자금 비율이 큰 차이가 날수록 A가 승리할 확률, 즉 불리한 편이 승리할 확률이 줄어드는 것을 확인할 수 있다.
본 문제에서는 상한 $N$이 존재한다. 유한한 상태공간에서는 종료 확률은 1의 값을 가진다.
확률변수 Random variable
변수
변할 수 있는 수이면서, 다양한 값을 가질 수 있는 수. 물론 실제로 '변할 수 있는 수'는 없으며, 직관적으로 말해 다양한 값을 가질 수 있는 기호라고 이해하면 된다.
확률변수
임의의 값을 가지는 변수로, 위키피디아에서는 값이 무작위하고 특정한 분포를 따르는 변수이자 구간이 정해져 있고 측정할 수 있는 함수라고 설명한다. Joe 교수님은 확률변수는 실수에 대한 확률 시행이 있는 표본 공간 S 안의 함수, 또는 확률 시행 일부의 수치적인 '요약'이라 정의한다.
임의성은 확률시행에서 오며, 확률시행은 서로 다른 결과에 대해 다른 확률을 부여하고 이때 전체 표본 공간의 확률은 1의 값을 가진다. 확률시행이 끝나면 특정한 결과 s를 알게 되고 그 값을 다루기 쉬운 실수로 대응하게 하는데, s에서 실수로 대응할 때 적용하는 함수가 곧 확률변수라 이해하면 될 듯하다.
분포
베르누이 분포 $X \sim Bern(p)$
확률변수 $X$가 베르누이 분포 $X \sim Bern(p)$를 따른다.
→ $X$가 0 또는 1 두 값만 가질 수 있다고 할 때, $P(X=1)=p,\ P(X=0)=1-p$에
이항 분포 $X \sim Bin(n,p)$
n개의 독립적인 베르누이 시행 동안의 성공 횟수의 분포.
$$Probability \ Mass \ Function\ of\ Bin(n,p)= P(X=k)=\begin{pmatrix} n \\ k \end{pmatrix} p^k(1-p)^{n-k}$$
'Academic > Statistics' 카테고리의 다른 글
| 확률론 기초: Statistics 110 _ 기댓값, 지시확률변수와 선형성 (0) | 2025.09.18 |
|---|---|
| 확률론 기초: Statistics 110 _ 확률변수와 확률분포 (0) | 2025.09.17 |
| 확률론 기초: Statistics 110 _ Monty Hall 문제와 심슨의 역설 (1) | 2025.09.16 |
| 확률론 기초: Statistics 110 _ 조건부 확률과 전확률정리 (0) | 2025.09.15 |
| 확률론 기초: Statistics 110 _ 조건부 확률 (0) | 2025.09.15 |