확률론 기초: Statistics 110 _ 도박꾼의 파산 문제와 확률변수

2025. 9. 17. 11:56·Academic/Statistics

본 글은 네이버 부스트코스에서 제공하는 하버드 확률론 기초: Statistics 110 강의를 기초로 정리하였습니다. 

 

 

Conditioning

조건을 부여하는 것 Conditioning은 통계학의 핵심이며, 확률변수 Random variables와 그 분포에 관련이 있다. 

 

 

도박꾼의 파산 문제 Gambler's Ruin

도박꾼의 파산

문제 

도박꾼 A와 도박꾼 B는 각 라운드에서 1달러씩 걸며 동일한 경기를 반복하고 있다. 둘 중 한 명이 파산하면 게임은 종료되는데, A가 게임을 이길 확률, 다시 말해 B가 파산해 게임이 종료될 확률은? 

→ 유사한 문제에 대응할 수 있도록 패턴을 파악하는 것이 중요하다.

 

 

사건 정의와 가정

사건 정의

p: 한 라운드에서 A가 이길 확률

q: 1-p

 

가정

(1) 매 라운드는 독립적이다. 

(2) A는 i 달러, B는 (N-i) 달러로 시작하고, 한 도박꾼이 N달러를 가질 때까지 게임이 진행된다. 

     - i는 [0, N]에서 임의로 배치되고 이동 단위는 정수 1의 값을 가진다. p는 i가 양의 방향으로 움직일 확률에 해당한다. 

     - i가 0 또는 N에 위치하면 게임은 종료된다. 

 

 

풀이

$P_i=P(A\ wins\ game|A\ starts\ at\ 1\ dollar)$라고 하자

 

A가 승리하는 사건을 첫 라운드의 결과로 분할해 생각하면 조건으로 설정하면

- 첫 라운드에서 A가 p의 확률로 승리하면 자금은 (i+1) 달러 + 그 이후 A가 승리할 확률은 $P_{i+1}$

- 첫 라운드에서 A가 q의 확률로 패배하면 자금은 (i-1) 달러 + 그 이후 A가 승리할 확률은 $P_{i-1}$

 

전체 확률의 법칙을 적용하면

$P_i$ = P(A 승리 | 첫 라운드 A 승리)·P(첫 라운드 A 승리) + P(A 승리 | 첫 라운드 A 패배)·P(첫 라운드 A 패배)

$$P_i=pP_{i+1}+qP_{i-1}, \ 1 \leq i\leq N-1$$

계차방정식: 이산적인 시간에서만 관측 가능

 

$P_i=x^i$라고 가정하자

$$x^i=px^{i+1}+qx^{i-1}\\px^2-x+q=0$$

$$x=\frac{1\pm \sqrt{1-4pq} }{2p}$$

 

$1-4pq=1-4p(1-p)=(2p-1)^2$ 이므로,

$$x=\frac{1\pm \sqrt{1-4pq}}{2p}=\frac{1 \pm |2p-1|}{2p} \in \ \big\{{1,\frac qp}\big\}$$

$$P_i=A\times 1^i+B(\frac qp)^i,\ if \ p \neq q$$

 

 

$p \neq q$인 경우

$P_0=0$을 대입하면, $0=A+B$

$P_N=1$을 대입하면, $1=A(1-\frac qp)^N$

 

$$1=A(1-(\frac qp)^N) \Rightarrow A=\frac 1{1-(\frac qp)^N}$$

 

$$P_i=A+B(\frac qp)^i=A(1-(\frac qp)^i)=\frac 1{1-(\frac qp)^N}(1-(\frac qp)^i)=\frac {1-(\frac qp)^i}{1-(\frac qp)^N}$$

 

따라서

$$P_i=\frac {1-( \frac qp)^i}{1-(\frac qp)^N}$$

$p<q$이면, $P_i$는 상대적으로 커지고, $p>q$이면, $P_i$는 작아진다. 

A와 B가 승리할 확률이 서로 다를 때,

A가 승리할 확률이 작다면 A가 N달러에 먼저 도달할 확률이 커지고, A가 승리할 확률이 크다면 A가 N 달러에 먼저 도달할 확률이 작아진다. 

 

 

$p=q=\frac 12$인 경우

극한을 취하면

$$P_i=\lim _{x \rightarrow 1} \frac{1-x^i}{1-x^N}$$

 

로피탈의 정리에 따라 

$$P_i=\frac iN$$

 

따라서 p와 q가 동일한, 공정한 경우에는 

$$P_i=\frac iN ,\  if\ p=q=\frac 12$$

 

 

게임이 영원히 지속될 확률은 어떻게 되는가

$p=q$로 공정한 경우, 아래 공식에 따라 게임은 결국 종료된다. 

$$P_i+P_{N-i}=\frac iN + \frac {N-i}N=1$$

 

$p \neq q$로 공정하지 않을 경우, 

$i=N-i,\ p=0.49,\ P$ 를 A가 승리할 확률이라고 하면,

$$P=\begin{cases}0.40 & N=20\\0.12 & N=100\\0.02 & N=200\end{cases} $$

초기 보유 자금 비율이 큰 차이가 날수록 A가 승리할 확률, 즉 불리한 편이 승리할 확률이 줄어드는 것을 확인할 수 있다. 

 

본 문제에서는 상한 $N$이 존재한다. 유한한 상태공간에서는 종료 확률은 1의 값을 가진다. 

 

 

 

확률변수 Random variable

변수

변할 수 있는 수이면서, 다양한 값을 가질 수 있는 수. 물론 실제로 '변할 수 있는 수'는 없으며, 직관적으로 말해 다양한 값을 가질 수 있는 기호라고 이해하면 된다. 

 

확률변수

임의의 값을 가지는 변수로, 위키피디아에서는 값이 무작위하고 특정한 분포를 따르는 변수이자 구간이 정해져 있고 측정할 수 있는 함수라고 설명한다. Joe 교수님은 확률변수는 실수에 대한 확률 시행이 있는 표본 공간 S 안의 함수, 또는 확률 시행 일부의 수치적인 '요약'이라 정의한다. 

 

임의성은 확률시행에서 오며, 확률시행은 서로 다른 결과에 대해 다른 확률을 부여하고 이때 전체 표본 공간의 확률은 1의 값을 가진다. 확률시행이 끝나면 특정한 결과 s를 알게 되고 그 값을 다루기 쉬운 실수로 대응하게 하는데, s에서 실수로 대응할 때 적용하는 함수가 곧 확률변수라 이해하면 될 듯하다. 

 

 

 

분포

베르누이 분포 $X \sim Bern(p)$

확률변수 $X$가 베르누이 분포 $X \sim Bern(p)$를 따른다. 

→ $X$가 0 또는 1 두 값만 가질 수 있다고 할 때, $P(X=1)=p,\ P(X=0)=1-p$에 

 

 

이항 분포 $X \sim Bin(n,p)$

n개의 독립적인 베르누이 시행 동안의 성공 횟수의 분포. 

 

$$Probability \ Mass \ Function\ of\ Bin(n,p)= P(X=k)=\begin{pmatrix} n  \\ k \end{pmatrix} p^k(1-p)^{n-k}$$

 

 

'Academic > Statistics' 카테고리의 다른 글

확률론 기초: Statistics 110 _ 기댓값, 지시확률변수와 선형성  (0) 2025.09.18
확률론 기초: Statistics 110 _ 확률변수와 확률분포  (0) 2025.09.17
확률론 기초: Statistics 110 _ Monty Hall 문제와 심슨의 역설  (1) 2025.09.16
확률론 기초: Statistics 110 _ 조건부 확률과 전확률정리  (0) 2025.09.15
확률론 기초: Statistics 110 _ 조건부 확률  (0) 2025.09.15
'Academic/Statistics' 카테고리의 다른 글
  • 확률론 기초: Statistics 110 _ 기댓값, 지시확률변수와 선형성
  • 확률론 기초: Statistics 110 _ 확률변수와 확률분포
  • 확률론 기초: Statistics 110 _ Monty Hall 문제와 심슨의 역설
  • 확률론 기초: Statistics 110 _ 조건부 확률과 전확률정리
mila-aa
mila-aa
  • mila-aa
    log-able
    mila-aa
  • 전체
    오늘
    어제
    • 분류 전체보기 (13)
      • Academic (9)
        • Statistics (9)
        • Linear Algebra (0)
        • Algorithm (0)
      • Study (1)
        • SQL (0)
        • Visualization (1)
      • Project (0)
      • Note (0)
        • Why-metrics (0)
        • Issue (0)
        • Thinking (0)
      • Review (1)
        • Article (2)
        • Book (0)
        • Tastes (0)
        • Certificate (0)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    Visualization
    린 분석
    RFM 분석
    tableau
    데이터리안
    원씽
    Statistics 110
    데이터 문해력
    Statistics
    Book
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.4
mila-aa
확률론 기초: Statistics 110 _ 도박꾼의 파산 문제와 확률변수
상단으로

티스토리툴바