확률론 기초: Statistics 110 _ Monty Hall 문제와 심슨의 역설

2025. 9. 16. 12:34·Academic/Statistics

본 글은 네이버 부스트코스에서 제공하는 하버드 확률론 기초: Statistics 110 강의를 기초로 정리하였습니다. 

 

 

문제가 완벽히 같더라도 다른 표현과 환경을 제시한다면, 불가능하게 들릴 수 있다. 

 

Monty Hall problem

문제

총 세 개의 문이 있고, 하나의 문 뒤에는 차량이 그리고 남은 두 개의 문 뒤에는 염소가 놓여 있다. 몬티는 각각의 문 뒤에 놓인 것이 무엇인지 알고 있으며, 참가자는 차량이 뒤에 놓인 문을 열고 싶어 한다. 참가자가 문을 하나 선택하면 몬티가 남은 두 개의 문 중 염소가 뒤에 놓인 문을 열며, 참가자는 처음 선택을 번복할 수도 혹은 고수할 수도 있다. 

 

추가 가정

몬티가 남은 두 개의 문 중 하나의 문을 열 때, 열게 될 문을 선택할 확률은 동일하다. 

Lazy Monty Hall 문제처럼 문 열러가기 귀찮다거나 등의 이유로 두 개의 문 중 하나를 고를 확률이 다르지 않다는 것.

 

 

정답

처음 내린 결정을 바꿔야 한다. 

 

 

풀이

Method 1. Tree diagram

만약 참가자가 1번 문을 선택한 후에 몬티가 2번 문 뒤를 열었다고 해보자. 

 

몬티는 염소가 있는 문 만을 열 수 있으므로 차량은 1번 문과 3번 문 중 하나의 뒤편에 있다. 

 

참가자가 1번 문, 몬티가 2번 문을 선택했을 때, 참가자가 선택을 번복해 성공할 확률은 처음 선택을 고수했을 때보다 더 높다. 

 

 

 

Method 2. 전체 확률의 법칙

사건 정의

S: 선택을 번복해 성공할 확률

Dj: j번 문의 뒤에 차량이 놓여 있을 확률 (j ∈ {1, 2, 3})

 

풀이

참가자가 1번 문을 선택했다고 가정하자. 아래 식에서 각 항에 곱해진 1/3은 차가 각 문에 배치될 사전확률을 의미한다.

 

 

각 확률이 동일함을 고려하면, 

 

 

Method 3. Try simple and Extreme cases

만약 문이 100만 개 있고, 몬티가 999,999개 중 하나의 문을 연다면?

대부분의 사람들은 자신이 선택한 문이 아닌, 몬티가 열지 않은 999,998개 중 하나의 문 뒤에 차가 있을 것이라 확신하게 된다. 즉, 대부분의 사람들이 번복을 결정하게 된다.

 

 

 

Simpson's paradox

교수님 왈, '역설'은 사실 존재하지 않는다. 다만 사람들의 직관에 반대되는 경우이며, 우리가 더 깊게 생각한다면 풀 수 있을 것.

 

첫 번째 의사가 모든 가능한 수술에서 성공할 확률이 두 번째 의사보다 높다. 그런데 전체적으로는 두 번째 의사의 성공 확률이 더 높을 수 있을까?

 

심슨 왈, '가능하다'

 

 

예제. 의사 히버트와 닉

문제

두 명의 의사가 두 가지의 수술을 진행한다고 가정하자

 

어려운 수술과 쉬운 수술 각각을 놓고 보면 히버트의 수술 성공률이 더 높다. 하지만, 전체 성공률을 단순 합계로 계산하면, 히버트는 80%의 성공 확률, 닉은 83%의 성공 확률을 가진다. 

 

 

사건을 다음과 같이 정의해보자.

A: 수술이 성공하는 경우 

B: 의사 닉이 수술하는 경우 (B^c: 의사 히버트가 수술)

C: 어려운 수술 (C^c: 쉬운 수술) 

 

어려운 수술의 경우, 의사 히버트가 집도할 때 성공할 확률이 더 높다. 
쉬운 수술의 경우, 의사 히버트가 집도할 때 성공할 확률이 더 높다.
전체적인 관점에서, 의사 닉이 수술에 성공할 확률이 더 높다. 

 

 

여기에서 C는 교란 요인 Confounder에 해당하며 동시에 통제해야 할 요인이다. 

 

증명

전체 확률의 법칙의 조건부 형식을 고려해보자. 다음 식에서 B를 조건으로 삼는 가중치의 경우, 비교할 만한 값이 존재하지 않고 유동적으로 변하기 때문에 P(A|B)와 P(A|B^c)의 대소를 확인하는 것에는 어려움이 있다. 

 

 

 

예제. 

다음 식과 같이 생각한다면 심슨의 역설은 가능하다. 

 

 

두 명의 야구 선수

1번 선수는 첫 시즌과 두 번째 시즌에서 각각 높은 타율을 기록했지만, 2번 선수는 전체 타율로 1번 선수보다 더 높은 타율을 기록할 수 있다. 

 

법정 문제

UC 버클리의 대학원 입학 시험에서 여성이 차별받는 주장의 소송이 제기된 바 있다. 전체 입학률에서는 여자보다 남자가 입학하기 쉬운 것으로 나타났지만, 각 학과 자료에서는 명백한 증거가 없었다. 특정 학과가 여자에게 인기가 많다거나, 어떤 학과는 다른 학과보다 합격하기 어렵다는 등의 다양한 요인이 있었을 것. 

 

 

두 가지 맛의 젤리 빈이 든 네 개의 병

 

1 vs 2 1번 = 1 > 2번 = 2/3
3 vs 4 3번 = 1/4 > 4번 = 0
{1, 3} vs {2, 4} {1, 3} = 2/5 = 40% < {2, 4} = 2/4 = 50%

 

 

 

 

 

'Academic > Statistics' 카테고리의 다른 글

확률론 기초: Statistics 110 _ 확률변수와 확률분포  (0) 2025.09.17
확률론 기초: Statistics 110 _ 도박꾼의 파산 문제와 확률변수  (0) 2025.09.17
확률론 기초: Statistics 110 _ 조건부 확률과 전확률정리  (0) 2025.09.15
확률론 기초: Statistics 110 _ 조건부 확률  (0) 2025.09.15
확률론 기초: Statistics 110 _ Birthday Problem과 확률의 특성  (0) 2025.09.15
'Academic/Statistics' 카테고리의 다른 글
  • 확률론 기초: Statistics 110 _ 확률변수와 확률분포
  • 확률론 기초: Statistics 110 _ 도박꾼의 파산 문제와 확률변수
  • 확률론 기초: Statistics 110 _ 조건부 확률과 전확률정리
  • 확률론 기초: Statistics 110 _ 조건부 확률
mila-aa
mila-aa
  • mila-aa
    log-able
    mila-aa
  • 전체
    오늘
    어제
    • 분류 전체보기 (13)
      • Academic (9)
        • Statistics (9)
        • Linear Algebra (0)
        • Algorithm (0)
      • Study (1)
        • SQL (0)
        • Visualization (1)
      • Project (0)
      • Note (0)
        • Why-metrics (0)
        • Issue (0)
        • Thinking (0)
      • Review (1)
        • Article (2)
        • Book (0)
        • Tastes (0)
        • Certificate (0)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    Statistics
    데이터리안
    린 분석
    tableau
    데이터 문해력
    Statistics 110
    RFM 분석
    Visualization
    Book
    원씽
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.4
mila-aa
확률론 기초: Statistics 110 _ Monty Hall 문제와 심슨의 역설
상단으로

티스토리툴바