본 글은 네이버 부스트코스에서 제공하는 하버드 확률론 기초: Statistics 110 강의를 기초로 정리하였습니다.
조건부 확률
Thinking conditionally
Thinking conditionally is a condition for thinking.
조건부로 생각하는 것은 생각하는 것에 대한 조건이며, 다시 말해 명확하게 생각할 수 없다는 것.
조건부로 생각하는 건 어떤 사실, 주어진 정보 등을 고려해 생각한다는 것이고, 생각하는 것에 대한 조건이라는 것은 옳은 생각을 하기 위해 반드시 필요한 전제라 할 수 있다. 조건을 고려하지 않고 생각하는 건 생각이 아니며, 조건을 전제해 생각해야만 사고가 성립한다는 의미인 듯
How to solve a problem in Statistics
- Try simple and extreme cases
- Break up problem into simpler pieces 문제가 어렵다면 더 잘게 쪼개 작은 조각의 문제를 해결해 보고 그 조각을 합쳐 해결한다.
S의 분할
![]() |
![]() |
예제. Get random 2-card hand from 52 cards of standard deck.
전체 카드 덱에서 Ace는 총 4장이 존재하며, 카드를 선택하는 순서는 고려하지 않는다.
(1) Find P(both Aces | have Ace)
이미 한 장의 Ace 카드를 가지고 있을 때, 총 두 장의 Ace 카드를 가질 확률.



(2) P(both Aces | have Ace of Spades).
한 장이 스페이드 A일 때, 두 장 모두 A일 확률.

(2)에서는 특정한 Ace 카드를 조건으로 확률을 계산한다. Ace 카드가 총 4장이라는 점을 생각해, (1)의 계산을 (2)의 4회 시행으로 단순하게 생각해선 안된다.

순서를 고려하지 않는다고 가정할 때,




예제. Patient gets tested for disease afflicts 1% of population, and tests positive. Suppose test is advertised as “95% accurate”, suppose this means

사건 정의
D: 실제로 환자가 질병을 보유
T: 환자의 검사 결과가 양성 판정
환자가 궁금해 할 것은 결국 양성 판정을 받았을 때 실제로 질병이 있을 경우 → P(D|T)

c.f. 통계학적 접근은 사람들 대부분의 직관과 다르다.
하버드 출신 의사 60명에게 위와 비슷한 질문을 던졌고, 그중 80%가 P(D|T)를 95% 정도일 것이라 답변했다. 물론, 검사를 다시 시행해 볼 수도 있다. 다만, 첫 번째 검사와 두 번째로 시행할 검사가 서로 독립이 아닐 수 있다는 점을 생각하자. 아마 다른 종류의 검사를 진행해야 할지도 모른다.
사람들은 위 문제에서 검사의 '95% 정확성'에 집중하지만, '인구의 1%'라는 표현에도 집중해야 할 필요가 있다. 검사가 잘못되는 것도 드물지만, 그만큼이나 질병을 가지게 되는 것도 드물다. 심리적으로 사람들은 검사의 오류에 집중하게 되는 부분도 있다.
문제에 따르면,1,000명의 환자가 있을 때 이중 10명이 질병을 보유하게 된다. 검사는 항상 옳다고 가정할 때, 검사에 따라 전체의 5%인 50명만이 양성 판정을 받는다. 양성 판정을 받을 수 있는 집단에는 50명의 질병 미보유자와 10명의 질병 보유자가 속해 있다. 즉, 양성 판정을 받았을 때 질병을 보유하게 될 확률은 총 60명 중 10명 (0.16)과 같다.
+ 환자에게 질병에 관련된 증상이 선제되어 검사를 받는 것일 수도 있다. 그렇다면 문제에서 주어진 상황을 새로 갱신해 확률을 다시 계산해 볼 수 있다.
베이즈 정리의 일관성
어떤 정보를 한 개씩 얻든, 한꺼번에 얻든, 어떤 조합으로 얻든, 어느 순서로 갱신하든, 항상 마지막으로는 주어진 조건 하에서 원했던 확률을 얻게 된다.
조건부 확률에서 자주 발생하는 실수
Confusing P(A|B), P(B|A) prosecutor's fallacy
Sally Clarkson Case
샐리 클락슨의 두 아이는 영아돌연사증후군(SIDS)로 사망했지만, 이 아이들에 대한 살인죄로 유죄 선고를 받았다.
증거로 제시되었던 건 증인으로 선 전문가의 발언. 전문가는 그녀가 결백하다고 가정했을 때, 두 아이가 뚜렷한 이유 없이 사망할 확률이 1/8500라고 주장했다. 사망한 아이가 두 명이었으므로 그 제곱의 근사치인 7,300만 분의 1이 샐리 클락슨이 결백할 확률이라는 것. 이에 따라 그녀는 유죄를 선고받고 수감되었다.
위 주장에서는 두 아이의 사망이 서로 독립이라 가정했지만, 독립이어야 한다는 타당한 이유가 제시되지 않았다. 유전적 성질이라든가 환경적 요인 등을 고려할 수 있음에도.
전문가가 주장한 것은 P(증거|결백함), 그녀가 결백하다고 가정했을 때 두 아이가 SIDS로 사망할 확률. 그러나 법정에서 실제로 필요로 하는 것은 P(결백함|증거). 즉, 그런 증거가 있음에도 그녀가 결백할 확률을 구해야 했다.
P(결백함|증거)를 구하기 위해서는 P(증거|결백함), P(증거|유죄), 사전확률 P(결백함)을 모두 명시해야 했고, 두 아이의 사망에 대한 독립성 가정도 이를 뒷받침하는 타당한 근거가 필요했다.
Confusing P(A) "prior" with P(A|B) "posterior"
사전 확률과 사후 확률의 혼동
"A가 발생했을 때"라는 표현은 P(A|A)=1을 의미할 뿐, P(A)=1을 나타내는 것이 아님을 기억하자.
Confusing independence with conditional independence
독립과 조건부 독립의 혼동
조건부 독립의 정의
만약 P(A∩B|C) = P(A|C) P(B|C)라면, 사건 A와 B는 사건 C에 대해 조건부 독립이다.
{ C에 대해 조건부 독립 → 독립 }인가
아니다.
사전 정보가 없는 상대와 체스 게임을 몇 회 진행한다고 하자. 이전 경기의 결과를 참고해 상대의 실력을 가늠하게 될 수 있으며, 이후의 결과에 영향이 갈 수 있다. 경기는 조건부 독립이지만 독립(비조건부 독립)은 아니다.
{ 독립 → C가 주어졌을 때 조건부 독립 } 인가
아니다
A를 화재 경보가 울리는 사건, F를 화재가 발생한 사건, C를 팝콘을 튀기는 사건으로 정의하자. F와 C는 독립이며, F와 C 중 하나가 발생하면 A 가 발생한다.

'Academic > Statistics' 카테고리의 다른 글
| 확률론 기초: Statistics 110 _ 도박꾼의 파산 문제와 확률변수 (0) | 2025.09.17 |
|---|---|
| 확률론 기초: Statistics 110 _ Monty Hall 문제와 심슨의 역설 (1) | 2025.09.16 |
| 확률론 기초: Statistics 110 _ 조건부 확률 (0) | 2025.09.15 |
| 확률론 기초: Statistics 110 _ Birthday Problem과 확률의 특성 (0) | 2025.09.15 |
| 확률론 기초: Statistics 110 _ 해석을 통한 문제풀이 및 확률의 공리 (0) | 2025.09.15 |

