본문 바로가기

통계학

조건부 확률, 이미 우리는 체득하고 있다?

본격적으로 통계학에 관한 글을 쓰기 위해 무엇부터 쓸까 하다 보니


한번에 높은 수준의 통계학을 쓰다가는 내가 밑천이 없는게 들킬까봐 안되겠다.


아주 기초적인 수준부터 이야기하고자 한다.



가끔 우리는 이런 일을 당한다.

아침에 집을 나섰을때 비가 오지 않아서 우산을 챙기지 않았다.

그런데 집으로 돌아오는 길에 비가 와서 그냥 맞고가야하나 우산을 어디서 구해야 하나 하는 일을 가끔 겪었을 것이다.


이같은 일을 겪으면서 우리는 학습적으로 조건부 확률과 베이즈 정리를 응용하게 된다.


100일중에 아침에 비가 오는 경우는 30일 (30%)

100일중 저녁에 비가 오는 경우는 35일 (35%)이다.


이것을 기호로 나타내면 P(아침에 비) = 0.3, P(밤에 비) = 0.35


하지만 우리는 밤에 비가 올 확률이 0.35 이라고 곧이곧대로 받아들이지 않는다.

왜냐하면 아침에 비가 오는 것과 저녁에 비가 오는 것을 독립이라고 보지 않기 때문이다.


아침에 비가 안왔을때 저녁에도 비가 안올 것이라 예상할 것이고

아침에 비가 온다면 저녁에도 비가 올 것이라 예상할 수 있다.


 

 저녁에 비가 온다

 저녁에 비가 안온다

 

 아침에 비가 온다

 28

 2

 30

 아침에 비가 안온다

 7

63

 70 
  35 65 


아침에 비가올 경우 저녁에도 비가 올 것이라는 생각을 할 수 있고(28/30 = 약 93%)

아침에 비가 안올 경우 저녁에도 비가 안올 것이라고 예측할 수 있다. ( 63/70 = 약 90%)


아침에 비가 안올 때 저녁에 비가 오는 경우 (7/70 = 10% )는 저녁에 비가 올 확률(30/100 = 30%)에 비하면 적기 때문에

합리적으로 생각한 결과일지도 모르겠다.



이것을 수식으로 정리해보면


사건 A가 주어졌을 때 B의 조건부 확률은 다음과 같다.


다만 P(B) > 0 이 조건이 성립할 때 이다.




이제 준비운동이 끝났다.


다음에 올릴 것은 베이즈 정리(Bayes's Theorem)인데 이것을 공부하기 위해서는 좀더 짱구를 굴려야 한다.