본문 바로가기

카테고리 없음

여러 확률변수의 조건부분포와 독립 그리고 iid!

이젠 여러 확률변수들이 서로 상관성이 있는지 독립인지 어떻게 표현하고 계산할 수 있는지 알아보겠다.




두 사건이 독립일때 아래와 같은 수식을 본 적이 있을 것이다.



위 식을 말로 표현하면, 사건 A와 B가 동시에 일어날 확률은 사건A 가 일어날 확률에 사건B가 일어날 확률을 곱한 것이다.

(한손에는 동전을 던지고 다른 한손에는 주사위를 던져서 동전 앞면과 주사위 6이 나올 경우를 단순 계산하면 1/12가 되는것 처럼)



여기서 조금더 확장하면 사건A, B를 확률변수X, Y라 하면 아래와 같은 식이 가능하다.


모든x,y에 대해        일때


  확률변수 X와 Y는 독립(independent)라 한다. 역도 성립한다.




이는 확률변수가 3개 이상일때도 성립한다. 식으로 나타내면


이고


X_1부터 X_n까지 모두 독립이라는 뜻이다. 게다가 모두 같은 확률분포 f(x)를 따른다면 이들의 관계는


independent and identically distributed라고 하고 줄여서 iid라고 표현한다.






하지만 독립이 아니라면????

머리아파지기 시작한다. 계산도 귀찮아진다.


확률변수 X,Y 의 결합밀도함수를 f(x,y)라 할때 Y값이 y로 주어질 때


X 의 조건부확률밀도함수(conditional probability density function)을 f(x|y)로 나타내고


 식으로 나타내면 아래와 같다.




이것을 이용하면 Y=y일때, X 의 조건부기대값(conditional expectation)을 구할 수 있는데


이산형일 경우

연속형일 경우

로 정의할 수 있다.


조금더 정리하면 Y=y일때의 기대값이므로 위의 조건부 기대값은 y에 관한 변수에 의해 좌지우지되는 함수가 된다. 즉, E(X|y) = f(y).




여러 확률변수의 독립성을 말하는데에 공분산과 상관계수가 빠질 수 없다.


공분산과 상관계수는 따로 깊게 정리할 필요가 있어 다른 기회에 집중적으로 다룰 일이 있을 것 같아 지금은 일단 미뤄두기로 하자.