본문 바로가기

통계학

결합분포에 대해 알아보자!

주사위를 던졌을때 주사위(X)가 얼마가 나올까? 내일의 날씨(X)는 어떤 날씨일까?


흔히 생각하는 확률변수는 하나이다.


그럼 2개 혹은 그 이상일때에는 어떻게 될까?


예를들어 중간고사 점수의 확률변수를 X라 하고 기말고사 점수의 확률변수를 Y라 했을때


중간고사 점수에 관한 확률밀도함수 f(X), 기말고사 점수에 관한 확률밀도함수 f(Y)가 존재한다.

(probability density function 연속형일경우 확률밀도함수, 이산형일경우 확률질량함수 probability mass function) 



그렇다면 중간고사점수와 기말고사점수 2개를 모두다 고려한 확률밀도함수는

f(X,Y)로 표현할 수 있을 것이고 이를 결합확률밀도함수(joint probability density function) 라 한다.


변수가 1개 있을 경우 2차원 그래프에 확률밀도함수를 그릴 수 있지만

변수가 2개 있다면 X축을 중간고사점수, Y축을 기말고사점수로 한 다음 Z 축을 확률값으로 하여 3차원 그래프로 나타낼 수 있을 것이다.

물론 2차원그래프의 아래 면적, 3차원그래프의 아래 부피는 확률밀도함수의 정의에 의해 모두 1이다.





이러한 것들을 기호화 하여 정의하여 보면


다음과 같이 정의된   를 두 확률변수 X,Y 의 결합확률밀도함수(joint density function)라 한다.


(1) 이산형: 

(2) 연속형: 




결합누적분포함수(joint cumulative distribution function)는 자연스럽게 다음과 같다.

           

   


그렇다면 여기서 몇가지 정리될 수 있는 사실을 나열해 보면


(1) 이산형: 


(2) 연속형:


f(x,y)를 f(x)로, 즉 확률변수가 2개 있는 함수에서 하나로 줄일 수 있지 않을까?


그것이 주변확률밀도함수(marginal probability density function)이다.


X의 주변확률밀도함수를 구할때 팁은 'y를 없애자' 혹은 'x만 남기자' 라는 목표로 계산하면 된다.


(이산형) 

(연속형)



지금까지 두 변수의 결합분포에 대해서 알아보았다.

다음에 다룰 것은 두 변수가 독립인지 독립이 아닐때 조건부 확률밀도함수는 어떻게 계산할 수 있을까에 대해 다루어 보겠다.