본문 바로가기

공분산(Covariance)과 상관계수(Correlation) 확률변수X가 있을때 우리가 흔히 이 분포를 나타낼때 쓰는것이 첫번째로 평균이고두번째로 분산이다. 평균으로써 분포의 중간부분을 알아내고분산으로써 분포가 얼마나 퍼져있는지 알아낸다. 더 알고싶으면 Skewness 혹은 직접 시각화 해보거나 방법이 있지만우선 가장 쉽고 잘표현되는것이 평균과 분산이다. 그렇다면 확률변수가 2가지일때 이 확률분포들이 어떤모양으로 되어있는지를 알고싶을때가장 먼저 X의 평균, 다음이 Y의 평균이다. 이렇게 되면 대충 분포가 어디에 주로 모여있는지 (m_x, m_y)가 나온다.그다음으로 궁금한게 얼마나 퍼져있는지 인데 그것은 확률변수의 분산을 구하면 되지만각 확률변수들이 어떻게 퍼져있는지를 나타내는 것이 공분산(Covariance)이다., 두 확률변수 X와 Y가 어떤 모양으로 퍼져있는.. 더보기
여러 확률변수의 조건부분포와 독립 그리고 iid! 이젠 여러 확률변수들이 서로 상관성이 있는지 독립인지 어떻게 표현하고 계산할 수 있는지 알아보겠다. 두 사건이 독립일때 아래와 같은 수식을 본 적이 있을 것이다. 위 식을 말로 표현하면, 사건 A와 B가 동시에 일어날 확률은 사건A 가 일어날 확률에 사건B가 일어날 확률을 곱한 것이다.(한손에는 동전을 던지고 다른 한손에는 주사위를 던져서 동전 앞면과 주사위 6이 나올 경우를 단순 계산하면 1/12가 되는것 처럼) 여기서 조금더 확장하면 사건A, B를 확률변수X, Y라 하면 아래와 같은 식이 가능하다. 모든x,y에 대해 일때 확률변수 X와 Y는 독립(independent)라 한다. 역도 성립한다. 이는 확률변수가 3개 이상일때도 성립한다. 식으로 나타내면 이고 X_1부터 X_n까지 모두 독립이라는 뜻이다.. 더보기
결합분포에 대해 알아보자! 주사위를 던졌을때 주사위(X)가 얼마가 나올까? 내일의 날씨(X)는 어떤 날씨일까? 흔히 생각하는 확률변수는 하나이다. 그럼 2개 혹은 그 이상일때에는 어떻게 될까? 예를들어 중간고사 점수의 확률변수를 X라 하고 기말고사 점수의 확률변수를 Y라 했을때 중간고사 점수에 관한 확률밀도함수 f(X), 기말고사 점수에 관한 확률밀도함수 f(Y)가 존재한다.(probability density function 연속형일경우 확률밀도함수, 이산형일경우 확률질량함수 probability mass function) 그렇다면 중간고사점수와 기말고사점수 2개를 모두다 고려한 확률밀도함수는f(X,Y)로 표현할 수 있을 것이고 이를 결합확률밀도함수(joint probability density function) 라 한다. 변수.. 더보기