본문 바로가기

확률분포정리(Common Probability Distributions: The Data Scientist’s Crib Sheet) (2) 저번에 이어서 2탄을 마저 이어서 해보자 t distribution은 앞서 설명했듯이 맥주품질을 관리하던 William Gosset이 만든 함수인데적은 표본으로도 최대한 결과를 얻어내기 위한 스마트한 방법이라고 설명하였다. 적은표본이기 대문에 normal Distribution에 비해 꼬리부분이 두껍다.그리고 n이 많아지면 많아질수록 normal distribution에 수렴한다.그림으로 살펴보면 점점 꼬리가 얇아지는것을 확인 할 수 있다. t distribution을 통해 대표적으로 평균이 얼마인지(분산은 모를때) 가설검정을 할대 t-test로 많이 쓰인다. 다음은 chi-square distribution이다. chi-square distribution은 normal distribution을 제곱하여.. 더보기
William Sealy Gosset과 t분포(t distribution) 여러가지 분포를 다루다가 문득 생겨난 궁금증이 있다. 분포이름이 Student t Distribution?? 학생 t?그래서 t-Distribution이 어떻게 탄생하게 되었는지 구글링을 하여 영문위키와 관련된 글들을 참고로 해서 써보겠다. William Sealy Gosset 은 수학과 화학을 전공하였고 우리가 흔히 알고 있는 아일랜드 더블린의 기네스 맥주(우리가 마시는 맥주도 윌리엄 고셋의 노력이 들어가있다?!) 회사에 입사하였다. 그는 열정이 넘쳐서 최적의 술맛을 내기 위해 주조 방법, 보리를 재배 등에서 여러 통계적 지식을 적용했다. 그는 일하며 공부하고 시행착오를 겪으며(이상적인 회사원이다!) 저명한 Biometrical(식물 측정학??)로 유명한 칼 피어슨(Karl Pearson) (이때만해도.. 더보기
확률분포정리(Common Probability Distributions: The Data Scientist’s Crib Sheet) (1) 처음 통계학에서 여러가지 분포를 배울때 그것을 외울때 특히 분포의 이름이 분포와 매칭이 쉽게 되지 않을 때 여러가지 분포를 종이에 적어놓고 화살표로 이어가며 이야기의 흐름처럼 정리했던 기억이 났는데 그종이가 어디갔지? 그래서 구글링을 통해 괜찮게 정리된 포스팅이 있어 참고해 보고자 한다.https://blog.cloudera.com/blog/2015/12/common-probability-distributions-the-data-scientists-crib-sheet/ 가장 먼저 시작할 것은 바로 베르누이 분포(Bernoulli Distribution)이다. 베르누이 분포는 분포중에서 가장 쉽다. 흔히 확률하면 떠오르는 것이 동전이다. 즉 동전 앞뒤를 나타내는 분포이다.0(앞)이 나오거나 1(뒤)이 나오.. 더보기