본문 바로가기

통계학

William Sealy Gosset과 t분포(t distribution)

여러가지 분포를 다루다가 문득 생겨난 궁금증이 있다.


분포이름이 Student t Distribution??


학생 t?

그래서 t-Distribution이 어떻게 탄생하게 되었는지 구글링을 하여 영문위키와 관련된 글들을 참고로 해서 써보겠다.





 William Sealy Gosset 은 수학과 화학을 전공하였고 우리가 흔히 알고 있는 아일랜드 더블린의 기네스 맥주(우리가 마시는 맥주도 윌리엄 고셋의 노력이 들어가있다?!) 회사에 입사하였다. 그는 열정이 넘쳐서 최적의 술맛을 내기 위해 주조 방법, 보리를 재배 등에서 여러 통계적 지식을 적용했다. 


 그는 일하며 공부하고 시행착오를 겪으며(이상적인 회사원이다!) 저명한 Biometrical(식물 측정학??)로 유명한 칼 피어슨(Karl Pearson)  (이때만해도 통계학과가 없었다. 칼 피어슨이 최초의 통계학과를 만듦)에게 도움을 구하면서 논문을 하나 썼다. 당시에 사용가능했던 분석방법은 그저 N을 많이 확보하는 방법이었는데 Gosset이 쓴 논문은 N이 많지 않을때 문제를 해결할 수 있는 방법에 관한 내용이었다.

 당시 Gosset이 이런 내용의 논문을 쓸 수 밖에 없었던 이유가 다른 Biometrical학계에서는 샘플을 왕창 구하는 것이 그다지 어려운 일이 아니었지만 Gosset이 일하는 맥주공장은 그렇지 않았기 때문이다. 역시 필요는 발명의 어머니!



 하지만 기네스사에선 영업비밀이 노출되는것을 꺼려 Gosset이 논문을 내는 것을 반대했다. 그래서 Gosset은 학생Student라는 필명으로 논문을 발표했다. 그래서 Gosset의 발견은 아직도 Student's t-distribution이라 불린다.


 당시 컴퓨터도 없었을텐데 인간 MonteCarlo가 되어 t분포의 테이블을 구했다고 한다. 연구자라 함은 머리도 좋아야하지만 근성도 있어야 하나보다.