스튜던트 t 분포
확률 밀도 함수
|
|
누적 분포 함수
|
|
매개변수
|
자유도(실수값)
|
지지집합
|
|
확률 밀도
|
|
누적 분포
|
, 여기에서 은 초기하함수
|
기댓값
|
일 때 0, 나머지는 정의되지 않음
|
중앙값
|
0
|
최빈값
|
0
|
분산
|
( ), ( ), 나머지는 정의되지 않음
|
비대칭도
|
일 때 0
|
적률생성함수
|
정의되지 않음
|
특성함수
|
, 는 베셀 함수
|
스튜던트 t 분포(Student t分布, 영어: Student’s t-distribution)는 정규 분포의 평균을 측정할 때 주로 사용되는 분포이다.
정의
스튜던트 t 분포는 다음 확률변수의 분포로 정의된다.

여기에서
는 표준정규분포,
는 자유도
인 카이제곱 분포이다.
t 분포는 종모양으로서 t=0에서 좌우대칭을 이룬다. t 분포의 모양을 결정하는 것은 자유도이며, 자유도가 커질수록 표준정규분포에 가깝게 된다.[1]:194
정규분포에서의 추정
어떤 정규분포의 평균이
이고 분산이
일 때, 그 분포에서 n개의 표본을 추출한 것을
라고 표기한다. 표본평균과 표본분산은 다음과 같다.


이 값들은 실제 평균과 분산에 대한 불편추정값이다. 이때,

은 자유도가
인 카이제곱 분포가 된다는 것이 Cochran 정리에 의해 알려져 있다. 또한

는 평균이 0이고 분산이 1인 정규분포를 가지며,
는 서로 독립이라는 것을 증명할 수 있다.
이때
에서
대신
로 대체한 추축량(pivot quantity)은 다음과 같다.

이때
에는
가 사용되지 않으므로, 이 분포는 분산을 모를 때의 평균값
를 추정하는 데에 사용이 가능하다. 이때
의 분포는 자유도 n-1인 t-분포가 된다.
구간 추정
자유도 n-1인 t 분포
에 대해,

을 만족하는 실수
는 수치적으로 계산이 가능하다. 이때,

이므로, 정규분포의 평균은 90%의 신뢰도로
신뢰구간에 속하게 된다.
역사
프리드리히 로베르트 헬메르트(독일어: Friedrich Robert Helmert)가 1875년에 도입하였다.[2][3][4][5] 이듬해 야코프 뤼로트(독일어: Jacob Lüroth)도 같은 분포를 재발견하였다.[6][7] 그러나 헬메르트와 뤼로트의 논문은 영문 학계에 널리 알려지지 않았다.
1908년에 윌리엄 고셋이 "스튜던트"(영어: Student, ‘학생’)라는 필명으로 1908년 재발견하였다.[8] 고셋은 기네스 양조 공장에서 일했고, 맥주에 사용되는 보리의 질을 시험하기 위해 이 분포를 도입하였고, 경쟁사들에게 기네스의 획기적인 통계 기법을 숨기기 위해 필명을 사용하였다고 한다.[9]:326 이후 저명한 통계학자인 로널드 피셔는 이 분포를 "스튜던트 분포"라고 불렀고, t라는 기호를 사용하였다.[10] 피셔 이후 이 분포는 고셋의 필명을 따 "스튜던트 t 분포"로 알려지게 되었다.
각주
같이 보기