P-value란?

검정통계량에대한 확률로, 우리가 얻은 검정통계량보다 크거나 같은 값을 얻을 수 있는 확률

여기서 계산하는 검정통계량들은 대부분이 귀무가설을 가정하고 얻게되는 값이라는점!

p-value는 귀무가설을 기각하면 안되는데, 기각할 확률이다. 여기서 귀무가설을 잘못 기각했는지, 맞게 기각했는지 확인할 수 없다.

가설검증이라는 것은 전체 데이터의 일부만을 추출하여 평균을 내고, 그 평균이 전체 데이터의 평균을 잘 반영한다는 가정 하에 전체 데이터의 평균을 구하는 작업인데, 아무리 무작위 추출을 잘한다 하더라도 추출된 데이터의 평균은 전체 데이터의 평균에서 멀어질 수 있음.
따라서 내가 추출한 데이터의 평균이 원래의 전체 데이터의 평균과 얼마나 다른 값인지를 알 수 있는 방법이 필요함. 그래서 나온게 p-value

t-value는 두 표본에 대해서 표본 집단 평균 간의 차이에, 그 차이에 대한 불확실도를 나눠줌으로써 집단간의 차이와 이 차이가 얼마나 확실한지를 한꺼번에 설명해준다. 그래서 검정통계량만을 제시함으로써 엄밀하고도 편리한 방식으로 두 표본 집단간의 차이를 표현할 수 있게 되었다.

그러나 t-분포는 표본수(자유도)에 따라 모양이 다르다보니 같은 t-value라고 하더라도 표본수에 따라서 표본 간의 차이가 충분히 크다고 할 수도 있고, 그렇지 않다고 할 수도 있는것이다. 그렇기에 p-value와 같은 확률로 유의성을 점검할 수 있는 지표로 기재했기에, 표본수에 관계없이, 검정통계량의 분포의 모양에 상관없이 확률이라는 값 하나만 기재하여 헷갈리지 않게 사용하는것.

P값이 선택된 유의수준보다 작다면, 귀무가설 $H_0$을 기각하고, 대립가설$H_a$을 수용.
P값이 유의수준보다 크거나 같다면, 귀무가설을 기각하지 못함 → 그러나 무조건적으로 $H_0$을 수용한다는 뜻은 아님!

출처 : 칸아카데미, 공대생의수학노트

'Statistics' 카테고리의 다른 글

Covariance and Correlation 상관계수  (0) 2021.01.27
Chi-Square Test  (0) 2021.01.27
T-Test, Chi-Square  (0) 2021.01.27
Type of Error  (0) 2021.01.27
Hypothesis Test 가설검정  (0) 2021.01.27

+ Recent posts