P-값 (유의 확률, P-value)

P-값이 뭐지?

유의 확률(有意 確率, 영어: significance probability, asymptotic significance) 또는 p-값(영어: p-value, probability value)은 귀무가설이 맞다고 가정할 때 얻은 결과보다 극단적인 결과가 실제로 관측될 확률이다. 실험의 유의확률은 실험의 표본 공간에서 정의되는 확률변수로서, 0~1 사이의 값을 가진다.
p-값(p-value)은 귀무 가설(null hypothesis)이 맞다는 전제 하에, 표본에서 실제로 관측된 통계치와 '같거나 더 극단적인' 통계치가 관측될 확률이다. 여기서 말하는 확률은 '빈도주의' (frequentist) 확률이다.
- 위키백과

모르고 보면 말이 헷갈리는데, 한 마디로 '귀무가설이 맞다고 볼 수 있는 확률'이다.
조금 더 구체적으로 표현하면 '귀무가설이 참이라는 것을 표본이 나타낼 확률'이다

단순하게 '귀무가설이 맞을 확률'이라고 단정지을 수 있을 것 같은데, 이는 옳지 못하다.
왜냐하면 뽑아낸 표본이 어쩌다 보니 귀무가설이 틀렸다고 말할 수도 있는데 실제로는 맞을 수도 있고(제1종 오류),
반대로 표본이 귀무가설을 맞다고 하는데 실제로는 틀릴 수도 있기 때문이다(제2종 오류).

P-값이 0.05보다 크면 귀무가설이 맞다고 볼 수 있으며(귀무가설 채택, 대안가설 기각),
반대로 0.05보다 작으면 귀무가설이 틀렸다고 볼 수 있다(귀무가설 기각, 대안가설 채택).

<참고 자료>
유의 확률 - 위키백과
1종 오류와 2종 오류 - 위키백과
P값을 올바르게 해석하는 방법 How to Correctly Interpret P Values
p-value의 의미
1종 오류와 2종 오류

+ Recent posts