통계적 가설 검정

From IT위키

분류:데이터 과학분류:기술사 기출

Statistical Hypothesis Test
표본에서 얻은 사실을 근거로 하여 모집단에 대한 가설이 맞는지 통계적으로 검정하는 분석 방법
  • 모집단의 특성에 대한 통계적 가설을 모집단으로 부터 추출한 표본을 사용하여 검토하는 통계적인 추론 과정
  • 증명된 바 없는 주장이나 가설을 표본 통계량에 입각하여 주장이나 가설의 진위 여부를 판단, 증명, 검정하는 통계적 추론 방식
  • 통계적인 유의성을 검정하는 것으로, 유의성 검정(Significance Test)이라고도 함

구성[edit | edit source]

  • 귀무가설(Null Hypothesis): 직접 검정 대상이 되는 가설
    • 증명된 바 없는 주장이나 가설로, 우선은 이 귀무가설이 옳다고 가정
    • 귀무가설은 기각(reject)이 목표
    • 일반적으로 H0로 표기
  • 대립가설(Alternative Hypothesis): 귀무가설에 대립되는 가설
    • 새로운 주장 또는 실제로 입증하고 싶은 가설
    • 대립가설은 채택(accept)이 목표
    • 일반적으로 H1로 표기
  • 임계값(Critical Value)
    • 주어진 유의수준에서 귀무가설의 채택과 기각에 관련된 의사결정 기준값
  • 유의 수준(Level of Significance)
    • 귀무가설이 실제 옳음에도 기각할 오류의 수준(위험 부담)
    • 일반적으로 α로 표기
    • 0.05 라는 값을 가장 흔하게 사용

절차[edit | edit source]

  • 1. 가설 설정
  • 2. 유의수준 결정
  • 3. 통계 분석
  • 4. 임계값과 유의수준 비교
  • 5. 기각 또는 채택

예시[edit | edit source]

  • 상황
    • 어떤 회사의 계약직의 지난해 평균 월급은 150만 원, 표준편차는 12만 원이었다고 한다.
  • 가설 설정
    • 올해는 그보다 높을 것이라고 생각하여 표본 조사를 실시하기로 하였다.
    • 귀무가설(H0) : 평균 월급 = 150만 원
    • 대립가설(H1) : 평균 월급 > 150만 원
  • 유의수준 설정
    • 유의수준은 α = 0.05 로 설정하였다.
  • 통계 분석
    • 임의로 계약직 사원 100명을 뽑아 평균 월급을 조사하였다.
    • 100명에 대한 조사 결과는 155만 원이었다.
  • 임계값과 유의수준 비교
    • 표준정규분포표를 이용하여 95%(1 - 0.05)에 해당하는 z값 1.645 를 이용
    • 1.645 = (임계값 - 150) / 1.2
    • 임계값 = 151.974
    • 155만 원 > 151.974만 원
  • 기각 또는 채택
    • 귀무가설 기각, 대립가설 채택
    • 즉, 올해 계약직 평균 월급은 작년의 150만 원보다 높다

두 가지 오류[edit | edit source]

  • 제1종 오류: 귀무가설이 참임에도 이를 기각하는 오류
  • 제2종 오류: 귀무가설이 거짓임에도 이를 채택하는 오류

기술사 기출[edit | edit source]

  • 정보관리기술사 111회 1교시
  • 정보관리기술사 121회 1교시

참고 문헌[edit | edit source]