통계적 가설 검정: Difference between revisions

From IT위키
(새 문서: 분류:데이터 과학분류:기술사 기출 ;Statistical Hypothesis Test ;모집단의 특성에 대한 통계적 가설을 모집단으로 부터 추출한 표본을 사...)
 
No edit summary
 
(2 intermediate revisions by the same user not shown)
Line 1: Line 1:
[[분류:데이터 과학]][[분류:기술사 기출]]
[[분류:데이터 과학]][[분류:기술사 기출]]
;Statistical Hypothesis Test
;Statistical Hypothesis Test
;모집단의 특성에 대한 통계적 가설을 모집단으로 부터 추출한 표본을 사용하여 검토하는 통계적인 추론 과정
;표본에서 얻은 사실을 근거로 하여 모집단에 대한 가설이 맞는지 통계적으로 검정하는 분석 방법
* 모집단의 특성에 대한 통계적 가설을 모집단으로 부터 추출한 표본을 사용하여 검토하는 통계적인 추론 과정
* 증명된 바 없는 주장이나 가설을 표본 통계량에 입각하여 주장이나 가설의 진위 여부를 판단, 증명, 검정하는 통계적 추론 방식
* 통계적인 유의성을 검정하는 것으로, 유의성 검정(Significance Test)이라고도 함
* 통계적인 유의성을 검정하는 것으로, 유의성 검정(Significance Test)이라고도 함
== 구성 ==
* '''[[귀무가설|귀무가설(Null Hypothesis)]]''': 직접 검정 대상이 되는 가설
** 증명된 바 없는 주장이나 가설로, 우선은 이 귀무가설이 옳다고 가정
** 귀무가설은 기각(reject)이 목표
** 일반적으로 '''H<sub>0</sub>'''로 표기
* '''[[대립가설|대립가설(Alternative Hypothesis)]]''': 귀무가설에 대립되는 가설
** 새로운 주장 또는 실제로 입증하고 싶은 가설
** 대립가설은 채택(accept)이 목표
** 일반적으로 '''H<sub>1</sub>'''로 표기
* '''임계값(Critical Value)'''
** 주어진 유의수준에서 귀무가설의 채택과 기각에 관련된 의사결정 기준값
* '''유의 수준(Level of Significance)'''
** 귀무가설이 실제 옳음에도 기각할 오류의 수준(위험 부담)
** 일반적으로 '''α'''로 표기
** 0.05 라는 값을 가장 흔하게 사용
== 절차 ==
* 1. 가설 설정
* 2. 유의수준 결정
* 3. 통계 분석
* 4. 임계값과 유의수준 비교
* 5. 기각 또는 채택
== 예시 ==
* '''상황'''
** 어떤 회사의 계약직의 지난해 평균 월급은 150만 원, 표준편차는 12만 원이었다고 한다.
* '''가설 설정'''
** 올해는 그보다 높을 것이라고 생각하여 표본 조사를 실시하기로 하였다.
** 귀무가설(H<sub>0</sub>) : 평균 월급 = 150만 원
** 대립가설(H<sub>1</sub>) : 평균 월급 > 150만 원
* '''유의수준 설정'''
** 유의수준은 α = 0.05 로 설정하였다.
* '''통계 분석'''
** 임의로 계약직 사원 100명을 뽑아 평균 월급을 조사하였다.
** 100명에 대한 조사 결과는 155만 원이었다.
* '''임계값과 유의수준 비교'''
** [[표준정규분포표]]를 이용하여 95%(1 - 0.05)에 해당하는 z값 1.645 를 이용
** 1.645 = (임계값 - 150) / 1.2
** 임계값 = 151.974
** 155만 원 > 151.974만 원
* '''기각 또는 채택'''
** 귀무가설 기각, 대립가설 채택
** 즉, 올해 계약직 평균 월급은 작년의 150만 원보다 높다
== 두 가지 오류 ==
* [[제1종 오류]]: 귀무가설이 참임에도 이를 기각하는 오류
* [[제2종 오류]]: 귀무가설이 거짓임에도 이를 채택하는 오류


== 기술사 기출 ==
== 기술사 기출 ==
* 정보관리기술사 111회 1교시
* 정보관리기술사 111회 1교시
* 정보관리기술사 121회 1교시
* 정보관리기술사 121회 1교시
== 같이 보기 ==
* [[귀무가설]]
* [[대립가설]]
* [[1종 오류]]
* [[2종 오류]]


== 참고 문헌 ==
== 참고 문헌 ==
* https://blog.naver.com/PostView.nhn?blogId=mykepzzang&logNo=220884858347
* 정보관리기술사 121회 기출풀이 자료(아이리포 왕멘토)
* 정보관리기술사 121회 기출풀이 자료(아이리포 왕멘토)

Latest revision as of 23:59, 9 May 2020

분류:데이터 과학분류:기술사 기출

Statistical Hypothesis Test
표본에서 얻은 사실을 근거로 하여 모집단에 대한 가설이 맞는지 통계적으로 검정하는 분석 방법
  • 모집단의 특성에 대한 통계적 가설을 모집단으로 부터 추출한 표본을 사용하여 검토하는 통계적인 추론 과정
  • 증명된 바 없는 주장이나 가설을 표본 통계량에 입각하여 주장이나 가설의 진위 여부를 판단, 증명, 검정하는 통계적 추론 방식
  • 통계적인 유의성을 검정하는 것으로, 유의성 검정(Significance Test)이라고도 함

구성[edit | edit source]

  • 귀무가설(Null Hypothesis): 직접 검정 대상이 되는 가설
    • 증명된 바 없는 주장이나 가설로, 우선은 이 귀무가설이 옳다고 가정
    • 귀무가설은 기각(reject)이 목표
    • 일반적으로 H0로 표기
  • 대립가설(Alternative Hypothesis): 귀무가설에 대립되는 가설
    • 새로운 주장 또는 실제로 입증하고 싶은 가설
    • 대립가설은 채택(accept)이 목표
    • 일반적으로 H1로 표기
  • 임계값(Critical Value)
    • 주어진 유의수준에서 귀무가설의 채택과 기각에 관련된 의사결정 기준값
  • 유의 수준(Level of Significance)
    • 귀무가설이 실제 옳음에도 기각할 오류의 수준(위험 부담)
    • 일반적으로 α로 표기
    • 0.05 라는 값을 가장 흔하게 사용

절차[edit | edit source]

  • 1. 가설 설정
  • 2. 유의수준 결정
  • 3. 통계 분석
  • 4. 임계값과 유의수준 비교
  • 5. 기각 또는 채택

예시[edit | edit source]

  • 상황
    • 어떤 회사의 계약직의 지난해 평균 월급은 150만 원, 표준편차는 12만 원이었다고 한다.
  • 가설 설정
    • 올해는 그보다 높을 것이라고 생각하여 표본 조사를 실시하기로 하였다.
    • 귀무가설(H0) : 평균 월급 = 150만 원
    • 대립가설(H1) : 평균 월급 > 150만 원
  • 유의수준 설정
    • 유의수준은 α = 0.05 로 설정하였다.
  • 통계 분석
    • 임의로 계약직 사원 100명을 뽑아 평균 월급을 조사하였다.
    • 100명에 대한 조사 결과는 155만 원이었다.
  • 임계값과 유의수준 비교
    • 표준정규분포표를 이용하여 95%(1 - 0.05)에 해당하는 z값 1.645 를 이용
    • 1.645 = (임계값 - 150) / 1.2
    • 임계값 = 151.974
    • 155만 원 > 151.974만 원
  • 기각 또는 채택
    • 귀무가설 기각, 대립가설 채택
    • 즉, 올해 계약직 평균 월급은 작년의 150만 원보다 높다

두 가지 오류[edit | edit source]

  • 제1종 오류: 귀무가설이 참임에도 이를 기각하는 오류
  • 제2종 오류: 귀무가설이 거짓임에도 이를 채택하는 오류

기술사 기출[edit | edit source]

  • 정보관리기술사 111회 1교시
  • 정보관리기술사 121회 1교시

참고 문헌[edit | edit source]