통계적 가설 검정: Difference between revisions
From IT위키
No edit summary |
|||
(2 intermediate revisions by the same user not shown) | |||
Line 1: | Line 1: | ||
[[분류:데이터 과학]][[분류:기술사 기출]] | [[분류:데이터 과학]][[분류:기술사 기출]] | ||
;Statistical Hypothesis Test | ;Statistical Hypothesis Test | ||
;모집단의 특성에 대한 통계적 가설을 모집단으로 부터 추출한 표본을 사용하여 검토하는 통계적인 추론 과정 | ;표본에서 얻은 사실을 근거로 하여 모집단에 대한 가설이 맞는지 통계적으로 검정하는 분석 방법 | ||
* 모집단의 특성에 대한 통계적 가설을 모집단으로 부터 추출한 표본을 사용하여 검토하는 통계적인 추론 과정 | |||
* 증명된 바 없는 주장이나 가설을 표본 통계량에 입각하여 주장이나 가설의 진위 여부를 판단, 증명, 검정하는 통계적 추론 방식 | |||
* 통계적인 유의성을 검정하는 것으로, 유의성 검정(Significance Test)이라고도 함 | * 통계적인 유의성을 검정하는 것으로, 유의성 검정(Significance Test)이라고도 함 | ||
== 구성 == | |||
* '''[[귀무가설|귀무가설(Null Hypothesis)]]''': 직접 검정 대상이 되는 가설 | |||
** 증명된 바 없는 주장이나 가설로, 우선은 이 귀무가설이 옳다고 가정 | |||
** 귀무가설은 기각(reject)이 목표 | |||
** 일반적으로 '''H<sub>0</sub>'''로 표기 | |||
* '''[[대립가설|대립가설(Alternative Hypothesis)]]''': 귀무가설에 대립되는 가설 | |||
** 새로운 주장 또는 실제로 입증하고 싶은 가설 | |||
** 대립가설은 채택(accept)이 목표 | |||
** 일반적으로 '''H<sub>1</sub>'''로 표기 | |||
* '''임계값(Critical Value)''' | |||
** 주어진 유의수준에서 귀무가설의 채택과 기각에 관련된 의사결정 기준값 | |||
* '''유의 수준(Level of Significance)''' | |||
** 귀무가설이 실제 옳음에도 기각할 오류의 수준(위험 부담) | |||
** 일반적으로 '''α'''로 표기 | |||
** 0.05 라는 값을 가장 흔하게 사용 | |||
== 절차 == | |||
* 1. 가설 설정 | |||
* 2. 유의수준 결정 | |||
* 3. 통계 분석 | |||
* 4. 임계값과 유의수준 비교 | |||
* 5. 기각 또는 채택 | |||
== 예시 == | |||
* '''상황''' | |||
** 어떤 회사의 계약직의 지난해 평균 월급은 150만 원, 표준편차는 12만 원이었다고 한다. | |||
* '''가설 설정''' | |||
** 올해는 그보다 높을 것이라고 생각하여 표본 조사를 실시하기로 하였다. | |||
** 귀무가설(H<sub>0</sub>) : 평균 월급 = 150만 원 | |||
** 대립가설(H<sub>1</sub>) : 평균 월급 > 150만 원 | |||
* '''유의수준 설정''' | |||
** 유의수준은 α = 0.05 로 설정하였다. | |||
* '''통계 분석''' | |||
** 임의로 계약직 사원 100명을 뽑아 평균 월급을 조사하였다. | |||
** 100명에 대한 조사 결과는 155만 원이었다. | |||
* '''임계값과 유의수준 비교''' | |||
** [[표준정규분포표]]를 이용하여 95%(1 - 0.05)에 해당하는 z값 1.645 를 이용 | |||
** 1.645 = (임계값 - 150) / 1.2 | |||
** 임계값 = 151.974 | |||
** 155만 원 > 151.974만 원 | |||
* '''기각 또는 채택''' | |||
** 귀무가설 기각, 대립가설 채택 | |||
** 즉, 올해 계약직 평균 월급은 작년의 150만 원보다 높다 | |||
== 두 가지 오류 == | |||
* [[제1종 오류]]: 귀무가설이 참임에도 이를 기각하는 오류 | |||
* [[제2종 오류]]: 귀무가설이 거짓임에도 이를 채택하는 오류 | |||
== 기술사 기출 == | == 기술사 기출 == | ||
* 정보관리기술사 111회 1교시 | * 정보관리기술사 111회 1교시 | ||
* 정보관리기술사 121회 1교시 | * 정보관리기술사 121회 1교시 | ||
== 참고 문헌 == | == 참고 문헌 == | ||
* https://blog.naver.com/PostView.nhn?blogId=mykepzzang&logNo=220884858347 | |||
* 정보관리기술사 121회 기출풀이 자료(아이리포 왕멘토) | * 정보관리기술사 121회 기출풀이 자료(아이리포 왕멘토) |
Latest revision as of 23:59, 9 May 2020
- Statistical Hypothesis Test
- 표본에서 얻은 사실을 근거로 하여 모집단에 대한 가설이 맞는지 통계적으로 검정하는 분석 방법
- 모집단의 특성에 대한 통계적 가설을 모집단으로 부터 추출한 표본을 사용하여 검토하는 통계적인 추론 과정
- 증명된 바 없는 주장이나 가설을 표본 통계량에 입각하여 주장이나 가설의 진위 여부를 판단, 증명, 검정하는 통계적 추론 방식
- 통계적인 유의성을 검정하는 것으로, 유의성 검정(Significance Test)이라고도 함
구성[edit | edit source]
- 귀무가설(Null Hypothesis): 직접 검정 대상이 되는 가설
- 증명된 바 없는 주장이나 가설로, 우선은 이 귀무가설이 옳다고 가정
- 귀무가설은 기각(reject)이 목표
- 일반적으로 H0로 표기
- 대립가설(Alternative Hypothesis): 귀무가설에 대립되는 가설
- 새로운 주장 또는 실제로 입증하고 싶은 가설
- 대립가설은 채택(accept)이 목표
- 일반적으로 H1로 표기
- 임계값(Critical Value)
- 주어진 유의수준에서 귀무가설의 채택과 기각에 관련된 의사결정 기준값
- 유의 수준(Level of Significance)
- 귀무가설이 실제 옳음에도 기각할 오류의 수준(위험 부담)
- 일반적으로 α로 표기
- 0.05 라는 값을 가장 흔하게 사용
절차[edit | edit source]
- 1. 가설 설정
- 2. 유의수준 결정
- 3. 통계 분석
- 4. 임계값과 유의수준 비교
- 5. 기각 또는 채택
예시[edit | edit source]
- 상황
- 어떤 회사의 계약직의 지난해 평균 월급은 150만 원, 표준편차는 12만 원이었다고 한다.
- 가설 설정
- 올해는 그보다 높을 것이라고 생각하여 표본 조사를 실시하기로 하였다.
- 귀무가설(H0) : 평균 월급 = 150만 원
- 대립가설(H1) : 평균 월급 > 150만 원
- 유의수준 설정
- 유의수준은 α = 0.05 로 설정하였다.
- 통계 분석
- 임의로 계약직 사원 100명을 뽑아 평균 월급을 조사하였다.
- 100명에 대한 조사 결과는 155만 원이었다.
- 임계값과 유의수준 비교
- 표준정규분포표를 이용하여 95%(1 - 0.05)에 해당하는 z값 1.645 를 이용
- 1.645 = (임계값 - 150) / 1.2
- 임계값 = 151.974
- 155만 원 > 151.974만 원
- 기각 또는 채택
- 귀무가설 기각, 대립가설 채택
- 즉, 올해 계약직 평균 월급은 작년의 150만 원보다 높다
두 가지 오류[edit | edit source]
기술사 기출[edit | edit source]
- 정보관리기술사 111회 1교시
- 정보관리기술사 121회 1교시
참고 문헌[edit | edit source]
- https://blog.naver.com/PostView.nhn?blogId=mykepzzang&logNo=220884858347
- 정보관리기술사 121회 기출풀이 자료(아이리포 왕멘토)