상관관계 분석: Difference between revisions

From IT위키
No edit summary
No edit summary
Line 8: Line 8:
* 강도
* 강도
** 상관관계의 강하고 약하고의 정도
** 상관관계의 강하고 약하고의 정도
** -1 ~ +1의 상관계수에서 +1 또는 -1에 가까우면 강한 상관관계, 0에 가까우면 음의 상관관계
** 강한 상관관계일수록 공분산, 또는 상관계수의 크기가 큼
** 약한 상관관계일수록 공분산, 또는 상관계수의 크기가 작음


== 상관계수 ==
== 공분산과 [[상관계수]] ==
=== [[공분산]] ===
Covariance
2개의 변수 사이의 상관 정도로, 범위의 영향을 크게 받음
* COV(X,Y) = E(X-μ<sub>x</sub>)(Y-μ<sub>y</sub>)
* 양의 상관이면 공분산이 +로 점점 더 커짐
* 음의 상관이면 공분산이 -로 점점 더 작아짐
* 상관이 없으면 0에 가까움
* 범위의 영향이 적도록 표준화한 것이 상관계수
 
=== [[상관계수]] ===
Correlation Coefficient
Correlation Coefficient
* 일반적으로 -1 ~ +1까지의 범위로 나타남
* 일반적으로 -1 ~ +1까지의 범위로 나타남
** 1인 경우: 완벽한 양의 상관관계
** 표본 상관계수: [[피어슨 상관계수]]
** -1인 경우: 완벽한 음의 상관관계
* 1인 경우: 완벽한 양의 상관관계
** 0인 경우: 상관관계가 없음
* -1인 경우: 완벽한 음의 상관관계
* 예시
* 0인 경우: 상관관계가 없음
** [[피어슨 상관계수]]


== 변수의 수 ==
== 변수의 수 ==

Revision as of 21:56, 12 December 2020

Correlation

한 변수와 다른 변수가 함께 변하는 함수관계

방향성과 강도

  • 방향성
    • 양의 상관관계: X가 증가할 때 Y가 증가
    • 음의 상관관계: X가 증가할 때 Y가 감소
  • 강도
    • 상관관계의 강하고 약하고의 정도
    • 강한 상관관계일수록 공분산, 또는 상관계수의 크기가 큼
    • 약한 상관관계일수록 공분산, 또는 상관계수의 크기가 작음

공분산과 상관계수

공분산

Covariance 2개의 변수 사이의 상관 정도로, 범위의 영향을 크게 받음

  • COV(X,Y) = E(X-μx)(Y-μy)
  • 양의 상관이면 공분산이 +로 점점 더 커짐
  • 음의 상관이면 공분산이 -로 점점 더 작아짐
  • 상관이 없으면 0에 가까움
  • 범위의 영향이 적도록 표준화한 것이 상관계수

상관계수

Correlation Coefficient

  • 일반적으로 -1 ~ +1까지의 범위로 나타남
  • 1인 경우: 완벽한 양의 상관관계
  • -1인 경우: 완벽한 음의 상관관계
  • 0인 경우: 상관관계가 없음

변수의 수

  • 단순상관분석: 2개의 변수 간 상관관계 분석
  • 다중상관분석: 3개 이상의 변수 간 상관간계 분석
  • 편상관계분석: 다중상관분석에서 다른 변수와의 관계를 고정하고 나머지 두 변수 간 상관관계 분석

상관관계와 인과관계

상관관계는 단순히 변수간 선형 상관성을 의미할 뿐, 인과관계로 볼 수는 없다

  • 인과관계: 원인과 결과의 관계
    • ex) 저녁을 먹었기 때문에 배가 부르다
  • 상관관계: 변수간의 선형 상관성
    • ex) 저녁을 먹는 양에 따라 배 부른 정도가 증가한다.