교육연구방법

교육연구과 통계검증(9)- 상관

밍티쳐 2025. 4. 11. 14:32
반응형
  1. 공분산과 상관계수

변수간 관련성이란?

  • 두변수간 서로 관련성이 있는지? 변수가 변해감에 따라 다른 변수가 함께 변해가는가?
  • 상관관계와 인과관계

엄밀하게 통제된 실험설계에서는 상관관계를 인과관계로 해석 가능

하지만 조사연구에서는 상관관계를 인과관계 보다는 변수간 '상호관련성'으로 해석해야함

 

1-1. 공분산

공분산

  • 두 변수가 동시에 변하는 정도로, 한 변수가 얼마만큼 변할 때 다른 변수는 얼마만큼 변해가는 지의 정도를 X Y의 평균 (𝑋̄, 𝑌̄)을 기준으로 계산
  • X 변수의 편차와 Y 변수의 편차를 구하여 곱한 값들의 평균.
  •  

공분산의 특징

지역독립성 (location-free)충족

두 변수에 일정한 값을 규칙적으로 더하거나 빼도 동일 수치

평균도 함께 변하기 때문

척도독립성 (scale-free)미충족 : 어떤 값을 규칙적으로 각기 변수에 곱하거나 나누어 주어도 상관계수는 변하지 않음.

어떤 값을 두 변수에 곱하거나 나누어 주면, 즉 척도가 달라지면, 공분산 수치가 변화

따라서, 공분산의 크기만 가지고는 두 변수 간 관련성의 크기를 추정하기 어렵다

 

상관계수의 특징

지역독립성 (location-free)충족 : 변수에 일정한 값을 규칙적으로 더하거나 빼도 상관계수 변하지 않음.

척도독립성 (scale-free)충족 : 어떤 값을 규칙적으로 각기 변수에 곱하거나 나누어 주어도 상관계수는 변하지 않음.

 

상관계수의 해석

범위: -1.0 에서 +1.0 사이

부호:

  • 양수한 변수의 값이 커지면 다른 변수의 값도 함께 커진다는 것을 의미
  • 음수한 변수의 값이 커지면 다른 변수의 값은 반대로 작아진다는 것을 의미

절대값:

  • 절대값이 1.0에 가까워질수록 상관관계가 커지고
  • 절대값이 0.0에 가까워질수록 상관관계가 약해진다는 것을 의미

 

상관관계 SPSS

 

  1. 상관계수의 해석

상관계수의 기본가정

-정규분포가정 X, Y 연속변수이고 정규분포

-선형성 가정 : 경향성이 있어야 .

-등분산성 가정 : 변수들을 대표하는 직선을 그었을때 독립변수의 어떤 지점에서도 종속변수의 흩어진 정도가 같음을 말함.

-이상점(outlier) 없어야 .

 

상관계수에 영향을 미치는 요인들

  • Outlier 이상치 존재
  • 범위의 제한, 자료의 절단(자료의 특성상 변수 중에 변수 이든 혹은 변수 모두이든 변수가 절단되었을때 상관계수의 해석에 주의를 기울어야 한다.)
  • 이질적 하위집단의 존재

 

상관관계를 인과관계로 해석하는데 있어서 주의해야하는 이유

  • 역관계의 가능성
  • 3 변수의 개입 가능성
  • 매개변수와 조절변수

매개변수

조절변수 -> 상호작용효과

 

인과관계 추정을 위한 기본조건

원인과 결과의 공변성:

  • 원인과 결과는 일관성이 있는 특정한 공변성을 가져야
    즉 원인이 생기거나, 사라지거나, 증가하거나, 감소하거나 변화하면,
    그에 따라서 결과에서도 일관된 변화가 발생하여야!

원인의 선행성:

  • 원인에서의 변화가 결과에서의 변화보다 시간적으로 먼저 발생하여야

기타 현상의 불변성:

  • 원인에서의 변화와 결과에서의 변화를 제외한
    나머지 모든 현상이 불변이어야

특수상관계수

Spearman의 등위상관계수

  • 석차로 이루어진 데이터 혹은 석차로 변환한 데이터에 Pearson의 적률상관계수 공식을 직접 적용 : 원자료가 지니고 있는 정보를 상실했기에 서열점수에 의한 등위상관계수는 적률상관계수보다 낮게 나온다.

 

양류상관계수

  • 한 변수는 연속변수이지만 다른 한 변수는 이분변수인 두 변수에 대해서 Pearson의 적률상관계수 공식을 직접 적용. 현대통계학에서는 Karl Pearson 단순적률상관계수 공식으로 추정함.

 

양분상관계수

  • 독립변수, 종속변수 모두 양적변수였으나 양적인 독립변수를 연구자가 임의기준에 따라 이분하여 인위적으로 이분된 독립변수와 양적인 종속변수의 상관을 추정하기 위해 사용됨.

 

파이계수

  • 두 변수 모두 이분변수인 경우, 이 두 변수에 대해서 Pearson의 적률상관계수 공식을 직접 적용

 

 

부분상관과 준부분상관

부분상관 혹은 편상관 (partial correlation)

  • 세 개 이상의 변수들이 상호상관을 갖는 경우에, 그 중에서 두 변수만의 고유한 관계를 측정하기 위한 상관
  • 변수 X1, X2, X3가 상호상관을 갖는 경우에, X1 X2 모두에서 X3의 영향을 통제하고 난 후에 X1 X2가 갖는 고유상관

준부분상관 (semipartial correlation, part correlation)

  • 여러 변수가 상호 상관을 갖는 경우에 두 변수 중 한 변수에 대해서만 제3의 변수의 영향을 통제하고 난 후 구한 상관

 

서울대학교 교육통계 강의 자료. 사범대학교 교육학과 박현정교수

성태제(2019). 현대기초통계학 이해와 적용 8. 학지사. pp, 121-168.

 

반응형