- 공분산과 상관계수
변수간 관련성이란?
- 두변수간 서로 관련성이 있는지? 즉 한 변수가 변해감에 따라 다른 변수가 함께 변해가는가?
- 상관관계와 인과관계
엄밀하게 통제된 실험설계에서는 상관관계를 인과관계로 해석 가능
하지만 조사연구에서는 상관관계를 인과관계 보다는 변수간 '상호관련성'으로 해석해야함
1-1. 공분산
▣ 공분산
- 두 변수가 동시에 변하는 정도로, 한 변수가 얼마만큼 변할 때 다른 변수는 얼마만큼 변해가는 지의 정도를 X와 Y의 평균 (𝑋̄, 𝑌̄)을 기준으로 계산
- X 변수의 편차와 Y 변수의 편차를 구하여 곱한 값들의 평균.
▣ 공분산의 특징
■ 지역독립성 (location-free) → 충족
□ 두 변수에 일정한 값을 규칙적으로 더하거나 빼도 동일 수치
□ 평균도 함께 변하기 때문
■ 척도독립성 (scale-free) → 미충족 : 어떤 값을 규칙적으로 각기 두 변수에 곱하거나 나누어 주어도 상관계수는 변하지 않음.
□ 어떤 값을 두 변수에 곱하거나 나누어 주면, 즉 척도가 달라지면, 공분산 수치가 변화
□ 따라서, 공분산의 크기만 가지고는 두 변수 간 관련성의 크기를 추정하기 어렵다
▣ 상관계수의 특징
■ 지역독립성 (location-free) → 충족 : 두 변수에 일정한 값을 규칙적으로 더하거나 빼도 상관계수 변하지 않음.
■ 척도독립성 (scale-free) → 충족 : 어떤 값을 규칙적으로 각기 두 변수에 곱하거나 나누어 주어도 상관계수는 변하지 않음.
▣ 상관계수의 해석
■ 범위: -1.0 에서 +1.0 사이
■ 부호:
- 양수 → 한 변수의 값이 커지면 다른 변수의 값도 함께 커진다는 것을 의미
- 음수 → 한 변수의 값이 커지면 다른 변수의 값은 반대로 작아진다는 것을 의미
■ 절대값:
- 절대값이 1.0에 가까워질수록 상관관계가 커지고
- 절대값이 0.0에 가까워질수록 상관관계가 약해진다는 것을 의미
상관관계 SPSS
- 상관계수의 해석
상관계수의 기본가정
-정규분포가정 X, Y 연속변수이고 정규분포
-선형성 가정 : 경향성이 있어야 함.
-등분산성 가정 : 두 변수들을 대표하는 직선을 그었을때 독립변수의 어떤 지점에서도 종속변수의 흩어진 정도가 같음을 말함.
-이상점(outlier)가 없어야 함.
상관계수에 영향을 미치는 요인들
- Outlier 이상치 존재
- 범위의 제한, 자료의 절단(자료의 특성상 두 변수 중에 한 변수 이든 혹은 두 변수 모두이든 변수가 절단되었을때 상관계수의 해석에 주의를 기울어야 한다.)
- 이질적 하위집단의 존재
상관관계를 인과관계로 해석하는데 있어서 주의해야하는 이유
- 역관계의 가능성
- 제3 변수의 개입 가능성
- 매개변수와 조절변수
매개변수
조절변수 -> 상호작용효과
▣ 인과관계 추정을 위한 기본조건
■ 원인과 결과의 공변성:
- 원인과 결과는 일관성이 있는 특정한 공변성을 가져야
□ 즉 원인이 생기거나, 사라지거나, 증가하거나, 감소하거나 변화하면,
그에 따라서 결과에서도 일관된 변화가 발생하여야!
■ 원인의 선행성:
- 원인에서의 변화가 결과에서의 변화보다 시간적으로 먼저 발생하여야
■ 기타 현상의 불변성:
- 원인에서의 변화와 결과에서의 변화를 제외한
나머지 모든 현상이 불변이어야
특수상관계수
▣ Spearman의 등위상관계수
- 석차로 이루어진 데이터 혹은 석차로 변환한 데이터에 Pearson의 적률상관계수 공식을 직접 적용 : 원자료가 지니고 있는 정보를 상실했기에 서열점수에 의한 등위상관계수는 적률상관계수보다 낮게 나온다.
▣ 양류상관계수
- 한 변수는 연속변수이지만 다른 한 변수는 이분변수인 두 변수에 대해서 Pearson의 적률상관계수 공식을 직접 적용. 현대통계학에서는 Karl Pearson의 단순적률상관계수 공식으로 추정함.
▣ 양분상관계수
- 독립변수, 종속변수 모두 양적변수였으나 양적인 독립변수를 연구자가 임의기준에 따라 이분하여 인위적으로 이분된 독립변수와 양적인 종속변수의 상관을 추정하기 위해 사용됨.
▣ 파이계수
- 두 변수 모두 이분변수인 경우, 이 두 변수에 대해서 Pearson의 적률상관계수 공식을 직접 적용
▣ 부분상관과 준부분상관
■ 부분상관 혹은 편상관 (partial correlation)
- 세 개 이상의 변수들이 상호상관을 갖는 경우에, 그 중에서 두 변수만의 고유한 관계를 측정하기 위한 상관
- 변수 X1, X2, X3가 상호상관을 갖는 경우에, X1과 X2 모두에서 X3의 영향을 통제하고 난 후에 X1과 X2가 갖는 고유상관
■ 준부분상관 (semipartial correlation, part correlation)
- 여러 변수가 상호 상관을 갖는 경우에 두 변수 중 한 변수에 대해서만 제3의 변수의 영향을 통제하고 난 후 구한 상관
서울대학교 교육통계 강의 자료. 사범대학교 교육학과 박현정교수
성태제(2019). 현대기초통계학 이해와 적용 제 8판. 학지사. pp, 121-168.
'교육연구방법' 카테고리의 다른 글
교육연구과 통계검증(13)- 이원분산분석 (0) | 2025.04.16 |
---|---|
교육연구과 통계검증(12)- 일원분산분석 (0) | 2025.04.15 |
교육연구과 통계검증(11)- 중다회귀분석 (1) | 2025.04.11 |
교육연구과 통계검증(10)- 회귀 (0) | 2025.04.11 |
교육연구과 통계검증(8)- t검증 (1) | 2025.04.09 |
교육연구와 통계방법(7) - 가설검증의 관점(불편파성, 구간추정, 표본크기) (0) | 2025.04.08 |
교육연구와 통계방법(6)- 가설검증 (0) | 2025.04.08 |
교육연구와 통계방법(5) -정규분포, 표집분포 (0) | 2025.04.07 |