반응형

SPSS 통계 이용방법 가이드: 17일차 - 군집 분석(Cluster Analysis) 고급 활용

오늘은 SPSS의 **군집 분석(Cluster Analysis)**을 고급 수준으로 활용하는 방법을 알아보겠습니다. 기본적인 군집 분석(계층적 군집 분석, K-Means 분석)은 이미 6일차에서 다뤘습니다. 이번에는 더 복잡한 데이터 구조를 분석하거나 군집 품질을 평가하는 심화 기법을 소개합니다.


1. 군집 분석 고급 활용이란?

기본 군집 분석에서 고급으로 확장하기

  • 특징:
    • 데이터 전처리(표준화)와 변수 선택 최적화.
    • 군집 품질 평가와 해석 강화.
    • 혼합 데이터(명목형 + 연속형)를 포함한 군집 분석.
  • 활용 분야:
    • 고객 세분화(마케팅).
    • 유전자 데이터 분석(의학).
    • 소비 패턴 군집화(소매업).

2. 고급 군집 분석 실행 전 준비

A. 데이터 전처리:

  1. 표준화(Standardization):
    • 연속형 변수가 서로 다른 단위를 가지고 있다면, Z-점수(Standardized Scores)로 변환하여 분석합니다.
    • 메뉴에서 Analyze > Descriptive Statistics > Descriptives 선택 후 Save standardized values as variables 옵션 활성화.
  2. 변수 선택:
    • 군집 분석에 필요한 변수만 선택하여 분석에 포함.
    • 분석 목적과 관계없는 변수는 제외.

B. 군집 품질 평가:

  1. 군집 간 거리:
    • 군집 간 거리가 클수록 서로 다른 군집으로 명확히 분리된 것으로 평가.
  2. 내부 일관성:
    • 군집 내 데이터가 얼마나 밀집되어 있는지 확인합니다(군집의 응집성).

3. 혼합 데이터에 대한 군집 분석: 두 Step Approach

SPSS에서는 명목형 변수와 연속형 변수를 동시에 다룰 수 있는 TwoStep Cluster Analysis를 제공합니다.

실습: 소비자 프로파일 군집화

고객 데이터를 활용해 나이, 월 소득(연속형)과 구매 채널(명목형)을 기반으로 군집을 생성하겠습니다.

  1. 데이터 준비:
    • 연속형 변수: Age, Income
    • 명목형 변수: Channel (Online, Offline)
  2. TwoStep 군집 분석 실행:
    • 메뉴에서 Analyze > Classify > TwoStep Cluster를 클릭합니다.
  3. 변수 설정:
    • 분석할 모든 변수(Age, Income, Channel)를 "Variables" 창에 추가합니다.
  4. 옵션 설정:
    • "Number of Clusters"에서 Auto-cluster를 선택하거나, 원하는 군집 수를 지정합니다.
    • "Measure"에서 혼합 데이터에 적합한 거리 척도(Euclidean Distance for continuous, Log-likelihood for categorical)를 선택합니다.
  5. 결과 확인:
    • "OK"를 클릭하면 군집 분석 결과가 출력됩니다.

4. 고급 군집 분석 결과 해석하기

A. 군집 요약 표:

  • 각 군집의 크기(빈도)와 주요 특성을 요약.
    • 예: 군집 1 = "고소득 온라인 구매자", 군집 2 = "저소득 오프라인 구매자".

B. 변수 중요도:

  • 군집 형성에 가장 기여한 변수 확인.
    • 예: 구매 채널(Channel)이 Age, Income보다 군집 구분에 더 중요한 변수로 나타날 수 있음.

C. 군집 품질 평가:

  • Silhouette Measure of Cohesion and Separation:
    • 값이 1에 가까울수록 군집 품질이 높음.
  • Cluster Distances:
    • 군집 간 거리가 클수록 서로 잘 구분된 군집임.

5. 군집 분석 결과 시각화

A. 군집 프로파일 그래프 그리기:

  1. 메뉴에서 Graphs > Chart Builder를 클릭합니다.
  2. Clustered Bar Chart를 선택하고, x축에 군집 변수, y축에 주요 연속형 변수를 추가합니다.
  3. 명목형 변수는 색상으로 그룹화하여 표현합니다.

B. 군집 간 거리 시각화:

  • SPSS의 Dendrogram(계층적 군집 분석 결과)이나 Scatter Plot을 활용해 군집 간의 분포를 확인합니다.

6. 고급 군집 분석의 활용 사례

1) 고객 세분화:

  • 목표: 고객의 연령, 소득, 구매 채널을 바탕으로 VIP 고객 그룹 식별.
  • 활용: 각 그룹에 맞춘 맞춤형 마케팅 캠페인 실행.

2) 의료 데이터 분석:

  • 목표: 환자의 건강 상태 데이터를 바탕으로 질병 유형 분류.
  • 활용: 군집별 맞춤형 치료 방법 제안.

3) 소비 패턴 분석:

  • 목표: 소비자의 쇼핑 행동 데이터를 기반으로 군집을 생성.
  • 활용: 오프라인 구매자와 온라인 구매자에게 다른 할인 전략 적용.

7. 오늘의 실습 목표

  1. SPSS에서 TwoStep Cluster Analysis를 실행해 혼합 데이터를 분석하세요.
  2. 군집 품질(Silhouette, Cluster Distances)을 평가해 군집의 적합성을 확인하세요.
  3. 군집 결과를 시각화하고, 각 군집의 특성을 해석하세요.

8. 마무리

고급 군집 분석은 데이터를 세분화하고, 데이터 간의 관계를 이해하며, 전략적 의사결정을 내리는 데 강력한 도구입니다. 오늘 배운 내용을 활용해 더 깊이 있는 데이터 분석을 수행해보세요. 다음 18일차에서는 요인 분석(Factor Analysis)의 고급 활용을 다룰 예정입니다.

궁금한 점이나 도움이 필요하다면 댓글로 남겨주세요! 😊 함께 해결하겠습니다.

반응형
반응형

SPSS 통계 이용방법 가이드: 16일차 - 다차원 척도법 (Multidimensional Scaling, MDS)

**다차원 척도법(Multidimensional Scaling, MDS)**은 데이터를 시각적으로 표현하여 변수 간의 관계나 패턴을 이해하는 통계 기법입니다. 특히, 대상 간의 거리나 유사성을 기반으로 다차원 데이터를 2차원 또는 3차원 공간에 배치하여 쉽게 이해할 수 있게 합니다.

오늘은 SPSS에서 다차원 척도법을 실행하고, 결과를 해석하는 방법을 배워보겠습니다.


1. 다차원 척도법이란?

다차원 척도법의 특징:

  • 목적:
    • 대상 간의 거리나 유사성을 시각적으로 표현.
    • 데이터의 숨겨진 구조를 파악하고 변수 간의 관계를 이해.
  • 주요 질문:
    • 데이터 간의 거리를 2차원 또는 3차원 공간에 배치했을 때, 어떤 패턴이 나타나는가?
    • 대상 간의 유사성 또는 차이는 무엇인가?

활용 사례:

  1. 마케팅: 고객이 선호하는 브랜드 간의 유사성 분석.
  2. 교육: 학생들의 학습 태도나 성향을 시각적으로 분류.
  3. 심리학: 사람들의 성격 유형 간의 관계 분석.

2. SPSS에서 다차원 척도법 실행하기

실습: 브랜드 유사성 분석

고객 설문 조사에서 5개의 브랜드(A, B, C, D, E) 간의 유사성을 분석해보겠습니다.

  1. 데이터 준비:
    • 거리 데이터: 브랜드 간의 유사성을 거리 행렬 형태로 입력(예: A-B = 2, A-C = 3 등).
    • 거리 행렬은 **대칭 행렬(Symmetric Matrix)**로 구성됩니다.
  2. 다차원 척도법 실행:
    • 메뉴에서 Analyze > Scale > Multidimensional Scaling (PROXSCAL)을 클릭합니다.
  3. 변수 설정:
    • "Rows"에 분석할 변수(예: 브랜드 이름)를 추가합니다.
    • "Data Format"에서 Proximities를 선택하고, 데이터 유형을 "Distance"로 설정합니다.
  4. 모형 설정:
    • "Model" 탭에서 차원 수(Dimensions)를 설정합니다(기본값: 2차원).
    • 거리 측정 방식으로 Euclidean Distance를 선택합니다.
  5. 옵션 설정:
    • "Output" 탭에서 StressRSQ를 선택하여 모델 적합도를 확인합니다.
  6. 결과 확인:
    • "OK"를 클릭하면 출력 창에 다차원 척도법 결과와 그래프가 표시됩니다.

3. 결과 해석하기

A. Stress 값:

  • 모델 적합도를 나타내며, 낮을수록 적합도가 높습니다.
    • Stress < 0.05: 매우 우수
    • 0.05 ≤ Stress < 0.1: 양호
    • 0.1 ≤ Stress < 0.2: 보통
    • Stress ≥ 0.2: 부적합

B. RSQ 값:

  • 모델이 데이터를 설명하는 정도를 나타내며, 값이 1에 가까울수록 적합도가 높습니다.
    • 예: RSQ = 0.9 → 모델이 데이터의 90%를 설명.

C. Configuration Plot (배치도):

  • 데이터 간의 관계를 시각적으로 표현.
    • 가까운 점: 두 대상 간의 유사성이 높음.
    • 먼 점: 두 대상 간의 유사성이 낮음.

D. 각 축의 의미:

  • MDS에서 각 축의 의미는 데이터의 구조에 따라 달라지며, 분석자가 해석해야 합니다.
    • 예: x축이 "가격"을, y축이 "품질"을 나타낼 수 있음.

4. 다차원 척도법 결과 시각화

Configuration Plot 해석:

  1. SPSS 결과 창에서 생성된 배치도를 확인합니다.
  2. 브랜드(A, B, C, D, E)가 그래프에 점으로 표시되며, 점 간의 거리가 브랜드 간의 유사성을 나타냅니다.
    • 예: A와 B가 가까이 있으면 두 브랜드가 유사하다는 의미.

추가 그래프 그리기:

  • 필요 시 SPSS의 Graphs > Chart Builder를 사용해 맞춤형 그래프를 생성할 수 있습니다.

5. 다차원 척도법 결과 활용하기

활용 사례:

  1. 마케팅 전략 수립:
    • 유사한 브랜드를 묶어 마케팅 캠페인을 기획하거나, 경쟁 브랜드와 차별화 전략을 수립.
  2. 고객 분석:
    • 고객 그룹 간의 유사성을 파악하여 세분화된 타겟 마케팅 실행.
  3. 교육과 심리학:
    • 학생이나 피험자의 특성을 이해하고 맞춤형 프로그램을 개발.

6. 오늘의 실습 목표

  1. SPSS에서 다차원 척도법을 실행하여 데이터의 관계를 시각적으로 표현하세요.
  2. Stress와 RSQ 값을 활용해 모델 적합도를 평가하세요.
  3. Configuration Plot을 해석하여 데이터의 패턴과 관계를 이해하세요.

7. 마무리

다차원 척도법은 데이터 간의 관계를 시각적으로 분석하고, 숨겨진 패턴을 발견하는 데 매우 유용한 도구입니다. 오늘 배운 내용을 바탕으로 데이터를 분석하고, 인사이트를 도출해 보세요. 다음 17일차에서는 군집 분석(Cluster Analysis)의 고급 활용을 다룰 예정입니다.

궁금한 점이 있다면 댓글로 남겨주세요! 😊 함께 해결하겠습니다.

반응형
반응형

SPSS 통계 이용방법 가이드: 15일차 - 판별 분석 (Discriminant Analysis)

**판별 분석(Discriminant Analysis)**은 관찰된 데이터를 바탕으로 그룹(또는 범주)을 분류하거나, 어떤 변수들이 그룹을 구분하는 데 중요한지를 분석하는 데 사용됩니다. 이 기법은 범주형 종속 변수와 연속형 독립 변수를 다룰 때 매우 유용합니다.

오늘은 SPSS를 활용해 판별 분석을 실행하고, 결과를 해석하는 방법을 배워보겠습니다.


1. 판별 분석이란?

판별 분석의 특징:

  • 목적:
    • 데이터를 특정 그룹으로 분류.
    • 독립 변수들이 그룹 구분에 얼마나 기여하는지 확인.
  • 종속 변수: 범주형 데이터 (예: 합격/불합격, 남성/여성).
  • 독립 변수: 연속형 데이터 (예: 점수, 나이, 소득 등).

활용 사례:

  1. 교육: 학생들의 시험 점수로 합격 여부 예측.
  2. 마케팅: 고객의 구매 데이터를 기반으로 고객 그룹 분류.
  3. 의료: 환자의 검사 데이터를 활용해 질병 진단.

2. SPSS에서 판별 분석 실행하기

실습: 학생 합격 여부 예측

학생들의 점수 데이터를 활용해 합격 여부(합격=1, 불합격=0)를 예측하는 판별 분석을 실행해보겠습니다.

  1. 데이터 준비:
    • 종속 변수: Status (합격 여부: 1=합격, 0=불합격)
    • 독립 변수: Math_Score, English_Score, Science_Score
  2. 판별 분석 실행:
    • 메뉴에서 Analyze > Classify > Discriminant를 클릭합니다.
  3. 변수 설정:
    • 종속 변수(Status)를 "Grouping Variable"로 추가하고, 그룹 정의(1, 0)를 설정합니다.
    • 독립 변수(Math_Score, English_Score, Science_Score)를 "Independents"에 추가합니다.
  4. 분석 옵션 설정:
    • "Statistics" 버튼을 클릭해 Wilks' LambdaClassification Results를 선택합니다.
    • "Save" 버튼을 클릭하면 판별 점수(Discriminant Scores)를 저장할 수 있습니다.
  5. 결과 확인:
    • "OK"를 클릭하면 판별 분석 결과가 출력됩니다.

3. 결과 해석하기

A. Eigenvalues and Canonical Correlation:

  • Eigenvalue: 판별 함수의 분산을 나타냅니다. 값이 클수록 판별력이 높습니다.
  • Canonical Correlation: 독립 변수와 종속 변수 간의 상관관계를 나타냅니다(값이 1에 가까울수록 강한 상관).

B. Wilks' Lambda:

  • 독립 변수들이 그룹 구분에 얼마나 기여하는지 나타냅니다.
    • p < 0.05: 독립 변수들이 종속 변수에 유의미한 영향을 미침.

C. Standardized Canonical Discriminant Function Coefficients:

  • 독립 변수들이 판별 함수에 얼마나 기여하는지를 나타냅니다.
    • 값이 클수록 해당 독립 변수가 그룹 구분에 더 중요한 역할을 함.

D. Classification Results:

  • 관측값이 올바르게 분류된 비율을 나타냅니다.
    • 정확도(Percent Correct): 예측된 그룹과 실제 그룹이 얼마나 일치하는지 확인.
    • 높은 정확도는 모델의 분류 능력이 우수함을 의미합니다.

4. 결과를 시각화하기

판별 점수 플롯 그리기:

  1. 메뉴에서 Graphs > Chart Builder를 클릭합니다.
  2. Scatter/Dot Plot을 선택하고, 판별 점수(Discriminant Scores)를 x축과 y축에 설정합니다.
  3. 그룹 변수(Status)를 색상으로 구분하여 그룹 간 차이를 시각적으로 표현합니다.

그래프 해석:

  • 그룹별로 점들이 얼마나 구분되는지를 확인합니다.
  • 점들이 명확히 구분될수록 판별 함수가 잘 작동하고 있음을 의미합니다.

5. 판별 분석 결과 활용하기

활용 사례:

  1. 교육: 학생 데이터를 기반으로 시험 합격 여부를 예측하여 추가 학습 지원 제공.
  2. 마케팅: 고객 데이터를 활용해 VIP 고객과 일반 고객을 분류하고, 맞춤형 마케팅 전략 수립.
  3. 의료: 환자의 검사 결과를 바탕으로 질병 진단 및 치료 계획 수립.

6. 오늘의 실습 목표

  1. SPSS에서 판별 분석을 실행하여 데이터의 그룹 분류를 수행하세요.
  2. Wilks' Lambda와 Classification Results를 기반으로 모델의 유의성과 정확도를 평가하세요.
  3. 판별 점수를 시각화하여 그룹 간 차이를 이해하세요.

7. 마무리

판별 분석은 데이터를 기반으로 그룹을 분류하고, 변수 간의 관계를 이해하는 데 강력한 도구입니다. 오늘 배운 내용을 활용해 데이터를 분석하고, 의사결정에 적용해보세요. 다음 16일차에서는 **다차원 척도법(Multidimensional Scaling, MDS)**을 다룰 예정입니다.

질문이나 어려운 점이 있다면 댓글로 남겨주세요! 😊 함께 해결하겠습니다.

반응형
반응형

SPSS 통계 이용방법 가이드: 14일차 - 혼합 설계 분산 분석 (Mixed Design ANOVA)

**혼합 설계 분산 분석(Mixed Design ANOVA)**은 **반복 측정 요인(Within-Subjects Factor)**과 **독립 요인(Between-Subjects Factor)**을 함께 고려하는 분석 방법입니다. 예를 들어, 두 그룹(예: 남성, 여성)의 학업 성적 변화를 여러 시간대(1학기, 2학기, 3학기)에 걸쳐 비교할 때 사용할 수 있습니다.

오늘은 SPSS에서 혼합 설계 분산 분석을 실행하고, 결과를 해석하는 방법을 알아보겠습니다.


1. 혼합 설계 분산 분석이란?

혼합 설계 ANOVA의 특징:

  • 반복 측정 요인: 동일한 집단에서 시간이나 조건에 따른 변화 분석.
  • 독립 요인: 서로 다른 집단 간의 차이 분석.
  • 상호작용 효과: 시간(조건)과 집단 간의 상호작용 여부 분석.

활용 사례:

  1. 교육: 학습법(강의식, 토론식) 간의 성적 변화 비교.
  2. 의료: 두 치료 방법(A, B)에 따른 환자의 건강 상태 변화 분석.
  3. 심리학: 스트레스 관리 방법(명상, 운동)과 시간 경과에 따른 스트레스 수준 변화 분석.

2. SPSS에서 혼합 설계 분산 분석 실행하기

실습: 학습법에 따른 학업 성적 변화 비교

학생 데이터를 활용해 두 학습법(강의식, 토론식)이 1학기, 2학기, 3학기 동안 학업 성적(Math_Score)에 어떤 영향을 미치는지 분석해보겠습니다.

  1. 데이터 준비:
    • 반복 측정 변수(Within-Subjects Factor): Math_Score1 (1학기), Math_Score2 (2학기), Math_Score3 (3학기)
    • 독립 변수(Between-Subjects Factor): Learning_Method (강의식=1, 토론식=2)
  2. 혼합 설계 ANOVA 실행:
    • 메뉴에서 Analyze > General Linear Model > Repeated Measures를 클릭합니다.
  3. 반복 측정 요인 설정:
    • "Within-Subject Factor Name"에 Semester(학기)를 입력하고, 측정 횟수(3)를 설정합니다.
    • "Add" 버튼을 클릭한 뒤 "Define" 버튼을 누릅니다.
  4. 변수 설정:
    • Math_Score1, Math_Score2, Math_Score3을 반복 측정 변수로 추가합니다.
    • Between-Subjects Factor에 Learning_Method를 추가합니다.
  5. 옵션 설정:
    • "Plots" 버튼을 클릭하여 학기와 학습법 간의 상호작용 그래프를 추가합니다.
    • "Options" 버튼에서 Descriptive Statistics(기술 통계)와 Estimates of Effect Size(효과 크기)를 선택합니다.
  6. 결과 확인:
    • "OK"를 클릭하면 출력 창에 혼합 설계 ANOVA 결과와 그래프가 표시됩니다.

3. 결과 해석하기

A. 기술 통계 (Descriptive Statistics):

  • 각 학습법(강의식, 토론식)과 학기(1학기, 2학기, 3학기)에 따른 평균과 표준편차를 확인할 수 있습니다.

B. Mauchly's Test of Sphericity (구형성 검정):

  • 반복 측정 요인 간의 분산이 동일한지 검증.
    • p ≥ 0.05: 구형성 가정 충족 → 표준 ANOVA 결과 사용 가능.
    • p < 0.05: 구형성 가정 불충족 → 수정된 결과(Greenhouse-Geisser 또는 Huynh-Feldt)를 참조.

C. Test of Within-Subjects Effects (반복 측정 요인의 효과):

  • 학기(시간)에 따른 성적 변화가 유의미한지 확인.
    • p < 0.05: 학기에 따른 변화가 통계적으로 유의미함.

D. Between-Subjects Effects (집단 간의 효과):

  • 학습법(강의식, 토론식)에 따른 성적 차이가 유의미한지 확인.
    • p < 0.05: 학습법 간의 차이가 통계적으로 유의미함.

E. 상호작용 효과:

  • 학기와 학습법 간의 상호작용 효과 확인.
    • p < 0.05: 학습법에 따라 학기별 성적 변화 패턴이 다름.

4. 결과 시각화하기

상호작용 그래프 그리기:

  1. SPSS 결과 창에서 생성된 "Profile Plot"을 확인합니다.
  2. x축: 학기(Semester), y축: 성적(Math_Score).
  3. 학습법(Learning_Method)은 각 곡선으로 표현됩니다.

그래프 해석:

  • 곡선이 교차한다면 학기와 학습법 간의 상호작용 효과가 있음을 시사.
  • 두 곡선이 일정한 간격으로 유지된다면 상호작용 효과가 없음을 나타냄.

5. 혼합 설계 ANOVA 결과 활용하기

활용 사례:

  1. 교육: 학습법에 따른 효과적인 수업 전략 수립.
  2. 의료: 특정 치료 방법이 시간 경과에 따라 효과를 발휘하는지 확인.
  3. 마케팅: 광고 캠페인이 기간과 소비자 그룹에 따라 다른 효과를 보이는지 분석.

6. 오늘의 실습 목표

  1. SPSS에서 혼합 설계 분산 분석을 실행하여 반복 측정 요인과 독립 요인의 효과를 분석하세요.
  2. 상호작용 효과를 확인하고, 결과를 시각화하여 이해하세요.
  3. Mauchly's Test 결과를 기반으로 구형성 가정 충족 여부를 검토하세요.

7. 마무리

혼합 설계 분산 분석은 시간(조건)과 집단 간의 관계를 동시에 분석할 수 있는 강력한 도구입니다. 오늘 배운 내용을 바탕으로 데이터를 심층적으로 이해하고 활용해 보세요. 다음 15일차에서는 **판별 분석(Discriminant Analysis)**을 다룰 예정입니다.

궁금한 점이나 어려운 부분이 있다면 댓글로 남겨주세요! 😊 함께 해결하겠습니다.

반응형
반응형

SPSS 통계 이용방법 가이드: 13일차 - 반복 측정 분산 분석 (Repeated Measures ANOVA)

**반복 측정 분산 분석(Repeated Measures ANOVA)**은 동일한 집단에서 여러 시점 또는 조건에서 측정된 데이터를 분석하는 통계 기법입니다. 예를 들어, 학생들의 학업 성취도를 학기별로 측정하거나, 약물 치료 전후의 효과를 비교할 때 사용됩니다. 오늘은 SPSS에서 반복 측정 분산 분석을 실행하고, 결과를 해석하는 방법을 알아보겠습니다.


1. 반복 측정 분산 분석이란?

반복 측정 분산 분석의 특징:

  • 반복 측정: 같은 대상에서 여러 조건(또는 시점)에서 데이터를 수집.
  • 주요 질문:
    • 시간이나 조건에 따라 측정값이 유의미하게 변화하는가?
    • 조건 간의 상호작용 효과는 있는가?

활용 사례:

  1. 교육: 학기별 시험 성적 변화 분석.
  2. 의료: 약물 치료 전후 환자의 상태 변화 분석.
  3. 심리학: 스트레스 감소 프로그램 참여 전후의 효과 분석.

2. SPSS에서 반복 측정 분산 분석 실행하기

실습: 학기별 성적 변화 분석

학생들의 수학 점수를 3학기(1학기, 2학기, 3학기) 동안 측정한 데이터를 분석해보겠습니다.

  1. 데이터 준비:
    • 각 학기의 성적이 별도의 변수로 입력되어 있어야 합니다.
      • Math_Score1: 1학기 성적
      • Math_Score2: 2학기 성적
      • Math_Score3: 3학기 성적
  2. 반복 측정 분산 분석 실행:
    • 메뉴에서 Analyze > General Linear Model > Repeated Measures를 클릭합니다.
  3. 측정 조건 설정:
    • "Within-Subject Factor Name"에 측정 조건 이름(예: Semester)을 입력하고, 측정 횟수(3)를 지정합니다.
    • "Add"를 클릭한 뒤 "Define" 버튼을 누릅니다.
  4. 변수 설정:
    • 1학기, 2학기, 3학기 성적(Math_Score1, Math_Score2, Math_Score3)을 순서대로 선택하여 "Within-Subjects Variables"에 추가합니다.
  5. 옵션 설정:
    • "Plots" 버튼을 클릭하여 요인 간 상호작용 효과를 그래프로 표현할 수 있도록 설정합니다.
    • "Options" 버튼에서 Descriptive Statistics(기술 통계)와 Estimates of Effect Size(효과 크기)를 선택합니다.
  6. 결과 확인:
    • "OK"를 클릭하면 출력 창에 반복 측정 분산 분석 결과가 표시됩니다.

3. 결과 해석하기

A. 기술 통계 (Descriptive Statistics):

  • 각 조건(1학기, 2학기, 3학기)의 평균과 표준편차를 제공합니다.

B. Mauchly’s Test of Sphericity:

  • 구형성 검정: 반복 측정 데이터의 분산이 동일한지 확인.
    • p ≥ 0.05: 구형성 가정 충족 → 표준 ANOVA 결과 사용 가능.
    • p < 0.05: 구형성 가정 불충족 → 수정된 결과(Greenhouse-Geisser 또는 Huynh-Feldt)를 참조해야 함.

C. Test of Within-Subjects Effects:

  • 시간(또는 조건)에 따른 차이가 유의미한지 확인.
    • p-값(Sig.):
      • p < 0.05: 시간에 따른 변화가 유의미함.
      • p ≥ 0.05: 시간에 따른 변화가 유의미하지 않음.
  • Partial Eta Squared: 효과 크기를 나타냅니다. 값이 클수록 해당 요인이 영향을 미침.

D. 상호작용 효과:

  • 여러 요인(예: 시간 × 그룹)의 상호작용이 유의미한지 검토합니다.

4. 반복 측정 분산 분석 결과 시각화

조건별 평균 비교:

  1. 메뉴에서 Graphs > Chart Builder를 클릭합니다.
  2. Line Chart를 선택한 뒤, x축에 시간(예: Semester), y축에 성적(Math_Score)을 설정합니다.
  3. "OK"를 클릭하여 그래프를 생성합니다.

그래프 해석:

  • 각 시점의 평균값 변화를 선으로 연결한 그래프를 통해 데이터의 추세를 시각적으로 확인할 수 있습니다.

5. 반복 측정 분산 분석 결과 활용하기

활용 사례:

  1. 교육: 학생들의 성적이 특정 학기에서 급격히 상승하거나 감소하는 원인 분석.
  2. 의료: 약물 투여 전후 환자 상태의 변화 추적 및 효과 검증.
  3. 심리학: 시간 경과에 따른 스트레스 감소 프로그램의 효과 평가.

6. 오늘의 실습 목표

  1. SPSS에서 반복 측정 분산 분석을 실행하여 시간 또는 조건 간의 차이를 분석하세요.
  2. Mauchly’s Test와 수정된 결과(Greenhouse-Geisser, Huynh-Feldt)를 활용해 구형성 가정을 검토하세요.
  3. 결과를 그래프로 시각화하여 데이터의 변화를 직관적으로 이해하세요.

7. 마무리

반복 측정 분산 분석은 시간이나 조건에 따른 데이터 변화를 분석하고, 변수 간의 상호작용 효과를 이해하는 데 매우 유용한 도구입니다. 오늘 배운 내용을 바탕으로 데이터를 심층적으로 분석해보세요. 다음 14일차에서는 **혼합 설계 분산 분석(Mixed Design ANOVA)**을 다룰 예정입니다.

궁금한 점이 있다면 댓글로 남겨주세요! 😊 함께 학습하고 해결하겠습니다.

반응형

+ Recent posts