SPSS 통계 이용방법 가이드: 15일차 - 판별 분석 (Discriminant Analysis)

2025. 1. 9. 22:51

SPSS 통계 이용방법 가이드: 15일차 - 판별 분석 (Discriminant Analysis)

**판별 분석(Discriminant Analysis)**은 관찰된 데이터를 바탕으로 그룹(또는 범주)을 분류하거나, 어떤 변수들이 그룹을 구분하는 데 중요한지를 분석하는 데 사용됩니다. 이 기법은 범주형 종속 변수와 연속형 독립 변수를 다룰 때 매우 유용합니다.

오늘은 SPSS를 활용해 판별 분석을 실행하고, 결과를 해석하는 방법을 배워보겠습니다.

1. 판별 분석이란?

판별 분석의 특징:

목적:
- 데이터를 특정 그룹으로 분류.
- 독립 변수들이 그룹 구분에 얼마나 기여하는지 확인.
종속 변수: 범주형 데이터 (예: 합격/불합격, 남성/여성).
독립 변수: 연속형 데이터 (예: 점수, 나이, 소득 등).

활용 사례:

교육: 학생들의 시험 점수로 합격 여부 예측.
마케팅: 고객의 구매 데이터를 기반으로 고객 그룹 분류.
의료: 환자의 검사 데이터를 활용해 질병 진단.

2. SPSS에서 판별 분석 실행하기

실습: 학생 합격 여부 예측

학생들의 점수 데이터를 활용해 합격 여부(합격=1, 불합격=0)를 예측하는 판별 분석을 실행해보겠습니다.

데이터 준비:
- 종속 변수: Status (합격 여부: 1=합격, 0=불합격)
- 독립 변수: Math_Score, English_Score, Science_Score
판별 분석 실행:
- 메뉴에서 Analyze > Classify > Discriminant를 클릭합니다.
변수 설정:
- 종속 변수(Status)를 "Grouping Variable"로 추가하고, 그룹 정의(1, 0)를 설정합니다.
- 독립 변수(Math_Score, English_Score, Science_Score)를 "Independents"에 추가합니다.
분석 옵션 설정:
- "Statistics" 버튼을 클릭해 Wilks' Lambda와 Classification Results를 선택합니다.
- "Save" 버튼을 클릭하면 판별 점수(Discriminant Scores)를 저장할 수 있습니다.
결과 확인:
- "OK"를 클릭하면 판별 분석 결과가 출력됩니다.

3. 결과 해석하기

A. Eigenvalues and Canonical Correlation:

Eigenvalue: 판별 함수의 분산을 나타냅니다. 값이 클수록 판별력이 높습니다.
Canonical Correlation: 독립 변수와 종속 변수 간의 상관관계를 나타냅니다(값이 1에 가까울수록 강한 상관).

B. Wilks' Lambda:

독립 변수들이 그룹 구분에 얼마나 기여하는지 나타냅니다.
- p < 0.05: 독립 변수들이 종속 변수에 유의미한 영향을 미침.

C. Standardized Canonical Discriminant Function Coefficients:

독립 변수들이 판별 함수에 얼마나 기여하는지를 나타냅니다.
- 값이 클수록 해당 독립 변수가 그룹 구분에 더 중요한 역할을 함.

D. Classification Results:

관측값이 올바르게 분류된 비율을 나타냅니다.
- 정확도(Percent Correct): 예측된 그룹과 실제 그룹이 얼마나 일치하는지 확인.
- 높은 정확도는 모델의 분류 능력이 우수함을 의미합니다.

4. 결과를 시각화하기

판별 점수 플롯 그리기:

메뉴에서 Graphs > Chart Builder를 클릭합니다.
Scatter/Dot Plot을 선택하고, 판별 점수(Discriminant Scores)를 x축과 y축에 설정합니다.
그룹 변수(Status)를 색상으로 구분하여 그룹 간 차이를 시각적으로 표현합니다.

그래프 해석:

그룹별로 점들이 얼마나 구분되는지를 확인합니다.
점들이 명확히 구분될수록 판별 함수가 잘 작동하고 있음을 의미합니다.

5. 판별 분석 결과 활용하기

활용 사례:

교육: 학생 데이터를 기반으로 시험 합격 여부를 예측하여 추가 학습 지원 제공.
마케팅: 고객 데이터를 활용해 VIP 고객과 일반 고객을 분류하고, 맞춤형 마케팅 전략 수립.
의료: 환자의 검사 결과를 바탕으로 질병 진단 및 치료 계획 수립.

6. 오늘의 실습 목표

SPSS에서 판별 분석을 실행하여 데이터의 그룹 분류를 수행하세요.
Wilks' Lambda와 Classification Results를 기반으로 모델의 유의성과 정확도를 평가하세요.
판별 점수를 시각화하여 그룹 간 차이를 이해하세요.

7. 마무리

판별 분석은 데이터를 기반으로 그룹을 분류하고, 변수 간의 관계를 이해하는 데 강력한 도구입니다. 오늘 배운 내용을 활용해 데이터를 분석하고, 의사결정에 적용해보세요. 다음 16일차에서는 **다차원 척도법(Multidimensional Scaling, MDS)**을 다룰 예정입니다.

질문이나 어려운 점이 있다면 댓글로 남겨주세요! 😊 함께 해결하겠습니다.

저작자표시 비영리 동일조건

'APA, EXCEL, & SPSS' 카테고리의 다른 글

SPSS 통계 이용방법 가이드: 17일차 - 군집 분석(Cluster Analysis) 고급 활용 (0)	2025.01.09
SPSS 통계 이용방법 가이드: 16일차 - 다차원 척도법 (Multidimensional Scaling, MDS) (0)	2025.01.09
SPSS 통계 이용방법 가이드: 14일차 - 혼합 설계 분산 분석 (Mixed Design ANOVA) (0)	2025.01.09
SPSS 통계 이용방법 가이드: 13일차 - 반복 측정 분산 분석 (Repeated Measures ANOVA) (0)	2025.01.09
SPSS 통계 이용방법 가이드: 12일차 - 중다 대응 분석 (Multiple Correspondence Analysis, MCA) (0)	2025.01.09

HENRY HENRY@@ 님의 블로그입니다.

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

HENRY

SPSS 통계 이용방법 가이드: 15일차 - 판별 분석 (Discriminant Analysis)

SPSS 통계 이용방법 가이드: 15일차 - 판별 분석 (Discriminant Analysis)

1. 판별 분석이란?

판별 분석의 특징:

활용 사례:

2. SPSS에서 판별 분석 실행하기

실습: 학생 합격 여부 예측

3. 결과 해석하기

A. Eigenvalues and Canonical Correlation:

B. Wilks' Lambda:

C. Standardized Canonical Discriminant Function Coefficients:

D. Classification Results:

4. 결과를 시각화하기

판별 점수 플롯 그리기:

그래프 해석:

5. 판별 분석 결과 활용하기

활용 사례:

6. 오늘의 실습 목표

7. 마무리

'APA, EXCEL, & SPSS' 카테고리의 다른 글

+ Recent posts

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역