반응형

SPSS 통계 이용방법 가이드: 11일차 - 생존 분석 (Survival Analysis)

**생존 분석(Survival Analysis)**은 특정 사건(예: 이탈, 사망, 종료)이 발생하기까지의 시간 데이터를 분석하는 통계 기법입니다. 예를 들어, 고객이 서비스를 이용하다가 이탈할 때까지의 기간이나, 특정 치료를 받은 환자의 생존 기간을 분석할 때 사용됩니다. 오늘은 SPSS에서 생존 분석을 실행하고, 결과를 해석하는 방법을 배워보겠습니다.


1. 생존 분석이란?

생존 분석의 특징:

  • 종속 변수: 사건 발생까지의 시간.
  • 독립 변수: 사건 발생에 영향을 미칠 수 있는 변수들(예: 나이, 성별, 치료 방법 등).
  • 주요 질문:
    • 사건 발생 확률은 시간이 지남에 따라 어떻게 변하는가?
    • 어떤 요인이 사건 발생에 영향을 미치는가?

활용 사례:

  1. 의료: 치료 방법에 따른 환자의 생존 기간 비교.
  2. 비즈니스: 고객이 서비스를 이탈하기까지의 기간 분석.
  3. 사회학: 고용 상태 변화까지의 기간 분석.

2. 생존 분석의 주요 용어

  1. 생존 시간(Survival Time): 사건이 발생하기까지의 시간.
  2. 검열(Censoring): 사건이 발생하지 않은 데이터를 의미(예: 연구 종료 시점까지 생존).
  3. 생존 함수(Survival Function): 특정 시간까지 생존할 확률.
  4. 위험 함수(Hazard Function): 특정 시점에서 사건이 발생할 위험.

3. SPSS에서 생존 분석 실행하기 (Kaplan-Meier 분석)

실습: 치료 방법에 따른 생존 기간 비교

환자 데이터를 사용해 두 치료 방법(A, B)에 따른 생존 기간의 차이를 분석하겠습니다.

  1. 데이터 준비:
    • 종속 변수: Surv_Time (생존 시간, 단위: 월)
    • 상태 변수: Status (사건 발생 여부, 1=사건 발생, 0=검열)
    • 그룹 변수: Treatment (치료 방법, A/B)
  2. 생존 분석 실행:
    • 메뉴에서 Analyze > Survival > Kaplan-Meier를 클릭합니다.
  3. 변수 설정:
    • "Time"에 Surv_Time, "Status"에 Status를 추가합니다.
    • "Define Event" 버튼을 클릭하고 Event 값으로 "1"을 입력합니다(사건 발생).
    • "Factor"에 Treatment를 추가합니다(치료 그룹).
  4. 옵션 설정:
    • "Display"에서 Survival Plot(생존 곡선)을 선택합니다.
    • "Statistics"에서 Log Rank Test(로그 순위 검정)를 선택하여 그룹 간 차이를 검증합니다.
  5. 결과 확인:
    • "OK"를 클릭하면 출력 창에 생존 분석 결과와 생존 곡선이 나타납니다.

4. Kaplan-Meier 결과 해석하기

A. 생존 곡선(Survival Plot):

  • x축: 시간
  • y축: 생존 확률
  • 곡선이 높을수록 생존 확률이 높음을 의미.
  • 두 치료 그룹(A, B)의 곡선을 비교하여 생존 차이를 시각적으로 확인.

B. Log Rank Test:

  • p-값(Sig.) 확인:
    • p < 0.05: 두 그룹 간 생존 기간 차이가 통계적으로 유의미함.
    • p ≥ 0.05: 두 그룹 간 차이가 유의미하지 않음.

5. SPSS에서 생존 분석 실행하기 (Cox 비례위험 모형)

실습: 여러 변수의 영향 분석

나이, 성별, 치료 방법이 생존 기간에 미치는 영향을 분석해보겠습니다.

  1. 데이터 준비:
    • 종속 변수: Surv_Time
    • 상태 변수: Status
    • 독립 변수: Age (나이), Gender (성별), Treatment (치료 방법)
  2. Cox 회귀 분석 실행:
    • 메뉴에서 Analyze > Survival > Cox Regression을 클릭합니다.
  3. 변수 설정:
    • "Time"에 Surv_Time, "Status"에 Status를 추가합니다.
    • 독립 변수(Age, Gender, Treatment)를 "Covariates" 창에 추가합니다.
  4. 옵션 설정:
    • "Statistics"에서 Confidence Interval(신뢰 구간)을 선택합니다.
  5. 결과 확인:
    • "OK"를 클릭하면 출력 창에 Cox 회귀 분석 결과가 나타납니다.

6. Cox 회귀 분석 결과 해석하기

A. 위험비(Hazard Ratio, Exp(B)):

  • Exp(B) > 1: 사건 발생 위험이 증가.
  • Exp(B) < 1: 사건 발생 위험이 감소.
  • 예: 치료 방법 B의 Exp(B) = 0.5 → 치료 방법 B가 사건 발생 위험을 50% 감소시킴.

B. p-값(Sig.):

  • p < 0.05: 독립 변수가 생존 시간에 유의미한 영향을 미침.

C. Wald 통계량:

  • 변수의 중요도를 나타냅니다. 값이 클수록 종속 변수에 미치는 영향이 큼.

7. 생존 분석 결과 활용하기

활용 사례:

  1. 의료: 특정 치료 방법의 효과 비교 및 환자 맞춤형 치료 계획 수립.
  2. 비즈니스: 고객 이탈 위험 예측 및 맞춤형 마케팅 전략 개발.
  3. 사회학: 정책 시행 후 효과 지속 기간 분석.

8. 오늘의 실습 목표

  1. Kaplan-Meier 생존 분석을 실행하여 그룹 간 생존 곡선을 비교하세요.
  2. Cox 회귀 분석을 통해 독립 변수가 생존 시간에 미치는 영향을 평가하세요.
  3. 생존 곡선을 시각화하여 결과를 이해하고 해석해보세요.

9. 마무리

생존 분석은 시간 데이터를 다루는 데 필수적인 기법으로, 다양한 분야에서 활용됩니다. 오늘 배운 Kaplan-Meier 분석과 Cox 회귀 분석을 통해 데이터를 심층적으로 이해하고 예측해보세요. 다음 12일차에서는 **중다 대응 분석(Multiple Correspondence Analysis)**을 다룰 예정입니다.

질문이나 도움이 필요하다면 댓글로 남겨주세요! 😊 함께 학습하고 해결하겠습니다.

반응형

+ Recent posts