Albert Sorribas
Esquema general
Introduccin al anlisis de supervivencia
Tipos de estudios
El concepto de censura
La curva de supervivencia
Concepto y modelos paramtricos
Concepto de funcin de riesgo (hazard function)
Estimacin (Kaplan-Meier)
Comparacin de curvas de supervivencia
Interpretacin de resultados
Ejemplos de anlisis utilizando el SPSS
2
Datos de supervivencia
Tiempo hasta que se presenta un
determinado suceso (muerte, recidiva, etc.)
En muchos casos, no disponemos de
informacin completa (prdida de
seguimientos, el suceso no se ha
presentado en algunos pacientes al final del
estudio).
En casos extremos, no disponemos de un
tiempo de inicio claro.
3
T = t1
T = t2
T > t3
T > t4
T = t5
Inicio
del estudio
Tiempo
Final
del estudio
4
t2
t3
t4
t 2 < T < t3
t1 < T < t 2
T > t2
T > t4
t3 < T < t 4
Inicio
del estudio
Tiempo
Final
del estudio
5
Algo de terminologa
Dato censurado (censored):
La funcin de supervivencia
La funcin de supervivencia es la
probabilidad de que el suceso de
inters se presente despus de un
cierto tiempo. Es decir:
S (t ) = P (T > t ) = f (u )du
t
f ( u ) du
0.8
0.6
0.4
0.2
0
0
10
15
209
Propiedades de la funcin de
supervivencia
La funcin de supervivencia es
complementaria con la funcin de
distribucin
S (t ) = 1 F (t ) = 1 P(T t )
Cumple:
S (0) = 1
t
S (t )
0
t1 < t 2 S (t1 ) S (t 2 )
10
Weibull
S (t ) = e t
S (t ) = e
t a
S (t ) = 1 F (t ) = 1 P(T t )
En general, esta funcin se desconoce y
debe estimarse a partir de los datos
11
Funcin de riesgo
(Hazard function)
La funcin de riesgo se define como:
f (t )
f (t )
h(t ) =
=
S (t ) 1 F (t )
12
Funcin de riesgo
(Hazard function)
La funcin de riesgo puede interpretarse
como la probabilidad de que se presente el
suceso el siguiente instante de tiempo
Si la funcin de riesgo es constante (caso
del modelo exponencial) la probabilidad es
independiente del tiempo
En muchos problemas reales, esta
probabilidad vara con el tiempo
13
Riesgo acumulado
El riesgo acumulado hasta un instante
determinado se calcula como:
t
14
=
= h(t )
t
S (t )
H (t ) = log S (t ) S (t ) = e H (t )
15
S (t ) = 1 F (t ) = e t
t
f (t ) e
h(t ) =
= t =
S (t )
e
H (t ) = log S (t ) = t
16
Estimacin de la funcin de
supervivencia (Caso paramtrico)
Conocemos la funcin de
supervivencia
Expresar la funcin de verosimilitud
Obtener los estimadores
mximo-verosmiles
Calcular sus varianzas
17
S (t ) = e t f (t ) = e t
Ejemplo: el modelo
exponencial
L = e ti
(datos no censurados)
i =1
i =1
i =1
log( L) = log( ) ti
log( L) n n
n
= ti = 0 = n
i =1
t
i =1
Matriz de informacin
i
(estimacin de la varianza de
los parmetros)
log( L )
) = I () 1
I ( ) =
V
(
2
n
2 log( L)
) =
V
=
18
n
2
2
S (t ) = e t f (t ) = e t
n
i =1
j =1
L = f (ti ) S (t j )
n
i =1
j =1
L = e ti e
Ejemplo: el modelo
exponencial
(censura tipo I)
t j
n
n
n
n
= =
n
w n
Matriz de informacin
ti + t j
(estimacin de la varianza de los
=
1
=
1
i
j
parmetros)
2
V ( ) =
n
19
Ejemplo
Datos :1, 1, 2 + , 4, 5+ , 6, 7, 10 + , 11
n=6
w = (1 + 1 + 4 + 6 + 7 + 11 + 2 + 5 + 10) = 47
6
=
= 0.127
47
2
V ( ) = 0.127 / 6 = 0.0027
20
Estimacin no-paramtrica
(Mtodo de Kaplan-Meier)
Desconocemos la funcin de
supervivencia
Realizamos una estimacin a partir de
los datos
Algunas definiciones:
Estimacin no-paramtrica
(Mtodo de Kaplan-Meier)
El estimador de Kaplan-Meier se
define como:
S KM (t ) = (1 d i / ni )
i:ti <t
22
7+
8 9 + 11 12 14 +
ti
ni
di
( ni d i ) / ni
S (t )
S (t )
10
9/10
9/10
0.900
7/9
9/10 x 7/9
0.700
4/5
0.560
11
2/3
0.373
12
1/2
0.187
23
1 2 2 5+
7+
8 9 + 11 12 14 +
ti
ni
di
( ni d i ) / ni
S (t )
S (t )
10
9/10
9/10
0.900
7/9
9/10 x 7/9
0.700
4/5
0.560
11
2/3
0.373
12
1/2
0.187
Funcin de supervivencia
1,2
1,0
,8
,6
Supervivencia acum
Datos
,4
Funcin de supervive
,2
ncia
Censurado
0,0
0
10
12
14
16
24
El mtodo de Kaplan-Meier en
SPSS
25
El mtodo de Kaplan-Meier en
SPSS
Survival Analysis for TIEMPO
Time
Status
Suceso
Suceso
Suceso
Cumulative
Standard
Cumulative
Number
Survival
Error
Events
Remaining
,9000
,0949
Censurado o perdido
Censurado o perdido
Suceso
Censurado o perdido
,7000
,1449
,5600
,1706
11
Suceso
,3733
,1902
12
Suceso
,1867
,1627
14
Censurado o perdido
Number of Cases:
10
Survival Time
Mean:
(Limited to
Median:
Censored:
Standard Error
( 40,00%)
Events: 6
5;
12 )
5;
17 )
14 )
11
26
Comparacin de curvas de
supervivencia
Evaluar si la supervivencia observada
permite concluir que los dos grupos
tienen la misma curva de
supervivencia
Ejemplo:
Grupo 1: 1 2 4+ 7 10+ 11+
Grupo 2: 1 3+ 5 7 8 10+
27
Comparacin de curvas de
supervivencia
28
Comparacin de
curvas de
supervivencia
Status
Suceso
,8333
Suceso
,6667
Censurado o perdido
Suceso
,4444
Censurado o perdido
Censurado o perdido
Number of Cases: 6
,1521
,1925
1
2
2
3
3
3
,2222
Censored:
( 50,00%)
5
4
3
2
1
0
Events: 3
11 )
7
Standard Error
4;
10 )
0;
17 )
Factor GRUPO = 2
Time
1
3
5
7
8
10
Status
Suceso
,8333
Censurado o perdido
Suceso
,6250
Suceso
,4167
Suceso
,2083
Censurado o perdido
Number of Cases: 6
Survival Time
Mean:
(Limited to
Median:
10 )
7
,1521
1
1
2
3
4
4
,2135
,2218
,1844
Censored:
Standard Error
( 33,33%)
5
4
3
2
1
0
Events: 4
4;
9)
3;
11 )
29
Comparacin de curvas de
supervivencia
Survival Analysis for TIEMPO
Total
GRUPO
GRUPO
1
2
Overall
Number
Number
Events
Censored
6
6
12
3
4
7
3
2
5
Percent
Censored
50,00
33,33
41,67
,11
,00
,02
df
Significance
1
1
,7347
1,0000
,8785
30
Comparacin de curvas de
supervivencia
Funciones de supervivencia
1,2
1,0
,8
Supervivencia acum
,6
GRUPO
,4
2
2-censurado
,2
0,0
1-censurado
TIEMPO
10
12
31
Procedimiento multivariantes
Regresin de Cox
Considerar el efecto de otras variables
en la supervivencia
Seleccionar las variables ms
importantes
Comparar grupos
Interpretar factores de riesgo
32
Fundamentos de la regresin de
Cox (modelo de riesgos proporcionales)
h(t | X) = h(t ) e X log(h(t | X) ) = log(h(t ) ) + X
*
h
t
X
(
|
)
(
X X )
e
=
h(t | X)
*
h(t | X 1 = 0) = h(t )
h(t | X 1 = 1)
1
=
1 e
h(t | X 1 = 1) = h(t )e
h(t | X 1 = 0)
33
Ejemplo (Cox1.sav)
34
Variables en la ecuacin
B
-,659
GRUP
ET
,334
Wald
3,899
gl
Sig.
,048
Exp(B)
,517
1,0
Supervivencia acumulada
,8
,6
,4
,2
GRUP
0,0
2
1
-,2
-20
20
40
60
80
100
Ejemplo
(Cox1.sav)
120
T
35
Ejemplo (Cox1.sav)
36
Variables en la ecuacin
B
,000
,005
-,009
-,634
X1
X2
X3
GRUP
ET
,064
,064
,029
,820
Wald
,000
,007
,104
,599
gl
1
1
1
1
Sig.
1,000
,932
,748
,439
Exp(B)
1,000
1,005
,991
,530
1,0
Supervivencia acumulada
,8
,6
Ejemplo
(Cox1.sav)
,4
,2
GRUP
0,0
2
1
-,2
-20
20
40
60
80
100
120
37
Seleccin de variables
Ejemplo Cox1.sav
38
Seleccin de variables
Variables en la ecuacin
Paso 1
Paso 2
Paso 3
Paso 4
GRUP
X1
X2
X3
GRUP
X2
X3
GRUP
X3
GRUP
B
-,634
,000
,005
-,009
-,635
,005
-,009
-,639
-,009
-,659
ET
,820
,064
,064
,029
,343
,061
,029
,340
,029
,334
Wald
,599
,000
,007
,104
3,434
,008
,104
3,532
,103
3,899
gl
1
1
1
1
1
1
1
1
1
1
Sig.
,439
1,000
,932
,748
,064
,929
,747
,060
,748
,048
Exp(B)
,530
1,000
1,005
,991
,530
1,005
,991
,528
,991
,517
Variables en la ecuacin
X1
X2
X3
GRUP
B
-,120
,128
-,040
-,386
ET
,018
,069
,035
,404
Wald
42,367
3,494
1,323
,912
gl
Sig.
,000
,062
,250
,340
1
1
1
1
Exp(B)
,887
1,137
,960
,680
Ejemplo
(Cox2.sav)
Variables en la ecuacin
Paso
1
Paso
2
Paso
3
GRUP
X1
X2
X3
X1
X2
X3
X1
X2
B
-,386
-,120
,128
-,040
-,117
,138
-,048
-,113
,138
ET
,404
,018
,069
,035
,018
,068
,034
,017
,068
Wald
,912
42,367
3,494
1,323
43,204
4,167
1,944
43,569
4,113
gl
1
1
1
1
1
1
1
1
1
Sig.
,340
,000
,062
,250
,000
,041
,163
,000
,043
Exp(B)
,680
,887
1,137
,960
,889
1,148
,953
,893
1,148
40
Estimacin de curvas de
supervivencia para
determinados valores de
las covariantes
1,0
Supervivencia acumulada
,8
,6
,4
,2
0,0
-,2
-20
20
40
60
80
100
120
1,0
,8
Supervivencia acumulada
,6
,4
,2
0,0
-,2
-20
20
40
60
80
100
120
41
Ejemplo
Hosmer & Lemeshow (1999)
Applied survival analysis.
Wiley Series in Probability and Statistics
42
Objetivos (1)
Usando el mtodo de Kaplan-Meier
Estudiar la supervivencia en funcin de la
historia previa de uso de drogas IV.
Estudiar la supervivencia en funcin de la edad
en el momento del inicio del estudio
Evaluar si existe una tendencia en la
supervivencia en funcin de la edad
43
Supervivencia en funcin de
la historia previa de uso de
drogas IV
Funciones de supervivencia
1,2
1,0
,8
Supervivencia acum
,6
Drug=0
,4
,2
Drug=1
0,0
0
10
20
30
40
50
60
70
Survival time
df
Significance
Log Rank
11,86
,0006
Breslow
10,91
,0010
Tarone-Ware
12,34
,0004
44
Funciones de supervivencia
1,2
1,0
,8
20-29 aos
Supervivencia acum
,6
,4
,2
40-54 aos
0,0
-,2
0
10
20
30
40
50
60
70
Survival time
df
Significance
Log Rank
19,91
,0002
Breslow
14,14
,0027
Tarone-Ware
16,96
,0007
45
Tendencia en
funcin de los
puntos medios de
los grupos de edad
46
Funciones de supervivencia
1,2
1,0
,8
Supervivencia acum
,6
Tendencia en
funcin de los
puntos medios de
los grupos de edad
,4
,2
0,0
-,2
0
20
30
40
50
60
70
Survival time
10
df
Significance
Log Rank
19,07
,0000
Breslow
14,08
,0002
Tarone-Ware
16,67
,0000
Objetivos (2)
Utilizando la regresin de Cox
Evaluar el efecto de la edad en la
supervivencia
Evaluar el efecto conjunto de la edad, el
uso de drogas IV y su posible interaccin
Selecionar qu modelo es ms adecuado
48
Efecto de la edad
Variables en la ecuacin
AGE
B
,081
ET
,017
Wald
21,799
gl
1
Sig.
,000
Exp(B)
1,085
Variables en la ecuacin
AGE
DRUG
B
,092
,941
ET
,018
,256
Wald
24,512
13,574
gl
1
1
Sig.
,000
,000
Exp(B)
1,096
2,564
50
Evaluacin de la interaccin
La interaccin no es
significativa.
En este modelo, tampoco
lo seria la variable DRUG
Variables en la ecuacin
AGE
DRUG
AGEXDRUG
B
,094
1,186
-,007
ET
,023
1,257
,034
Wald
16,894
,891
,039
gl
1
1
1
Sig.
,000
,345
,843
Exp(B)
1,099
3,274
,993
Variables en la ecuacin
Paso
1
Paso
2
B
,094
1,186
-,007
,092
,941
AGE
DRUG
AGEXDRUG
AGE
DRUG
ET
,023
1,257
,034
,018
,256
Wald
16,894
,891
,039
24,512
13,574
gl
1
1
1
1
1
Sig.
,000
,345
,843
,000
,000
Exp(B)
1,099
3,274
,993
1,096
2,564
Seleccin de
variables
1,2
1,0
Supervivencia acumulada
,8
La interaccin no es
significativa
La edad y el uso de
drogas IV se asocian
significativamente a
la supervivencia
,6
Drug=0
,4
,2
0,0
Drug=1
-,2
-10
10
Survival time
20
30
40
50
60
52
1,2
1,0
1,0
,8
,6
,6
Supervivencia acum
Supervivencia acumulada
,8
Drug=0
,4
,2
0,0
Drug=1
-,2
-10
10
Survival time
20
30
40
50
60
Drug=0
,4
,2
Drug=1
0,0
0
10
20
30
40
50
60
70
Survival time
53
Estimacin del
hazard ratio en
funcin del grupo de
edad
,8
Supervivencia acumulada
,6
Usamos la regresin
de Cox
El hazard ratio se
incrementa con la
edad
,4
,2
0,0
-10
10
20
30
40
50
60
Survival time
Variables en la ecuacin
B
Paso
1
GAGE
GAGE(1)
GAGE(2)
GAGE(3)
1,197
1,313
1,860
ET
,451
,459
,469
Wald
16,549
7,043
8,190
15,714
gl
3
1
1
1
Sig.
,001
,008
,004
,000
Exp(B)
3,310
3,718
6,426
8,012
9,140
16,123
54
Estimacin del
hazard ratio en
funcin de la edad
HR(t ) = e t
Usamos la regresin
de Cox
El hazard ratio se
incrementa con la
edad
Variables en la ecuacin
AGE
B
,081
ET
,017
Wald
21,799
gl
1
Sig.
,000
Exp(B)
1,085
55
Estimacin del
hazard ratio
Variables en la ecuacin
Paso 1
DRUG
B
,779
ET
,242
Wald
10,346
gl
1
Sig.
,001
Exp(B)
2,180
Paso
1
DRUG
AGE
B
,941
,092
ET
,256
,018
Wald
13,574
24,512
gl
1
1
Sig.
,000
,000
Exp(B)
2,564
1,096
56