Análisis de supervivencia
1 Variable de interés
2 Requisitos análisis de supervivencia
3 Características de variables “tiempo entre dos eventos”
3.1 Asimetría
3.2 Censura
3.3 Truncamiento
4 Partes del análisis de supervivencia
4.1 Análisis univariado
4.2 Análisis bivariado
4.3 Análisis multivariado
5. Ventajas de Cox
6. Requisitos Cox
7. Interpretación regresión de Cox
8. Confusión en Cox
Análisis de supervivencia
El análisis de supervivencia es una herramienta imprescindible para la epidemiología. Aunque se siga denominando
“análisis de supervivencia”, no siempre se mira la supervivencia de los individuos, sino que se puede mirar cualquier
tipo de evento.
La gran diferencia entre la regresión de Cox y los demás modelos de regresión (linear o logístico) es que en Cox se
tiene en cuenta el tiempo del evento (el tiempo transcurrido hasta la aparición de un suceso), en cambio los demás
modelos hacían la predicción del evento según las variables explicativas en un momento puntual.
1. Variable de interés
En las demás regresiones (análisis de correlación) teníamos las variables independientes (dieta, tabaco, ejercicio…)
y esto nos daba la relación con una variable dependiente (infarto agudo de miocardio).
(En regresión logística o linear solo interesa si aparece o no el evento).
1
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll
El desenlace de interés (variable dependiente o evento) no es una cantidad numérica ni una cualidad
dicotómica (Sí/No) sino la combinación de ambas cosas:
1. La variable categórica es una variable dicotómica e indica si se ha producido o no el evento (infarto agudo de
miocardio, etc).
2. La variable numérica indica cuánto tiempo ha pasado hasta que se ha producido el evento (desenlace).
En las variables explicativas (independientes) siempre vamos a tener una continua que es el tiempo y las
variables de la exposición (dieta, tabaco, etc).
En este modelo se expresa la función de riesgo instantáneo del evento (variable dependiente) (lambda) en
función del tiempo (t) y de las variables independientes X1, … , Xn).
: Riesgo base (Riesgo de aparición del evento cuando todas las variables explicativas tienen valor 0). Es
la única expresión que depende del tiempo.
2
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll
Ni la media, desviación típica, ni distribución normal pueden resumir bien el tiempo de supervivencia.
Los datos censurados afectan al cálculo del análisis de supervivencia porque no sabremos cuál es la
supervivencia de los que se pierden durante el estudio (tal vez fuera del estudio fallecen) o tal vez los
que están vivos al final del estudio, cuando este finaliza, fallecen. Por lo tanto, los datos censurados
son todos aquellos que no presentan el evento (fallecimiento, aparición enfermedad, etc) durante el
estudio de supervivencia.
En un estudio se suele marcar un inicio y un final en el tiempo de seguimiento, para observar los
eventos en su totalidad (sin censuras) requeriría un largo período y restaría actualidad y valor
científico a los resultados obtenidos.
3
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll
Hay que tener en cuenta estos datos censurados al hacer el estudio de supervivencia.
3.3 Truncamiento: Es una condición cuyo efecto es filtrar la presencia de ciertos individuos de forma
que el investigador no sabe de su existencia.
Es decir que el truncamiento tiene lugar cuando sólo se observa una parte de los individuos que
presentan la característica estudiada y del resto no se realiza ningún seguimiento, y por lo tanto no se
obtiene información sobre ellos.
Ocurre cuando por ejemplo se miran personas a partir de los 65 años para analizar la esperanza de
vida a partir de esa edad. Como muestra escoges un geriátrico. El problema es que no todas esas
personas entran en el geriátrico cuando tienen 65 años, es decir que hay personas que ya tienen 65
años y que no han entrado, o que han fallecido antes de los 65 años, por lo que no se ha podido
obtener información de esas personas y el estudio se ve truncado ya que no se sabe de la existencia
de personas que aportarían información al estudio.
Existe cuando es necesario que el individuo tenga una exposición concreta (edad >65 años) para
que sea considerado en el estudio. Sucede si se empieza observar al sujeto posteriormente a la
exposición (tener 65 años).
4
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll
** Si se coge el tiempo de referencia inicial los 65 años, no todos empezarán el estudio con 65
años por lo que habrá un truncamiento por la izquierda.
Solo se observa a los individuos que presentan la exposición o el evento de interés (65 años).
TIPOS DE OBSERVACIONES
No truncada, no censurada: Sería el ejemplo de un estudio que coge al individuo con 65 años (I; exposición) y
llega a observar a lo largo del tiempo cómo llega a desarrollar el evento dentro del estudio.
No truncada, censurada: El estudio coge al individuo con 65 años (exposición) pero el estudio finaliza antes de
que se haya podido observar el evento (dato censurado).
Truncada, no censurada: El estudio coge a un individuo mayor de 65 años (ya presentaba la exposición –
truncado a la izquierda-) y se llega a ver en el estudio cómo desarrolla el evento.
5
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll
Eje x: Tiempo
Eje y: Supervivencia (0-1.0)
Las funciones de supervivencia y de riesgo son inversamente proporcionales. Cuando el riesgo es mayor, la
supervivencia disminuye.
Kaplan-Meier es un estimador que indica la supervivencia media en cada momento del individuo. Al
principio del estudio (t=0, supervivencia = 1.0) están todos los individuos y poco a poco van ocurriendo
eventos que hacen disminuir la supervivencia a medida que va avanzando el tiempo. La supervivencia
nunca se incrementa.
El estimador de supervivencia indica la probabilidad de estar vivo en un momento determinado. (La
estimación de supervivencia en el tiempo 30 es de 0.11 aproximadamente, 11% de probabilidad de estar
vivo en ese momento, es decir, la probabilidad de que no te haya pasado el evento).
Función riesgo: Al principio nadie está en riesgo y a medida que va pasando el tiempo el riesgo aumenta.
Es la probabilidad de que te pase el evento a lo largo del tiempo. Puede tener diferentes distribuciones
según el evento, por ejemplo en la gripe el riesgo aumenta durante el invierno.
6
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll
4.2 Análisis bivariado (Comparativa, regresión logística ): Se comparan dos grupos y se analiza
si se distribuyen de forma diferente, es decir, si las funciones de supervivencia difieren desde un
punto de vista estadístico.
Para hacer la comparación se usan diversas pruebas estadísticas con contraste de hipótesis (permite
obtener p-valor).
La prueba estadística más usada es log-rank (test de riesgos proporcionales) que permite comparar las
distribuciones de supervivencia entre dos muestras y se basa en el modelo de Chi cuadrado.
7
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll
La regresión de Cox es el modelo más usado en el análisis multivariado del análisis de supervivencia para
evaluar variables dependientes (dicotómica) del tipo “tiempo hasta un suceso o evento”, y es el
equivalente en análisis de la supervivencia al modelo de regresión lineal y guarda reminiscencias con una
regresión logística de las tasas de riesgo (tiene en cuenta el tiempo).
En el caso de la estimación de supervivencia, el modelo de regresión de Cox también permite predecir las
probabilidades de supervivencia (permanencia libre del evento concreto) para un determinado sujeto
según el patrón de valores que presenten sus variables pronósticas, es decir según si tiene o no los factores
de riesgo que predicen el desarrollo del evento.
Se pueden analizar las posibles interacción y confusiones: Se ajusta por diferentes variables confusoras. Se
varían las variables y se observa la variación del riesgo (modelar).
La interpretación de una regresión de Cox es muy parecida a la de la regresión logística pero difiere en
algunos aspectos:
- La regresión logística el parámetro de asociación que se obtiene es la odds ratio (log de odds
ratio), en cambio en la regresión de Cox se obtiene un riesgo.
- No se trata sólo de saber el efecto sobre la supervivencia a un tiempo determinado (por ejemplo,
supervivencia a los 5 años –regresión logística mira solo a términos finales y no lo que pasa
entremedio-), sino de valorar cuál es el efecto sobre la función de supervivencia (a lo largo de
todo el periodo, sea cual sea el punto temporal que se elija).
Si sólo interesase estudiar el efecto sobre la supervivencia en un punto del tiempo (por ejemplo, a
los 5 años), entonces bastaría con un análisis de regresión logística, porque la variable de
respuesta sería dicotómica (sí sobreviven o no sobreviven).
5. Ventajas de Cox:
- Sólo la regresión de Cox permite afirmar que una supervivencia más ventajosa puede ser
atribuida a un determinado tratamiento. (Por la función de supervivencia)
8
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll
- Por ejemplo, comprueba que, a igualdad de edad, sexo, estadio tumoral, etc, los pacientes que
fueron tratados con trasplante hepático sobrevivieron más en cualquier punto posible dentro del
seguimiento que ha existido en el estudio.
*(info extra) En general en la modelización (linear, logística, cox..) la idea central es comparar dos perfiles
controlando las variables confusoras y analizando las variables explicativas de interés manteniendo
constantes las demás. De esta manera se puede observar la interacción entre dos medicamentos, o si una
variable está confundiendo.
Cox hace un Hazard riesgo proporcional el riesgo será diferente en cada instante. Cuando se
modera con Cox, te busca un riesgo que más o menos es estable a lo largo del tiempo, es decir
que hace un promedio ponderando la HR de los diversos momentos en los que se produce un
evento (a los 2 años, 4, etc) porque como ha sucedido un evento, el riesgo varía). Es como si se
hicieran muchas regresiones logísticas, una para cada momento que se observa una muerte.
Si miramos a los 2 años, el individuo 1 no consta en el estudio (ha abandonado el estudio –dato
censurado-). Cuando calculamos el riesgo instantáneo a los 2 años , no tenemos en cuenta
a este individuo.
9
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll
Cálculo del Hazard ratio a los 2 años (HR): (Cálculo no sale en el examen)
6. Requisitos Cox:
- El suceso debe ser irreversible. (Solo cuenta si ha tenido el evento. Por ejemplo, si tiene la gripe,
ya no se tiene en cuenta cuando se recupera como sujeto sano).
- Debe ocurrir una sola vez (No se mira si ha tenido el evento dos veces)
10
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll
- La censura no informativa: La persona que pierdes (abandona el estudio, muere, etc), el motivo
de su pérdida no debe estar relacionada con el evento estudiado.
- Cox asume que existe cierta constancia o proporcionalidad entre las razones de riesgo (Hazard) a
lo largo del tiempo del estudio.
A este supuesto se le llama proporcionalidad de los Hazards.
Si a los 3 meses el hazard de un grupo es el doble que el del otro, en los otros momentos del
tiempo también habrá una HR (razón) aproximadamente igual a 2.
En estas dos funciones de supervivencia y riesgo se puede observar la proporcionalidad.
En estos casos la razón de riesgo cambia de una mitad a otra del seguimiento. Se tendría que calcular la hazard
ratio de la primera mitad y la hazard ratio de la segunda y comparar.
(SPSS)
11
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll
Los resultados son muy parecidos a los de una regresión logística. La diferencia es que en “Exp(B)” no es una odds ratio
sino que es una Hazard ratio (quita el logaritmo y se hace una transfomación de Beta con la exponencial para que tenga
la medida que tenía anteriormente, es decir que le saca el logaritmo para hacer la interpretación más intuitiva), y
corresponde a la hazard ratio global (promedio ponderado que calcula Cox).
Como ET da no significativo, la diferencia observada en Expo(B) (Hazard ratio) del 23,4% se debe al azar. Si se debiera a
otras causas, saldría significativo.
RR no es lo mismo que HR
RR= 0,5 en un año significa que el riesgo de que el paciente muera antes de acabar el año es la mitad con el tratamiento
que con el control. (No tiene en cuenta el tiempo en el que se producen los sucesos).
HR (ponderada con Cox)= 0,5 implica que en cualquier momento del año, ya que es un promedio, el riesgo de morir de
un paciente es la mitad con el tratamiento que con el control. El tiempo es absolutamente decisivo.
8. Confusión en Cox
Cuando estratificamos por edad y no solo por tratamiento, vemos que era una variable confusora porque ya no da
significativo.
12
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll
13
DR