Anda di halaman 1dari 11

Grupo 5

Epidemiologa

27/10/2015

Tema 5: Regresin Logstica En Epidemiologa.


Para controlar la confusin y la interaccin se pueden usar distintos
modelos estadsticos, en concreto los modelos de regresin. El ao pasado
hablbamos de regresin lineal, cuando buscbamos la relacin entre una
variable y otra a travs de una recta. Ahora vamos a centrarnos en estudiar
la asociacin entre variables, es decir, en el anlisis de regresin, que puede
ser simple o mltiple.
MODELO DE REGRESIN LINEAL SIMPLE:
Ejemplo: El permetro torcico es una variable que se utiliza en clnica
para evaluar la posibilidad de realizar transplantes de rganos.
Desviaciones de ms de un 20% entre los permetros torcicos de donante
y receptor, suelen desaconsejar la realizacin del transplante. Sin embargo,
el permetro torcico no siempre se conoce, o no es tan fcil de medir como
el peso. Por sta y otras razones, nos interesa estudiar la posible relacin
entre el peso y el permetro torcico de las personas. Recogemos el
permetro torcico y el peso en kilos de 24 personas; tambin se recoge el
gnero:

El siguiente diagrama de
dispersin es una representacin
de todos estos datos, de hombres y
mujeres. Cada punto es un
individuo y est dibujado en la
interseccin entre el peso y el
permetro
torcico
de
cada
individuo. En ocasiones sabr el
peso del individuo pero no su
permetro torcico por lo que
mediante esta grfica se pretende
estudiar si hay relacin entre
ambas variables. En este caso, el

Grupo 5

Epidemiologa

27/10/2015

diagrama nos dice que s hay asociacin ya que las nubes de puntos
alargadas implican asociacin. Se alarga en cuando aumenta el peso
aumenta el permetro torcico.
Por tanto, aqu puedo establecer un modelo de regresin lineal simple (es el
que vimos el ao pasado):
-a es el punto en el cual la recta
corta el eje de las y.
-b es la pendiente de la recta de
regresin. El sentido es: cunto se
incrementa el permetro torcico
cuando el peso se incrementa 1kg.
- y es el permetro torcico.
x es el peso.

-El error aleatorio es la distancia


entre cada individuo y la lnea de
regresin.
MODELO DE REGRESIN SIMPLE:
En STATA se usa el comando reg permetro peso y nos hace una tabla
como esta:

El peso es la variable explicativa. Cuando utilizo el modelo de


mnimos cuadrados lo que quiero hacer es hacer mnimos los errores al
cuadrado, que son las diferencias entre la recta y cada uno de los puntos.
Aqu nos sale la estimacin de ambos coeficientes: la estimacin del
coeficiente a es igual
a 55,50, que es el valor
en el que la recta corta
el eje de las X y el
coeficiente b de la
variable es donde pone
peso y es igual a
0,5072.
Para
cada
coeficiente nos da un
error estndar y un
valor del test de la t con
un nivel de significacin
del 95%, que contrasta
si el coeficiente es igual
a 0; si el coeficiente es
significativamente diferente de 0. Es ms, nos da a conocer su intervalo
(entre 0,27 y 0,73 ene l caso del peso).

Grupo 5

Epidemiologa

27/10/2015

En conclusin, nos dice que la pendiente es significativamente


diferente de 0 (si fuera 0 la recta no ascendera, sera constante). Por cada
kilo de peso que se aumente se aumente, el permetro torcico se aumenta
en 0,5 centmetros; sta es la estimacin puntual. La estimacin por
intervalo de confianza es entre 0,27 y 0,73, como el intervalo no contiene al
0 es estadsticamente significativo; por ello podemos decir que existe una
asociacin entre el peso y el permetro torcico.
MODELO DE LNEAS PARALELAS:
Vamos a hacer ahora la separacin por gneros:
Puedo
hacer
dos
rectas de regresin: una
para las mujeres y otra para
los hombres.
En este caso tanto en
los hombres como en las
mujeres
se
aumentan
0,66cm
de
permetro
torcico por cada kilo que se
incrementa.
Tablas por
gnero:

Ahora nos podemos plantear: Cul es la diferencia en el


permetro torcico entre hombre y mujeres? Como las pendientes son
iguales las lneas son paralelas por lo que a diferencia en el permetro
torcico es la diferencia entre las rectas y este sera el efecto del gnero.
MODELO DE REGRESIN MLTIPLE:
En lugar de hacer dos modelos independientes, uno para hombres y
otro para mujeres, tambin podemos hacer un mismo modelo, una sola
lnea del permetro torcico en funcin del peso y del gnero; es decir,
vamos a introducir en el modelo dos variables.

Grupo 5

Epidemiologa

27/10/2015

Este modelo nos dice que por cada kilo que aumente el peso aumenta
el permetro torcico en 0,66 cm; pero aqu hay que tener en cuenta
tambin el efecto del gnero.

En este caso tenemos una segunda variable, X2, que es el gnero y


que slo toma dos valores: 0 y 1. Tomar valor 0 cuando estemos en los
verdes y 1 cuando estemos en los rojos.
El -3,65 que vemos
en la tabla es el efecto
del gnero, es decir, la
diferencia entre la recta
de mujeres y la de
hombres
de
la
que
hablbamos antes. Esta
diferencia es de 3,65cm y
tiene signo negativo ya
que tomamos como 0 el
gnero de los verdes
(mujeres).

Esto se usa mucho en medicina; de hecho la regresin logstica se usa


ahora para valorar el riesgo de sufrir un infarto si ha tenido infartos
anteriores, si tiene una determinada edad Esto se hace construyendo un
modelo para explicar la probabilidad de tener la enfermedad en funcin de
otra serie de variables. Con este modelo tenemos una idea para saber el
riesgo que corren las personas de padecer determinadas enfermedades.

SIGNIFICADO DEL MODELO SIN INTERACCIN: el modelo que hemos


utilizado es un modelo de lneas paralelas por lo que no hay
interaccin entre gnero y peso. En este caso no hay interaccin
ya que la pendiente del peso era la misma para mujeres que para
hombres.

Si estamos en el grupo de mujeres el modelo sera:

Si estamos en el grupo de hombres el modelo sera:

Grupo 5

Epidemiologa

27/10/2015

La nica diferencia que hay entre ambos es el -3 (b2), que es el efecto


del gnero.

MODELO CON INTERACCIN: Sin embargo, el modelo de regresin


se puede utilizar para estudiar la interaccin.

Ejemplo.: Recogemos el permetro torcico en centmetros y el peso el


kilos de 24 individuos obteniendo la tabla siguiente:

Sin embargo, en este


caso
la
lneas
no
son
paralelas,
uno
tiene
una
pendiente de 0,66 y otra de 2,23;
las lneas se cortan por lo que
hay interaccin. Tengo un
modelo independiente para cada
grupo de puntos.

Tambin puedo hacerlo


slo con un modelo: para
introducir la interaccin en el
modelo lo que hago es el

Grupo 5

Epidemiologa

27/10/2015

producto de X1 y X2; esto tiene un coeficiente, b3, que es el de la


interaccin.
Comandos STATA: reg permetro c peso i gnero (c=variable continua;
i = variable indicador del gnero: gnero femenino es 0 y gnero masculino
es 1)

El peso tiene un coeficiente de 2,23, el b1 = 2,23. Despus vemos


que tenemos un efecto de gnero de 67,01, es decir, el permetro torcico
entre los hombres es 67,01cm mayor. Luego tenemos el gnero por el peso
(como el gnero slo toma valor 1 en el caso de los hombres, al multiplicarlo
por el peso este valor slo se va a quedar en el caso de los hombres ya que
en las mujeres se multiplica por 0).
El test de homogeneidad es significativo, por tanto hay
interaccin. Esto quiere decir que la pendiente del rojo es 1,57cm menor
que la del verde a medida que aumentamos el peso.
Cuando hay interaccin entre peso y gnero, por tanto el modelo
causal de la enfermedad tiene que tener en cuenta peso y gnero
simultneamente. Si el test no resulta significativo podemos prescindir de la
interaccin e iramos a un modelo de lneas paralelas. Significado del
modelo con interaccin:
Si estamos en el grupo de mujeres el modelo sera:

Si estamos en el grupo de hombres el modelo sera:

Si b3 es estadsticamente diferente de 0, entonces hay interaccin


(modificacin de efecto). Las pendientes o efectos no son iguales en
ambos grupos.

Si b3 no es diferente de 0, puede existir confusin. Mirar como


cambia el coeficiente de una variable (peso) al incluir la otra (genero)
en el modelo.

Sin embargo, si no hay interaccin puede haber confusin y para saber si


hay confusin miramos el coeficiente de peso (0,66) y metemos la variable
gnero en el modelo, si no cambia el peso tras meter el gnero no hay
6

Grupo 5

Epidemiologa

27/10/2015

confusin. Por tanto, antes de estudiar la confusin se estudia la interaccin.


Si se afecta el coeficiente del peso, s hay confusin. Se habla de que tiene
que cambiar ms de un 10% pero esto es un criterio muy laxo, a veces se
dice que hay confusin con valores incluso menores.

Grupo 5

Epidemiologa

27/10/2015

Regresin Logstica:
La regresin logstica trata de estudiar la relacin funcional entre
diferentes factores (x1, x2, x3) y la probabilidad de que ocurra un
determinado suceso (p).
Por ejemplo, podramos estudiar la probabilidad de padecer una
enfermedad
segn
diversos
factores:
(b1=gnero),(
b2=edad),
(b3=exposicin a diversas sustancias) Este sera un modelo lineal igual
que los utilizados anteriormente con la nica diferencia de que en este caso
hemos incluido mltiples factores.

Sin embargo, los resultados de este modelo pueden ser menores que
0 o mayores que 1; y dado que la probabilidad solo puede tomar valores
entre 0 y 1 hemos de buscar otras alternativas para expresar esta
probabilidad.
La alternativa que vamos a utilizar va a ser la siguiente:

Vamos a expresar la probabilidad de padecer una enfermedad como


un cociente (arriba a la izquierda) conocido como el Odds de p y
acontinuacin vamos a transformarlo LOGIT (p).

Grupo 5

Epidemiologa

27/10/2015

La transformacin logit consiste en calcular el logaritmo neperiano


(ln) del odds relativo a una probabilidad odds de p. Estra transformacin
presenta la ventaja de ser un modelo lineal. El logit de p toma valores entre
+ infinito y infinito.
Relacin entre logit y su p:
Una vez obtenido el logit de p, a nosotros nos va a interesar obtener
la p. Esta la calculamos mediante la siguiente relacin.

El modelo de regresin logstica se escribe de dos formas:


-La variable a explicar es p (probabilidad de algn suceso de
inters, muerte indicencia de enfermedad).

-La variable Y a explicar o dependiente es el logit de p


(probabilidad de que ocurra un suceso)

Esta formulacin tiene la ventaja de ser lineal y por tanto, es la que


nosotros vamos a utilizar.

Grupo 5

Epidemiologa

27/10/2015

Lo que estamos haciendo con el modelo de regresin, es observar la


influencia del gnero (variable confusora) sobre el factor de exposicin (esto
tambin lo hacamos con el anlisis estratificado).
Calculamos los distintos logits para Logit (P 1.1) y Logit (P1.0).
Recordad que a la hora de insertar los datos, hay que tener en cuenta la
nomenclatura que hemos utilizado para nombrar los distintos: factor
hombre=1, fator mujer=0, factor exposicin=1, factor no exposicin=0.
Para observar qu factor/factores son los que difieren en entre
nuestras dos estratos a la hora de provocar la enfermedad, restamos los dos
logits. Dado que son dos ln, la diferencia de logaritmos es igual al cociente
de sus factores.

Podemos observar, que en lo que difieren ambos logits (estratos),


es en el coeficiente b2, el efecto del gnero. Y, qu significado tienen este
coeficientes en el modelo de regresin? En el modelo de regresin logstica
el coeficiente b2 es el ln del odds ratio. Por lo que si quisiesemos calcular el
oddsratio de los hombres hacia las mujeres; es decir, el cociente de la
incidencia de los hombres expuetos y no expuestos entre la incidencia de
las mujeres expuestas y no expuestas (efecto del gnero), sera el
coeficiente b2 elevado al nmero e.

10

Grupo 5

Epidemiologa

27/10/2015

En STATA podemos obtener directamente el coeficiente b o obtener


directamente el oddsratio (generalmente trabajaremos con el oddratio).

Conclusin:
El anlisis estratificado, visto la semana pasada, nos sirve cuando
tenemos pocos estratos o pocos niveles de generacin de confusin. Pero
cuando ya queremos ajustar por ms factores y tenemos varios niveles de
ajuste nosotros vamos a utilizar los modelos de resesin ya que es ms
cmodo y ms eficiente.

11

Anda mungkin juga menyukai