Anda di halaman 1dari 23

Bioestadística II

Bioestadística II
En clases anteriores hemos estudiado
diseños aleatorizados a un factor (con
y sin bloqueo), introduciendo el
modelo de Análisis de la Varianza

Bioestadística II
Modelo lineal de Anova a un factor
Yij es la j-ésima
observación del i-ésimo Variable respuesta:
μ es la media
tratamiento, realizada conjunto de observaciones
general de las
sobre cada unidad que se obtienen de las
observaciones
experimental unidades experimentales

Tratamiento: conjunto de
acciones que se aplican a
las unidades
experimentales con el fin
τi es el efecto de observar cómo
del i-ésimo ɛij es un término que
responden
tratamiento representa al error
aleatorio asociado a la
observación Yij
Bioestadística II
Modelo lineal de Anova a un factor con bloques

βj es el efecto del
j-ésimo bloque, ɛij es un
con j=1,…,b término que
Yij es la
observación en representa al
el i-ésimo error
tratamiento del aleatorio
j-ésimo bloque asociado a la
observación
μ es la media τi es el efecto Yij
general de las del
observaciones i-ésimo
tratamiento,
con i=1,…,a

Bioestadística II
Ahora introduciremos los
, donde se evalúan
-o más- aplicados a las
mismas unidades de observación.
En este caso, se asume el supuesto de
aditividad entre los factores estudiados

Bioestadística II
El modelo para un diseño a dos
factores es el siguiente

αi es el efecto del βj es el efecto del


i-ésimo nivel del j-ésimo nivel del factor B,
factor A, con i=1,…,a con j=1,…,b
Yij es la
respuesta al
i-ésimo nivel del
factor A y
j-ésimo nivel de
factor B
μ es la media ɛij es un término
que representa al
general de las
error aleatorio
observaciones
asociado a la
observación Yij
Bioestadística II
Hipótesis Estadísticas

H0: α1 = α2 = … = αa
H1: al menos un αi es diferente a los demás

H0: β1 = β2 = … = βb
H1: al menos un βj es diferente a los demás

Bioestadística II
Fuente de Grados de Cuadrado
Suma de Cuadrados F
Variación Libertad Medio
𝑎
(y𝑖· )2 (y·· )2 SCA 𝐂𝐌𝐀
Factor A SCA= - gla= a-1 CMA=
𝑖=1 𝑎 𝑎𝑏 gla 𝐂𝐌𝐄

𝑏
(y·𝑗 )2 (y·· )2 SCB 𝐂𝐌𝐁
Factor B SCB= - glb= b-1 CMB=
𝑗=1 𝑏 𝑎𝑏 glb 𝐂𝐌𝐄

gle= (gla)- SCE


Error SCE= SCT-SCA-SCB CME=
(glb) gld
𝑎 𝑏
2 (y·· )2
Total SCT= y𝑖𝑗 - glt= ab - 1
𝑎𝑏
𝑖=1 𝑘=1 Bioestadística II
Supuestos del modelo
 Todos los análisis de la varianza presentan los mismos supuestos para
el término correspondiente al error aleatorio:
• La varianza de los errores es constante (homogeneidad de varianzas)
• Los errores son variables aleatorias normales con esperanza cero
• Los errores (y por ende los datos) son independientes unos de otros

 ij ~ N I ( 0 ,  ) 2

 Mediante interpretaciones gráficas y test estadísticos


pueden evaluarse los supuestos de normalidad y
homogeneidad de varianzas. Bioestadística II
Supuestos del modelo
 Verificar la distribución normal de los errores:
• gráficamente: Q-Q plot
• Test de Shapiro-Wilk
Las hipótesis que se someten a prueba son:
H0: los residuos tienen distribución normal
H1: los residuos no tienen distribución normal

 Verificar la homogeneidad de varianzas


• gráficamente: residuos vs. predichos
• Test de Levene
Las hipótesis que se someten a prueba son:

H0: σ12 = σ22 = … = σa2


H1: al menos dos varianzas son distintas
Bioestadística II
Bioestadística II
En este caso, si el investigador supone
que la respuesta a dos factores no se
puede explicar como la suma de sus
efectos individuales, el modelo debe
incluir términos que incorporen estas
hipótesis

Bioestadística II
Se incorpora entonces un al
modelo. Permite la partición de la variabilidad
considerando los efectos de cada factor y la interacción
entre ellos. El modelo correspondiente es el siguiente:
δij representa los efectos
Y es la respuesta de
αi es el efecto del para cada combinación de
ijk i-ésimo nivel del los niveles de los factores, es
la k-ésima repetición
factor A, con decir, la interacción entre
de cada uno de los
i=1,…,a factores
tratamientos
(definidos como
todas las posibles
combinaciones de los
a niveles del factor A
con los b niveles del
factor B)
ɛijk es un término que
μ es la media βj es el efecto del representa al error
general de las j-ésimo nivel del aleatorio asociado a la
observaciones factor B, con j=1,…,b observación Yijk
Bioestadística II
Hipótesis Estadísticas

H0: δ11 = … = δa1 = δ12 =… = δ1b = … = δab


H1: al menos un δij es diferente a los demás

H0: α1 = α2 = … = αa
H1: al menos un αi es diferente a los demás

H0: β1 = β2 = … = βb
H1: al menos un βj es diferente a los demás
Bioestadística II
Bioestadística II
Supuestos del modelo
 Todos los análisis de la varianza presentan los mismos supuestos para
el término correspondiente al error aleatorio:
• La varianza de los errores es constante (homogeneidad de varianzas)
• Los errores son variables aleatorias normales con esperanza cero
• Los errores (y por ende los datos) son independientes unos de otros

 ij ~ N I ( 0 ,  ) 2

 Mediante interpretaciones gráficas y test estadísticos


pueden evaluarse los supuestos de normalidad y
homogeneidad de varianzas. Bioestadística II
Ejemplo de aplicación
 En un estudio sobre la potencialidad forrajera de Atriplex cordobensis, un
arbusto que crece en depresiones del chaco árido argentino, se evaluó la
concentración de proteínas en hojas cosechadas en invierno y verano sobre
plantas masculinas y femeninas. Para cada combinación de sexo y estación, se
obtuvieron tres determinaciones del contenido proteico medido como
porcentaje del peso seco. Los resultados se presentan en la siguiente tabla.

Estación
Invierno Verano
24 17
Femenino 28 18
26 16
Sexo
17 24
Masculino 18 25
16 23
Ejemplo de aplicación
 A continuación se presenta la tabla correspondiente
al Análisis de la Varianza (salida de Infostat).

Análisis de la varianza

Variable N R² R² Aj CV
Conc.Prot. 12 0,93 0,91 6,30

Cuadro de Análisis de la Varianza (SC tipo III)

F.V. SC gl CM F p-valor
Modelo 198,00 3 66,00 37,71 <0,0001
Factor A 3,00 1 3,00 1,71 0,2268
Factor B 3,00 1 3,00 1,71 0,2268
Factor A*Factor B 192,00 1 192,00 109,71 <0,0001
Error 14,00 8 1,75
Total 212,00 11
Ejemplo de aplicación
 Se grafica aquí la media ± el
error estándar asociado de la
concentración de proteínas en
hojas de Atriplex cordobensis,
por efecto del sexo y la época
de cosecha. Se observa que los
perfiles de respuesta se cruzan
en este caso donde la
interacción resultó
significativa.
Ejemplo de aplicación
 Para poner a prueba los supuestos del modelo, se solicitó al programa que guarde
los residuos. En primer lugar, esta información fue utilizada para evaluar los
supuestos mediante interpretaciones gráficas. Finalmente, se llevaron a cabo los
test estadísticos correspondientes.
 A continuación se detallan las
pruebas referidas a la
normalidad de los residuos
• Q-Q plot (normal)
• Test de Shapiro-Wilks

Shapiro-Wilks (modificado)

Variable n Media D.E. W* p (una cola)


RDUO_Conc.Prot. 12 0,00 1,13 0,94 0,6672
Ejemplo de aplicación
 Se incluyen aquí las pruebas para
evaluar la homogeneidad de varianzas
• Gráfico de dispersión de Residuos
(RDUO_Conc.Prot.) vs. Predichos
(PRED_Conc.Prot.)

• Test de Levene (Anova


tomando como
Análisis de la varianza
variable respuesta el Variable N R² R² Aj CV
RABS_Conc.Prot. 12 0,06 0,00 87,64
valor absoluto de los
Cuadro de Análisis de la Varianza (SC tipo III)
residuos, F.V. SC gl CM F p-valor
Modelo 0,33 1 0,33 0,62 0,4475
RABS_Conc.Prot.) Factor A 0,33 1 0,33 0,62 0,4475
Error 5,33 10 0,53
Total 5,67 11
Actividad de cierre
 Ejercicio integrador: Se desea estudiar cómo afecta la aplicación de distintas dosis de
droga sobre la concentración de cierta hormona en ratas. Dado que se trata de hormonas
esteroides, en el diseño del experimento se consideró también el sexo de las ratas
tratadas. Los resultados se encuentran en la siguiente tabla, expresados como
concentración plasmática de hormona en pg/ml . A continuación explique:
Sexo
1. Cuál es la variable respuesta y cuál la unidad de observación,
Femenino Masculino
2,3 1,8 cuáles son los factores y tratamientos resultantes, y cuántas
Control 2,1 2
1,9 2,1
repeticiones hay por tratamiento.
2,5 2,1 2. El modelo estadístico correspondiente al diseño utilizado,
Dosis
Droga 3 2,6
mínima
2,3 1,9 explicitando, en términos estadísticos y prácticos, cada uno
3,2 2,5
Dosis de los componentes.
2,9 2,9
máxima
3,3 2,7 3. Dócimas de hipótesis en términos estadísticos y prácticos.

4. Finalmente, ¿qué conclusiones pueden obtenerse

a partir de esta experiencia?

Anda mungkin juga menyukai