Anda di halaman 1dari 11

Junio2016_Soluciones.

pdf
examenes resueltos

1º Estadística

Grado en Farmacia

Facultad de Farmacia
UV - Universitat de València (Estudi General)

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su
totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1230555

EXAMEN DE ESTADÍSTICA (Código 34067)


17 de junio de 2016

Problema 1. La conservación adecuada de los medicamentos es fundamental para


mantener su actividad farmacológica de forma óptima. En general, deben evitarse los
lugares accesibles a los niños para evitar intoxicaciones, y los lugares muy húmedos,
muy cálidos o a la intemperie, para evitar la degradación del principio activo.
En un estudio sobre la conservación de un medicamento, 20 unidades del mismo se
conservaron durante un mes a una determinada temperatura, diferente para cada una de
las unidades. Tras el mes, se anotó dicha temperatura y se midió el porcentaje de la
concentración del principal principio activo que contenía el medicamento.
a) ¿Cuál sería la variable explicativa que debería escogerse para analizar estos datos?
Justifica la elección. Representa gráficamente la variable explicada mediante un

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
diagrama de cajas.
En este caso la variable explicativa (o independiente) que debemos escoger para
analizar estos datos sería:
X = temperatura en la que se conservó el medicamento
mientras que la variable explicada (o dependiente) sería:
Y = porcentaje de la concentración del principal principio activo que
contenía el medicamento.
Se ha realizado esta selección porque el objetivo del estudio es evaluar cómo afecta la
temperatura de conservación (X) en el porcentaje de la concentración del principio
activo (Y), para lo cual seleccionamos nosotros un conjunto de determinadas
temperaturas de conservación y observamos el porcentaje de concentración del principio
activo.
A continuación vamos a dibujar un diagrama de cajas de la variable explicada (Y) a
partir de los estadísticos calculados en la Tabla 1.1.

Podemos ver que los valores observados se mueven entre el 95.0% (valor mínimo) y el
99,9% (valor máximo). De la Tabla 1.1 podemos extraer todos los datos necesarios para
representar el gráfico:

Mínimo = 95.0%
Máximo = 99.9%
Mediana = Percentil 50 = 99.1%
Primer cuartil = Percentil 25 = 96.375%
Tercer cuartil = Percentil 75 = 99.50%
RIQ = 99.50 - 96.375 = 3.125
P25 - 1.5xRIQ = 91.6875, que es menor
que el mínimo
P75 + 1.5xRIQ = 104.1875, que es mayor
que el máximo
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1230555

b) ¿Cuál sería la recta de regresión correspondiente? ¿Qué porcentaje de la variabilidad


de la variable dependiente es explicado por la regresión lineal?

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
La recta de regresión aparece en la Tabla 1.7, en la que podemos ver que la recta
ajustada mediante la regresión lineal que explica la concentración (Y) en función de la
temperatura (X) es:
Y = 106.72003 - 0.38554 · X
En esta ecuación, la ordenada en el origen 106.72 muestra la concentración hipotética
del fármaco si la temperatura fuera 0 (aunque no tiene sentido al estar fuera del rango de
investigación), mientras que el coeficiente asociado a la temperatura -0.38554 nos
muestra la disminución media de la concentración del fármaco por cada unidad que se
incrementa la temperatura. Podemos ver por tanto que hay una relación inversa entre
ambas variables, esto es, que a mayor temperatura menor es la concentración de
fármaco para los rangos de temperatura investigados.
El porcentaje de la variabilidad de la concentración del fármaco explicado por la
regresión lineal viene dado por el coeficiente de determinación, que en este caso:
r2 = 0.8694 = 86.94%
Luego la temperatura en la que se almacena explica un 86.94% de la variabilidad
observada en la concentración del fármaco.

c) ¿Cuánto vale el coeficiente de correlación? ¿Y la desviación típica residual?


Interpreta su significado.
El coeficiente de correlación valora el grado de asociación existente entre ambas
variables observadas, y es la raíz cuadrada del coeficiente de correlación, que en este
caso tendría signo negativo (que coincide con el signo del coeficiente asociado a la
temperatura en la recta de regresión). Luego:
r = - raiz(r2) = - 0,9324
Podemos ver que es un valor muy próximo a -1, lo que indica que hay una relación
decreciente muy buena entre ambas variables.
Como se observa en la Tabla 1.7, la desviación típica residual es sY|X= 0.6524, que es
una medida de la variación de la variable Y cuando conocemos el valor de la variable X.

d) ¿Cuál sería la predicción del porcentaje de concentración del principio activo si ha


sido almacenado a 30 grados? ¿Y para 20 grados?

¡Celebra el fin de exámenes en un festival! Síguenos y gana entradas.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1230555

Ambas temperaturas están en el rango de temperaturas analizadas en este estudio (entre


17.8 y 31.3 grados). Vamos a estimar la concentración del fármaco para cada una de
estas temperaturas:
x = 20 grados --> (x=20)= 106.72003 - 0.38554 · 20 = 99.01%
x = 30 grados --> (x=30) = 106.72003 - 0.38554 · 30 = 95.15%

Problema 2. En un artículo de Hernández-Hernández et al. (2007) se pretendía analizar


el estado nutricional entre escolares de colegios privados y niños que vivían en zonas
suburbanas de la Ciudad de Caracas, e identificar si existían diferencias entre ambos
grupos, con datos de los años 2005 y 2006. En el estudio participaron 1009 niños y
niñas (de entre 4 y 10 años); 640 escolarizados en colegios privados de Caracas, y 369
niños y niñas (escolarizados o no) de zonas suburbanas de los Municipios Baruta y el
Hatillo. Los resultados obtenidos están resumidos en la siguiente tabla:
Bajo-peso Normo-peso Sobre-peso

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Colegio privado 15 384 241
Zona Suburbana 18 309 42
a) ¿Qué porcentaje de niños sufren malnutrición (bajo-peso)? Obtener estimaciones
puntuales de los porcentajes de niños de bajo-peso en ambos grupos.
En la Tabla 2.4 podemos ver que el porcentaje total de niños con bajo-peso del estudio
es del 3.3%.

La estimación de los niños de bajo-peso en cada uno de los dos grupos podemos verla
en la Tabla 2.1. Se observa que un 2.3% de niños de colegios privados presentan bajo-
peso, mientras que este porcentaje asciende al 4.9% para los niños de la zona suburbana.

b) Calcula la tabla de valores esperados para los datos obtenidos en este estudio.
Vamos a calcular las frecuencias esperadas para cada una de las 6 celdas de la tabla de
contingencia bajo la hipótesis nula de que la distribución de niños según su peso es
homogénea en ambas poblaciones.
Frec. observadas Bajo-peso Normo-peso Sobre-peso Total
Colegio privado 15 384 241 640
Zona Suburbana 18 309 42 369
Total 33 693 283 1009

Frec. Esperadas Bajo-peso Normo-peso Sobre-peso


Colegio privado 20.93 439.56 179.50
Zona Suburbana 12.07 253.44 103.50

TALENTO FARMACÉUTICO Y SANITARIO - MBA en Industria Farmacéutica y Biotecnológica


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1230555

(Colegioprivado) x (Bajo- peso) 640× 33


E(Colegioprivado,Bajo- peso) = = = 20.93
(Total niños) 1009
(Colegioprivado) x (Normo- peso) 640× 693
E(Colegioprivado,Normo- peso) = = = 439.56
(Total niños) 1009
(Colegioprivado)x (Sobre- peso) 640× 283
E(Colegioprivado,Sobre- peso) = = = 179.50
(Total niños) 1009
(Zona suburbana)x (Bajo- peso) 369× 33
E(Zonasuburbana,Bajo- peso) = = = 12.07

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
(Total niños) 1009
(Zona suburbana)x (Normo- peso) 369× 693
E(Zonasuburbana,Normo- peso) = = = 253.44
(Total niños) 1009
(Zona suburbana)x (Sobre- peso) 369× 283
E(Zonasuburbana,Sobre- peso) = = = 103.50
(Total niños) 1009

c) Plantea y resuelve el contraste de hipótesis adecuado para analizar los datos en


función de los objetivos del experimento. Utiliza α=0,05.
El objetivo del estudio es analizar si hay diferencias en el estado nutricional de ambos
grupos de niños. Por tanto, se trata de estudiar si hay homogeneidad en la distribución
de niños según peso en ambos grupos (colegio privado y zona suburbana), para lo cual
aplicaremos una prueba de homogeneidad de dos poblaciones resolviendo el contraste
de hipótesis siguiente:
H0: La distribución de niños según peso es igual en ambas zonas
HA: La distribución de niños según peso es diferente en ambas zonas
Vamos a suponer que las dos muestras de niños son representativas de las poblaciones a
estudiar. Para poder aplicar la prueba chi-cuadrado, necesitamos que las frecuencias
esperadas bajo la hipótesis nula sean todas mayores o iguales a 5, lo que se cumple en
este caso al ser la frecuencia esperada mínima igual a 12.07.
Por tanto podemos aplicar la prueba chi-cuadrado para resolver el contraste anterior. En
la Tabla 2.2 podemos ver el p-valor de este contraste, que es menor de 2.2x10-16, por lo
que será menor que el nivel de significación del 5%, y por tanto podremos rechazar la
hipótesis nula de homogeneidad en la distribución de pesos en ambas zonas.

De la Tabla 2.1 podemos ver que el nivel de sobrepeso es mucho mayor en los colegios
privados, mientras que en las zonas sub-urbanas es mayor el nivel de bajo-peso y de
normo-peso.

d) Anteriormente, en un amplio estudio realizado el año 2000 (Rodríguez-Melian,


2011), se observó que el 13% de los niños venezolanos sufrían malnutrición, un 25%
tenía sobrepeso y el resto estaban en un peso normal ¿Seguían siendo válidos estos
porcentajes en los años 2005 y 2006 para los niños de los grupos estudiados?
Vamos a comprobar si los porcentajes del estudio de 2000 (13% de bajo-peso, 62% de
normo-peso y 25% de sobre-peso) siguen siendo válidos para los escolaresanalizados en
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1230555

2005-2006. Sea π1, π2 y π3 la proporción de escolares de 2005-2006 con bajo-peso,


normo-peso y sobre-peso, respectivamente, consideramos el contraste de hipótesis:
H0: π1 = 0.13, π2 =0.62, π3 = 0.25
HA: Alguna de las proporciones es distinta
Para los datos analizados en 2005-2006, el porcentaje de niños con bajo-peso era del
3.3%, con normo-peso del 68.7% y con sobre-peso el 28.0%.

Para resolver este contraste tenemos que llevar a cabo una prueba chi-cuadrado de
bondad de ajuste, para lo cual las frecuencias esperadas bajo la hipótesis nula deben ser
todas mayores o iguales a 5. Según la Tabla 2.12, las frecuencias esperadas son en todos

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
los casos mayores o iguales a 5, por lo que podemos aplicar la prueba chi-cuadrado en
este caso.

En la Tabla 2.15 se observa que el p-valor de la prueba es menor de 2.2e-16, por lo que
será menor que el nivel de significación del 5%, rechazando por tanto la hipótesis nula.
Tenemos, por tanto, suficiente evidencia para afirmar que no siguen siendo válidos los
porcentajes del estudio del año 2000 para los niños estudiados en 2005-2006.

Si comparamos los porcentajes observados con los del año 2000, podemos ver que ha
disminuido mucho el porcentaje de niños con bajo-peso (ha pasado de un 13% a un
3.3%) y se ha incrementado el porcentaje de niños con sobre-peso (ha pasado del 25%
al 28.0%).

e) Obtener una estimación puntual y un intervalo de confianza del 95% para la


probabilidad de que un niño o niña tenga sobre-peso. En España, se ha establecido que
un 37% de la población infantil presenta sobre-peso ¿Podemos concluir que este
porcentaje es similar en la población venezolana estudiada?
Según los datos recogidos en el estudio, una estimación puntual del porcentaje de niños
y niñas con sobre-peso en Venezuela sería del 28.0%. Vamos a calcular además un
intervalo de confianza del 95% para esta estimación. En la Tabla 2.6 podemos ver que
el intervalo de confianza al 95% para la proporción de niños o niñas con sobre-peso en
Venezuela sería [25.29%,30.93%].

¡Celebra el fin de exámenes en un festival! Síguenos y gana entradas.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1230555

En la Tabla 2.6 se muestra también el contraste de este porcentaje con respecto a la


proporción de sobre-peso en España (π0=0.37). Sea π la proporción de sobre-peso en
Venezuela, queremos resolver el contraste de hipótesis:
H0: π0 = 0.37
HA: π0 ≠ 0.37

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Podemos ver que el p-valor del contraste binomial exacto es igual a 2.18e-9, por lo que
es menor que el nivel de significación α = 0.05, y por tanto podemos rechazar la
hipótesis nula y concluir que el porcentaje de sobre-peso en Venezuela es distinta a
España. En concreto, observando los valores obtenidos del estudio, en Venezuela
tenemos menos niños con sobrepeso.

Problema 3. Se está estudiando la eficacia de un fármaco en dos presentaciones


diferentes. Una de ellas se administrará por vía oral y la otra por vía intramuscular. Para
el estudio se eligen 24 voluntarios que se dividen aleatoriamente en dos grupos de igual
tamaño recibiendo cada grupo una de las dos formas de administración. En particular, se
analizarán la concentración máxima en plasma (CMAX) en µg/ml y el tiempo en el que
esta concentración máxima se alcanza (TMAX) en horas.

a) Identifica los elementos (variable(s) observada(s), población(es), muestra(s)), diseño


del experimento y objetivo del estudio.
Se han considerado dos poblaciones distintas:
P1= voluntarios a los que se les administra el fármaco por vía oral
P2= voluntarios a los que se les administra el fármaco por vía intramuscular
observando en cada una de ellas dos variables cuantitativas:
X= concentración máxima en plasma (CMAX) en µg/ml
Y= tiempo en el que esta concentración máxima se alcanza (TMAX) en horas
Para comparar la eficacia del fármaco en ambas poblaciones ese ha seleccionado
aleatoriamente una muestra de n1 = 12 voluntarios de vía oral y n2 = 12 voluntarios de
vía intramuscular.
En este caso tenemos dos muestras independientes, una de cada una de las poblaciones,
por lo que podemos estudiar si existen diferencias en la distribución de ambas variables
(X eY) respecto a ambos tipos de administración.

b) A partir de la información proporcionada por las tablas obtenidas con R, razona que
procedimientos serían los más apropiados para analizar estadísticamente los datos
obtenidos. Utiliza α=0.05.
En primer lugar vamos a estudiar si existen diferencias en la concentración máxima en
plasma (X) en ambos tipos de administración.
En la Tabla 3.1 tenemos una estimación de la media y la mediana poblacional de
CMAX para ambos tipos de administración. Podemos ver que la media y la mediana

TALENTO FARMACÉUTICO Y SANITARIO - MBA en Industria Farmacéutica y Biotecnológica


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1230555

muestral de CMAX es de 20.32 y 20.25, respectivamente, para la administración


intramuscular, y de 17.72 y 17.10, respectivamente, para la administración oral.

Como en este caso la muestra en ambos grupos es pequeña (n1 = n2 = 12), vamos a
comprobar la normalidad de ambas muestras aplicando la prueba de Shapiro-Wilks, que
es una prueba de normalidad que tiene como hipótesis nula la normalidad de la
distribución de la que provienen los datos y como hipótesis alternativa la no

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
normalidad.

En este caso, en la Tabla 3.3 podemos ver que el p-valor de los datos asociados a la
administración intramuscular es 0.592, mientras que el asociado a la administración oral
es 0.2271. Como ambos son mayores o iguales a 0.05, podemos aceptar la hipótesis
nula de normalidad en ambos casos para un nivel de significación de α = 5%.Por tanto,
podemos aplicar una prueba paramétrica para comparar:
µ1 = CMAX medio de los voluntarios con el fármaco por vía oral
µ2 = CMAXmedio de los voluntarios con el fármaco por vía intramuscular
En primer lugar, tenemos que evaluar la homogeneidad de varianzas de la variable X en
ambas poblaciones. Sean:
σ12 = varianza CMAX de los voluntarios con el fármaco por vía oral
σ22 = varianza CMAX de los voluntarios con el fármaco por vía intramuscular
Vamos a plantear el contraste de hipótesis:
H0: σ12 = σ22
HA: σ12≠ σ22
Para resolver este contraste utilizaremos la prueba de Levene. En la Tabla 3.4 podemos
ver el p-valor asociado a esta prueba es 0.005677, por lo que para un nivel de
significación del 5% rechazamos la hipótesis nula de homogeneidad de varianzas, por lo
que para comparar las dos medias utilizaremos la prueba de Welch de dos muestras.

Vamos a plantear el siguiente contraste de hipótesis:


H0: µ1= µ2
HA: µ1≠ µ2

¡Celebra el fin de exámenes en un festival! Síguenos y gana entradas.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1230555

En la Tabla 3.9 podemos ver que el p-valor de la prueba es 0.04593, por lo que para un
nivel de significación del 5% rechazamos la hipótesis nula, por lo que podemos decir
que el CMAX medio de ambos procedimientos no es igual. Podemos ver que el CMAX
asociado a la vía intramuscular es mayor que el asociado a la vía oral.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
En segundo lugar vamos a estudiar si existen diferencias en el que esta concentración
máxima se alcanza (Y) en ambos tipos de administración. En la Tabla 3.1 tenemos una
estimación de la media y la mediana poblacional de TMAX para ambos tipos de
administración. Podemos ver que la media y la mediana muestral de TMAX es de 1.50
y 1.50, respectivamente, para la administración intramuscular, y de 1.79 y 2.0,
respectivamente, para la administración oral.

Como en este caso la muestra en ambos grupos es pequeña (n1 = n2 = 12), vamos a
comprobar la normalidad de ambas muestras aplicando la prueba de Shapiro-Wilk, que
es una prueba de normalidad que tiene como hipótesis nula la normalidad de la
distribución de la que provienen los datos y como hipótesis alternativa la no
normalidad.

En este caso, en la Tabla 3.2 podemos ver que el p-valor de los datos asociados a la
administración intramuscular es 0.01114, mientras que el asociado a la administración
oral es 0.01922. Como ambos son menores de 0.05, tenemos suficiente evidencia para
rechazar la hipótesis nula de normalidad en ambos casos para un nivel de significación
de α = 5%. Por tanto, podemos aplicar una prueba no paramétrica para comparar ambas
distribuciones.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1230555

Sean: m1 = mediana CMAX de los voluntarios con el fármaco por vía oral
m2 = mediana CMAX de los voluntarios con el fármaco por vía intramuscular
Vamos a resolver el siguiente contraste de hipótesis:
H0: m1= m2
HA: m1≠ m2
En la Tabla 3.15 podemos ver que el p-valor de la prueba de Wilcoxon es 0.1988, por lo

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
que para un nivel de significación del 5% no tenemos suficiente evidencia para rechazar
la hipótesis nula, por lo que el TMAX de ambos procedimientos es igual.

c) ¿Hay evidencia de que las diferentes formas de administración del fármaco impliquen
diferencias en la concentración máxima del mismo?
Sí, tal y cómo se ha visto en el apartado b).

d) Si es posible, determina un intervalo de confianza del 95% para la diferencia de las


medias de la concentración máxima.
Sea µd = µ1 - µ2 la diferencia de las medias de CMAX entre el grupo intramuscular y
oral. Hemos visto que una estimación del efecto adicional de la vía intramuscular
respecto a la vía oral era:
µˆ d = µˆ1 − µˆ 2 = x1 − x2 = 20.31751 − 17.71667 = 2.60
Además, en la Tabla 3.9 podemos ver un intervalo de confianza para este parámetro:
IC95% ( µ d ) = [0.0559,5.1458]

e) ¿Hay evidencia de que las diferentes formas de administración del fármaco impliquen
diferencias en la variable TMAX? ¿Podrías dar un intervalo de confianza para estimar
esta diferencia? Justifica cada respuesta.
No hay evidencia, tal y cómo hemos visto en el apartado b).
En este caso no podemos calcular un intervalo de confianza por no tener normalidad.

TALENTO FARMACÉUTICO Y SANITARIO - MBA en Industria Farmacéutica y Biotecnológica