Anda di halaman 1dari 23

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER

FACULTAD DE INGENIERA QUMICA







ESCUELA ACADMICA PROFESIONAL DE INGENIERIA QUMICA









Presentado al:


Dr.Sc ABRAHAM PALACIOS VELASQUEZ


Realizado por:


MERINO ROJAS Cristina Carolina






Alumna del III ciclo de Ingeniera Qumica







HUANCAYO- PERU


EJERCICIOS ANOVA
PREGUNTAS Y EJERCICIOS
1. Explique en qu consiste y cuando se debe aplicar el diseo
completamente al azar con un solo criterio de clasificacin.

Este diseo est centrado en comparar los tratamientos en cuanto a sus medias
poblacionales y se utiliza cuando el objetivo es comparar ms de dos tratamientos

2. Supongamos que se desea aprobar la igualdad entre s de cinco medias. Una
alternativa para hacer esto sera comparar de dos en dos las medias, utilizando
la prueba T student y al final tomar una decisin. Explique porque esto
aumenta el error tipo I.

En este caso con cinco medias tenemos diez posible pares de medias, y si la
probabilidad de aceptar la H
0
para cada prueba individual es de 1- = 0.95, entonces
la probabilidad de aceptar las diez H
0
es de 0.95
10
= 0.5987, lo cual representa un
aumento considerable del error tipo I. Aunque se utilice un nivel de confianza tal que
(1-
)
10
= 0.95, el procedimiento resulta inapropiado porque se pueden
producir sesgos por parte del experimentador.

3. Qu mide el cuadrado medio del error en el ANOVA de un experimento?

Mide la suma de cuadrados divididos entre sus respectivos grados de libertad

4. Qu son los grados de libertad para una suma de cuadrados en un anlisis de
varianza?

Representa el nmero de piezas de informacin independientes en la suma de
cuadrados. En general, es el nmero de observaciones menos el nmero de
parmetros estimados de los datos.

5. A continuacin se muestra parte del ANOVA para comparar cinco tratamientos
con cuatro replicas cada uno.

Fuente
de
variacin
Suma de
cuadrados
G. de
libertad
C. medio Razn F Valor p
Tratamiento
Error
Total
800
400
1200
4
15
19
200
26.66
7.5 P(3.06>7.5)












a) Agregar en esta tabla los grados de libertad, el cuadrado medio y la razn F para
cada una de las Fuentes de variacin.
b) Explique de manera esquemtica como calculara el valor P o la significancia
observada, para ver si hay diferencia entre tratamientos.

Valor-p es el rea bajo la distribucin F
k-1, N-k
a la derecha del estadstico F
0
, es decir,
el valor-p=P (F>F
0)


c) Con la informacin disponible se puede hacer conjeturas sobre si hay diferencias
significativas entre tratamientos? Argumente su respuesta.

Es posible determinar la diferencia entre los tratamientos, mediante la informacin
presentada en la tabla ANOVA con el valor obtenido del estadstico F
0
que sigue una
distribucin F con (k-1) grados de libertad en el numerador y (N-k) grados de libertad en
el denominador y el valor obtenido de la tablas de la distribucin F para probar la
hiptesis de igualdad de los tratamientos con respecto a la media de la correspondiente
variable de respuesta. Ya que en caso de rechazar la hiptesis anterior se estara
asumiendo que las medias de los tratamientos son diferentes.


d) Anote el modelo estadstico y formule la hiptesis pertinente.






6. Se desea investigar el efecto del pH en el crecimiento de cierto
microorganismo en un medio especfico. Para ello se realiza un experimento,
teniendo como punto de partida la misma cantidad de microorganismos. Se
hacen cuatro repeticiones y se obtienen los siguientes resultados. estos
datos son evidencia suficiente para afirmar que los niveles de pH donde se
logra menor y mayor crecimiento son el 3 y el 2, respectivamente? Explique
su respuesta.

Nivel de pH Crecimiento promedio (en %)
1
2
3
80
105
75


No se puede afirmar que el nivel de pH influya directamente en el crecimiento
promedio, se considera que hay ms factores que intervienen, adems es necesario
que nos proporcionen ms datos por tratamiento para tomar esa decisin.

7. Se desea investigar la influencia de la temperatura en el rendimiento de un
proceso qumico, en particular interesa investigar un rango de temperatura
entre 60 y 120 C. se tiene recursos para realizar 20 corridas
experimentales.

a)Los niveles de temperatura con los que se experimenta son: 60, 65, 70 y 120; se
hacen 5 repeticiones con cada nivel. Considera que es adecuado el diseo
experimental usado? Argumente su respuesta, y de ser necesario proponga
alternativas.

No es adecuado el diseo experimental debido a que los niveles de temperatura con
los cuales se pretende experimentar no estn distribuidos uniformemente en el rango
establecido, se recomienda hacer un experimento con 5 rplicas para los siguientes
tratamientos: 60,80, 100, 120.


b) El orden en que decidieron hacer las corridas experimentales para facilitar el
trabajo experimental fue: primero la cinco del nivel bajo de temperatura luego la cinco
del siguiente y as hasta finalizar. Es correcto lo que hicieron? Argumente su
respuesta

No es correcto, las corridas experimentales deben ser aleatorias para que el
resultado de un tratamiento no influya en el inmediato siguiente (no violar los
supuestos del modelo)

c)Para hacer el anlisis estadstico se comparan, mediante una prueba T-student, de
dos en dos niveles de temperatura, y con base en esto obtuvieron conclusiones. Es
adecuado tal anlisis? , argumente, en su caso proponga alternativas.

No adecuado, aumenta el error tipo I: rechazar la Ho siendo verdadera en cada par de
medias
8. Describa en qu consiste cada uno de los supuestos del modelo en el
anlisis de varianza, y explique la forma tpica en que estos supuestos se
verifican.


Normalidad: Consiste en verificar que los residuos sigan una distribucin
normal con media cero y se verifica graficando los residuos en una escala
X-Y de tal manera que si los residuos siguen una distribucin normal al
graficarlos tienden a quedar alineados en una lnea recta.

Varianza Constante: Comprobar que los residuos de cada tratamiento
tienen la misma varianza, es verificado graficando los predichos contra los
residuos y si los puntos en esta grafica se distribuyen de manera aleatoria
en una banda horizontal (sin ningn patrn claro y contundente) entonces es
seal de que se cumple el supuesto de que los tratamientos tienen igual
varianza.

Independencia: Probar que los residuos son independientes entre si, se
verifica si se grafica el orden en que se colecto un dato contra el residuo
correspondiente, de esta manera si al graficar en el eje horizontal el tiempo
(orden de corrida) y en el eje vertical los residuos, se detecta una tendencia o
patrn no aleatorio claramente definido, esto es evidencia de que existe una
correlacin entre los errores y, por lo tanto el supuesto de independencia no
se cumple.


9. Qu son y cuando se aplican las pruebas para comparar medias?

Son mtodos que nos permiten hacer comparaciones entre todos los
posibles pares de medias, dependiendo del nmero de tratamientos para
identificar cuales resultaron diferentes, Se aplican cuando es rechazada
la Ho (todas las medias son iguales).

10. En una industria qumica se prueban diferentes mezclas para ver si difieren en
cuanto al peso molecular final. Se prueban cuatro diferentes mezclas, con
cinco repeticiones cada una (=0.05). A continuacin se muestra una parte de
la tabla de anlisis de varianza y los promedios obtenidos para cada mezcla.
Fuente de variacin Valor p
Mezcla 0.01
Error

Mezcla Peso medio
A 10000
B 7000
C 8000
D 7500

a) Las mezclas difieren de manera significativa en cuanto a su peso molecular?
S, se puede observar en los datos, una diferencia significativa entre el peso
molecular.
b) Con el anlisis de varianza de acuerdo al promedio, se puede asegurar que
con la mezcla B se logra un menor peso molecular? Argumente su respuesta. No,
dado que es necesario saber qu condiciones influyeron en cada uno de los
experimentos.
c) Si al verificar los supuestos de varianza constante (igual varianza entre las
mezclas), stos no se cumplen, qu significa eso? Se puede seguir apoyando la
conclusin del inciso (a)? S, ya que al inicio se especific que hay una gran
diferencia entre los tratamientos, esto se debe a una diferencia notable entre las
varianzas.
11. Se hace un estudio sobre la efectividad de tres marcas de spray para matar
moscas.
Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el
nmero de moscas muertas expresado en porcentajes.
Nmero de replica
Marca 1 2 3 4 5 6
1 72 65 67 75 62 73
2 55 59 68 70 53 50
3 64 74 61 58 51 69

a) Formule la hiptesis adecuada y el modelo estadstico.


Hiptesis nula:
Ho= 1 = 2
Ho= 1 = 3
Ho= 2= 3

Hiptesis alternativa:
H
A
= 1 2
H
A
= 1 3
H
A
= 2 3

b) Existe diferencia significativa entre la efectividad promedio de los
productos en spray? La media de cada uno de los productos fueron los
siguientes:
Marca 1: 69
Marca 2: 59.16
Marca 3: 62.83
A simple vista se puede deducir con esto, que la marca 1 es la que presenta
mayor efectividad, mientras que el producto 2 y 3 no tienen mucha diferencia,
sin embargo, es prudente analizar la varianza de estos datos ms a fondo.

c) Hay algn spray mejor? Argumente la respuesta
ANOVA
Fuentes
de
variacin
Suma de
cuadrado
s
Grado
s de
liberta
d
Cuadrado
s medios
Fo F tablas
Tratamient
o
281.33 5 56.26 0.8328 < 3.1058
Error 810.636 12 67.55

Total 1092 17


Considerablemente el spray de la marca 1, dado que la tabla ANOVA indica
que existe diferencia entre las medias de los datos, sin embargo el mtodo LSD
puede ser de utilidad para comprobar la H
A
que indica que al menos una de las
medias es diferente con respecto al mtodo utilizado.
Comparaciones= (3 (3-1))/2= (3(3-1))/2=6/2=3
LSD= t/2, GL error CM error (1/nm+ 1/nn)
LSD= t 0.05/2, 17 67.55 (1/6+1/3)
LSD= 0.025, 18 67.55 (3/6)
LSD= 2.1315 (4.22)=8.99





Ho |yi-yj| LSD ni nj

1-

2
| 69-59.16 |
9.84
>
8.99
3 7

1-

3
| 69-62.83 | 6.17< 8.99 3 7

2-

T3

| 59.16 -62.83
|
3.67< 8.99
3 7


2

3

1


d) D un intervalo al 95% de confianza para la efectividad promedio
(porcentaje) de cada una de las marcas.

12. En un centro de investigacin se realiza un estudio para comparar
varios tratamientos que, al aplicarse a los frijoles crudos, reducen su tiempo
de coccin. Estos tratamientos son a base de bicarbonato de sodio
(NaHCO3) y cloruro de sodio o sal comn (NaCl). El primer tratamiento es
el del control, que consiste en no aplicar ningn tratamiento. El tratamiento
T2 es el remojo en agua con bicarbonato de sodio, el T3 es el remojar en
agua con sal comn y el T4 es remojar en agua con una combinacin de
ambos ingredientes en proporciones iguales. La variable de respuesta es el
tiempo de coccin en minutos. Los datos se muestran en la siguiente tabla:
Control T
2
T
3
T
4

213 76 57 84
214 85 67 82
204 74 55 85
208 78 64 92
212 82 61 87
200 75 63 79
207 82 63 90
yi. 552 430 599 1581 y..
ni 7 7 7 21 N
yi 78.85 61.42 85.57 75.28
Media
Y

a). De qu manera el experimentador debe aleatorizar los experimentos y el
material experimental? Tratando los datos completamente al azar, esta manera
determinar el orden en que se realizarn los experimentos
b) De ejemplos de factores que deben estar fijos durante las pruebas
experimentales, para que no afecten los resultados y las conclusiones.
Calidad y/o procedencia de los reactivos utilizados
Especie de frijoles
Grosor del recipiente donde se cocern
Volumen de agua utilizada
Tipo de flama utilizada en el experimento

c) Formule y pruebe la hiptesis de que las medias de los tratamientos son
iguales.
Ho=
T2
=
T3
=
T4
H
A

T2

T3

T4

ANOVA
Fuentes
de
variacin
Suma de
cuadrado
s
Grado
s de
liberta
d
Cuadrado
s medios
Fo F tablas
Tratamient
o
2174 2 1087
59.239619
4
>3.5545571
5
Error
330.28571
4
18
18.349206
3

Total
2504.2857
1
20


El valor crtico de F es mayor que el valor F de tablas por lo tanto, es
aceptada de H
A,
de acuerdo a los resultados obtenidos se acepta la
hiptesis alternativa


e) .Hay algn tratamiento mejor? .Cual es el tiempo de coccin esperado para el
mejor tratamiento?
LSD; servir para comprobar la H
A
que indica que al menos una de las medias
es diferente con respecto al mtodo utilizado.
Comparaciones= (3 (3-1))/2= (3(3-1))/2=6/2=3
LSD= t/2, GL error CM error (1/nm+ 1/nn)
LSD= t 0.05/2, 18 18.34 (1/3+1/7)
LSD= 0.025, 18 18.34 (10/21)
LSD= 2.10 (2.92)=6.20

Ho |yi-yj| LSD ni nj

T2-

T3
| 78.85-61.42
|
17.43 6.20*
3 7

T2-

T4

| 78.85-85.57
|
6.42 6.20*
3 7

T3-

T4

| 61.42 -85.57
|
24.15 6.20*
3 7

Con la prueba LSD se deduce se rechaza la Ho y se acepta la H
A
, la cual indica
que cada uno de los tratamientos son diferentes.



T3

T2

T4
Derivado del anlisis anterior se puede llegar a la conclusin de que el
tratamiento T3 es el mejor por tener el menos tiempo, recordando que la
eficiencia en un proceso se traduce bsicamente en tiempo y dinero.

f) Algo importante a cuidar en un experimento es que no haya efectos
colaterales no deseados, causados por el tratamiento ganador; en este caso,
piense en los posibles efectos colaterales que podra causar el mejor
tratamiento. El cloruro de sodio puede causar daos severos a la salud, as
como al medio ambiente.

15.Una compaa farmacutica desea evaluar el efecto que tiene la cantidad de
almidn en la dureza de las tabletas. Se decidi producir lotes con una cantidad
determinada de almidn, y que las cantidades de almidn a aprobar fueran de
2%, 5% y 10%. La variable de respuesta seria el promedio de la dureza de 20
tabletas de cada lote. Se hicieron 4 rplicas por tratamiento y se obtuvieron los
siguientes resultados:

% de almidn Dureza
2 4.3 5.2 4.8 4.5
5 6.5 7.3 6.9 6.1
10 9.0 7.8 6.1 8.1

a) Hay evidencia suficiente de que el almidn influya en la dureza de las
tabletas?
A simple vista, los datos que arroja la tabla anterior, indican que el
porcentaje de almidn es directamente proporcional al nivel de dureza que
presentan las tabletas.
Ho=
T2
=
T3
=
T4

% de almidn Dureza
2 4.3 5.2 4.8 4.5
5 6.5 7.3 6.9 6.1
10 9.0 7.8 6.1 8.1
yi. 19.8 20.3 17.8 18.7 76.6 y..
ni 3 3 3 3 12 N
yi 6.6 6.76 5.93 6.23 6.38
Media
Y


b) Realice los anlisis complementarios necesarios.

ANOVA
Fuentes
de
variacin
Suma de
cuadrado
s
Grado
s de
liberta
d
Cuadrado
s medios
Fo F tablas
Tratamient
o
1.25 3 0.418
0.14
<
4.066
Error 23.62 8 2.95
Total 24.87 11

Segn los resultados arrojados por el anlisis de varianza, la F de tablas es
mayor que la F calculada, por lo que se acepta la hiptesis nula, que dice, que
todas las medias de los tratamientos son iguales entre s, esto es, que tal y como
se mostr al inicio de la tabla, el porcentaje de almidn adicionado a las tabletas,
es directamente proporcional al nivel de dureza adquirido por las tabletas.

c) Si se desea maximizar la dureza de las tabletas, que recomendara al
fabricante?
En principio fabricar tabletas con porciones equivalentes, es decir, almidn con
respecto a la sustancia activa, adems de revisar bien los datos arrojados por el
estudio, ya que cuando pasamos de un 2% a un 5% de almidn la dureza
aumenta 1.52 veces, sin embargo, cuando pasan a agregar 10%, slo aumenta
1.38 respectivamente, por lo que considero que debera llegarse a un trmino
adecuado donde se contemple la economa de la empresa.



16.- Los datos que se presentan en seguida son rendimientos en toneladas por
hectrea de un pasto con tres niveles de fertilizacin nitrogenada. El diseo fue
completamente aleatorizado, con cinco repeticiones por tratamiento.

Niveles de nitrgeno
1 2 3
14.823 25.151 32.605
14.676 25.401 32.460
14.720 25.131 32.256
14.5141 25.031 32.669
15.065 25.276 32.111

a) Las diferencias mustrales hacen obvia la presencia de diferencias
Poblacionales? No especficamente dado que, al estudiar una pequea parte
de la poblacin, no podemos asumir que todas las dems sean iguales ya que
existen determinados factores para cada parte que no se aprecian a simple
vista.




b) Obtenga el anlisis de varianza e interprtelo.


ANOVA
Fuentes
de
variacin
Suma de
cuadrado
s
Grado
s de
liberta
d
Cuadrado
s medios
Fo F tablas
Tratamient
o
788.36 2 394.18 10102.8 3.885
Error 0.468 12 0.039
Total 788.82 14

Se puede apreciar una diferencia bastante marcada entre la Fo y la F de tablas,
lo cual indica que existe una diferencia entre las medias de los tratamientos por lo
que procedemos a realizar el clculo LSD (Diferencia Mnima Significativa).

LSD nos ayudar a comprobar con respecto la H
A
cul de las medias es
diferente con respecto al mtodo utilizado?
Comparaciones= (3 (3-1))/2= (3(3-1))/2=6/2=3
LSD= t/2, GL error CM error (1/nm+ 1/nn)
LSD= t 0.05/2, 12 0.039 (1/3+1/5)
LSD= 0.025, 12 0.039 (1/3+1/5)
LSD= 2.178 (0.1438)=0.3131

Ho |yi-yj| LSD ni nj

A-

B
| 14.75-25.19| 10.84 0.3131* 3 5

B-

C
| 25.19-32.42| 7.23 0.3131* 3 5

C-

A
| 32.42-14.75| 17.67 0.3131* 3 5

Con la prueba LSD se deduce se rechaza la Ho y se acepta la H
A
, la cual indica
que cada TODOS los tratamientos son diferentes entre s.

A

B

C

Derivado del anlisis anterior se puede llegar a la conclusin de que el
tratamiento 3 es el mejor por tener mayor rendimiento, recordando que la
eficiencia de fertilizacin nitrogenada se traduce bsicamente en tiempo y dinero.

17.- Un qumico del departamento de desarrollo de un laboratorio farmacutico
desea conocer cmo influye el tipo de aglutinante utilizado en tabletas de
ampicilina de 500mg en el porcentaje de friabilidad; para ello, se eligen los
siguientes aglutinantes: polivinil-pirrolidona (PVP), carboximetilcelulosa sodica
(CMC) y grenetina (Gre). Los resultados del diseo experimental son los
siguientes.

Aglutinante % de friabilidad
PVP 0.485 0.250 0.073 0.250 0.161
CMC 9.65 9.37 9.53 9.86 9.79
Gre 0.289 0.275 0.612 0.152 0.137




a) Especifique el nombre del diseo experimental.
Anlisis del efecto del aglutinante en pastillas de ampicilina con respecto al
porcentaje de friabilidad.


b) Sospecha que hay algn efecto significativo del tipo de aglutinante sobre
la variable de respuesta? S, dado que como se puede observar en los
datos, no permanecen todos homogneos o con un rango de diferencia
aceptable sino que dependiendo del aglutinante se disparan,
especficamente en el CMC.



c) Escriba la hiptesis para probar la igualdad de medias y el modelo
estadstico.

Hiptesis
Ho=
T1
=
T2
=
T3
=
T4
H
A

T1

T2

T3

T4

Modelo estadstico
Yij= + Ti+Eij



d) Realice el anlisis adecuado para probar las hiptesis e intrprete los
resultados.

Aglutinante % de friabilidad
PVP 0.485 0.250 0.073 0.250 0.161
CMC 9.65 9.37 9.53 9.86 9.79
Gre 0.289 0.275 0.612 0.152 0.137
yi.
10.424 9.895 10.215 10.262 10.088
50.884 y..
ni
3 3 3 3 3
15 N
yi
3.47 3.298 3.405 3.4206 3.362
16.96
Media
Y




ANOVA
Fuentes
de
variacin
Suma de
cuadrado
s
Grado
s de
liberta
d
Cuadrado
s medios
Fo F tablas
Tratamient
o
0.0523 4 394.18
0.0004467
<
3.4780
Error 293.10 10 0.039
Total 293.15 14









La razn F calculada es menor a F de tablas por lo que se acepta la Ho que nos
dice que todas las medias son iguales entre s.

e) Revise los supuestos Hay algn problema?


1.- Normalidad


El experimento no cumple con el supuesto de normalidad dado su coeficiente de
correlacin de 0.65.















R = 0.6506
-2.5
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
0 2 4 6 8 10 12
Normalidad
Zi
Linear (Zi)
















2.- Homogeneidad


El experimento no cumple con el supuesto de homogeneidad al presentarse los
datos disparados y acumulados solo en algunas partes.

3.- Grfico de medias
-12
-10
-8
-6
-4
-2
0
9.8 9.9 10 10.1 10.2 10.3 10.4 10.5
Homogeneidad
eij (e. residual)














4.- Prueba de independencia



El experimento no cumple con el supuesto de independencia, al presentar datos
dependientes unos de otros en algunas partes del experimento.

0
2
4
6
8
10
12
0 1 2 3 4 5 6
Grfico de medias
datos orig.
yi.(media)
R = 0.71
-14
-12
-10
-8
-6
-4
-2
0
0 5 10 15 20
Prueba de independencia
eij (e. residual)
Linear (eij (e. residual))

18.- Se cultivaron cuatro diferentes clonas de Agave tequilana bajo un mismo
esquema de manejo. Se quiere saber qu clona es la que responde mejor a dicho
manejo, evaluando el nivel de respuesta con el porcentaje de azucares
reductores totales en base hmeda. Los datos se muestran a continuacin:

Clona
1 2 3 4
8.69 8.00 17.39 10.37
6.68 16.41 13.73 9.16
6.83 12.43 15.62 8.13
6.43 10.99 17.05 4.40
10.30 15.53 15.42 10.38

a) Mediante ANOVA, compare las medias de las clonas y verifique
residuales.



1.- Normalidad
ANOVA
Fuentes
de
variacin
Suma de
cuadrado
s
Grado
s de
liberta
d
Cuadrado
s medios
Fo F tablas
Tratamient
o
213.62 3 71.20 12.53 > 3.238
Error 90.925 16 5.68
Total 304.55 19

Los datos del experimento cumplen con el supuesto de normalidad entre sus
datos al tener una R
2
= 0.9491 (0.9491=0.9742), es decir, bastante cercano a
1.













2.-Homogeneidad
R = 0.9491
-2.5
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
0 5 10 15 20
Normalidad
Zi
Linear (Zi)

Los datos adems, presentan cierto grado de homogeneidad en su distribucin
porque lo que se considera que tambin se cumple con este supuesto.

3.- Independencia

Aunado a lo anterior, los datos arrojados tambin cumplen con el supuesto de
independencia, esto se puede apreciar con el simple hecho de visualizar la
distribucin de los datos en el grfico, o bien, calcular la R
2
que nos arroja
0.0005, muy lejano de 1.

b) Hay una clona que haya respondido mejor al esquema de manejo?
Argumente su respuesta. Segn el grfico de medias, la clona 2 es la
ms cercana a la realidad (media general).
0
0.2
0.4
0.6
0.8
1
1.2
1.4
0 5 10 15 20
Homogeneidad
eij (e. residual)
R = 0.0005
0
0.2
0.4
0.6
0.8
1
1.2
1.4
0 5 10 15 20 25
Independencia
eij (e. residual)
Linear (eij (e. residual))





0
2
4
6
8
10
12
14
16
18
20
0 1 2 3 4 5
Diagrama de medias
datos orig.
yi.(media)
Media
general: 11.19

Anda mungkin juga menyukai