Anda di halaman 1dari 7

ANALISIS DE LA VARIANZA

En la estimacin de parmetros y contrastes de hiptesis se estudi, por ejemplo, la comparacin entre medias de dos poblaciones. Con esta herramienta se puede decidir, por ejemplo, si la dureza de un metal templado con cierto tipo de aceite es mayor que la dureza obtenida con otro tipo. Este problema es un caso particular del estudio de la influencia de un factor o variable explicativa, el tipo de aceite en la dureza del templado. Para el factor en estudio slo se han considerado dos niveles aceite tipo 1 y tipo2. Si se quieren estudiar ms niveles, por ejemplo un aceite tipo 3, o bien la influencia conjunta de dos o ms factores, por ejemplo tipo de aceite y temperatura, en una variable respuesta no se pueden utilizar las tcnicas anteriores. El procedimiento a utilizar es el anlisis de la varianza (ANOVA). A primera vista podra parecer posible abordar estos problemas con las tcnicas de regresin anteriores. Sin embargo, en regresin, las variables explicativas o factores tienen que ser cuantitativas, mientras que en anlisis de la varianza suelen ser cualitativas, como por ejemplo, el tipo de aceite. Adems, los distintos niveles de los factores son generalmente controlables por el experimentador y no pueden tomar cualquier valor, mientras que en los modelos de regresin suelen ser no controlables. Estas formas de anlisis que permiten la influencia del experimentador en el mejoramiento de los procesos y diseo de las experiencias se denominan tcnicas de diseo experimental. Las tcnicas de diseo experimental basadas en la estadstica son particularmente tiles en el mundo de la ingeniera. Los resultados de estos experimentos pueden conducir a: 1. 2. 3. 4. Mejorar el rendimiento del proceso Reducir la variabilidad del proceso y acercarlo a los requerimientos nominales Disminucin del tiempo de diseo y desarrollo Disminucin del costo de operacin

Algunas aplicaciones representativas de los experimentos diseados de manera estadstica en la ingeniera de diseo son: 1. Evaluacin y comparacin de configuraciones de diseo bsicas 2. Evaluacin de diferentes materiales 3. Seleccin de parmetros para obtener diseo robusto (que funcione bien bajo una gama amplia de condiciones) 4. Determinacin de los parmetros ms importantes que impactan sobre el funcionamiento del producto Todo lo anterior est basado en los ANlisis DE VArianza (ANDEVA o ANOVA por su nombre en ingls). Los conceptos bsicos de ANOVA se introducen con el modelo de un factor con varios niveles. Se contrasta si se producen los mismos resultados de la variable respuesta para los distintos niveles del factor, y en caso de no ser as, se comparan las medias correspondientes a los distintos niveles del factor.

ANOVA CON UN FACTOR


El propsito del anlisis de varianza con un factor es estudiar el efecto de la aplicacin de varios niveles de un factor en una variable respuesta. Para ello se comparan las medias observadas en las muestras correspondientes a los distintos niveles del factor. Si estn prximas, las diferencias se atribuyen al azar. En caso contrario, se concluye que los efectos de los tratamientos o niveles son significativos. El contraste de hiptesis se basa en la comparacin de dos estimaciones de la varianza y de ah procede el nombre de esta tcnica.

43

Notacin: k ni yij
k

: n de niveles del factor : tamao de la m.a.s. del nivel i-simo : observacin j-sima de la variable respuesta correspondiente al nivel i-simo (i=1, 2, ..., k; j= 1, 2, ...,ni)

n=

n
i =1

: nmero total de observaciones

: valor medio de la variable respuesta correspondiente al nivel i


i-simo del factor Fijado un nivel i, las diferencias entre los valores observados dentro de ese nivel, yij , y su media , i son el resultado de mltiples factores no controlados que se denominan efectos residuales o errores residuales eij . Por tanto, yij
=

+ eij i

Para el anlisis de los datos se adopta la hiptesis de que los errores residuales, e ij , son independientes y siguen la misma distribucin N(0, ). Esto equivale a decir que la distribucin de cada observacin Yij es N( , ). i Contraste de igualdad de medias Se trata de probar si las diferencias observadas n los distintos niveles se deben a que alguno (o todos) tiene influencia en la variable respuesta o si se deben al azar. La hiptesis nula es que las diferencias son debidas al azar, es decir: Ho : = =...= k 1 2 H1: Alguna diferencia existe Los resultados se ordenan en una tabla como la siguiente: Variable respuesta Nivel 1 Nivel 2 . . . Nivel k Y1 Y2 . . . Yk Observaciones y11 ... y1n1 y21 ... y2n2 . . . yk1 ... yknk Media Muestral Media Poblacional

y1 y2
. . .

1 2

. . .

yk

El contraste se basa en la comparacin de dos estimaciones independientes de la varianza comn 2 . Para ello se descompone la variabilidad total de los datos en dos componentes: una que refleja la variacin dentro del nivel y la otra que refleja la variacin entre los niveles. En caso de que Ho sea cierto, la segunda componente es cero, no obstante que se observarn diferencias en las medias de los distintos niveles. Hay que probar mediante el contraste que esas diferencias se deben al azar.

44

En caso de rechazar Ho, se considera que las diferencias se deben a la influencia de los distintos niveles. El procedimiento prctico, como en todos los test, es el siguiente: Fijado un nivel de significacin

, se busca en la tabla Fk ,n ,un valor k tal que P(F > k) = 1 k

2 2 Se calcula el cuociente S e / S r . Si es mayor que k, se rechaza Ho y en caso contrario se acepta.

Observacin: 2 2 Se puede demostrar que S e / S r ~ Fk ,n , donde 1 k

S e2 =
y

SCE ( k 1) 2

S r2 =

SCD ( n k ) 2

SCE = ni ( yi y ) 2
i =1

: Suma de cuadrados entre los niveles

SCD =
i =1

(y
j =1 ni

ni

ij

yi ) 2

: Suma de cuadrados dentro de los niveles

STC = SCE + SCD

: Suma de cuadrados total

STC =
i =1

(y
j =1

ij

y )2

Anlisis de las diferencias de medias


Si se rechaza Ho, se concluye que alguna diferencia existe, pero no se sabe donde. La solucin es comparar las parejas de las cuales se tenga alguna sospecha de que pueden ser las causantes de las diferencias (tal vez todas). Esta comparacin puede hacerse mediante intervalos de confianza o prueba de hiptesis para la diferencia de medias. 2 La diferencia con el mtodo usual, es que debe estimarse 2 a travs de S r (que contiene los datos de toda la muestra) y no solamente de los datos de la pareja en estudio. Para el clculo del intervalo de confianza y para el contraste de hiptesis se utiliza los mismos estadsticos conocidos, haciendo la salvedad del estimador de la varianza.

Comparaciones mltiples
Existen varios mtodos de comparaciones mltiples, entre los ms conocidos estn : el test de Tukey, el test de Scheffe, el test LSD, el test de Bonferroni, el test de Duncan y otros. Todos ellos utilizan estadsticos de prueba en que se considera la influencia de todas las observaciones y no solamente de los pares en estudio. Adems, entregan p-valores los que se contrastan con el nivel de significacin alfa y se utilizan los criterios clsicos para aceptar o rechazar. Ejemplo: Se mide la temperatura de una mezcla con 4 termmetros obtenindose los siguientes datos:

45

Termmetros 1 2 3 4

Observaciones 63, 63, 62, 65, 66, 63 64, 64, 63, 64, 65 58, 59, 59, 68 61, 61, 62, 60, 63

ANALISIS DE LA VARIANZA PARA DOS O MAS FACTORES


Un experimento es slo una prueba o una serie de pruebas. En todas las disciplinas cientficas y en ingeniera se realizan experimentos, y son una parte importante en el aprendizaje de la forma en que trabajan los sistemas y los procesos. La validez de las conclusiones que se obtienen de un experimento depende en gran medida de la manera en que ste se efecte. Por tanto el diseo del experimento tiene un papel importante en la solucin eventual del problema que lo motiv. En el medio de la ingeniera, las aplicaciones el diseo experimental son numerosas. Algunas reas de uso potencial son: Deteccin de fallas en procesos Desarrollo y optimizacin de procesos Evaluacin de materiales y alternativas Confiabilidad y pruebas de duracin Pruebas de rendimiento Configuracin del diseo de productos Determinacin de la tolerancia de los componentes

Los mtodos de diseo experimental permiten resolver estos problemas de manera eficiente durante las primeras etapas del ciclo del producto. Esto ofrece la ventaja de reducir de manera notable tanto el costo total del producto como el tiempo de desarrollo. Se estudiar un modelo con dos factores con interaccin entre ellos. Las mismas ideas son aplicables a modelos con ms factores, aunque se complican los clculos. Statgraphics permite incluir hasta 10 factores con interacciones conjuntas de hasta tres factores. MODELO CON DOS FACTORES E INTERACCION

yijk = + i + j + I ij + e ijk
donde:

i=1...n ; j=1...r ; k=1...s

i j
I ij

y ijk

: Es el valor k-simo de la variable respuesta dentro del nivel i del factor A y del nivel j del factor B : Es la media global : Mide el efecto del nivel i del factor A : Mide el efecto del nivel j del factor B

: Mide la interaccin entre los factores A y B; es decir, la diferencia entre el valor observado y el previsto con un modelo que supone efectos aditivos de los factores eijk : Es el error o efecto residual. Se adopta la hiptesis de que estos errores son independientes y se distribuyen N (0, )

46

Los parmetros , j e I ij miden los efectos diferenciales respecto a la media global ; es decir, i miden los incrementos (positivos o negativos) sobre la media global producido por cada uno de los niveles de los factores y por la interaccin. Por tanto se deben compensar los efectos de unos niveles con los de otros, esto es:

=
i =1 i j =1

= I ij = I ij = 0
i =1 j =1

Contrates a realizar: 1. Ho: 1 = 2 = ... = n = 0 H1: Algn 2.

es distinto de cero i

Ho: 1 = 2 = ... = r = 0

H1: Algn j es distinto de cero

3.

Ho: I ij = 0 para todo (i,j) H1: Algn I ij es distinto de cero

De forma anloga a lo estudiado para un factor, se hace una descomposicin del tipo : STC = SCA + SCB + SCI + SCD Donde: SCA SCB SCI SCD : Suma de cuadrados entre los niveles de A. Mide la variabilidad debida al factor A. : Suma de cuadrados entre los niveles de B. Mide la variabilidad debida al factor B : Suma de cuadrados que mide la variabilidad debida a la interaccin de los factores : Suma de los cuadrados dentro de los niveles. Mide la variabilidad residual, es decir, la debida a los dems factores no incluidos en el modelo

Los estadsticos a utilizar en los contrastes son: 1.


2 SA ~ Fn ,nr ( s ) 1 1 S r2 2 SB ~ Fr ,nr ( s ) 1 1 S r2

2.

3.

S I2 ~ F( n )( r ), nr ( s ) 1 1 1 S r2

El procedimiento prctico es el mismo que para todos los test estudiados anteriormente.

47

En caso de rechazar alguna de las hiptesis nulas se puede hacer un estudio comparativo de las diferencias de medias correspondientes. Los fundamentos tericos son los mismos que para un factor. Ejemplo: Se experimenta en un proceso de fabricacin en dos condiciones de funcionamiento, tipos de materia prima,

, 2 1 1

, obtenindose los siguientes resultados: 3

2 , y tres

1 2

2
16 40 30 38 33 44 12 40

3
8 42

20 36

El modelo general ser: Yijk = + i + j + () ij + eijk , donde, i=1, 2 ; j=1, 2, 3 ; k=1, 2 donde por ejemplo, y 211 = 36 es la primera observacin, del segundo nivel del factor 1. ( ) ij es la interaccin (si la hay) entre el funcionamiento y el tipo de materia prima. eijk es todo lo que no podemos controlar en nuestro experimento (error aleatorio). Se supone normalidad e independencia de los errores, es decir, eijk ~ N(0,

2 )

Las hiptesis son: 1ra. Ho: Ho: 2da. Ho: Ho: 3ra. Ho: Ho: Prctica: Entrar en statgraphics al editor de datos y crear el vector FABRICA y las variables dato, func y matprim de acuerdo al siguiente esquema: dato 20 16 30 33 12 8 func 1 1 1 1 1 1 matprim 1 1 2 2 3 3 En el proceso de fabricacin, las dos condiciones producen el mismo efecto

1 = 2
No hay diferencia en las materias primas de nuestro proceso de fabricacin.

1 = 2 = 3
No hay interaccin entre el tipo de funcionamiento y el tipo de materia prima ( ) ij =0 para todo i,j

48

36 40 38 44 40 42

2 2 2 2 2 2

1 1 2 2 3 3

Entrar en Anlisis de varianza multifactor: Data: A: B: FABRICA.dato FABRICA.func FABRICA.matprim

49

Anda mungkin juga menyukai