Anda di halaman 1dari 22

AO DE LA INTEGRACIN NACIONAL Y EL RECONOCIMIENTO DE NUESTRA DIVERSIDAD

UNIVERSIDAD NACIONAL DE PIURA FACULTAD DE MEDICINA HUMANA DEPARTAMENTO DE MORFOSIOLOGA

Anlisis de varianza
ASIGNATURA : Bioestadstica aplicada a la medicina

DOCENTE

Prof. Zulln Len

ALUMNO

: BAYONA CHAVEZ, KEVIN EFREN CHUMACERO SANCHEZ, SERGIO ENRIQUEZ PUMAHUACRE, VALESKA GUERRERO REYES, RAUL PAZ FLORES, ADAN VLADIMIR

CICLO

III CICLO

INTRODUCCIN

El anlisis de la variancia, el cual se define como una tcnica en la que la variancia total de un conjunto de datos se divide en dos o mas componentes, y cada uno de ellos se asocia con una fuente especifica de variacin, de manera que durante el anlisis es posible encontrar la magnitud con la que contribuye cada una de esas fuentes en la variacin total. El desarrollo del anlisis de la variancia (ANOVA) se debe principalmente al trabajo de R. A. Fisher, cuyas contribuciones a la estadstica, desde 1912 hasta 1962, tuvieron una gran influencia en toda la estadstica moderna.

APLICACIONES
El anlisis de variancia tiene amplia aplicacin en el ANALISIS de datos derivados de experimentos. Los principios para el diseo de experimentos se estudian en varias obras, entre ellas las de Hinkelmann y Kempthorne, Montgomery, y Myers y Well. No se estudia aqu con detalle este tema, porque de hacerlo sera necesario por lo menos un captulo adicional. Sin embargo, algunos conceptos importantes del diseo experimental aparecen conforme se estudia el anlisis de la variancia. EI anlisis de la variancia se utiliza para cumplir dos objetivos: 1) estimar y probar hiptesis respecto a las variancias de las poblaciones y 2) estimar y probar hiptesis respecto a las medias de las poblaciones. En esta seccin el objetivo es estimar y probar hiptesis respecto a las medias de las poblaciones. Sin embargo, tal como se puede apreciar, las conclusiones respecto a las medias dependen de la magnitud de las varianzas observadas. Es posible observar que los conceptos y tcnicas cubiertas bajo el titulo de anlisis de la variancia son extensiones de los conceptos y tcnicas que se tratan en el tema de prueba de hiptesis. En dicho tema se aprendi a probar la hiptesis nula que dice que dos medias son iguales. En este capitulo se estudia como probar la hiptesis nula que afirma que tres o ms medias son iguales. Por ejemplo, mientras que en el all se aprendi a determinar si es posible concluir que dos tratamientos difieren en eficacia, aqu se aprender a determinar si es posible concluir que tres o mas tratamientos difieren en eficacia. Los siguientes ejemplos ilustran algunas ideas bsicas relacionadas con la aplicacin del anlisis de la variancia, las cuales se ampliaran y explicaran en las siguientes secciones. Ejemplo 1: Suponga que se pretende saber si tres medicamentos difieren en su eficacia para disminuir las concentraciones sricas de colesterol en los seres humanos. Se aplican a tres grupos de individuos, respectivamente, los medicamentos A, B y C. Despus de transcurrido cierto periodo se toman mediciones para identificar el grado en que se redujo el nivel de colesterol srico en cada individuo. Se encuentra que el colesterol disminuyo en diferente medida en cada individuo, es decir, existe variabilidad entre las mediciones. La pregunta es: por qu son diferentes las mediciones? Probablemente, porque cada individuo recibi diferente medicamento. AI revisar las mediciones hechas en los individuos que recibieron el medicamento A, se encuentra que la cantidad de colesterol disminuy en diferente grado en cada individuo. Y al revisar las mediciones de

los individuos que recibieron los medicamentos B y C, se encuentra que tambin ocurre la misma situacin: existe variabilidad entre las mediciones de los tres grupos. Otra vez la pregunta por qu son diferentes las mediciones? Entre las causas posibles estn las diferencias genticas de cada individuo y la diferencia en sus dietas. A travs del anlisis de la variabilidad observada es posible llegar a la conclusin de que los tres medicamentos tienen igual eficacia. Para hacer esto, es necesario utilizar tcnicas y conceptos de variancia. Variables En el ejemplo se mencionan tres tipos de variables. Se tiene que estas variables estn presentes en todas las situaciones en las que se utiliza el anlisis de la variancia como la tcnica ms conveniente. Primero se tiene la variable tratamiento, que en el ejemplo se identifica como "medicamento". Se tienen tres "categoras" para esta variable: medicamentos A, B y C. El segundo tipo de variable es la variable respuesta; para este ejemplo, se refiere al nivel de colesterol antes y despus. La variable respuesta es la variable que se espera que presente diferentes valores cuando se utilicen diferentes "categoras" para la variable tratamiento. Finalmente, se mencionan otras variables: composicin gentica y dieta, llamadas variables extraas. Estas pueden tener efecto sobre la variable respuesta, pero no son el foco de atencin para el experimento porque la variable tratamiento es la variable de inters principal. La pregunta que es necesario responder es: las diferentes "categoras de la variable tratamiento producen diferencias, en promedio, en la variable respuesta? Supuestos Para utilizar correctamente el anlisis de variancia como una herramienta de la inferencia estadstica es necesario satisfacer un conjunto de suposiciones fundamentales. Aunque el investigador experto no espera que todas las suposiciones se cumplan a la perfeccin, es importante que las personas que utilizan las tcnicas del anlisis de la variancia estn enteradas de las suposiciones bsicas y sean capaces de identificar cuando tales suposiciones no son satisfechas. Debido a que los experimentos en los que las suposiciones son satisfechas perfectamente no se presentan con frecuencia, se sugiere que los resultados del anlisis de variancias sean considerados mas como aproximaciones que como resultados exactos. Estas suposiciones se exponen en las siguientes secciones. El anlisis de la variancia se estudia segn la forma en que se utiliza para analizar los resultados de dos diseos de experimentaci6n diferentes: los diseos completamente aleatorizados y los diseos por bloques completos y aleatorizados. Aunado a esto, el concepto de experimento factorial se utiliza en diseos completamente aleatorizados, sin que esto agote las posibilidades. En las referencias bibliogrficas se encuentran algunos estudios acerca de otros diseos.

Procedimiento de ANOVA En la presentacin del anlisis de variancia para diferentes diseos, se sigue el procedimiento de pasos presentado utilizados en una prueba de hiptesis comn. A continuacin se replantea el procedimiento para incluir nuevos conceptos, necesarios para adaptar el procedimiento al anlisis de la variancia. 1. Descripcin de datos. Adems de describir los datos de la muestra en la forma usual, estos se despliegan en forma tabular. 2. Supuestos. Junto con las suposiciones que fundamentan el anlisis, se presenta el modelo de cada diseo estudiado. El modelo se compone de una representaci6n simblica de un valor representativo de los datos que se han de analizar. 3. Hiptesis. 4. Estadstica de prueba. 5. Distribucin de la estadstica de prueba. 6. Regla de decisin. 7. Calculo de la estadstica de prueba. El resultado de los clculos aritmticos se resume en una tabla llamada anlisis de la variancia (ANOVA, siglas en ingles). Las entradas en la tabla facilitan la evaluacin de los resultados del anlisis. 8. Decisin estadstica. 9. Conclusin. 10. Calculo del valor p. En el tema de pruebas de hiptesis se estudi la forma de probar la hiptesis nula de no diferencia entre las medias de dos poblaciones. A menudo, el investigador tendr inters en probar una hiptesis de esta clase para ms de dos poblaciones. EI estudiante, al enfrentar por primera vez este problema, puede inclinarse a sugerir que todos los pares posibles de medias muestrales se deben probar por separado mediante la prueba t de Student. Suponga que hay cinco poblaciones involucradas. EI numero posible de pares de medias muestrales es C52 = 10. Dado que es muy laborioso llevar a cabo muchas pruebas t, sera deseable disponer de un mtodo de anlisis ms eficiente. Sin embargo, una consecuencia muy importante que podra desprenderse de la realizacin de todas las pruebas t posibles es que es muy probable llegar a una conclusin falsa. Suponga que se extrajeron cinco muestras a partir de poblaciones que tienen medias iguales. Como se vio en el prrafo precedente, seria necesario efectuar 10 pruebas si estas

se efectuaran por separado. Si se elige un nivel de significacin =05 para cada prueba, la probabilidad de no rechazar una hiptesis de no diferencia en cada caso sera de 0.95. Mediante la regla de multiplicacin para la probabilidad, si las pruebas fueran independientes una de otra, la probabilidad de no rechazar la hiptesis de no diferencia en los 10 casos sera (0.95)10 = 0.5987. La probabilidad de rechazar al menos una hiptesis de no diferencia, entonces, seria de 1-0.5987= 0.4013. Puesto que se sabe que la hiptesis nula es verdadera en todos los casos de este ejemplo, al rechazar la hiptesis nula se comete un error de tipo I. Entonces, a la larga, al probar todos los posibles pares de medias a partir de las cinco muestras, se podra cometer un error de tipo I en 40 por ciento de los casos. EI problema se hace mas complicado en la prctica, porque tres o mas pruebas t con base en los mismos datos de las muestras no seran independientes entre s. Dado lo anterior, es claro que se requiere un mtodo para hallar una deferencia significativa entre varias medias. EI anlisis de variancias constituye dicho mtodo. ANOVA unilateral El tipo ms simple de anlisis de variancia es el que se conoce como anlisis de la variancia unilateral, en el cual se investiga una sola fuente de variacin o factor. Esto es una extensin a tres o mas muestras del procedimiento de la prueba t, para utilizarlo en dos muestras independientes. Dicho de otra forma, se puede afirmar que utilizar la prueba t con dos muestras independientes es un caso especfico del anlisis de la variancia unilateral. En una situacin caracterstica, se quiere utilizar el anlisis de la variancia unilateral para probar la hiptesis nula que indica que tres o ms tratamientos son igualmente eficaces. EI experimento se disea en tal forma que los tratamientos de inters se asignan de manera totalmente aleatoria a los individuos u objetos en los que se han de realizar las determinaciones para medir la eficacia de los tratamientos. Por esta razn, el diseo se llama diseo de experimentacin completamente aleatorizado. Es posible asignar aleatoriamente individuos para tratamiento como sigue. Suponga que se cuenta con 16 individuos para participar en un experimento, en el que se pretende comparar cuatro medicamentos. Se numeran a los individuos del 1 al 16; despus, a partir de la tabla de nmeros aleatorios se seleccionan consecutivamente, sin repetir, los nmeros del al 16. Para ilustrar esto, se utiliza la tabla D y se comienza aleatoriamente desde un punto que esta, digamos, en la interseccin del rengln 4 y las columnas 11 y 12. EI numero de dos dgitos que esta en esa interseccin es 98. Los siguientes 16 nmeros consecutivos de dos dgitos, entre 1 y 16, son 16,09,06, 15, 14, 11,02,04, 10,07,05, 13,03, 12,01 y 08. Se asignan los individuos 16, 09,06 Y 15 al primer grupo, para aplicarles el medicamento A. EI medicamento B se aplica a los individuos 14, 11,02 Y 04; los individuos

10,07, 05 y 13 reciben el medicamento C, y los individuos 03, 12,01 y O8 reciben el medicamento D. Es importante decir que la cantidad de individuos en cada grupo no tiene que ser el mismo. La figura 1 muestra el esquema de asignacin aleatoria. Pasos de la prueba de hiptesis Despus de haber decidido que el diseo completamente aleatorizado es el diseo adecuado, se procede con los pasos de la prueba de hiptesis. Primero se analizan con detalle y despus se da un ejemplo. 1. Descripcin de los datos. Las mediciones (u observaciones) que resultan de un diseo experimental completamente aleatorizado, junto con las medias y los totales que puedan calcularse a partir de los datos, pueden presentarse, si as conviene, en la forma que se muestra en la tabla 1. Los smbolos utilizados en la tabla 1 se definen como sigue:
Figura 1: asignacin de los individuos a los grupos de tratamiento en un diseo completamente aleatorizado.

Tabla 1: tabla aleatorizado.

de

valores

de

muestra

para

diseo

completamente

2. Supuestos. Antes de establecer las suposiciones, es necesario especificar el modelo para el experimento descrito aqu.

El modelo Tal como se habr notado, un modelo es una representacin simblica de un valor representativo del conjunto de datos. Para escribir el modelo para el diseo experimental completamente aleatorizado, se debe identificar el valor representativo a partir de los datos representados por la muestra desplegada en la tabla 1. Se utiliza el smbolo xij para representar dicho valor.

EI anlisis de la varianza unilateral puede escribirse como sigue:

(Ecuacin 1) Los trminos en este modelo se definen de la siguiente forma:

1.

representa la media de todas las k-medias poblacionales, y se le conoce como la gran media. representa la diferencia entre la media de la j-sima poblacin y la gran media. Se le conoce como efecto del tratamiento.

2.

3. eij representa la cantidad en que difieren una medicin individual de la media poblacional a la que pertenece. Se le conoce como trmino del error. Componentes del modelo Al revisar el modelo es posible apreciar que una observacin representativa a partir del conjunto completo de datos bajo estudio est compuesto de: 1) la gran media, 2) efecto del tratamiento, y 3) trmino del error que representa la desviacin de la observacin a partir de su media grupal. En la mayora de las situaciones, el inters est solamente en los k-tratamientos representados en el ejemplo. Cualquier inferencia que se haga, se aplica nicamente a estos tratamientos y no se pretende ampliar la inferencia a cualquier otro conjunto mayor de tratamientos. Cuando se establecen tales restricciones para los objetivos inferencia les, el modelo se conoce como modelo I o modelo de efectos fijos. El anlisis en este libro se limita a este modelo. Supuestos del modelo Las suposiciones para el modelo de efectos fijos son las siguientes: a) Los k conjuntos de datos observados forman k muestras aleatorias simples a partir de las poblaciones respectivas. b) Cada una de las poblaciones de las que se extraen las muestras siguen una distribucin normal con media y varianza .

c) Cada una de las poblaciones tienen la misma variancia. Es decir, , varianza comn.

d) Las 'tj son constantes desconocidas y L 'tj =0, puesto que la suma de todas las desviaciones de
j

a partir de su media,

, es cero. .

e) Las eij tienen un medio igual acero, porque la media de x. es

f) Las eij Tienen una variancia igual a la variancia de las x., porque las eij y las x. difieren solo por una constante; es decir, la variancia del error es igual a especificada en el inciso c. g) Las eij siguen una distribucin normal (e independiente). , la variancia comn,

3.- Hiptesis. Pruebe la hiptesis que dice que todas las poblaciones o tratamientos tienen medias iguales contra la hiptesis alternativa, que dice que al menos un par de poblaciones no tienen medias iguales. Las hiptesis se redactan como sigue:

Si las medias de las poblaciones son iguales, y el efecto de cada tratamiento es igual a cero, de tal manera que, alternativamente, las hiptesis pueden escribirse como sigue:

Si Ho es verdadero y las suposiciones se cumplen respecto a que las variancias son iguales y que las poblaciones siguen una distribucin normal, entonces es posible apreciar una fotografa de la poblacin como se muestra en la figura 2. Cuando Ho es verdadera, las medias de la poblacin son todas iguales y las poblaciones estn centradas sobre el mismo punto (la media comn) en el eje horizontal. Si todas las poblaciones siguen una distribucin normal con variancias iguales, la distribucin es idntica, de tal manera que

en la fotografa cada una de ellas esta sobrepuesta sobre las otras, y una sola fotografa es suficiente para representarlas a todas. Cuando la Ho es falsa, probablemente 10 es porque la media de una de las poblaciones es diferente de las dems que SI pueden ser iguales. o, tal vez, todas las medias poblacionales son diferentes. Estas son nicamente dos de las posibilidades cuando Ho es falsa. Existen muchas otras posibles combinaciones de medias iguales y medias diferentes. La figura 3 muestra una fotografa de las poblaciones cuando se cumplen las suposiciones, pero Ho es falso porque no hay dos medias de poblaciones que sean iguales. 4.-Estadstica de prueba. La estadstica de prueba para el anlisis de la variancia unilateral es el clculo de la razn, designada como R.V, tal como se estudia en el captulo 7. Las dos variancias con las que se calcula la R.V son las mismas variancias calculadas a partir de los datos de la muestra. Los mtodos mediante los cuales es posible calcular las variancias se estudian mas adelante.
Figura 2: descripcin de las poblaciones representadas en un diseo completamente aleatorizado cuando Ho es verdadera y se cumplen las suposiciones.

Figura 3: Descripcin de las poblaciones representadas en el diseo completamente aleatorizado cuando las suposiciones de variancias iguales y poblaciones con distribucin normal se cumplen, pero Ho es falsa porque ninguna de las medias poblacionales es igual.

5. Distribucin de la estadstica de prueba. En la seccin 7.8 se dijo que R.V. sigue una distribucin F cuando Ho es verdadera y se cumplen las suposiciones. 6. Regla de decisin. En general, la regla de decisin es rechazar la hiptesis nula si el valor calculado para R.V. es mayor 0 igual que el valor critico de F con nivel 0. 7. Calculo de la estadstica de prueba. Se defini al anlisis de la variancia como un proceso por el que variacin total presente en el conjunto de datos se divide en componentes que son atribuibles a diferentes fuentes. EI termino variacin se utiliza en este contexto para referirse a la suma de desviaciones al cuadrado de las observaciones de su media o suma de cuadrados. Los clculos iniciales aplicados para una ANOVA unilateral consisten en la divisin de la variacin total presente en los datos observados dentro de sus componentes bsicos, cada uno de los cuales es atribuible a una fuente identificable. Aquellos que utilizan computadoras para realizar los clculos probablemente quieran pasar por alto el estudio de los clculos asociados para obtener la estadstica de prueba. Suma total de cuadrados Antes de hacer cualquier divisin, primero es necesario calcular la suma total de cuadrados. La suma total de cuadrados es la suma de los cuadrados de las desviaciones de las observaciones individuales a partir de la media de todas las observaciones tomadas juntas. La suma total de cuadrados (SC total) se define como

Donde

indica que hay que sumar las desviaciones del cuadrado para cada grupo de indica que hay que sumar los totales de los k grupos que se obtienen

tratamiento, y

al aplicar . El lector puede identificar la ecuacin 1 como el numerador de la variancia que puede calcularse a partir del conjunto completo de observaciones juntas.

Suma de cuadrados dentro de los grupos

Ahora se muestra cmo calcular los primeros dos componentes de la suma total de cuadrados. EI primer paso para calcular estos componentes es realizar ciertos clculos dentro de cada grupo. Estos clculos implican realizar dentro de cada grupo, la suma de las desviaciones al cuadrado de las observaciones individuales, a partir de su media. Despus de realizar estos clculos dentro de cada grupo, se obtiene la suma de los resultados individuales del grupo. A este componente de variacin se le llama suma de cuadrados dentro de los grupos y se le designa como SCdentro. A esta cantidad algunas veces se le conoce como suma de cuadrados residuales o de errores. La expresin matemtica para estos clculos es la siguiente:

Suma de cuadrados entre los grupos Para obtener el segundo componente de la suma total de cuadrados, se calcula para cada grupo la desviacin al cuadrado de la media del grupo a partir de la gran media, y se multiplica el resultado por el tamao del grupo. Finalmente, se suman los resultados de todos los grupos. Esta cantidad es una medida de la variacin entre los grupos y se conoce como suma de cuadrados entre los grupos o SCentre. La frmula para calcular est entre cantidad es como sigue:

Entonces, para resumir, se encuentra que la suma total de cuadrados es igual a la suma de cuadrados entre los grupos ms la suma de los cuadrados dentro de los grupos. Esta relacin se expresa as:

Con la suma de cuadrados, recin descrita, es posible calcular dos estimaciones de la variancia comn de la poblacin, . Puede demostrarse que cuando las suposiciones se cumplen y las medias de las poblaciones son todas iguales, tanto la suma de cuadrados dentro de los grupos como la suma de cuadrados entre grupos, si se dividen entre sus respectivos grados de libertad, producen estimaciones de independientes. insesgadas e

Primera estimacin de Dentro de cualquier muestra, la expresin matemtica:

El lector reconocer el numerador de la ecuacin como la suma de cuadrados entre los grupos para el caso especial en que todos los tamaos de las muestras son iguales. Cuando se divide esta suma de cuadrados entre los grados de libertad asociados k -1, se obtiene lo que se conoce como el cuadrado medio entre los grupos.

Cuando no todos los tamaos de las muestras son iguales, una estimacin de base en la variabilidad entre las medias de las muestras se obtiene mediante

con

Si, adems, la hiptesis nula es verdadera, puede esperarse que esas dos estimaciones de tengan una magnitud muy semejante. Si la hiptesis nula es falsa, esto es, si todas las medias de las poblaciones son diferentes, se puede esperar que el cuadrado medio entre los grupos, que se calcula mediante el uso de las desviaciones al cuadrado de las medias de las muestras a partir de toda la media, sea mayor que el cuadrado medio dentro de los grupos. Para comprender el anlisis de la variancia es necesario tener en cuenta que el cuadrado medio entre grupos proporciona una estimacin valida de cuando la suposicin de igualdad de las variancias de las poblaciones se cumple y cuando Ho es verdadero. Ambas condiciones, una hiptesis nula verdadera y variancias iguales en las poblaciones, se deben cumplir para que el cuadrado medio entre grupos sea una estimacin vlida para .

La razn de variancias Lo que se necesita ahora es comparar las dos estimaciones de mediante el clculo de la siguiente relacin de variancia, que representa la estadstica de prueba requerida.

Si las dos estimaciones son aproximadamente iguales, la R.V. ser casi igual a 1. Una razn prxima a 1 tiende a apoyar la hiptesis de que las medias son iguales para las

poblaciones. Por otra parte, si el cuadrado medio entre los grupos es considerablemente mayor que el cuadrado medio dentro de los grupos, la R.V. ser, a su vez, considerablemente mayor que 1. Un valor de RV. Con esta caracterstica ocasionara dudas sobre la hiptesis de igualdad de las medias de las poblaciones. Se sabe que debido a la variabilidad del muestreo, aun cuando la hiptesis nula es verdadera, es poco probable la igualdad de los cuadrados medios entre y dentro de los grupos. Por lo tanto, antes de concluir que las diferencias no se deben a la fluctuacin del muestreo, es necesario decidir qu tan grande debe ser la diferencia observada. Dicho de otra forma, (que tan grande debe ser un valor de RV. para concluir que la diferencia observada entre las dos estimaciones de no es resultado nicamente del azar.

Prueba de F

Para responder a la pregunta anterior se debe considerar la distribucin muestral de la razn de las variancias para dos muestras. En el captulo 6 se proporciona una estimacin insesgada de la variancia real para la poblaci6n de la cual proviene la muestra. Bajo la suposici6n de que todas las variancias de la poblacin son iguales, es posible continuar las k estimaciones para obtener

Esta es.la primera estimacin de a , y se le puede llamar variancia dentro de los grupos, dado que la expresin corresponde a la suma de cuadrados dentro de los grupos de la ecuacin 8.2.3 dividida entre los respectivos grados de libertad. El estudiante advertir que esta es una extensin para las k muestras del procedimiento de combinacin de variancias que se plante en los captulos 6 y 7,. Donde la combinacin de las variancias se utiliza para la distribucin t. A la cantidad en la ecuaci6n 8.2.5 casi siempre se le llama cuadrado medio dentro de los grupos, en lugar de variancia dentro de los grupos.

El cuadrado medio dentro de los grupos es una estimacin valida de slo si las variancias de las poblaciones son iguales. Sin embargo, no es necesario que Ho sea verdadera para que el cuadrado medio dentro de los grupos sea una estimacin valida de . Esto es, el cuadrado medio dentro de los grupos estima a sin importar si Ho es verdadera o falsa, siempre que las variancias de las poblaciones sean iguales.

Segundo estimacin de La segunda estimacin .de se puede obtener a partir de la frmula ya conocida para . Si la ecuacin es resuelta para

la variancia de las medias de las muestras,

, la variancia de la poblacin a partir de la cual se extrajeron las muestras, se tiene

Una estimacin insesgada de proporcionado por

, calculado a partir de los datos de la muestra, es

Se obtiene la estimacin para

vio que la cantidad ( )( )

una distribucion F cuando las variancias de las

muestras se calculan a partir de muestras extraidas de forma independiente y aleatoria de una poblacin que sigue una distribucion normal. La distribucion F, presentada por R. A. Fisher a principios de la dcada de 1920, se ha convertido en una de las distribuciones de mayor uso en la estadstica moderna. Ya se tiene conocimiento de su uso en la

construccin de intervalos de confianza para las variancias de la poblacin y para probar hiptesis acerca de estas. En este capitulo se apreciara que la distribucin F es fundamental para el anlisis de variancias. Por lo tanto, a la operacin identificada como R.V con frecuencia se le identifica como F, y al procedimiento de prueba se le llama prueba de F. En el tema de pruebas de hiptesis se estudia que, cuando las variancias de la poblacin son iguales, se anulan en la expresin ( )( ) para dejar, , la cual sigue una

distribucin F. La distribucion F es realmente una familia de distribuciones, y la distribucin F que se utiliza en una situacin determinada depende del numero de grados de libertad asociados con la variancia muestral del numerador (grados de libertad del numerador) y del numero de grados de libertad asociados con la variancia muestral en el denominador (grados de libertad del denominador). Una vez que se determina la distribucin F adecuada, el tamao de la R.V observada que causara el rechazo de la hiptesis de la igualdad de las medias de la poblacin depende del nivel de significacin elegido. El nivel de significacin elegido determina el valor crtico de F, que es el valor que separa la regin de aceptacin de la regin de rechazo. Como se ha visto, la R.V se calcula, en situaciones de este tipo, colocando el cuadrado medio entre los grupos en el numerador y el cuadrado medio dentro de los grupos en el denominador, par 10 que el valor de los grados de libertad del numerador es igual al numero de grupos menos 1, (k -1), Yel valor de los grados de libertad del denominador es igual a: ( )

La tabla ANOVA Los clculos que se han efectuado se pueden resumir y mostrar en una tabla como la tabla 2, conocida como tabla ANOVA. 8. Decisin estadstica. Para tomar una decisin es necesario comparar la R.V calculada contra el valor critico de F, que puede obtenerse de la tabla G con los correspondientes grados de libertad k -1 en el numerador y Nk en el denominador. Si el valor calculado para R.V. es mayor o igual que el valor critico F, la hiptesis nula es rechazada; pero si es menor que el valor calculo de F, no se rechaza la hiptesis nula.

Explicacin de par que se rechaza la hiptesis nula. Existen dos posibles explicaciones de por que puede ser rechazada la hiptesis nula. Si la hiptesis

nula es verdadera, es decir, si las variancias de las dos muestras son estimaciones de una variancia comn, se sabe que la probabilidad de obtener un valor para RV. Mayor o igual que el valor critico F es igual al nivel de significacin. Es posible concluir, si se desea, que la hiptesis nula es verdadera y suponer que debido a la casualidad se obtuvo un conjunto de datos que originaron un evento extrao. Por otro lado, posiblemente se prefiera suponer que el valor calculado de R.V. no representa un evento extrao producto del azar, sino que, en lugar de ello, refleja el hecho de que existe algo que acta y que no es el azar. Se concluye que ese otro "algo" es una hiptesis nula falsa. Esta ltima es la explicacin que en general se da para los valores de RV. que son mayores que el valor critico de F. Dicho de otra forma, si el valor calculado de RV. es mayor que el valor crtico de F, la hiptesis nula se rechaza. Vale la pena recordar que la hiptesis original que se desea probar es:

El rechazo de la hiptesis acerca de las variancias implica un rechazo de la hiptesis de la igualdad de las medias poblacionales? La respuesta es afirmativa. Un valor grande de RV. result del hecho de que el cuadrado medio entre los grupos era considerablemente mayor que el cuadrado medio dentro de los grupos. Dado que el cuadrado medio entre los grupos se basa en la dispersi6n de las medias muestrales en torno a su media, esta cantidad ser grande cuando exista una gran discrepancia entre los tamaos de las medias muestrales. Debido a esto, un valor significativo de la R.V. indica que se rechace la hiptesis nula de la igualdad de las medias poblacionales.

9. Conclusin. Cuando se rechaza Ho se concluye que no todas las medias poblacionales son iguales. Cuando no se rechaza Ho se concluye que probablemente todas las medias poblacionales son iguales. 10. Calculo del valor p.

Bibliografa: http://www.seh-lelha.org/stat1.htm http://es.wikipedia.org/wiki/Bioestad%C3%ADstica http://www.vitutor.com/estadistica/descriptiva/a_2.html http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt11.html#seccion2 http://es.wikipedia.org/wiki/Representaci%C3%B3n_gr%C3%A1fica http://www.ing.unp.edu.ar/estadisitio/index.html http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_frecuencias" http://www.vitutor.net/2/11/distribucion_frecuencias.html http://www.ucv.cl/web/estadistica/promedio.htm http://www.aaamatematicas.com/sta.htm http://www.disfrutalasmatematicas.com/datos/desviacion-estandar.html http://es.wikipedia.org/wiki/Desviaci%C3%B3n_est%C3%A1ndar

Anda mungkin juga menyukai