4.2 Estadistica

4.
2 PRUEBA NO PARAMETRICA La mayor parte de los procedimientos de prueba de hiptesis que se presentan en las unidades anteriores se basan en la suposicin de que las muestras aleatorias se seleccionan de poblaciones normales. Afortunadamente, la mayor parte de estas pruebas an son confiables cuando experimentamos ligeras desviaciones de la normalidad, en particular cuando el tamao de la muestra es grande. Tradicionalmente, estos procedimientos de prueba se denominan mtodos paramtricos. En esta seccin se consideran varios procedimientos de prueba alternativos, llamados no paramtricos mtodos de distribucin libre, que a menudo no suponen conocimiento de ninguna clase acerca de las distribuciones de las poblaciones fundamentales, excepto que stas son continuas.
Los procedimientos no paramtricos o de distribucin libre se usan con mayor frecuencia por los analistas de datos. Existen muchas aplicaciones en la ciencia y la ingeniera donde los datos se reportan no como val BIBLIOGRAFA
Probabilidad y estadstica aplicadas a la ingeniera. 2 edicin Montgomery Runger Limusa Wiley Probabilidad y estadstica. Cuarta edicin Walpole Myers Mc Graw Hill Estadstica Richard C. Weimer CECSA
ores de un continuo sino ms bien en una escala ordinal tal que es bastante natural asignar rangos a los datos. Se debe sealar que hay desventajas asociadas con las pruebas no paramtricas. En primer lugar no utilizan la informacin que proporciona la muestra, y por ello una prueba no paramtrica ser menos eficiente que el procedimiento paramtrico correspondiente, cuando se pueden aplicar ambos mtodos. En consecuencia, para lograr la misma eficiencia, una prueba no paramtrica requerir la correspondiente prueba paramtrica. Como se indic anteriormente, ligeras divergencias de la normalidad tienen como resultado desviaciones menores del ideal para las pruebas paramtricas estndar.
EJEMPLO.Dos jueces deben clasificar cinco marcas de cerveza de mucha demanda mediante la asignacin de un grado de 1 a la marca que se considera que tiene la mejor calidad global, un grado 2 a la segunda mejor, etctera. Se puede utilizar entonces una prueba no paramtrica para determinar donde existe algn acuerdo entre los dos jueces. Se debe sealar que hay varias desventajas asociadas con las pruebas no paramtricas. En primer lugar, no utilizan la informacin que proporciona la muestra, y por ello una prueba no paramtrica ser menos eficiente que el procedimiento paramtrico correspondiente, cuando se pueden aplicar ambos mtodos. En consecuencia, para lograr la misma potencia, una prueba no paramtrica requerir la correspondiente prueba no paramtrica.
Como se indic antes, ligeras divergencias de la normalidad tienen como resultado desviaciones menores del ideal para las pruebas paramtricas estndar. Esto es cierto en particular para la prueba t y la prueba F. En el caso de la prueba t y la prueba F, el valor P citado puede ser ligeramente errneo si existe una violacin moderada de la suposicin de normalidad. En resumen, si se puede aplicar una prueba paramtrica y una no paramtrica al mismo conjunto de datos, debemos aplicar la tcnica paramtrica ms eficiente. Sin embargo, se debe reconocer que las suposiciones de normalidad a menudo no se pueden justificar, y que no siempre se tienen mediciones cuantitativas.
4.2.1 ESCALA DE MEDICION Definicin de escala Cualquier recurso para determinar la magnitud o cantidad de un objeto o hecho de cualquier clase; instrumento para asignar un nmero o guarismo que indicar cunto hay de algo; un recurso de medicin que provee un conjunto de normas (numeradas de acuerdo con ciertas reglas de trabajo) con las que se puede comparar el objeto que ser medido, para asignarle un nmero o valor matemtico que represente su magnitud. El trmino es de amplia aplicacin: una escala de alguna clase est incluida en toda medicin o estimacin. Implcito en cada caso hay un conjunto de reglas para asignar nmeros o valores: son estas reglas las que dan significado a las cantidades. Los objetos pueden ser perceptuales o conceptuales.
La escala de medida de una caracterstica tiene consecuencias en la manera de presentacin de la informacin y el resumen. La escala de medicin-grado de precisin de la medida de la caracterstica tambin determina los mtodos estadsticos que se usan para analizar los datos. Por lo tanto, es importante definir las caractersticas por medir. Las escalas de medicin ms frecuentes son las siguientes: Escala Nominal.- No poseen propiedades cuantitativas y sirven nicamente para identificar las clases. Los datos empleados con las escalas nominales constan generalmente de la frecuencia de los valores o de la tabulacin de nmero de casos en cada clase, segn la variable que se est estudiando. El nivel nominal permite mencionar similitudes y diferencias entre los casos particulares. Los datos evaluados en una escala nominal se llaman tambin "observaciones cualitativas", debido a que describen la calidad de una persona o cosa estudiada, u "observaciones categricas" porque los valores se agrupan en categoras. Por lo regular, los datos nominales o cualitativos se describen en trminos de porcentaje o proporciones. Para exhibir este tipo de informacin se usan con mayor frecuencia tablas de contingencia y grficas de barras. Escala Ordinal.- Las clases en las escalas ordinales no solo se diferencian unas de otras (caracterstica que define a las escalas nominales) sino que mantiene una especie de relacin entre s. Tambin permite asignar un lugar especfico a cada objeto de un mismo conjunto, de acuerdo con la intensidad, fuerza, etc.; presentes en el momento de la medicin. Una caracterstica importante de la escala ordinal es el hecho de que, aunque hay orden entre las categoras, la diferencia entre dos categoras adyacentes no es la misma en toda la extensin de la escala. Algunas escalas consisten en calificaciones de mltiples factores que se agregan despus para llegar a un ndice general.
Debe mencionarse brevemente una clase espacial de escala ordinal llamada "escala de posicin", donde las observaciones se clasifican de mayor a menor (o viceversa). Al igual que en las escalas nominales, se emplean a menudo porcentajes y proporciones en escalas ordinales.
Escala de Intervalo.- Refleja distancias equivalentes entre los objetos y en la propia escala. Es decir, el uso de sta escala permite indicar exactamente la separacin entre 2 puntos, lo cual, de acuerdo al principio de isomorfismos, se traduce en la certeza de que los objetos as medidos estn igualmente separados a la distancia o magnitud expresada en la escala. Escala de Razn.- Constituye el nivel ptimo de medicin, posee un cero verdadero como origen, tambin denominada escala de proporciones. La existencia de un cero, natural y absoluto, significa la posibilidad de que el objeto estudiado carezca de propiedad medida, adems de permitir todas las operaciones aritmticas y el uso de nmeros representada cantidades reales de la propiedad medida.
Con esto notamos que esta escala no puede ser usada en los fenmenos psicolgicos, pues no se puede hablar de cero inteligencia o cero aprendizaje, etc.
4.2.2 METODOS ESTADSTICOS CONTRA NO PARAMETRICOS 1.- EL CASO DE DOS MUESTRAS: Las pruebas estadsticas de dos muestras se usan criando el investigador desea establecer la diferencia entre chis tratamientos o si un tratamiento es mejor que otro. Por ejemplo adiestramiento, uso de psicofrmaco, en cada caso el grupo que ha sufrido el tratamiento es comparado con el que no lo ha experimentado o que ha sufrido un tratamiento diferente. En la comparacin de estos grupos, a veces se observan diferencias significativas que no son el resultado del tratamiento, por ejemplo, en el estudio de los trabajadores que se someten a un entrenamiento diferente para determinar cul es el mejor para elevar su calificacin, puede ser que la diferencia no se deba, realmente, a uno u otra tratamiento, sino que uno de los grupos estaba ms motivado por elevar rpidamente
su calificacin y, de esta forma, no se refleja verdaderamente la efectividad del procedimiento de enseanza. Una forma de eliminar esta dificultad, es usar MUESTRAS RELACIONADAS estas se pueden lograr: Cuando el propio sujeto es su propio control. Con parejas de sujetos en las que se asignan los miembros de cada pareja, a las dos condiciones. La tcnica paramtrica usual para analizar datos provenientes de dos muestras relacionadas es aplicar la prueba t a los puntajes, estos se pueden obtener de los dos puntajes de cada pareja igualada o de los puntajes de cada sujeto bajo las dos condiciones. stas pruebas determinan la medida en dije las diferencias de las muestras indican, de forma convincente, una diferencia en el proceso aplicado en ellos. En el caso de dos MUESTRAS INDEPENDIENTES, ellas pueden obtenerse: Tomando al azar sujetos de dos poblaciones. Asignando al azar ambos tratamientos a miembros de algunas muestras de orgenes arbitrarios. No es necesario que la muestra sea del mismo tamao. En este caso, la prueba t es la tcnica paramtrica indicada para analizar los datos de las dos muestras independientes. Los mtodos estadsticos no paramtricos adecuados para estos casos, son:
2.-EL CASO DE K MUESTRA: Hasta aqu hemos visto las pruebas estadsticas idneas para probar la significacin de las diferencias. Entre una sola muestra y una poblacin determinada. Entre dos muestras relacionadas o independientes. Ahora veremos las pruebas que determinan la significacin de las diferencias entre 3 o ms grupos, relacionados o independientes. A veces las circunstancias requieren de diseos experimentales de ms de dos muestras o condiciones que puedan estudiarse simultneamente y entonces es necesario usar una prueba estadstica que indique si existe una diferencia total entre las k muestras o condiciones, ya que no es posible tener confianza en una decisin acerca de k muestras, en la que el anlisis se haga probando las muestras, 2 a 2.La tcnica paramtrica para probar si varias muestras proceden de una misma poblacin, es el anlisis de varianza o prueba F. La misma facilita que no haya prdida de precisin al estimar la varianza por separado, pues se utiliza una varianza combinada.
En el caso no paramtrico, tenemos:
EJEMPLO: Una compaa de taxis trata de decidir si el uso de llantas radiales en lugar de llantas regulares con cinturn mejora la economa
de combustible.se equipan 16 automviles con llantas radiales y se manejan por un recorrido de prueba establecido. Sin cambiar de conductores, se equipan los mismos autos con las llantas regulares con cinturn y se manejan una vez ms por el recorrido de prueba.se registra el consumo de gasolina, en kilmetros por litro, de la siguiente manera:
Automvil 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Llantas radiales 4.2 4.7 6.6 7.0 6.7 4.5 5.7 6.0 7.4 4.9 6.1 5.2 5.7 6.9 6.8 4.9
llantas con cinturn 4.1 4.9 6.2 6.9 6.8 4.4 5.7 5.8 6.9 4.9 6.0 4.9 5.3 6.5 7.1 4.8
Podemos concluir en el nivel de significancia de 0.05 que los autos equipados con llantas radiales obtienen mejores economas de combustible que los equipados con llantas regulares con cinturn?
Solucin: representemos con
1 y 2 los kilmetros por litro promedio
para los autos equipados con llantas radiales y con cinturn, respectivamente. 1. H: 12.
2= 0
H1: 1- 2 > 0
3. = 0.05 4. Estadstica de prueba : variable binomial x con p= 5. Clculos: despus de reemplazar cada diferencia positiva con un smbolo + `` y cada diferencia negativa con un smbolo "-, y despus descartar las dos diferencias cero ,obtenemos la secuencia + - + - + - + - + - + - + - + - + -+ - + Para la que n= 14 y x =11. Con el uso de la aproximacin de la curva normal, encontramos que
Z= 10.5 7 = 1.87
14/2
Y entonces P= P(X 11) P ( Z>1.87)= 0.0307 6. DECISION: rechazar Ho y concluir que, en promedio, las llantas radiales mejoran la economa de combustible.
4.2.3 PRUEBA DE KOLMOGOROV SMIRNOV

Recurdese que para aplicar la prueba de bondad de ajuste chi-cuadrada cuando el modelo propuesto bajo es continuo, es necesario aproximar mediante
el agrupamiento de los datos observados en un nmero finito de intervalos de clase. Este requisito de agrupar los datos implica tener una muestra ms o menos grande. De esta manera, la prueba de bondad de ajuste chi-cuadrada se encuentra limitada cuando es continua y la muestra aleatoria disponible
tiene un tamao pequeo. Una prueba de bondad de ajuste ms apropiada que la chi-cuadrada cuando Kolmogorov Smirnov. La prueba de Kolmogorov Smirnov no necesita que los datos se encuentren agrupados y es aplicable a muestras de tamao pequeo. sta se basa en una comparacin entre las funciones de distribucin acumulativa que se observa en la muestra ordenada y la distribucin propuesta bajo la hiptesis nula. Si esta comparacin revela una diferencia suficientemente grande entre las funciones de distribucin muestral y propuesta, entonces la hiptesis nula de que la distribucin es , se rechaza. , en donde se especifica es continua, es la basad en la estadstica de
Considrese la hiptesis nula por en forma completa. Dentese por de una muestra aleatoria de tamao acumulativa muestral como
a las observaciones ordenadas y defnase la funcin de distribucin
En otras palabras, para cualquier valor ordenado de la muestra aleatoria, es la proporcin del nmero de valores en la muestra que son iguales o menores a . Ya que se encuentra completamente especificada, es posible evaluar a para algn valor deseado de , y entonces compara este ltimo con el valor correspondiente de . Si la hiptesis nula es verdadera, entonces es lgico
esperar que la diferencia sea relativamente pequea. La estadstica de Kolmogorov Smirnov se define como
|
La estadstica
|.
tiene una distribucin que es independiente del modelo es una estadstica
propuesto bajo la hiptesis nula. Por esta razn, se dice
independiente de la distribucin. Lo anterior da como resultado que la funcin de distribucin para cualquier valores cuantiles superiores de . En la tabla J del apndice, se proporcionan los para varios valores de la muestra. El lector debe que se encuentran en la parte inferior de la mayores de
notar que los valores asintticos de
tabla proporcionan una adecuada aproximacin para los valores de 50. Para un tamao del error de tipo i, la regin crtica es de la forma
)
se rechaza si para algn valor
De acuerdo con lo anterior, la hiptesis observado del valor
se encuentra dentro de la regin crtica de tamao
Como se hizo anteriormente, la estadstica de Kolmogorov Smirnov es, en general, superior a la prueba de bondad de ajuste chi cuadrada cuando los datos involucran una variable aleatoria continua, debido a que no es necesario agrupar los datos. Adems, la prueba de Kolmogorov Smirnov tiene la atractiva propiedad de ser aplicable a muestras de tamao pequeo. Por otro lado, la estadstica se encuentra limitada, ya que el modelo propuesto bajo debe especificarse en forma completa. La estadstica de Kolmogorov Smirnov no se aplica a todos aquellos casos para los que as observaciones no son inherentemente cuantitativas a consecuencia de las ambigedades que pueden surgir cuando se ordenan las observaciones.
4.2.4 PRUEBA DE ANDERSON-DARLING. Esta prueba compara la funcin de distribucin acumulada emprica de los datos de su muestra con la distribucin esperada si los datos son normales. Si esta diferencia observada es suficientemente grande, la prueba rechazar la hiptesis nula de normalidad en la poblacin. En estadstica, la prueba de Anderson-Darling es una prueba no paramtrica sobre si los datos de una muestra provienen de una distribucin especfica. La frmula para el estadstico A determina si los datos (observar
que los datos se deben ordenar) vienen de una distribucin con funcin acumulativa F A2 = N S Donde:
El estadstico de la prueba se puede entonces comparar contra las distribuciones del estadstico de prueba (dependiendo que F se utiliza) para determinar el P-valor.
4.2.5 PRUEBA DE RYAN-JOINER Esta prueba evala la normalidad calculando la correlacin entre sus datos y las puntuaciones normales de sus datos. Si el coeficiente de correlacin se encuentra cerca de 1, es probable que la poblacin sea normal. La estadstica de Ryan-Joiner evala la solidez de esta correlacin; si se encuentra por debajo del valor crtico apropiado, se rechazar la hiptesis nula
H0
de normalidad en la poblacin. Esta prueba es similar a la prueba de normalidad de Shapiro-Wilk.
4.2.6 PRUEBA DE SHAPPIRO WILK En estadstica, la prueba de ShappiroWilk, se usa para contrastar la normalidad de un conjunto de datos. Se plantea como hiptesis nula que una muestra X1,..., Xn proviene de una poblacin normalmente distribuida. Se considera uno de las pruebas ms potentes para el contraste de normalidad, sobre todo para muestras pequeas (n<30). El estadstico de la prueba de Shappiro Wilk es:
Donde:
= con el subndice i entre parntesis es el nmero que ocupa la i-sima posicin en la muestra;
= (x1 + ... + xn) / n es la media muestral; Las constantes ai se calculan
Donde:
Siendo m1,..., mn son los valores medios del estadstico ordenado, de variables aleatorias independientes e idnticamente distribuidas, muestreadas de distribuciones normales. V es la matriz de covarianzas de ese estadstico de orden. La hiptesis nula se rechazar si W es demasiado pequeo.
CONCLUSION
De esta manera puedo finalizar que es muy substancial tener siempre en cuenta la escala de medicin que se est utilizando, pues no todos los procedimientos estadsticos son apropiados para cualquier anlisis. En general, las variables estadsticas se clasifican en variables continuas o cuantitativas y variables discretas o cualitativas, segn el nivel de escala en que estn medidas. Las variables continuas se refieren a magnitudes medidas en escala de intervalos o de razn, mientras que las variables discretas comprenden magnitudes medidas en escalas de nivel nominal y ordinal. Por otro lado puedo concluir que las pruebas no paramtricas se encargan de estudiar las pruebas y modelos estadsticos cuya distribucin no se ajusta; o sea que no asumen ningn parmetro de las variables mustrales, por eso es muy importante el conocimiento de las pruebas no paramtricas, ya que se aplica en la administracin debido a la prueba de la tabla de contingencia como la de bondad de ajuste analizan datos nominales u ordinales. Estas pruebas, se usan ampliamente en las aplicaciones de negocios, lo que demuestra la importancia de la habilidad para manejar datos categricos o jerarquizados adems de los cuantitativos.
BIBLIOGRAFA Probabilidad y estadstica aplicadas a la ingeniera. 2 edicin Montgomery Runger Limusa Wiley Probabilidad y estadstica. Cuarta edicin Walpole Myers Mc Graw Hill Estadstica Richard C. Weimer CECSA

4.2 Estadistica

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

4.2 Estadistica

Diunggah oleh

Hak Cipta:

Format Tersedia

4.

En el caso no paramtrico, tenemos:

Solucin: representemos con

1 y 2 los kilmetros por litro promedio

4.2.3 PRUEBA DE KOLMOGOROV SMIRNOV

a las observaciones ordenadas y defnase la funcin de distribucin

tiene una distribucin que es independiente del modelo es una estadstica

propuesto bajo la hiptesis nula. Por esta razn, se dice

notar que los valores asintticos de

De acuerdo con lo anterior, la hiptesis observado del valor

se encuentra dentro de la regin crtica de tamao

de normalidad en la poblacin. Esta prueba es similar a la prueba de normalidad de Shapiro-Wilk.

= (x1 + ... + xn) / n es la media muestral; Las constantes ai se calculan

Anda mungkin juga menyukai