Anda di halaman 1dari 34

Universidad Nacional Experimental del Tchira

Vicerrectorado Acadmico

Departamento de Matemtica y Fsica

PRUEBAS DE TIPO NO PARAMTRICA O DE LIBRE


DISTRIBUCIN

AUTOR:

TAVERA LUIS

CI: 21.001.932

Agosto de 2017
1. HOMOGENEIDAD E INDEPENDENCIA POR JI-CUADRADA PARA
TABLAS DE CONTINGENCIA FXC
a. Usos y aplicaciones:
Comprender la importancia de este mtodo para medir si dos
muestras aleatorias provienen de la misma poblacin. Notar
que en la estadstica no paramtrica, como es este contraste,
no se realizan contrastes sobre parmetros de la poblacin
(contraste de igualdad de medias), acentuando que se realizan
contrastes sobre la poblacin origen.
Metodologa muy til para comparar diversas muestras y
extraer conclusiones sobre la igualdad en las distribuciones
poblacionales de cada una de ellas.
b. Contraste de hiptesis:
Cuando se desea comparar dos caracteres (X, Y) en una
misma poblacin que admiten las modalidades:
X(x1,x2,,xi,,xj) Y(y1,y2,,yi,,yj), se toma una muestra
de tamao n, representando por nij el nmero de elementos de
la poblacin que presentan la modalidad xi de X e Yj de Y.

Se plantea la hiptesis nula H0 :No existe diferencia entre las


distribuciones empricas de X e Y

El estadstico de contraste observado:

que sigue aproximadamente una Chi-cuadrado


con (k-1)x(m-1) grados de libertad.

c. Estadstico de prueba y criterio de decisin:


Homogeneidad:

Se acepta H0 si:

Se rechaza H0 si:
Independencia:

Se acepta H0 si:

Se rechaza H0 si:

d. Metodologa para su aplicacin:


Se toma una muestra de tamao n, representando por nij
el nmero de elementos de la poblacin que presentan la
modalidad xi de X e Yj de Y.
Luego se plantea la hiptesis nula H0
Se agrupan frecuencias observadas y esperadas en la
tabla de contingencia (k x m)

Estadstico de contraste observado


Contraste de hiptesis dependiendo el caso
(homogeneidad o independencia)
Criterio de desicin
e. Dos ejemplos de aplicacin:

1) Un estudio sobre caries dental en nios de seis ciudades con diferentes


cantidades de fluor en el suministro de agua, ha proporcionado los resultados
siguientes:

H0: Las incidencias de caries es igual en las seis ciudades (las poblaciones
son homogeneas)

H1: Las incidencias de caries no es igual en las seis ciudades (las


poblaciones no son homogeneas)
H0: Las incidencias de caries es igual en las seis ciudades.

H1: Las incidencias de caries no es igual en las seis ciudades

Con p<0.05 se rechaza H0


Con p>0.05 no se rechaza H0

Conclusin: La incidencia de caires no es igual en las seis unidades.

2) Una muestra aleatoria de 200 adultos se clasifican de acuerdo al sexo y al


nmero de horas que miran televisin durante la semana las frecuencias se
dan en la siguiente tabla:

Con esta informacin, se puede concluir que el tiempo utilizado para ver tv
es independiente del sexo? Use =0.05

H0: El sexo es independiente de las horas de ver televisin

H0: El sexo y las horas de ver televisin estn relacionados


H0: El sexo es independiente de las horas de ver televisin

H0: El sexo est asociado a las horas de ver televisin


Conclusin: El sexo de la persona est asociado a la hora que mira tv, las
mujeres permanecen ms tiempo viendo tv.

2. BONDAD DE AJUSTE POR JI-CUADRADA:


a. Usos y aplicaciones:
Estas pruebas permiten verificar que la poblacin de la cual
proviene una muestra tiene una distribucin especificada o
supuesta.
Saber si una muestra procede de una poblacin terica con
determinada distribucin de probabilidad.
El test de la x2 se puede aplicar en situaciones donde se
desea decidir si una serie de datos (observaciones) se ajusta o
no a una funcin terica previamente determinada (Binomial,
Poisson, Normal, etc.)
Metodologa til para validar las hiptesis sobre la distribucin
terica en la poblacin que se realiza en la estadstica
paramtrica, i.e., contrastes de hiptesis, intervalos de
confianza, regresin lineal, etc.

b. Contraste de hiptesis:
Sea una poblacin, donde se analiza un carcter X con
(x1,x2,,xk) modalidades excluyentes, denotado por ni es el
nmero de elementos que representa la modalidad xi

(frecuencia observada de xi),

Se plantea la hiptesis nula H0: La distribucin terica


representa a la distribucin emprica u observada.
c. Estadstico de prueba y criterio de decisin:

Se acepta H0 si:

Se rechaza H0 si:
d. Metodologa para su aplicacin:
Dada una muestra aleatoria de n observaciones (x1, , xn) los pasos
que se deben emplear para realizar este contraste de hiptesis son los
siguientes:
Determinar las categoras de la variable aleatoria, ci,
i=1,, k.
Calcular la probabilidad de cada categora P(ci) = pi,
suponiendo cierta H0.
Calcular las frecuencias esperadas Ei = n pi de cada
categora, bajo H0.
Construir la regin critica del contrasta a partir de la
comparacin entre las frecuencias observadas y
esperadas mediante el estadstico chi-cuadrado
Calcular las frecuencias observadas Oi de cada
categora y comprobar si el valor del estadstico, para la
muestra obtenida, sobrepasa el umbral, en cuyo caso se
rechaza la hiptesis nula.
e. Dos ejemplos de aplicacin:
1. Sea X la variable aleatoria que representa el nmero de errores
diarios de un sistema operativo y se quiere averiguar si se ajusta a
una distribucin de Poisson con = 2 a partir de los datos
recogidos durante 84 das. Se trata por tanto de contrastar las
hiptesis:

1) Las categoras que se van a considerar son: c 1=0,c2=1, c3=2,c4=3,


c5=4 o ms.
2) Las probabilidades de cada categora segn H0 son:

3) Las frecuencias esperadas para una muestra de tamao 84 son


las siguientes:

4) Para el nivel de significancia de =0.05 el umbral vale


5) Las frecuencias observadas fueron:

y el valor

estadstico es:

Conclusin: Por lo tanto se no se rechaza la hiptesis de que el


nmero de errores siga una distribucin de Poisson con = 2.

2. Se quiere averiguar si la variable aleatoria del ejemplo anterior, se ajusta a


una distribucin de Poisson a partir de los datos recogidos durante los 84
das. Se trata por tanto de contrastar las hiptesis:

1) Las categoras que se van a considerar son: c 1=0,c2=1, c3=2,c4=3,


c5=4 o ms.
2) Para calcular las probabilidades de cada categora se estima el
parmetro mediante la media muestral X y se obtiene = 1.81. De
acuerdo con este valor el valor estimado para las probabilidades
tericas es:
3) Las frecuencias esperadas para una muestra de tamao 84 son
las siguientes:

4) Para el nivel de significacin =0.05 el umbral vale:

5) Las frecuencias observadas fueron:

y
el
6) valor del estadstico es

Conclusin: Por lo tanto no se rechaza la hiptesis de que el


nmero de errores siga una distribucin de Poisson.

3. BONDAD DE AJUSTE POR KOLMOGOROV Y SMIRNOV


a. Usos y aplicaciones:

Es aplicable solamente a variables aleatorias contnuas

es una prueba no paramtrica que determina la bondad de ajuste


de dos distribuciones de probabilidad entre s.

En el caso de que queramos verificar la normalidad de una


distribucin, la prueba de Lilliefors conlleva algunas mejoras con respecto
a la de Kolmogrov-Smirnov; y, en general, el test de ShapiroWilk o la
prueba de Anderson-Darling son alternativas ms potentes.
Conviene tener en cuenta que la prueba Kolmogrov-Smirnov es
ms sensible a los valores cercanos a la mediana que a los extremos de
la distribucin. La prueba de Anderson-Darling proporciona igual
sensibilidad con valores extremos.

b. Contraste de hiptesis:
H0: Los datos analizados siguen una distribucin M.
H1: Los datos analizados no siguen una distribucin M.
c. Estadstico de prueba y criterio de decisin:

donde:
xi es el i-simo valor observado en la muestra (cuyos valores
se han ordenado previamente de menor a mayor).

es un estimador de la probabilidad de observar


valores menores o iguales que xi.

es la probabilidad de observar valores menores o


iguales que xi cuando H0 es cierta.

d. Metodologa para su aplicacin:


Se colocan los n datos histricos en una tabla de
frecuencias con m= intervalos o utilizando la formula
de de Struges: K=1+3.3log n ; donde n es el nmero de
datos de la muestra.
o Encuentre la amplitud del intervalo de clase por
medio de la siguiente relacin.

Amplitud =
o Para cada intervalo se tendr la frecuencia
observada i (FOi). Se calcula la media y la
varianza de los datos.
Se encuentra la probabilidad observada (POi), dividiendo
la frecuencia observada de cada intervalo por el nmero
total de datos.
Se calcula la probabilidad acumulada observada de cada
intervalo (PAOi) del paso 2
Se propone una distribucin de probabilidad de acuerdo
con la forma de tabla de frecuencia obtenida en 1. O con
la grafica de los datos.
Con la funcin acumulada de la distribucin propuesta,
se calcula la probabilidad esperada acumulada para
cada intervalo (PEAi) mediante la integracin de la
distribucin propuesta.
Se calcula la probabilidad acumulada (PAEi) para cada
intervalo de clase.
Se calcula el valor absoluto entre la diferencia de PAO y
PAE para cada intervalo y se selecciona la mxima
diferencia, llamndola MD.
El estimador MD se comporta con un valor limite
correspondiente a la (tabla que contiene los valores
crticos de kolmogorov-Smirnov). Con n datos y a un
nivel de confianza de 1. Si el estimador MD es menor
o igual al valor lmite de la tabla, entonces se acepta ha
hiptesis de que la informacin histrica sigue la
distribucin propuesta.
e. Dos ejemplos de aplicacin:
(Para probabilidad uniforme)
1. Un muestreo realizado sobre la demanda de televisores en un
almacn del centro de Medelln durante 40 dias tiene el siguiente
comportamiento.

1) Hallamos el rango R = Xmas Xmin


R= 13-1= 12
K= 1+3.3log41
2) Encontramos el valor de k=6.3 y se aproxima a 6
Luego k=6
12
3) Hallar la amplitud A = = =2
6

4) El lmite inferior es 1 y al superior se le suma la amplitud y as


sucesivamente, como se nota en la tabla de frecuencias
5) Luego se completa la tabla de frecuencias
6) Se quiere proponer la hiptesis que los datos en estudio siguen
una distribucin uniforme de lo cual procedemos de la siguiente
manera:
a. Integramos la funcin de densidad de la distribucin uniforme
Con esta frmula se encuentra la POA (Probabilidad de observacin
acumulada) para cada intervalo.

31
Para el primer intervalo POA = = 0.167
12

51
Para el segundo intervalo POA = = 0.333 y as sucesivamente.
12

LS= Lmite superior de cada intervalo

Podemos observar que la mxima diferencia de la columna POA PEA es


0.025 La cual al ser comparada con la tabla de los valores crticos de
kolmogorov Smirnov el cual es 0.2150 d 40%,5 = , con la cual se cumple la
hiptesis, luego no se rechaza la hiptesis que este conjunto de datos se
pueden modelar por medio de una distribucin uniforme entre 1 y 13
televisores demandados por das A un nivel de confianza de del 95%.
Luego que se ha encontrado que los datos se pueden modelar por una
distribucin uniforme se busca entonces generar variables aleatorias
uniformes como entradas estocsticas para un modelo de simulacin a
travs la frmula:

Para estimar los parmetros a y b utilizamos los mtodos de los momentos


en base a los datos histricos.

Como se tienen dos momentos se deben usar los dos primeros de la media y
la varianza. Es decir, igualamos la media y la varianza de la poblacin

a la media de la muestra

Se sabe que la media para una distribucin uniforme y que la

varianza es

Despejando a y b de las dos expresiones anteriores:

De la primera ecuacin despejamos b,


En resumen la ecuaciones para estimar a y b requieren que se estime la
media y las varianza de la muestra

(Para probabilidad exponencial)


2. Un muestreo realizado sobre la demanda de caf en el eje cafetero a
travs del tiempo, medida por cargas es:

1) Hallamos el rango R = Xmas Xmin


R= 20-0= 20
K= 1+3.3log50
2) Encontramos el valor de k=6.6 y se aproxima a 7
Luego k=7
20
3) Hallar la amplitud A = = = 2.8 =3
7

La Dm= 0.030208 se compara con lo cual indica que los datos


de caf en el eje cafetero siguen una distribucin exponencial con media de
=6 toneladas/dias. Es decir,

Demanda Exp ( =6) toneladas/das

Recordemos que el parmetro que define la distribucin de probabilidad


exponencial es la media la cual se encuentra cuando los datos estn
agrupados de la siguiente manera:

Con esta formula se puede comprobar que X =6 y se puede demostrar por el

estimador de mxima verosimilitud de es la media muestral , es decir =

Luego =6

Recurdese que al integrar la funcin de densidad exponencial

Se obtiene
4. ANLISIS DE LA VARIANZA POR RANGOS DE KRUSKAL Y WALLIS

a. Usos y aplicaciones:

Es una generalizacin de la prueba de la suma de rangos para el


caso de k > 2 muestras. Se utiliza para probar la hiptesis nula H0 de que
k muestras independientes provienen de poblaciones idnticas.

La prueba constituye un procedimiento no paramtrico para robar


la igualdad de las medias, en el anlisis de varianza de un factor, cuando
el experimentador desea evitar la suposicin de que las muestras se
seleccionaron de poblaciones normales.

b. Contraste de hiptesis:
La suma de los rangos que corresponde a las ni observaciones en la i-
sima muestra se denota mediante la variable aleatoria Ri. Consideremos
ahora el estadstico

que se aproxima muy bien mediante una distribucin chi cuadrada con k -
1 grados de libertad, cuando H0 es verdadera, siempre y cuando cada
muestra conste de al menos 5 observaciones.
c. Estadstico de prueba y criterio de decisin:
Para probar la hiptesis nula H0 de que k muestras independientes
provienen de poblaciones idnticas se calcula

donde ri es el valor supuesto de Ri para


i = 1, 2,..., k. Si h cae en la regin crtica H > X2 con v = k 1 grados de
libertad, se rechaza H0 al nivel de significancia , de otra manera no se
rechaza H0.

d. Metodologa para su aplicacin:


Primero combinamos todas las k muestras y acomodamos

las n = observaciones en orden


ascendente y sustituimos el rango apropiado.
Contraste de hiptesis
Estadstico de prueba
Criterio de desicin
e. Dos ejemplos de aplicacin:
1. En un experimento para determinar cul de tres diferentes
sistemas de misiles es preferible, se mide la tasa de combustin
del propulsor. Los datos, despus de codificarlos, se presentan en
la tabla. Utilice la prueba de Kruskal-Wallis y un nivel de
significancia de = 0.05 para probar la hiptesis de que las tasas
de combustin del propulsor son iguales para los tres sistemas de
misiles.
1. H0: 1 = 2 = 3
2. H1: las tres medias son diferentes.
3. = 0.05.

4. Regin crtica: para v = 2 grados de


libertad.
5. Clculos: En la tabla convertimos las 19 observaciones a
rangos y sumamos los rangos para cada sistema de misiles.
Conclusin: Como h = 1.66 no cae en la regin crtica h > 5.991, no hay
evidencia suficiente para rechazar la hiptesis de que las tasas de
combustin del propulsor son iguales para los tres sistemas de misiles.

2. Una EPS solicita y contrata personal para su equipo gerencial en


tres escuelas diferentes.

Se dispone de calificaciones de desempeo en muestras


independientes de cada una de las escuelas.

Se dispone de calificaciones de 7 empleados de la escuela A, 6


empleados de la escuela B y 7 empleados de la escuela C.
La calificacin de cada gerente est en escala de 0 a 100. El
lmite superior es la mxima nota.

Ho: Las Escuelas son idnticas en trminos de las evaluaciones de


desempeo.

H1: Por lo menos una de las Escuelas no es idntica en trminos


de las evaluaciones de desempeo.
Se ordenan las n observaciones
Ubicar los rangos asignados de acuerdo a la clasificacin original
(escuelas)
Se obtiene la suma de los rangos (a,b,c) correspondientes a los elementos
de cada muestra, rj y se halla el rango promedio.

Estadstico de prueba:

=3.21
Conclusin: Al analizar el resultado en SPSS el sig. nos da mayor a 0.05,
entonces se sigue aceptando Ho.

5. ANLISIS DE CORRELACIN POR RANGOS DE SPEARMAN.

a. Usos y aplicaciones:

Es un estadstico basado en rangos, que sirve para determinar si


hay asociacin entre dos variables de un mismo sujeto.

Es una medida de asociacin que requiere que ambas variables


sean medidas por lo menos en una escala ordinal, de manera que los
sujetos puedan colocarse en dos series ordenadas.
b. Contraste de hiptesis:
H0: No existe asociacin entre las dos variables
H1: Existe una relacin o asociacin entre las dos variables
c. Estadstico de prueba y criterio de decisin:

o en otros casos

d. Metodologa para su aplicacin:

Se asignan rangos en la variable X y en la variable Y, de


manera independiente.

Se determinan las diferencia entre los rangos (di).

Se eleva al cuadrado cada di y luego se suman los resultados,

para reemplazar en la siguiente formula:

Toma de decisin.

e. Dos ejemplos de aplicacin:


Obtener el coeficiente de correlacin de Spearman

Tx = (33-3)+(23-2) = 30

Ty = (23-2) +(43-4)+(23-2)+ (23-2) = 78

103 10 30
2 = = 80
12
103 10 78
2 = = 76
12

80+7625
rsc= = 0.84
280.76

2 .Las cifras que se listan en la tabla, publicadas por la Comisin Federal


de Comercio, muestran los miligramos de alquitrn y nicotina que se
encontraron en 10 marcas de cigarrillos. Calcule el coeficiente de
correlacin de rangos para medir el grado de relacin entre el contenido
de alquitrn y de nicotina en cigarrillos.

Sean X y Y los contenidos de alquitrn y nicotina, respectivamente.


Primero asignamos rangos a cada conjunto de medidas, con el rango de
1 asignado al nmero ms bajo en cada conjunto, el rango de 2 al
segundo nmero ms bajo en cada conjunto, y as sucesivamente, hasta
que se asigna el rango 10 al nmero ms grande. La tabla muestra los
rangos individuales de las mediciones y las diferencias en rangos para
los 10 pares de observaciones.
Al sustituir en la formula de rs, encontramos que

(6)(5.50)
rs= 1-(10)(1001) = 0.967

lo que indica una correlacin positiva alta entre las cantidades de alquitrn y
de nicotina que se encuentra en los cigarrillos.

1. H0: = 0 .

2. H1: > 0.

3. = 0.01.

4. Regin crtica: rs > 0.745, de la tabla.

5. Clculos: Del ejemplo 16.8, rs = 0.967.

6. Decisin: Se rechaza H0 y se concluye que hay una correlacin


significativa entre la cantidad de alquitrn y nicotina que se encuentra en los
cigarrillos.

Con base en la suposicin de que no hay correlacin, se puede demostrar


que la distribucin de los valores rs se aproxima a una distribucin normal,
con una media igual a cero y una desviacin estndar de 1/ n 1 conforme
aumenta n. En consecuencia, cuando n excede a los valores dados en la
tabla se puede probar si existe una correlacin significativa calculando
y comparando con los valores crticos de la distribucin normal estndar que
se presentan en la tabla.

Anda mungkin juga menyukai