Anda di halaman 1dari 11

REPUBLICA BOLIVARIANA DE VENEZUELA

MINISTERIO DEL PODER POPULAR PARA LA DEFENSA


UNIVERSIDAD NACIONAL EXPERIMENTAL POLITECNICA
DE LA FUERZA ARMADA
UNEFA
LARA BARQUISIMETO

ESTADISTICA NO PARAMETRICA

INTEGRANTES:
LISANDRY PALACIOS V-21.506.193
FABIOLA NELO V-25.630.110
DULIMAR PIA V-24.353.968
SECCION:
3D02AG
MATERIA: ESTADISTICA II
PROF.: PEDRO SILVA

ESTADISTICA NO PARAMETRICA
Es una rama de la estadstica que estudia las pruebas y modelos estadsticos
cuya distribucin subyacente no se ajusta a los llamados criterios paramtricos, es
decir, que no puede ser definida previamente pues son los datos observados que la
determinan. La utilizacin de estos mtodos se hace recomendable cuando no se
puede asumir que los datos se ajusten a la distribucin conocida.
PRUEBA ESTADISTICA NO PARAMETRICA
Son aquellas que no presuponen una distribucin de probabilidad para los
datos, por ello se conoce tambin como una distribucin libre. En la mayora de los
casos los resultados estadsticos se derivan nicamente a partir de procedimientos de
ordenacin y recuento. El termino no paramtrico sugiere que la prueba no est
basada en un parmetro.
PRUEBA DE SIGNOS: Se usa para hacer pruebas de hiptesis acerca de la
mediana de una poblacin. Es decir, Ho: la mediana poblacional es igual a un
valor dado; H1: La mediana poblacional es mayor o distinta del valor dado.
o EJEMPLO:
Los tiempos de sobrevivencia (en aos) de 12 personas que se han sometido a
trasplante de corazn son los siguientes: 3.1, 0.9, 2.8, 4.3, 0.6, 1.4, 5.8, 9.9,
6.3, 10.4, 0, 11.5 Probar con 95% se confianza si los datos del tiempo de vida
despus del trasplante sugieren que la mediana sea distinta a 5.
Persona 1
Aos
3.1

2
0.9

3
2.8

4
4.3

5
0.6

6
1.4

7
5.8

8
9.9

9
10
6.3 10.4

11
0

12
11.5

Proponemos que la mediana es 5, se calculan las diferencias contra el valor de


prueba (cada dato menos 5).
3.1 0.9 2.8 4.3 0.6 1.4 5.8 9.9 6.3 10.4 0 11.5
-5
-5
-5
-5
-5
-5 -5 -5 -5
-5 -5 -5
-1.9 -4.1 -2.2 -0.7 -4.4 -3.6 0.8 4.9 1.3 5.4 -5 6.5
El resultado de restar la mediana (-5) nos arrojara tanto signos positivos como
negativos. Si algn resultado nos da 0 debemos obviar esa observacin, pero
en este caso ninguno nos dio 0.
Ahora ocupamos otra fila solo con los signos.
3.1
-5

0.9
-5

2.8
-5

4.3
-5

0.6
-5

1.4
-5

5.8 9.9 6.3 10.4 0 11.5


-5 -5 -5
-5 -5 -5

-1.9 -4.1 -2.2 -0.7 -4.4 -3.6 0.8 4.9 1.3


+
+
+

5.4
+

-5
-

6.5
+

Como resultado tenemos 7 Negativos y 5 Positivos.


La prueba se basa en la distribucin binomial, ya que bien sale positivo o
negativo.
n= 12; p= 0.5
Lo que deseamos saber es que tanto acertado es encontrar que:
Los 12 datos sean positivos y 0 negativos
0 sean positivos y 12 negativos.
P= (x=12) = P= (x=0)
P= (x=0) = P= (x=12)
La funcin de probabilidad de la distribucin binomial, tambin es
denominada la distribucin de Bernoulli, y es:

( = ) = ( ) .

Donde:
n es el nmero de pruebas
k es el nmero de xitos
p es la probabilidad de xitos
q es la probabilidad de fracaso

El numero combinatorio: ( ) =

!
!+()!

si p= 0.5 ; q= (1-p)= 0.5

Ahora bien, para trabajar, usaremos esta frmula: ( ) =


!+()!
Recordando que 12!= 12*11*10*9*8*7*6*5*4*3*2*1
DATOS

n= 12
k= se pueden tomar valores del 0 al 12
p= 0.5
q= 0.5
Cul ser la probabilidad de encontrar
12 positivos y 0 negativos o viceversa?

OPERACIN
12
( = 12) = ( ) 0.512 . 0.5
12
12!
(12) =
0.512 . 0.5
12! (12 12)!
(12) = (1)(0.000244)(0.5)
(12) = 0.00012
Hay que recordar que en el otro extremo
tenemos 0, y que ambos tienen el mismo
valor.

Como tenemos 7 positivos y 5 negativos, se concluye que no hay diferencia


con la mediana; se tena:
Ho= =0.5
H1= 0.5
Por lo tanto se acepta la Ho
Las personas que han sido operadas del corazn tienen una mediana del tiempo de
vida de 5 aos.
PRUEBA DE DE PEARSON: Se considera una prueba no paramtrica
que mide la discrepancia entre una distribucin observada y otra terica
(bondad de ajuste), indicando en qu medida las diferencias existentes entre
ambas, de haberlas, se deben al azar en el contraste de hiptesis. Tambin se
utiliza para probar la independencia de dos variables entre s, mediante la
presentacin de los datos en tablas de contingencia.
o EJEMPLO:
En un centro de salud analizamos las historias de enfermera (292 hombres y 192
mujeres) de ellos tienen ulcera 10 hombres y 24 mujeres, y no tienen 282 hombres y
168 mujeres, se establece un nivel de significacin del 0.05.
Ho= Xh=Xm (las dos variables no estn asociadas)
Hi= XhXm (las variables si estn asociadas)
Tabla de contingencia:

Variable: Sexo

Hombre
Mujeres
Totales

Variable: Aparicin de Ulcera


Ulceras
No Ulceras
10
282
24
168
34
450

Total
292
192
484

Valores esperados

Variable:
Sexo

Hombre
Mujeres
Totales

Variable: Aparicin de Ulcera


Ulceras
No Ulceras
292*34/484=20.5 292*450/484=271.5
192*34/484=13.5 292*450/484=178.5
34
450

Total
292
192
484

Como no hay valores esperados menos a 5 se puede usar 2


( )2
(10 20.5)2 (282 271.5)2 (24 13.5)2 (168 178.5)2
]=
+
+
+

20.5
271.5
13.5
178.5
2
= (5.38) + (0.41) + (8.17) + (0.62)
2 = 14.58
Ahora necesitamos el Gl (grado de libertad): Gl= 1; nivel de significancia= 0.05
2 = [

Con estos valores lo buscamos en la tabla y tenemos que es 2 = 3.84

Ahora se comparas los resultados: 2 = 14.58 y 2 (1; 0.05) = 3.84


Y tenemos que si:
2 > 2 (1; 0.05) Se rechaza la hiptesis nula (Ho) y se concluye que las dos variables estan
asociadas.
2 < 2 (1; 0.05) Se acepta la hiptesis nula (Ho) y se concluye que nos hay prueba
estadstica de que las variables estn asociadas.
Por lo tanto se rechaza la Ho y acepta Hi.
Afirmamos que existe relacin entre tener ulcera y sexo.
PRUEBA DE COEFICIENTE KAPPA DE COHEN: Es una medida estadstica
que ajusta el efecto del azar en la proporcin de la concordancia observada para
elementos cualitativos (variables categricas). En general se cree que es una medida
ms robusta que el simple clculo del porcentaje de concordancia, ya que K tiene en
cuenta el acuerdo que ocurre por azar. Algunos investigadores han expresado su
preocupacin por la tendencia de K a dar por seguras las frecuencias de las categoras
observadas, lo que puede tener el efecto de subestimar el acuerdo para una categora
de uso habitual; por esta razn, K se considera una medida de acuerdo excesivamente
conservadora.
o EJEMPLO:
Dos radilogos independientes informan como neumona si/no 100radiografias, los
resultados son:
Observador A
Observador B
Pulmona
No pulmona
Total
Pulmona
4
6
10
No pulmona
10
80
90
total
14
86
100

Observador B
Pulmona
No pulmona
total

Observador A
Pulmona
No pulmona
a
b
c
d
t
u

Total
r
s
n

Formula:


1
Siendo Po la proporcin de acuerdos observados
Pe la proporcin de acuerdos esperados en la hiptesis de independencia
=

4+80

100

= 0.84

+
2
(1014)+(9086)
1002

= 0.788

Por lo tanto:

1
0.84 0.788
=
= 0.25
1 0.788
=

De acuerdo con lo anterior, se tiene que el 84% de acuerdo, segn la interpretacin anterior el
acuerdo observado est compuesto por un 24.5% de acuerdo mximo y un 75.5% del
esperado por el azar.
PRUEBA DE FRIEDMAN: Es una prueba no paramtrica desarrollado por el
economista Milton Friedman. Equivalente a la prueba ANOVA para medidas
repetidas en la versin no paramtrica, el mtodo consiste en ordenar los datos por
filas o bloques, reemplazndolos por su respectivo orden. Al ordenarlos, debemos
considerar la existencia de datos idnticos.
o EJEMPLO:
Ho= las distribuciones de la J poblaciones son idnticas
H1= las distribuciones no son idnticas
Estadstico de contraste:

12
2 3( + 1)
( + 1)
La distribucin del estadstico de contraste, aproxima chi cuadrado con n-1 grados de libertad
con muestras grandes (n>15 o J<4)
2 =

1
2
3

1
9
8
9

2
6
4
5

Se asigna rangos por filas y sumamos por columnas.

3
4
5
6

4
5
6
4

12
12
( )2 3( + 1) =
2 =
252 3(3)(4 + 1) = 5.4
(3)(4)(4 + 1)
( + 1)
1

De acuerdo a la tabla de la prueba el estadstico de contraste es significativo 0.05 y el valor


crtico para n=3 y J=4 es 5.4
Se acepta la hiptesis nula.
PRUEBA U DE MANN-WHITNEY: Es una prueba no paramtrica aplicada a dos
muestras independientes. Es, de hecho, la versin no paramtrica de la habitual
prueba t de Student.
o EJEMPLO:
Un experimentador utiliza dos mtodos para ensear a leer a un grupo de 10 nios de 6 aos,
quienes ingresan por primera vez a la escuela. El experimentador quiere demostrar que el
procedimiento ideado por l es ms efectivo que el tradicional; para ello, mide el desempeo
en la lectura en funcin de la fluidez, comprensin, anlisis y sntesis.
El plan experimental preliminar consiste en elegir al azar tanto una muestra de 10 nios como
el mtodo por utilizar.
Planteamiento de la hiptesis.
Hiptesis alterna (H1). Las calificaciones de ejecucin de lectura, segn el mtodo de
enseanza del experimentador son ms altas y diferentes que las observadas en el mtodo
tradicional.
Hiptesis nula (Ho). Las diferencias observadas entre las calificaciones de ejecucin de
lectura mediante los dos mtodos se deben al azar.

Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta H1 y se rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza H1.
Dos mtodos diferentes aplicados en dos grupos de nios.
Aplicacin de la prueba estadstica.
De acuerdo con los paso, las observaciones se deben ordenar en rangos del menor al mayor.
Rangos de lectura de la tabla anterior.
Calculamos la U.
De los dos valores de U calculados, se elige el ms pequeo (4) y se comparan con los
valores crticos de U Mann-Whitney.

En caso de que el valor de U calculado no se localice en las tablas correspondientes, se


transformar en la frmula siguiente:
U = n1n2 - U'
En esta frmula, U' corresponde al valor ms alto.
Decisin.
A la probabilidad del valor U de Mann-Whitney, calculado anteriormente, corresponde 0.048,
el cual es ms pequeo que el nivel de significancia; por lo tanto, se acepta Ha y se rechaza
Ho.
Interpretacin.
Entre las calificaciones de la ejecucin de lectura mediante los dos mtodos de enseanza
existe una diferencia significativa a un nivel de probabilidad de error menor que 0.05; es
decir, aun cuando las muestras son pequeas, las calificaciones ms altas mediante el mtodo
diseado por el experimentador sealan ms efectividad, con la probabilidad de equivocarse
de 0.048 para aceptarlo.
PRUEBA DE KOLMOGROV-SMIRNOV: Es una prueba no paramtrica que se
utiliza para determinar la bondad de ajuste de dos distribuciones de probabilidad
entre s.
o EJEMPLO:
Se tiene la siguiente muestra {0.00, 0.75, 0.63, 0.20, 0.34, 0.99} de nmeros aleatorios.
Ordenamos la muestra y construimos la siguiente tabla:
j

( ) =

1
2
3
4
5
6

0.000
0.200
0.340
0.630
0.750
0.990
Mximos D
Mximo

( ) =
0.167
0.333
0.500
0.667
0.833
1.000


6
0.167
0.133
0.160
0.037
0.083
0.010
0.167

1
6
0.000
0.033
0.007
0.130
0.083
0.157
0.157

0.167

Dado que 0.167< 0.470= (0.1;6) decimos que no hay evidencia que la muestra no provenga
de una distribucin uniforme.
PRUEBA DE KRUSKAL-WALLIS: Es un mtodo no paramtrico para probar si
un grupo de datos proviene de la misma poblacin. Intuitivamente, es idntico al
ANOVA con los datos reemplazados por categoras. Es una extensin de la prueba de
la U de Mann-Whitney para 3 o ms grupos.
o EJEMPLO:
Una manufacturera recluta y contrata personal para su equipo gerencial en tres escuelas
diferentes; se dispone de calificaciones de 7 empleados de la escuela A, 6 de la escuela B y 7
de la escuela C, la calificacin de cada gerente est en escala del 0 al 100, y el lmite superior
es la mxima nota.
A
B
C
25
60
50
70
20
70
60
30
60
85
15
80
95
40
90
90
35
70
80
75
a) Determinar si las tres escuelas son idnticas en cuanto a las evaluaciones de
desempeo.
Ho= Las poblaciones son idnticas en termino de evaluaciones del desempeo
H1= Las poblaciones no son idnticas en termino de evaluaciones del desempeo
Se le asigna el rango:

Escuela
B
B
A
B
B
B
C
A
B
C
A
C
C
C
A
C
A
A
C
A

Calificacin
15
20
25
30
35
40
50
60
60
60
70
70
70
75
80
80
85
90
90
95

Rango
3
4
5
6
7
8
10
12
12
12
14
14
14
15
16
16
17
18
18
19

Se ordena de acuerdo a la tabla original:


A
25
70
60
85
95
90
80

Rango
5
14
12
17
19
18
16
101

B
60
20
30
15
40
35

Rango
12
4
6
3
8
7

C
50
70
60
80
90
70
75

40

Calculo estadstico de la prueba:


Formula:

12
2
] 3( + 1)
=[
( + 1)

=1

(101)2 (40)4 (99)2


12
][
] 3(20 + 1)
=[
+
+
20(20 + 1)
7
6
7
= [0.029][3124.09] 63

Rango
10
14
12
16
18
14
15
99

= 27.60
2
Si 2
se rechaza Ho
2
Ahora bien el resultado con un grado de libertad de 2 se tiene que
= 5.99

Conclusin: El desempeo de los gerentes vara de acuerdo a la escuela que asista,


considerando que de la escuela B presenta menores calificaciones.
COEFICIENTE DE CORRELACIN DE SPEARMAN: Es una medida de la
correlacin (la asociacin o interdependencia) entre dos variables aleatorias
continuas. Para calcular , los datos son ordenados y reemplazados por su respectivo
orden.
o EJEMPLO:
Dato1
Dato2
Rango1
Rango2
D

6
2
2
1
1
1
4
9
1
3
2
4
7
3
3
2
1
1
2

Formula:

6 2
66
1(
) = 1(
) = 0.5
2
( 1
3(9 1)
La correlacin es negativa.
PRUEBA DE FISHER: La prueba f se utiliza principalmente para probar la
igualdad entre dos varianzas poblacionales que provienen de poblaciones que tiene
una distribucin normal, tambin se ha desarrollado un procedimiento basado en esta
prueba para investigar la igualdad entre tres o ms medias poblacionales,
procedimiento que comnmente se denomina anlisis de varianza (ANOVA).
o EJEMPLO:

Anda mungkin juga menyukai