Anda di halaman 1dari 36

U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 1




TEMARIO

Unidad 4: Pruebas de bondad de ajuste y pruebas no paramtricas



UNIDAD IV: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO
PARAMETRICAS
C0NCEPTUALES 30 PUNTOS



Investigacin DOCUMENTAL: %


Portada 5


ndice 5 CALIF =
*0.3
2
a b +

Introduccin 10


Desarrollo 45


Conclusin 25


Referencias bibliogrficas 10


100


Presentacin PP ( 0 100 )


PROCEDIMENTALES 60 PUNTOS



a) Resolucin de Problemario ( 0 - 100 )



b) Examen ( 0 -100 )

CALIF= *0.6
2
a b +








ACTITUDINALES 20 PUNTOS



a) Asistencia ( 0 - 100 )






CALIF = .*0.1 Pts







CALIFICACION DE LA UNIDAD = CC + CP + CA
Fecha de examen: Viernes 30 de Diciembre del 2012



U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 2

Unidad 4: Pruebas de bondad de ajuste y pruebas no paramtricas

4.1 Bondad de ajuste

Las pruebas de bondad de ajuste tienen varias aplicaciones, por ejemplo, en situaciones en las que
queremos determinar si un conjunto de datos se puede considerar como una muestra aleatoria de una
poblacin que tiene una distribucin dada.
Pero, Cmo podemos determinar qu tipo de distribucin tiene una variable aleatoria? Empecemos
por definir, Qu es una variable aleatoria?
Podemos decir que las variables aleatorias son aquellas que tienen un comportamiento probabilstico
en la realidad. Por ejemplo, el nmero de clientes que llegan cada hora a un banco depende del momento del
da, del da de la semana y de otros factores: por lo general, la afluencia de clientes ser mayor al medioda
que muy temprano por la maana; la demanda ser mayor el viernes que el mircoles; habr ms clientes un
da de pago que un da normal, etc. Dadas estas caractersticas, las variables aleatorias deben cumplir reglas
de distribucin de probabilidad como estas:

La suma de las probabilidades asociadas a todos los valores posibles de la variable aleatoria x es uno.
La probabilidad de que un posible valor de la variable x se presente siempre es mayor que o igual a
cero.
El valor esperado de la distribucin de la variable aleatoria es la media de la misma, la cual a su vez
estima la verdadera media de la poblacin.
Si la distribucin de probabilidad asociada a una variable aleatoria est definida por ms de un
parmetro, dichos parmetros pueden obtenerse mediante un estimador no sesgado. Por ejemplo, la
varianza de la poblacin
2
o puede ser estimada usando la varianza de una muestra que es
2
s . De la
misma manera, la desviacin estndar de la poblacin, o , puede estimarse mediante la desviacin
estndar de la muestra s .

Tipos de variables aleatorias:

Podemos diferenciar las variables aleatorias de acuerdo con el tipo de valores aleatorios que
representan. Por ejemplo, si hablramos del nmero de clientes que solicitan cierto servicio en un periodo de
tiempo determinado, podramos encontrar valores tales como 0,1, 2,........, n , es decir, un comportamiento
como el que presentan las distribuciones de probabilidad discretas. Por otro lado, si hablramos del tiempo
que tarda en ser atendida una persona, nuestra investigacin tal vez arrojara resultados como 1.54 min, 0.028
horas o 1.37 das, es decir, un comportamiento similar al de las distribuciones de probabilidad continuas.
Considerando lo anterior podemos diferenciar entre variables aleatorias discretas y variables aleatorias
continuas.

i. Variables aleatorias discretas. Este tipo de variables deben cumplir con estos parmetros:

( )
( )
0
0
1
......
i
i
b
i a b
i a
P x
p
P a x b p P P

=
=
>
=
s s = = +




U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 3

Algunas distribuciones discretas de probabilidad son: la uniforme discreta, la de Bernoulli, la
hipergeomtrica, la de Poisson y la binomial.

Distribucin de probabilidad de una variable aleatoria discreta

6 5 4 3 2 1 0
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00
X
P
r
o
b
a
b
i
l
i
d
a
d
Grfica de distribucin
Binomial, n=5, p=0.5


Podemos asociar a estas distribuciones de probabilidad el comportamiento de una variable aleatoria. Por
ejemplo, si nuestro propsito al analizar un muestreo de calidad consiste en decidir si la pieza bajo
inspeccin es buena o no, estamos realizando un experimento con dos posibles resultados: la pieza es buena o
la pieza es mala. Este tipo de comportamiento est asociado a una distribucin de Bernoulli. Por otro lado, si
lo que queremos es modelar el nmero de usuarios que llamaran a un telfono de atencin a clientes, el tipo
de comportamiento puede parecerse a una distribucin de Poisson.

ii. Variables aleatorias continuas. Este tipo de variables se representan mediante una ecuacin que se
conoce como funcin de densidad de probabilidad. Dada esta condicin, cambiamos el uso de la
sumatoria por la de una integral para conocer la funcin acumulada de la variable aleatoria. Por lo
tanto, las variables aleatorias continuas deben cumplir los siguientes parmetros:

( )
( )
( )
( ) ( ) ( )
0
0
1
b
a
P x
P x a
f x
P a x b P a x b f x

>
= =
=
s s = < < =
}
}

U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 4

Entre las distribuciones de probabilidad continuas tenemos: la uniforme continua, la exponencial, la
normal, le de Weibull, la Chi-cuadrada y la de Erlang.
6.5 6.0 5.5 5.0 4.5 4.0 3.5
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
X
D
e
n
s
i
d
a
d
Grfica de distribucin
Normal, Media=5, Desv.Est.=0.5

Algunos procesos pueden ser asociados a estas distribuciones. Por ejemplo, es posible que el tiempo
de llegada de cada cliente a un sistema tenga una distribucin de probabilidad muy semejante a una
exponencial, o que el tiempo que le toma a un operario realizar una serie de tareas se comporte de manera
muy similar a la dispersin que presenta una distribucin normal. Sin embargo, debemos hacer notar que
este tipo de distribuciones tiene sus desventajas, dado que el rango de valores posibles implica que existe la
posibilidad de tener tiempos infinitos de llegada de clientes o tiempos de ensamble infinitos, situaciones
lejanas a la realidad.
Determinacin del tipo de distribucin de un conjunto de datos
La distribucin de probabilidad de los datos histricos puede determinarse mediante las pruebas Chi-
cuadrada, de Kolmogorov-Smirnov y de Anderson-Darling.
4.1.1 Prueba Ji-Cuadrada

Las distribuciones Chi-cuadrada, al igual que las distribuciones t de student, son una familia de
distribuciones de probabilidad, cada una de ellas identificada por el nmero de parmetro de
grados de libertad . Sus propiedades son:

2
_ es no negativa en su valor; es cero o de valor positivo.

2
_ no es simtrica; es sesgada a la derecha.

2
_ est distribuida para formar una familia de distribuciones, una distribucin separada para cada
nmero diferente de grados de libertad.

U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 5

Diversas distribuciones de Chi-cuadrada:
40 30 20 10 0
0.10
0.08
0.06
0.04
0.02
0.00
X
D
e
n
s
i
d
a
d
10
20
df
Grfica de distribucin
Chicuadrado

Los valores crticos para Chi-cuadrada se obtienen de tablas. Cada valor crtico es identificado por
dos piezas de informacin: los grados de libertad (gl) y rea bajo la curva a la derecha del valor crtico que se
busca. Por tanto,
( )
2
, gl o
_ se lee: Chi cuadrada de gl, alfa es el smbolo que se emplea para identificar el
valor crtico de Chi-cuadrada con gl grados de libertad y con o rea a la derecha.



Ejemplo 1.
2
_ Asociada con la cola derecha:
Encuentre
( )
2
20, 0.05
_

Solucin: Use la tabla para hallar el valor de
( )
2
20, 0.05
_ en la interseccin de la fila gl=20 y la columna
0.05 o = , como se muestra enseguida:

.. . .. rea a la derecha
gl 0.05
.
.
.
.
.
.
20 . . 31.4




U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 6

0.07
0.06
0.05
0.04
0.03
0.02
0.01
0.00
X
D
e
n
s
i
d
a
d
31.4
0.05
0
Grfica de distribucin
Chicuadrado, df=20





Ejemplo 2.
2
_ Asociada con la cola izquierda:
Encuentre
( )
2
14, 0.90
_

Solucin: Use la tabla para hallar el valor de
( )
2
14, 0.90
_
en la interseccin de la fila gl=14 y la columna
0.90 o = , como se muestra enseguida:


.. . .. rea a la derecha
gl 0.90
.
.
.
.
.
.
14 . . 7.79








U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 7

0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0.00
X
D
e
n
s
i
d
a
d
7.79
0.9
0
Grfica de distribucin
Chicuadrado, df=14




La prueba Chi-cuadrada es una prueba de hiptesis a partir de datos, basada en el clculo de un valor
llamado estadstico de prueba, al cual suele comparrsele con un valor conocido como valor crtico, mismo
que se obtiene, generalmente, de tablas estadsticas. El procedimiento general de la prueba es:
1. Obtener al menos 30 datos de la variable aleatoria a analizar.
2. Calcular la media y varianza de los datos.
3. Crear un histograma de m n = intervalos y obtener la frecuencia observada en cada intervalo
i
O .
4. Establecer explcitamente la hiptesis nula, proponiendo una distribucin de probabilidad que se
ajuste a la forma del histograma.
5. Calcular la frecuencia esperada,
i
E , a partir de la funcin de probabilidad propuesta.
6. Calcular el estadstico de prueba:
( )
2
1
m
i i
i
i
E O
c
E
=


7. Definir el nivel de significancia de la prueba, o , y determinar el valor crtico de la prueba,
2
, 1 m k o
_


( k es el nmero de parmetros estimados en la distribucin propuesta).
8. Comparar el estadstico de prueba con el valor crtico. Si el estadstico de prueba es menor que el
valor crtico, no se puede rechazar la hiptesis nula.








U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 8

Ejemplo 3. Estos son los datos del nmero de automviles que entran a una gasolinera cada hora. (Estudio
realizado en la 76 gas station de Los Angeles, CA 1998).

1. Se obtienen 50 datos:

14 7 13 16 16 13 14 17 15 16
13 15 10 15 16 14 12 17 14 12
13 20 8 17 19 11 12 17 9 18
20 10 18 15 13 16 24 18 16 18
12 14 20 15 10 13 21 23 15 18

2. Calcular la media y varianza de los datos:

1
14 13 13 20 ......... 18
15.04
50
n
i
i
x
x
n
=
+ + + + +
= = =



( )
( ) ( ) ( )
2
2 2 2
2 1
14 15.04 13 15.04 ........... 18 15.04
13.14
1 50 1
n
i
i
x x
n
o
=

+ + +
= = =


3. Crear un histograma de
m n =
intervalos y obtener la frecuencia observada en cada intervalo
i
O

Intervalo
i
O
( ) p x
( ) 50*
i
E p x =
c
6-8.5 2
9-11.5 3
12-14.5 15
15-17.5 16
18-20.5 9
21-23.5 2
24-26.5 1
20-21 4
22-23 1
24-25 1
25-8 0
Totales 50


U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 9




El histograma de los 50 n datos = , considerando 11intervalos m= , la media muestral de 15.04 y la varianza
muestral de 13.14, permiten establecer la siguiente hiptesis:

Determinar la distribucin de probabilidad con un nivel de significancia o de 5 %

( )
0
: 15 /
:
a
H Poisson automoviles h
H Otra distribucion
=

Comenzamos por calcular la probabilidad de cada intervalo a partir de la funcin de probabilidad de Poisson:
( ) 0,1, 2, 3,.......
!
x
e
p x x
x


= =

( )
15
15
0,1, 2, 3,.......
!
x
e
p x x
x

= =

Por ejemplo, para el intervalo 8-9

( )
8 15 9 15
15 15
8, 9 0.0519
8! 9!
e e
p x

= = + =


Enseguida calculamos la frecuencia esperada en cada intervalo, multiplicando la probabilidad p(x) por el total
de datos de la muestra:
( )
( ) 50
i
i
E n p x
E p x
=
=


Y luego estimamos el estadstico de prueba:


( ) ( ) ( ) ( )
2 2 2 2
1
0.5185 1 2.5926 2 0.3100 0
......... 2.2215
0.5185 0.3100
m
i i
i
i
E O
c
E
=

= = + + + =


0
2
4
6
8
10
12
0-7 8-9 10-11 12-13 14-15 16-17 18-19 20-21 22-23 24-25 25-8
F
r
e
c
u
e
n
c
i
a

Automviles/h
Histograma de frecuencias de la llegada de automoviles a
la gasolinera
U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 10

A partir de los clculos realizados anteriormente se obtiene la siguiente tabla:

Intervalo
i
O
( ) p x ( ) 50*
i
E p x =
c
0-7 1 0.0104 0.5185 0.4471
8-9 2 0.0519 2.5926 0.1354
10-11 4 0.1149 5.7449 0.5300
12-13 10 0.1785 8.9233 0.1299
14-15 11 0.2049 10.2436 0.0559
16-17 10 0.1808 9.0385 0.1023
18-19 6 0.1264 6.3180 0.0160
20-21 4 0.0717 3.5837 0.0483
22-23 1 0.0336 1.6821 0.2766
24-25 1 0.0133 0.6640 0.1700
25-8 0 0.0079 0.3100 0.3100
Totales 50 1 50 2.2215

El valor del estadstico de prueba, 2.2215 c = , comparado con el valor crtico de tablas,
2
0.05, 11 0 1
18.307 _

= ,
indica que no podemos rechazar la hiptesis nula de que la variable aleatoria se comporta de acuerdo con
una distribucin de Poisson, con una media de 15 automviles/hora.
Valores crticos para la Distribucin
2
_

grados de
libertad
u

2
o
_
2
0.10
_
2
0.05
_
2
0.025
_
2
0.01
_
2
0.005
_
2
0.001
_
1 2.706 3.841 5.024 6.635 7.879 10.828
2 4.605 5.991 7.378 9.210 10.597 13.816
. . . . . . .
. . . . . . .
10 15.987 18.307 20.483 23.209 25.188 29.588


0.10
0.08
0.06
0.04
0.02
0.00
X
D
e
n
s
i
d
a
d
18.3
0.05
0
Grfica de distribucin
Chicuadrado, df=10




U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 11

4.2 Prueba de independencia

Las dos propiedades ms importantes que deben satisfacer los nmeros de un conjunto
i
r son
uniformidad e independencia.
Para probar la independencia de los nmeros de un conjunto
i
r primero es preciso formular las siguientes
hiptesis
0
:
:
i
A i
H los nmeros del conjunto r son independientes
H los nmeros del conjunto r no son independientes


Prueba de corridas arriba y abajo

El procedimiento de esta prueba consiste en determinar una secuencia de nmeros
( ) S que solo contiene
unos y ceros, de acuerdo con una comparacin entre
i
r y
1 i
r

. Posteriormente se determina el nmero de


corridas observadas
O
C (una corrida se identifica como la cantidad de unos y ceros consecutivos). Luego se
calcula el valor esperado, la varianza del nmero de corridas y el estadstico
0
Z , mediante las ecuaciones:
2
0
2 1
3
16 29
90
O
O
O
O
C
C
O C
C
n
n
C
Z

=
























U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 12

4.3 Pruebas no paramtricas

4.3.1 Prueba de Kolmogorov Smirnov

Desarrollada en la dcada de los treinta del siglo XX, esta prueba permite al igual que la prueba chi-
cuadrada- determinar la distribucin de probabilidad de una serie de datos. Una limitante de la prueba de
Kolmogorov-Smirnov estriba en que solamente se puede aplicar al anlisis de variables continuas. El
procedimiento general de la prueba es:
1. Obtener al menos 30 datos de la variable aleatoria a analizar.
2. Calcular la media y la varianza de los datos.
3. Crear un histograma de m n = intervalo, y obtener la frecuencia observada en cada intervalo
i
O
4. Calcular la probabilidad observada en cada intervalo
i
i
O
PO
n
= , esto es, dividir la frecuencia
observada
i
O entre el nmero total de datos n
5. Acumular las probabilidades
i
PO para obtener la probabilidad observada hasta el i simo
intervalo
i
POA
6. Establecer explcitamente la hiptesis nula, proponiendo una distribucin de probabilidad que se
ajuste a la forma del histograma.
7. Calcular la probabilidad esperada acumulada para cada intervalo,
i
PEA , a partir de la funcin de
probabilidad propuesta.
8. Calcular el estadstico de prueba: 1, 2, 3, ....., , ...,
i i
C mx PEA POA i k m = =
9. Definir el nivel de significancia de la prueba , o y determinar el valor crtico de la prueba,
, n
D
o

(consultando la tabla de valores crticos de la prueba de Kolmogorov-Smirnov).
10. Comparar el estadstico de prueba con el valor crtico. Si el estadstico de prueba es menor que el
valor critico no se puede rechazar la hiptesis nula.

Ejemplo 4: Un estudio del comportamiento del tiempo entre roturas de cierto filamento, medido en
minutos/rotura, se muestra a continuacin:

4.33 1.61 2.16 2.88 0.7 0.44 1.59 2.15 8.59 7.36
9.97 7.86 5.49 0.98 4.52 2.12 4.44 0.82 6.96 3.04
2.91 14.39 3.44 9.92 4.38 8.04 2.18 6.19 4.48 9.66
4.34 1.76 2.3 5.24 11.65 10.92 12.16 6.6 0.85 4.82
1.36 3.53 6.58 1.45 8.42 3.69 2.44 0.28 1.9 2.89

Determinar la distribucin de probabilidad con un nivel de significancia o de 5 por ciento.








Iniciamos el procedimiento calculando la cantidad de intervalos 50 7.071 8 m n = = = ~

U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 13


y el tamao de cada intervalo es
14.39 0.44
1.744 2
8 8
valor mayor valor menor
= = ~




El histograma de los 50 n datos = con 8 m= intervalos, la media muestral de 4.7336 y la varianza
muestral de 12.1991 permiten estimar un parmetro de forma de 1.38 y un parmetro de escala de 5.19 y
establecer la hiptesis:

( )
0
: 1.38, 5.19 minutos / rotura
:
A
H Weibull
H Otra distribucin
o | = =


y la probabilidad observada en cada intervalo
12 13 9 6 6 2 1 1
, , , , , , ,
50 50 50 50 50 50 50 50 50
i i
i
O O
PO
n

= = =
`
)



para despus calcular la probabilidad observada acumulada hasta el intervalo i


{ }
12 25 34 40 46 48 49 50
, , , , , , , 0.24, 0.50,......, 1
50 50 50 50 50 50 50 50 50
i i
i
O O
POA
n

= = = =
`
)





Posteriormente calculamos la probabilidad esperada acumulada de cada intervalo a partir de la
funcin de probabilidad acumulada de Weibull
0
2
4
6
8
10
12
14
0-2 2-4 4-6 6-8 8-10 10-12 12-14 14-
F
r
e
c
u
e
n
c
i
a

Minutos/roturas
Histograma
U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 14

( )
( )
( )
1
0
1.38
5.19
1
1
x
x
x
x
F x x e dx
F x e
F x e
o
| o o
o
|
o|
| |

|

\ .
| |

|
\ .
| |

|
\ .
=
=
=
}


Por ejemplo, para el intervalo con el lmite superior de 8:
( )
8
1.38
5.19
8
8 1 0.83747 PEA F e
| |

|
\ .
= = =

Por ltimo, calculamos el estadstico de prueba
{ }
0.24 0.2353 , 0.50 0.5025 ,...., 1 1 0.0375
i i
c mx POA PEA mx = = =
A partir de los clculos anteriores se obtiene la siguiente tabla:

Intervalo
i
O
i
PO
i
POA
i
PEA
i i
POA PEA
0-2 12 0.24 0.24 0.23526 0.0047
2-4 13 0.26 0.50 0.50247 0.0025
4-6 9 0.18 0.68 0.70523 0.0252
6-8 6 0.12 0.80 0.83747 0.0375
8-10 6 0.12 0.92 0.91559 0.0044
10-12 2 0.04 0.96 0.95839 0.0016
12-14 1 0.02 0.98 0.98042 0.0004
14- 1 0.02 1.00 1.00000 0.0000
Total 50 1.00 c 0.0375

El valor del estadstico de prueba, 0.0375 c = , comparado con el valor de tablas crtico,
0.05, 50
0.1923 D = ,
indica que no podemos rechazar la hiptesis nula de que la variable aleatoria se comporta de acuerdo con una
distribucin de Weibull con parmetro de escala 5.19 y parmetro de forma 1.38

Valores crticos de la prueba de Kolmogorov-Smirnov
grados de
libertad
u


0.1
D
o=


0.05
D
o=


0.01
D
o=

1 0.950 0.975 0.995
2 0.776 0.842 0.929
. . . .
45 0.182 0.203 0.243
35
Para valores
mayores a

1.22
n

1.36
0.1923
50
=
1.63
n

U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 15

0.16
0.14
0.12
0.10
0.08
0.06
0.04
0.02
0.00
D
e
n
s
i
d
a
d
0.05
0
Grfica de distribucin
Weibull, Forma=1.38, Escala=5.19, Valor umbral=0



Clculo de los Parmetros de la Distribucin de Weibull
El presente artculo presenta, paso a paso, el mtodo de los Mnimos Cuadrados para calcular los
parmetros de forma y escala de la distribucin de Weibull. Para el clculo del parmetro de localizacin se
emplea el complemento Solver de Excel.
Tambin se presentan dos ecuaciones para calcular el estimador Rango de mediana (ecuaciones 5 y
6), siendo esta ltima una forma aproximada y la que generalmente se usa en la literatura tcnica. Ya que la
ecuacin (5) es ms exacta, sta es la que se emplea; para ello, y debido a su complejidad, se presenta el
cdigo fuente en el lenguaje VBA (Visual Basic para Aplicaciones) para crear una funcin definida
por el usuario en Excel. Igualmente se usan las funciones PENDIENTE e INTERSECCIN.EJE, de Excel,
para calcular la pendiente y el intercepto de la lnea de regresin.
1. INTRODUCCIN
La distribucin de Weibull es una distribucin continua y triparamtrica, es decir, est completamente
definida por tres parmetros y es la ms empleada en el campo de la confiabilidad.
A pesar de la popularidad de esta distribucin, en la revisin bibliogrfica efectuada, la mayora de
los artculos y literatura tcnica consultados se remiten a una distribucin biparamtrica y, ms an, los
ejemplos all desarrollados presentan como datos conocidos los dos parmetros, generndose, as, las
siguientes preguntas: Cmo se calculan los parmetros? y por qu se omite el clculo del tercer parmetro?
El tercer parmetro es el parmetro de localizacin, es decir, el parmetro que localiza la abscisa a partir del
cual se inicia la distribucin.
0.1923
U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 16

El objetivo del presente artculo es responder a las dos preguntas anteriores, presentando una de las
cinco metodologas analticas existentes para el clculo de los parmetros y algunos criterios para
determinar si es necesario tener en cuenta el tercer parmetro.



El mtodo que se presenta es el mtodo de los Mnimos Cuadrados, por tres razones: la primera, es un
mtodo simple y expedito de aplicar; la segunda, la grfica de los datos sirven como una prueba de bondad
de ajuste de la distribucin y, la tercera, da un indicio sobre si se debe calcular o no el parmetro de
localizacin.
Para una metodologa grfica, la cual hace uso del papel especial llamado papel de probabilidad de
Weibull, vanse las referencias [5], [6]
2. EXPRESIN MATEMTICA DE LA DISTRIBUCIN
La funcin de densidad de la distribucin de Weibull para la variable aleatoria t est dada por la
siguiente expresin:
( )
( )
( )
1
exp , 1
t
t
f x t
o o
o
o


| |

| |
= > (
|
( \ .


Donde
t : Variable aleatoria que, para el caso de la confiabilidad, representa el tiempo entre fallas.
o : Parmetro de forma
( ) 0 o < <
| : Parmetro de escala
( ) 0 | < <
: Parmetro de localizacin < <
El parmetro alfa, como su nombre indica, determina la forma o perfil de la distribucin, la cual
es funcin del valor de ste.
El parmetro beta indica la escala de la distribucin, es decir, muestra que tan aguda o plana es la
funcin.
El parmetro gamma indica, en el tiempo, el momento a partir del cual se genera la distribucin.
Una distribucin biparamtrica est completamente definida por los parmetros de forma y de escala.
1. Mnimos cuadrados.
2. Grfico de la funcin tasa de falla.
3. Mxima similitud.
4. Estimacin de momentos.
5. Estimadores lineales.
U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 17

La funcin confiabilidad R (t) de Weibull se determina por la siguiente expresin:
( ) ( ) ( )
2
t
s
R t f s ds e
o

|
(
| |
(
|
(
\ .

= =
}
La funcin distribucin acumulativa F (t) es el complemento de la funcin confiabilidad y se define de
la siguiente manera:
( ) ( ) ( )
1 1 3
t
F t R t e
o

|
(
| |
(
|
(
\ .

= =


De la expresin anterior, se concluye que la funcin distribucin acumulativa se puede interpretar
como la probabilidad de falla. La relacin entre la funcin confiabilidad y la funcin probabilidad de falla se
muestra en la figura 1.




U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 18

Determinacin de los parmetros por el mtodo de los mnimos cuadrados
Para ilustrar el mtodo de los mnimos cuadrados, se desarrollar paso a paso un ejemplo.
El mtodo de los mnimos cuadrados permite calcular los parmetros de forma y escala, mediante la
transformacin doble logartmica de la funcin de distribucin acumulativa (ecuacin 3). El clculo del
parmetro de localizacin es ms complejo, emplendose para ello rutinas de clculo, como el programa
Solver de Excel.
La transformacin doble logartmica permite transformar la funcin de distribucin acumulativa en
una ecuacin lineal de regresin.
3.1 Deduccin de la ecuacin lineal de regresin
( ) ( ) ( )
1 1 4 Funcin acumulativa de Weibull
t
F t R t e
o

|
(
| |
(
|
(
\ .

= =

( )
( )
( )
( )
( )
1
1
1
1
1
ln ln Aplicando logaritmos naturales
1
1
ln Propiedad exponencial de los logaritmos
1
1
ln ln ln
1
t
t
t
F t
e
e
F t
e
F t
t
F t
t
F t
o
o
o

|
o

o
|
| |
|
\ .
| |
|
\ .
| |
|
\ .
=
=

(
=
(

(

(
| |
=
(
|

( \ .

( | |

= ( |
|

(
\ .
( )
( ) ( )
Aplicando logaritmos naturales.
1
ln ln ln ln *
1
t
F t
o o |
| |
|
\ .
( | |
= ( |
|

(
\ .

La expresin (*) representa una ecuacin lineal de la forma
( ) ** y x b o =
La cual es una recta de regresin, con:
( )
( ) ( )
1
ln ln ; ln ; ln ***
1
y x t b
F t
o |
( | |
= = =
( |
|

(
\ .

U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 19

De la expresin (**) se concluye que el parmetro de forma, o , es la pendiente de la recta de regresin.
De la expresin (***) se observa que el parmetro de escala, | , est en funcin del intercepto b de la recta
de regresin y del parmetro de forma o ; por lo tanto:
( ) ln ln 4 Definicin de algoritmo
b
b
b e
o
o | | |
o

= = =
3.2 Rango de mediana
Para poder trazar la recta de regresin, se debe calcular un estimador para la funcin de distribucin
acumulativa F(x). Este estimador, llamado Rango de mediana, es un estimador no paramtrico basado en el
orden de las fallas. Este aspecto implica que la muestra de datos se debe organizar de menor a mayor (en
forma ascendente).
La expresin matemtica para este estimador es:

Donde:
W (i): Rango de mediana para un nivel de confianza (1-), donde es el nivel de significancia y toma el
valor de 0.5 para este estimador.
i: Orden de la falla.
n: Nmero total de datos de la muestra.
F, v1, v2: Valor crtico de la distribucin F, evaluada en el nivel de significancia y con grados de libertad
v1 y v2.
Dada la complejidad de la ecuacin (5), generalmente el rango de mediana se aproxima mediante la
siguiente expresin, exacta dentro de 0.005 [1]:

Donde:
RM(xi): Rango de mediana.
i: Orden de falla.
n: Nmero total de datos de la muestra.
U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 20

Dado que la ecuacin (5) es ms exacta, en los clculos se empelar sta. Para facilitar su empleo, a
continuacin se presenta el cdigo fuente para crear una funcin definida por el usuario en Excel.
Para crear la funcin, sganse los siguientes pasos:
- Abra Excel.
- Hgase la combinacin de teclas Alt +F11. Esta accin abrir el editor de Visual Basic.
- En el men insertar de VB, seleccinese la opcin Mdulo.
- En el panel derecho, cpiese el siguiente cdigo fuente:
Public Function RangoMediana(alfa As Single, n As Long, i As Long) As Double
*****************************************************************************
*Esta funcin calcula el rango de mediana en funcin de la distribucin F. *
*alfa representa el nivel de significancia con el que se calcula la dist. F.*
*n es el nmero de puntos de la muestra. *
*i es el orden de falla. *
*****************************************************************************
Dim a As Double, f As Double
On Error GoTo ManejarError
a = i / (n - i + 1)
f = Application.WorksheetFunction.FInv(alfa, 2 * (n - i + 1), 2 * i)
RangoMediana = a / (f + a)
Salir:
Exit Function
ManejarError:
Select Case Err.Number
Case 1004
MsgBox Los argumentos (n) o (i) no pueden ser cero., vbCritical + vbOKOnly
Case Else
U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 21

MsgBox Se ha generado el error & Err.Number & _
Err.Description, vbCritical + vbOKOnly
End Select
Resume Salir
End Function
- Hgase clic en guardar del men Archivo del editor de VB para guardar la funcin.
- Hgase clic en Cerrar y volver a Excel del editor de VB. Esta accin cierra el editor de VB.
- Para usar la funcin creada, seleccinese Funcin del men Insertar de Excel. Se abre la ventana
Insertar funcin.
- En la ventana Insertar funcin, en la lista desplegable O seleccionar una categora, seleccinese la
categora Definidas por el usuario.
- En el cuadro de lista Seleccionar una funcin, hgase clic en RangoMediana.
- Hgase clic en el botn Aceptar.
- En la ventana Argumentos de funcin, digtese los valores de los argumentos. Tngase en cuenta que
el valor del argumento alfa siempre es 0.5.
3.3 Pasos
1.- A continuacin se presenta la secuencia que se debe seguir en la aplicacin del mtodo de los Mnimos
Cuadrados.1. Asuma o (parmetro de localizacin) igual cero y ordene los datos de menor a mayor. El
criterio de ordenacin debe ser el tiempo entre fallas. Vase la tabla 1.
U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 22


2. Calcule el rango de mediana para cada observacin usando la ecuacin (5) (6).
En nuestro caso se usar la ecuacin (5), empleando la funcin definida por el usuario RangoMediana. Vase
la figura 2.

Los argumentos de la funcin RangoMediana toman los siguientes valores:
Alfa=0.5; n=140 (total de puntos de la muestra); i= toma el valor indicado en la columna A. Los valores
calculados se muestran en la tabla 2.
U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 23


3. Calcule el logaritmo natural del tiempo entre fallas para cada observacin.
Vase la figura 3.

Obsrvese que en la funcin LN(nmero) de la columna D, el parmetro de localizacin, el cual se obtiene de
la celda L8, vale cero. Esto es importante, ya que la celda que contiene el parmetro de localizacin ser la
celda cambiante de Solver, en el caso que sea necesario calcular este parmetro. Los valores de la abscisa x
se muestran en la tabla 3.
U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 24


4. Calcule el valor de la ordenada y, es decir, el logaritmo del logaritmo del inverso de uno menos el rango de
mediana para cada uno de las observaciones de la muestra. Vase la figura 4.

Obsrvese la anidacin de la funcin logaritmo. El valor del rango de mediana se obtiene de los datos
calculados en la columna C. Los valores de la ordenada y se muestran en la tabla 4.

5. Genere un grfico con los datos de las columna D y E.
U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 25

Al trazar estos puntos, se genera la recta de regresin. Para ello seleccinese Grfico del men Insertar de
Excel; aparece la ventana Asistente para grficos. En sta, escjase la opcin XY (Dispersin) en la lista
Tipo de grfico y sganse las instrucciones en pantalla. Vase la figura 5


Para hallar la ecuacin de la recta de regresin, emplense las funciones: PENDIENTE (conocido_y;
conocido_x) donde: conocido_y son los valores dependientes (valores de la columna E) y conocido_x son los
valores independientes (valores de la columna D) para estimar la pendiente de la recta;
INTERSECCIN.EJE (conocido_y; conocido_x) para estimar el intercepto de la recta. Para determinar el
grado de correlacin lineal de los puntos, emplense las funciones: PEARSON (matriz1; matriz2) donde
matriz1 son los valores dependientes (columna E) y matriz2 son los valores independientes (columna D).
Esta funcin devuelve el coeficiente de correlacin r. COEFICIENTE.R2 (conocido_y; conocido_x)
devuelve el cuadrado del coeficiente de correlacin. Estos valores, en s, representan una especie de prueba
de bondad de ajuste de la recta de regresin. El coeficiente de correlacin est indicando que tan fuerte o
dbil es la relacin lineal entre los datos; si este valor es ms cercano a uno, hay una fuerte dependencia
lineal. Por otro lado, el coeficiente de determinacin, r2, est indicando el porcentaje de los puntos que estn
relacionados linealmente.
Aplicando las anteriores funciones de Excel, se obtiene la siguiente recta de regresin:
y=0.6995x-1.9514 (7)
De donde:

U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 26

El coeficiente de correlacin, r, indica que hay una excelente relacin (dependencia) lineal de los datos, ya
que su valor est muy prximo a uno. El coeficiente de determinacin, r2, indica que el 94.64% de los datos
estn relacionados linealmente. En conclusin, estos valores indican que la muestra se comporta conforme a
la funcin de densidad de Weibull.
6. Estime el valor del parmetro de forma y de escala.
Dado que el parmetro de forma es la pendiente de la recta de regresin, de la ecuacin (7) se obtiene:

De la ecuacin (4), numeral 3.1, se obtiene el valor del parmetro de escala:

3.4 Consideraciones sobre el parmetro de localizacin
Las siguientes consideraciones se deben tener en cuanta al momento de analizar un parmetro de localizacin
diferente de cero. Vanse las referencias bibliogrficas [1], [6]
a) Si al graficar los puntos de la muestra aparece una cola de puntos hacia arriba o hacia abajo, es un
indicativo de que el parmetro de localizacin debe ser calculado.
b) Una cola hacia abajo o una reduccin sbita de la pendiente son indicativos de que un parmetro de
localizacin positivo est presente. Vase la figura 5.
c) Una cola hacia arriba o un incremento sbito de la pendiente son indicativos de que un parmetro de
localizacin negativo est presente. Este punto est de acuerdo con el intervalo de validez de o. Vase el
numeral 2.
Un parmetro de localizacin negativo se presenta cuando hay unidades con fallas en servicio, o unidades en
servicio con defectos que causarn fallas. Ejemplos:
- Defectos originados durante el ensamble.
- Defectos originados durante el transporte.
- Defectos originados durante la instalacin o montaje.
- Defectos originados durante el almacenamiento.
d) Valores grandes del parmetro de forma (>10) son otro indicativo de que el parmetro de localizacin
debe ser calculado.
Teniendo en cuanta las consideraciones anteriores, y analizando la figura 5, se proceder a calcular el
parmetro de localizacin.
3.5 Clculo del parmetro de localizacin
U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 27

Para el clculo del parmetro se usar el complemento Solver de Excel, ya que debe ser determinado por
ensayo y error.
Para empezar, se debe definir la celda cambiante que, como se mencion en el paso 3 del numeral 3.3, debe
ser la celda donde se asign el valor cero. Esta celda debe estar involucrada en una funcin. Vase la figura
3.
El mejor estimador de es el valor de que proporcione el mejor ajuste de la lnea de regresin de los
datos mustrales. El coeficiente de determinacin, r2, proporciona esta medida [1], ya que ste mide la
cantidad de puntos que estn relacionados linealmente y, por lo tanto, la celda que contenga este valor ser la
celda objetivo a maximizar pues el objetivo es mejorar el ajuste de la recta de regresin. Para iniciar el
clculo se debe indicar al programa un punto de inicio, o punto semilla, en la celda cambiante. El mejor valor
de inicio de es un valor ligeramente inferior al valor ms bajo del tiempo entre fallas de la muestra. Para
el ejemplo, el punto semilla sera 0.166 (es ligeramente inferior al valor ms bajo del tiempo entre fallas de la
muestra, el cual corresponde al dato de orden uno 0.167. Vase la tabla 1). Este constituye la restriccin
en Solver. Vase la figura 6.

Es importante tener en cuenta que la celda objetivo debe contener una formula que relacione directa o
indirectamente el valor de la celda cambiante. Para el ejemplo la formula sera COEFICIENTE.R2 (E3:E142,
D3:D142). Obsrvese que el rango del segundo argumento involucra la celda cambiante L8. Vase la figura
3.
Al hacer clic en el botn Resolver de la ventana Parmetros de Solver, el programa genera la solucin 0.161,
siendo este el valor del parmetro de localizacin, y el coeficiente de correlacin se maximiza a 0.9886; es
decir, al tener en cuenta el parmetro de localizacin se mejora el ajuste de la recta de regresin. De igual
manera, los parmetros de forma y escala, y los valores de las abscisas (Xi) y ordenadas (Yi) se actualizan.
Vase la figura 7.
U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 28


Para que los valores se actualicen automticamente, stos deben estar relacionados por frmulas, tal y como
se muestra en la figura 8.

Ntese que el valor del parmetro de localizacin es positivo, corroborando lo dicho en la parte b) del
numeral 3.4. La figura 9 muestra el trazo de la nueva recta de regresin, siendo notable la agrupacin de los
puntos en forma de lnea. Comparece esta figura con la figura 5.
En la figura 10 se muestra el grfico de la funcin de densidad de Weibull para los parmetros calculados.
Reemplazndolos en la ecuacin (1) se obtiene la siguiente ecuacin:

U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 29




CONCLUSIONES
U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 30

1. El mtodo de los mnimos cuadrados facilita el clculo de los parmetros de la distribucin de Weibull
cuando se emplean programas informticos como Excel.
2. El anlisis del grfico de la recta de regresin sirve de criterio para determinar si es necesario calcular el
parmetro de localizacin.
3. El parmetro de localizacin tiene un gran efecto en la recta de regresin; sin embargo, se debe analizar
concienzudamente si un diferente de cero es necesario.
4. El coeficiente de correlacin, r, y el coeficiente de determinacin, r2, se constituyen en una prueba de
bondad de ajuste para la recta de regresin.
REFERENCIAS BIBLIOGRFICAS
1. Dodson, Bryan. The Weibull Analysis Handbook. 2da ed. Milwaukee, Wisconsin: ASQ Quality
Press, 2006.
2. Abernethy, Robert B. The New Weibull Handbook. 5ta ed. North Palm Beach, Florida. 2006
3. Walpole, Ronald E y Raymond Meyers. Probabilidad y estadstica para ingenieros. 3ra ed. Mxico:
Interamericana, 1990
4. Cspedes Zapata, Lucas y Santiago Meja Isaza. Implementacin de un Sistema de Indicadores para
la gestin de Mantenimiento de una empresa textilera. Medelln, 2005,194p. Trabajo de grado
Ingeniera Mecnica. Universidad EAFIT. Departamento de Ingeniera Mecnica. rea de
mantenimiento.
5. Tamborero del Pino, Jos Mara. NPT 331: Fiabilidad: La distribucin de Weibull [En lnea]
Disponible en:
http://www.insht.es/InshtWeb/Contenidos/Documentacion/FichasTecnicas/NTP/Ficheros/301a400/nt
p_331.pdf [Consulta: 22 de julio de 2010]
6. Estimation of the Weibull parameters [En lnea] Disponible en:
http://www.weibull.com/LifeDataWeb/lifedataweb.htm [Consulta. 26 de julio de 2010]
7. Yez, Medardo; Perdomo, Jos L y Gmez de la Vega, Hernando. Ingeniera de Confiabilidad: Pilar
fundamental del mantenimiento [En lnea] Disponible en: http://confiabilidad.net/articulos/ingenieria-
de-confiabilidad-pilar-fundamental-del-mantenimiento/#comment-list [Consulta: 28 de julio de 2010]
8. Duarte Holgun, Juan Carlos. Mantenimiento centrado en confiabilidad usando mtodos de
simulacin del ciclo de vida [En lnea] Disponible en:
http://www.noria.com/sp/rwla/conferencias/mem/Duarte-paper.pdf [Consulta: 28 de julio de 2010]
9. Garca Palencia, Oliverio. Optimizacin estadstica del mantenimiento industrial [En lnea]
Disponible en:
http://www.aciem.org/bancoconocimiento/O/Optimizacionestadisticadelmantenimientoindustr/Optimi
zacionestadisticadelmantenimientoindustr.asp [Consulta: 28 de julio de 2010]
10. Luna, Ana Eugenia. Teora de la confiabilidad [En lnea] Disponible en:
http://focuslab.lfp.uba.ar/public/CursoTErrores2k4/Monografias2005/Ana_E_Luna.pdf [Consulta: 22
de julio de 2010]






U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 31






















4.3.2 Aplicaciones del paquete computacional

Ajuste de datos con Stat::Fit
La herramienta Stat::Fit de ProModel se utiliza para analizar y determinar el tipo de distribucin de
probabilidad de un conjunto de datos. Esta utilera permite comparar los resultados entre varias distribuciones
analizadas mediante una calificacin. Entre sus procedimientos emplea la prueba Chi-cuadrada, de
Kolmogorov-Smirnov y de Anderson-Darling. Adems, calcula los parmetros apropiados para cada tipo de
distribucin, e incluye informacin estadstica adicional como media, moda, valor mnimo, valor mximo y
varianza, entre otros.

Resolviendo el ejemplo 4 con ProModel, nos da las siguientes estadsticas:

U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 32

A continuacin le pedimos en base a sus clculos, nos diga y nos muestre el tipo de distribucin que siguen los datos:













U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 33











EJERCICIOS PARA LA UNIDAD 4


Ejercicios:
1. Utilice la prueba Chi-cuadrada para determinar, con un nivel de confianza de 90%, qu tipo de
distribucin siguen los siguientes datos:

17.392 8.110 4.078 3.151 3.528 2.440 5.924 3.461 2.052 10.369
3.690 10.870 4.793 2.498 0.569 8.281 0.154 5.959 3.384 12.877
13.602 5.244 16.677 5.977 4.313 4.767 2.381 6.443 1.392 1.578
8.115 4.891 6.720 7.728 2.717 10.451 5.901 0.818 7.088 2.637
4.714 3.032 1.495 15.733 7.768 2.333 7.822 3.708 6.412 1.290
3.957 5.285 7.094 3.078 1.264 2.630 10.177 2.155 2.945 7.552
11.094 4.772 7.281 14.344 19.867 0.119 2.072 1.486 3.791 4.214
1.611 1.781 1.530 3.280 4.301 0.202 7.489 1.422 1.453 0.022
6.001 9.269 8.477 3.043 0.877 6.966 2.103 1.816 0.433 2.547
0.843 1.182 8.121 2.007 1.395 4.661 7.378 5.300 17.066 12.171

U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 34









2. A partir de la prueba Chi-cuadrada determine, con un nivel de confianza de 90%, Qu tipo de
distribucin siguen los datos?


18.799 14.889 20.977 25.106 24.793 26.933 11.266 19.063 24.380 15.653
17.239 13.238 12.612 16.089 16.906 11.528 17.728 18.384 20.539 18.538
18.692 18.519 25.371 19.659 19.255 17.947 27.889 23.463 29.503 17.380
26.646 13.550 22.156 23.609 27.676 19.662 17.905 22.701 18.475 23.030
14.223 16.611 13.914 18.548 19.870 20.112 18.709 28.778 13.030 17.054
9.690 25.791 14.881 17.386 23.031 21.867 23.498 22.383 14.513 15.537
22.776 21.291 16.241 19.036 20.526 22.231 20.555 16.356 27.539 21.949
20.289 23.319 23.448 17.454 16.307 24.445 15.195 13.764 22.845 22.554
28.823 25.775 25.216 20.452 20.008 21.815 19.898 15.781 12.901 23.313
21.777 22.472 20.854 15.892 24.953 18.755 16.640 16.715 18.284 18.187


3. Determine, con un nivel de confianza de 90%, qu tipo de distribucin siguen los datos; utilice la
prueba Chi-cuadrada

12.656 11.664 11.855 11.399 11.845 9.766 11.866 10.671 12.157 12.503
U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 35

13.317 11.381 11.252 12.146 11.769 11.792 13.577 12.038 11.854 13.830
11.369 13.271 11.985 11.936 13.610 12.363 12.437 11.765 12.683 11.931
11.264 10.902 12.204 11.019 13.940 11.873 10.412 11.665 12.957 11.617
11.346 10.634 12.316 11.836 12.571 11.363 11.654 12.286 11.669 12.212
9.526 11.931 12.247 14.116 10.475 10.441 9.695 13.178 14.374 11.610
10.999 12.548 12.659 11.148 12.809 12.660 11.793 10.452 13.013 12.763
11.650 11.309 12.863 12.347 12.556 14.086 12.273 10.893 12.480 10.771
12.566 11.843 12.299 12.357 12.131 11.728 10.653 14.121 13.598 13.049
10.522 10.883 12.533 12.074 11.991 12.161 10.118 11.743 11.062 11.002

4. Emplee la prueba Chi-cuadrada para determinar, con un nivel de confianza de 95%, qu tipo de
distribucin siguen los datos.


1.679 1.187 0.234 1.780 1.458 2.628 0.504 0.951 1.383 0.486
0.561 0.494 4.923 0.635 0.504 2.606 0.382 1.380 2.700 0.468
2.771 3.141 1.019 2.516 1.182 2.258 0.161 8.055 0.464 2.312
2.327 0.761 1.876 1.506 2.451 0.831 5.715 0.699 1.450 3.582
0.684 3.192 1.427 0.518 2.198 0.922 1.597 2.660 2.933 4.518
0.904 0.598 0.081 2.756 0.151 1.662 0.223 0.531 1.229 0.347
1.228 0.235 2.060 1.182 0.280 7.860 0.664 2.898 2.815 0.121
2.294 2.087 1.424 1.525 0.754 7.145 0.754 1.962 1.613 0.003
1.337 3.399 1.639 3.591 2.393 0.412 3.258 0.256 1.419 0.156
2.775 0.355 0.046 1.243 0.776 0.585 0.667 0.123 1.202 6.985

5. Determine, con un nivel de confianza de 95%, qu tipo de distribucin siguen los datos; emplee la prueba de
Kolmogorov-Smirnov
12.561 2.695 12.082 10.335 13.260 2.549 4.594 2.500 24.930 7.805
8.322 7.422 11.143 20.599 7.508 4.367 1.544 3.706 8.185 14.405
4.057 15.584 9.049 6.265 10.663 10.257 11.475 4.688 16.256 4.688
11.963 5.599 19.204 1.784 25.998 12.299 10.317 3.779 18.993 7.419
15.154 9.579 8.423 6.934 2.005 13.234 5.542 5.271 12.831 8.231
15.330 7.958 7.103 16.134 0.189 10.165 14.624 15.696 10.212 0.891
3.186 9.051 11.118 4.449 17.901 15.497 6.645 5.078 11.555 3.724
21.500 7.160 13.528 3.372 15.334 7.603 31.066 1.992 21.127 10.784
3.643 27.334 3.178 1.313 10.962 6.936 3.140 16.877 19.171 6.620
3.775 16.675 1.368 17.583 1.669 11.157 16.432 2.831 7.844 10.745

U4: PRUEBAS DE BONDAD DE AJUSTE Y PRUEBAS NO-PARAMETRICAS

Ing. Fernando Loera Rivera 36

6. Determine, con un nivel de confianza de 90%, que tipo de distribucin siguen los datos; emplee la prueba de
Kolmogorov-Smirnov. Compruebe con la herramienta Stat::Fit de ProModel
22.029 21.073 18.436 17.574 16.257 13.345 22.863 12.846 15.557 16.526
20.169 23.479 26.853 18.338 23.217 15.495 17.403 22.671 17.469 18.489
15.907 20.346 19.209 2.690 20.232 21.411 21.107 14.238 20.098 19.881
21.878 22.208 9.784 21.427 14.581 23.523 19.670 16.021 18.107 13.315
10.279 19.301 23.787 15..305 21.170 16.155 22.880 20.774 14.255 12.478
16.032 24.076 16.463 21.151 14.817 14.702 27.014 12.165 16.597 21.404
18.825 19.364 18.515 14.240 24.154 19.916 16.238 20.795 25.924 18.874
17.532 16.713 16.677 18.739 14.206 19.501 18.590 18.587 19.929 25.354
12.858 16.452 17.487 22.658 22.240 17.471 16.537 23.960 14.417 18.338
28.501 16.939 17.926 24.477 17.673 22.422 13.373 21.971 20.549 24.509



7. Determine, con un nivel de confianza de 90%, qu tipo de distribucin siguen los datos usando la prueba de
Kolmogorov-Smirnov. Compruebe con Stat::Fit
4.548 3.136 5.366 1.979 6.097 3.823 5.520 4.203 4.972 8.429
3.242 4.705 5.919 5.530 6.891 5.997 6.640 6.376 6.860 5.991
6.303 6.476 8.503 3.863 1.738 2.913 5.171 6.856 5.665 3.396
5.225 5.966 4.743 7.228 6.030 6.184 7.600 5.716 5.781 4.465
5.307 8.546 6.093 4.720 5.771 4.521 3.715 5.368 1.871 1.629
6.536 8.441 3.822 6.176 5.059 5.325 6.476 4.229 5.619 4.062
4.769 4.484 2.938 6.459 3.083 6.199 2.590 7.407 7.001 8.501
3.154 3.546 6.316 4.364 8.986 4.195 2.952 3.590 7.356 6.269
5.427 3.431 6.532 6.101 2.625 4.463 7.900 3.715 4.881 7.410
3.404 5.769 2.917 6.739 7.049 5.743 5.448 3.968 6.632 7.036

Anda mungkin juga menyukai