Anda di halaman 1dari 7

PRUEBAS DE BONDAD DE AJUSTE

1 DEFINICIN
Las pruebas de bondad de ajuste, consiste en comprobar grafica y
estadsticamente, si la frecuencia emprica de la serie analizada, se ajusta a
una determinada funcin de probabilidades terica seleccionada a priori, con
los parmetros estimados con base en los valores muestrales.
Las pruebas estadsticas tienen por objeto medir la certidumbre que se obtiene
al hacer una hiptesis estadstica sobre una poblacin, es decir, calificar el
hecho de suponer que una variable aleatoria, se distribuya segn una cierta
funcin de probabilidades.
Las pruebas de bondad de ajuste, ms utilizadas son:
Ajuste grafico
Chi cuadrado
Ajuste estadstico
Smirnov - Kolmogorov

5.2 AJUSTE GRAFICO


El ajuste grfico se puede realizar de las siguientes formas:
Comparar grficamente el histograma o funcin densidad emprica de la
serie de datos, con la funcin densidad terica y decidir visualmente, si
hay o no ajuste de acuerdo a la similitud o diferencia de ambos.
Comparar grficamente la funcin acumulada de la serie de datos, con
la funcin acumulada terica seleccionada, dibujada en papel
milimtrico (figura ) y decidir visualmente si hay o no ajuste.
Se puede tambin comparar grficamente la funcin acumulada de la
serie de datos, con la funcin acumulada terica, ploteada en un papel
probabilstico adecuado, donde la distribucin terica seleccionada, se
puede representar como una lnea recta (por lo general, solo se pueden
representar por una lnea recta las distribuciones de 2 parmetros. As
se tienen disponibles los papeles probabilsticos normal, log-normal,
gumbel, etc. El procedimiento consiste en plotear los valores de la
variable hidrolgica (caudal, precipitacin, temperatura, etc), versus la
probabilidad emprica en el papel de probabilidad correspondiente. Si los
puntos ploteados se agrupan alrededor de una lnea recta, que es la
representacin de a distribucin terica, se puede afirmar con cierta
certeza que estos datos se ajustan a la distribucin deseada.
PRUEBA CHI-CUADRADO
La prueba Chi-cuadrado se basa en el clculo de frecuencias, tanto de valores
observados, como valores esperados, para un nmero determinado de
intervalos. Esta prueba es comnmente usada, para verificar la bondad de
ajuste de la distribucin emprica a una distribucin terica conocida, fue
propuesta por Karl Pearson en 1900.
La expresin general de la prueba Chi- cuadrado est dada por:

X 2

i ei
2

c
ei

Donde:
k
i ei N
i 1

c2 = valor calculado de Chi-cuadrado a partir de los datos


i = nmero de valores observados en el intervalo de clase i
ei = nmero de valores esperados en el intervalo de clase i
k = nmero de intervalos de clase.
Asignando probabilidades a la ecuacin, es decir, asignando igual probabilidad
de ocurrencia a cada intervalo de clase, se tiene:
k

X 2

K N i NPI
2

c
i 1 NPI

Pi 1 / k o ei Pi N
Donde:
Ni = nmero de observaciones que caen dentro de los lmites de clases
ajustadas del intervalo i
N = tamao muestral
Pi = probabilidad igual para todos los intervalos de clases
Simplificando la ecuacin (5.2) se obtiene la frmula computacional
desarrollada por Markovic (1965)

k k 2
X Ni N
2
c
N i 1
El valor de c2 obtenido por la ecuacin se compara con el 12 la tabla , cuyo
valor se determina con:
Nivel de significacin : = 0.05 = 0.01
Grados de libertad: g.l. = k-1-h
Donde:
k=Nmero de Intervalos
h = es le nmero de parmetros a estimarse, as:
h = 2, para la distribucin normal
h =3, para la distribucin log-normal de 3 parmetros
CRITERIO DE DECISIN
El criterio de decisin se fundamenta en la comparacin del valor calculado de
Chi-cuadrado es menor o igual que el valor tabular, es decir:
X c2 X t2
entonces, se acepta la hiptesis que el ajuste es bueno al nivel de significacin
seleccionado
Si el Chi-cuadrado es mayor que el valor tabular, es decir:

X c2 X t2
entonces, el ajuste es malo y se rechaza la hiptesis, siendo necesario probar
con otra distribucin terica.

VENTAJAS Y LIMITACIONES
1. Es aplicable solo para ajustes a la distribucin normal, puesto que ha
sido desarrollado con base en los datos normales e independientes.
2. Se realiza en la funcin densidad de datos agrupados en intervalos de
clases.
3. Requiere un conocimiento a priori, de la funcin de distribucin terica
utilizada en el ajuste.
4. En la prctica se usa para cualquier modelo de ajuste, pero
estrictamente es valido para la normal.
5. Es de fcil aplicacin
Ejemplo

Dada la serie histrica de caudales medios anuales en m3/s, que


corresponde a un registro de 38 aos.
1121.3 26.7 110.1 63.4 122.4 64.2 59.6
114.9 92.8 95.6 76.3 162.1 110.2 40.3
142.4 58.8 48.8 52.3 97.2 144.7 112.2
205.8 57.4 178.3 36.3 52.5 109.2 137.1
114.5 79.0 67.5 88.0 165.6 78.5 32.9
72.5 76.9 70.0

Realizar la prueba de bondad de ajuste Chi- cuadrado para ver si se ajustan a


una distribucin normal,
SOLUCION
1. La hiptesis ser:
Ho : frecuencia observada = frecuencia esperada
Ha: frecuencia observada frecuencia esperada
2. Ordenando los datos de menor a mayor, se tiene:

26.7 32.9 36.3 40.3 48.5 48.8 52.3


52.5 57.4 58.8 59.6 63.4 64.2 67.5
70.0 72.5 76.3 76.9 79.0 88.0 92.8
95.6 97.2 109.2 110.1 110.2 112.2 114.5
121.3 122.4 137.1 142.4 144.7 144.9 148.3
162.1 165.5 205.8

3. Clculo de la frecuencia para datos agrupados


3.1. Calculo del nmero de intervalos de clase, segn Yevjevich
NC = 1 + 1.33 In (N)
NC = 1 + 1.33 IN (38)
NC = 5.84 6
3.2. Clculo de la amplitud de cada intervalo:
X max X min 205.8 26.5
X 35.82 36
Nc 1 5
X
18
2
3.3. Clculo de los intervalos de clase, marcas de clase, frecuencia
absoluta observada, frecuencia relativa, los resultados se muestran
Tabla Clculo de la frecuencia acumulada
Intervalos de clase Marcas de Frecuencia Frecuencia Frecuencia
clase absoluta () relativa acumulada
(1)
(2) (3) (4) (5)

8.7 44.7 26.7 4 0.1053 0.1053


44.7 80.7 62.7 15 0.3947 0.5000
80.7 116.7 98.7 9 0.2368 0.7368
116.7 152.7 134.7 7 0.1842 0.9211
152.7 188.7 170.7 2 0.0526 0.9737
188.7 224.7 206.7 1 0.0263 1.000

Donde:
Columna (3) nmero de valores comprendido en el intervalo de la columna
(1).
Columna (4) columna (3) entre N = 38
Columna (5) acumular valores de la columna (4)
3.4. Calculo de la media y desviacin estndar para datos agrupados,
utilizando las columnas (2) y (3)
k
xi f i
X i 1
90.17
N

xi X f i
k
2

S i 1
43.03
N 1
Donde:
Xi = marca de clase
i = frecuencia relativa

4. Calculo de la frecuencia esperada, utilizando la distribucin terica


normal, los resultados se muestran en la tabla 5.2
Donde:
x X
Z
Columna (3) : S formula variable estandarizada de la distribucin

normal para x= limites de clase de la columna (2)


Columna (4) : rea bajo la curva normal, puede usar la tabla.
Columna (5) : rea para cada intervalo de clase, se obtiene restando los
valores de la columna (4), si los signos de Z de la columna
(3) son igual y acumulando los valores de la columna(4), si
los signos de Z son diferentes.
Intervalo de clase Limit *** rea bajo la Frecuencia Frecuenci Frecuencia
e de formula curva relativa a observada
clase normal de 0 absoluta
az

8.7 -1.89 0.4706 - 4


8.7 44.7 44.7 -1.057 0.3554 0.1152 4.38 5 15
44.7 80.7 80.7 -0.220 0.0871 0.2687 10.21 10 9
80.7 116.7 116.7 0.617 0.2324 0.3195 12.14 12 7
116.7 152.7 152.7 1.453 0.4265 0.1931 7.34 7 2
152.7 188.7 188.7 2.290 0.4890 0.0625 2.38 3 1
188.7 224.7 224.7 3.126 0.4991 0.0101 0.38 1

Columna (6): columna (5) x N = 38, se redondea en forma adecuada de


tal manera que la suma de las frecuencias absolutas sea
igual a N = 38.
Columna (7): son los mismos valores de la columna (3) de la primera
tabla

5. Clculo de c2:
De

X c2
i ei 2
ei
sustituyendo valores de las columnas (6) y (7) de la tabla

X c2
4 5 2 15 10 2 9 12 2 7 7 2 1 3 2 1 1 3.78
5 10 12 7 3 1

6. Clculo del c2:


grado de libertad: = k 1 h
=612=3
nivel de significacin: = 0.05 = 5%
De la tabla Valores de X 2 , para = 3 y = 0.05 se tiene:

X 2 7.81

7. Criterio de decisin.
Como c2 = 3.78 < t2 = 7.81
Se acepta la hiptesis nula Ho
Los datos se ajustan a la distribucin normal, con un nivel de
significacin del 5% 95% de probabilidad.