Anda di halaman 1dari 11

Hacer un ajuste en Excel con el método de chi cuadrado y kolmogov

Método de chi cuadrado

Estadístico de prueba 'χ²'


Se le conoce como Estadístico de Prueba al valor que resulta luego de
aplicar una determinada fórmula a la información de la muestra tomada y
que se utiliza para rechazar o aceptar la Hipótesis Nula (Ho) a través del
Valor de la Distribución.
A continuación se muestra una fórmula detallada:

Donde:

= Cantidad de un valor con otro valor

= Resultado luego de multiplicarlo con su proporción correspondiente

= Suma total de todas las operaciones


Este método consiste en un procedimiento estadístico que permite aceptar
o rechazar una afirmación hecha con respecto a una cantidad cualitativa de
datos determinada.

Existen varios tipos de pruebas de chi-cuadrada:

Pruebas de chi-cuadrada de asociación e independencia


Los cálculos para estas pruebas son iguales, pero la pregunta que se está tratando de
contestar puede ser diferente.

 Prueba de asociación: Utilice una prueba de asociación para determinar


si una variable está asociada a otra variable. Por ejemplo, determine si
las ventas de diferentes colores de automóviles dependen de la ciudad
donde se venden.
 Prueba de independencia: Utilice una prueba de independencia para
determinar si el valor observado de una variable depende del valor
observado de otra variable. Por ejemplo, determine si el hecho de que
una persona vote por un candidato no depende del sexo del elector.

Prueba de bondad de ajuste de chi-cuadrada

Utilice este análisis para probar qué tan bien una muestra de datos categóricos se
ajusta a una distribución teórica.

Por ejemplo, usted puede comprobar si un dado es justo, lanzando el dado muchas
veces y utilizando una prueba de bondad de ajuste de chi-cuadrada para determinar si
los resultados siguen una distribución uniforme. En este caso, el estadístico de chi-
cuadrada cuantifica qué tanto varía la distribución observada de los conteos con
respecto a la distribución hipotética.
Chi cuadrado para estadística

El estadístico de chi-cuadrada es una medida de la divergencia entre la distribución


de los datos y una distribución esperada o hipotética seleccionada. Por ejemplo, se
utiliza para:
 Probar la independencia o determinar la asociación entre variables
categóricas. Por ejemplo, si usted tiene una tabla de dos factores de
resultados electorales basada en el sexo de los votantes, los estadísticos de
chi-cuadrada pueden ayudar a determinar si un voto es independiente del
sexo del votante o si existe alguna asociación entre voto y sexo. Si el valor p
asociado con el estadístico de chi-cuadrada es menor que el nivel de
significancia (α) seleccionado, la prueba rechaza la hipótesis nula de que las
dos variables son independientes.

 Determinar si un modelo estadístico se ajusta adecuadamente a los datos. Si


el valor p asociado al estadístico de chi-cuadrada es menor que el nivel de
significancia (α) seleccionado, la prueba rechaza la hipótesis nula de que el
modelo se ajusta a los datos.

Para obtener el valor de chi-cuadrado se tiene la siguiente formula

2
(𝑓0 − 𝑓𝑒 )2
𝑋𝑐𝑎𝑙𝑐 =∑
𝑓𝑒

𝑓0 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜

𝑓𝑒 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜


Ejemplo aplicado a la hidrologia mendiante calculos estadisticos

Ajustar la distribución normal a la precipitación máxima anual en 24 horas de la


estación ubicada en la universidad de sucre, en la siguiente tabla se aprecian las
precipitaciones aproximadas a estudiar. Se pide. Utilizar el test de chi-cuadrado
para determinar si la distribución normal se ajusta adecuadamente a los datos.

mes 1995 1996 1997


febrero 146 105
marzo 65 157 76
Abril 57 83 91
Mayo 64 85 131
Junio 87 78 100
Julio 143 70 104
Agosto 45 82 98
Septiembre 81 96 117
Octubre 145 150 117
noviembre 131 90 103

Se determina la precipitación total: 2897

Numero de datos= 29

Precipitación promedio (𝒙
̅) =

se calcula la desvia estandar con la formula:

1
𝑆 = √( ∑(𝑥𝑖 − 𝑥̅ )2 )
𝑛−1

(𝑥𝑖 − 𝑥̅ )2 =Cada precipitación (𝑥𝑖 )menos la precipitación promedio (𝑥̅ ). Al


cuadrado, por tanto se elabora la siguiente tabla para cada precipitación.
mes 1995 1996 1997
febrero 2125,53 26,05
marzo 1217,77 3260,80 571,05
Abril 1840,11 285,49 79,15
Mayo 1288,56 221,91 967,42
Junio 166,32 479,46 0,01
Julio 1857,91 893,80 16,84
Agosto 3013,63 320,29 3,60

Septiembre 357,08 15,18 292,53

Octubre 2034,32 2510,36 292,53

noviembre 967,42 97,94 9,63

∑(𝑥𝑖 − 𝑥̅ )2 = 25212,69

1
𝑆 = √( ∑(𝑥𝑖 − 𝑥̅ )2 )
𝑛−1

1
𝑆 = √( (25212,69))
29 − 1

𝑆 = 30.01

Primero se divide el intervalo de precipitación (R) en 7 intervalos. El primero es R ≤


40 y el último intervalo es R > 140 y los intervalos intermedios son cada 20, a cada
intervalo asigno un número de datos (ni) en base a la los datos del ejercicio:
Rango (mm) < 40 40 − 60 60 − 80 80 − 100 100 − 120 120 − 140 > 140

𝒏𝒊 0 2 5 9 6 7 0

Así también se determina la frecuencia relativa para cada intervalo, en base a la


siguiente expresión:

Rango (mm) < 40 40 − 60 60 − 80 80 − 100 100 − 120 120 − 140 > 160

𝒏𝒊 0,000 0,069 0,172 0,310 0,207 0,241 0,000

Partiendo de estos datos se determina la frecuencia acumulada:

Rango (mm) < 40 40 − 60 60 − 80 80 − 100 100 − 120 120 − 140 > 160

0,000 0,069 0,241 0,552 0,759 0,828 1,000

Cálculo de la variable normal estándar z corresponde al límite superior en cada uno


de los intervalos establecidos, mediante la siguiente expresión:
Rango (mm) < 40 40 − 60 60 − 80 80 − 100 100 − 120 120 − 140 > 160

𝒙𝒔𝒖𝒑 40 60 80 100 120 140 160

𝑍𝑖 -1,996 -1,330 -0,663 0,003 0,670 1,336 2,003

Considerando los valores obtenidos en Zi, se determina la Probabilidad acumulada


de la distribución normal estándar F(xi), en la tabla que se indica a continuación,
para los Zi negativos, el valor de F(xi) corresponde a una diferencia entre la unidad
(1) y el valor obtenido en la tabla, para Zi positivos, F(xi) corresponde a la lectura
realizada en dicha tabla.
A continuación se resumen el cálculo de la Probabilidad acumulada de la
distribución normal estándar F(xi)

Rango (mm) < 40 40 − 60 60 − 80 80 − 100 100 − 120 120 − 140 > 160

𝑍𝑖 -1,996 -1,330 -0,663 0,003 0,670 1,336 2,003

Lect. tabla 0.977 0.908 0.745 0.5 0.7486 0.908 0.977

𝐹(𝑥𝑖) 0.023 0.092 0.337 0.5 0.7486 0.908 0.977


La función de probabilidad incremental p(xi) se calcula mediante una diferencia
entre F(xi) del intervalo anterior y F(xi) del intervalo que se evalúa, de tal forma que:

Rango (mm) < 40 40 − 60 60 − 80 80 − 100 100 − 120 120 − 140 > 160

𝐹(𝑥𝑖) 0.023 0.092 0.337 0.5 0.7486 0.908 0.977

𝑝(𝑥𝑖) 0,023 0,069 0,245 0,163 0,2486 0,1594 0,069

Finalmente, se determina, el valor del CHI CUADRADO:

intervalo rango (mm) ni fs Fs Zi F(xi) p(xi) X^2 c


1 <40 0 0,000 0 -1,996 0,023 0,023 0,667

2 40-60 2 0,069 0,069 -1,33 0.092 0.069 0,000

3 60-80 5 0,172 0,241 -0,663 0,337 0,245 0,631

4 80-100 9 0,310 0,552 0,003 0,5 0,163 3,845

5 100-120 6 0,207 0,759 0,67 0,7486 0,2486 0,202

6 120-140 7 0,241 1 1,336 0,908 0,1594 1,211

7 >160 0 0,000 1 2,003 0,977 0,069 2,001

sumatoria 29 1,00 0,908 8,557


Se hallan los grados de libertad:

𝐺𝐿 = 𝑛𝑖 − 𝑛𝑝 − 1

Dónde:

𝑛𝑝 = 2

𝑛𝑖 = 7

𝐺𝐿 = 7 − 2 − 1 = 4

El ejercicio tiene 4 grados de libertad

El valor de 𝑋 2
𝑣,1−𝑎 es una probabilidad acumulada de 1 − 𝑎 = 1 − 0,069 = 0,931

De tal forma que:


2 2
𝑋 𝑣,1−𝑎 =𝑋 4;0,931

Finalmente de acuerdo ala siguiente tabla tenemos que:

De
la
Se interpola para saber el valor de 𝑋 2
4,0,931

tabla anterior, se obtiene que 𝑋 2


4,0,931 =𝑋 2
4;0,931 es mayor que 𝑥 2 = 8,557

Anda mungkin juga menyukai