Donde son variables aleatorias normales independientes de media cero y varianza uno.
El que la variable aleatoria tenga esta distribución se representa habitualmente
así: .
Índice
1Propiedades
o 1.1Función de densidad
o 1.2Función de distribución acumulada
2Relación con otras distribuciones
3Aplicaciones
4Véase también
5Enlaces externos
Propiedades[editar]
Función de densidad[editar]
Su función de densidad es:
[Expandir]Demostración
Aplicaciones[editar]
La distribución χ² tiene muchas aplicaciones en inferencia estadística. La más
conocida es la de la denominada prueba χ² utilizada como prueba de independencia y
como prueba de bondad de ajuste y en la estimación de varianzas. Pero también está
involucrada en el problema de estimar la media de una población normalmente
distribuida y en el problema de estimar la pendiente de una recta de regresión lineal, a
través de su papel en la distribución t de Student.
Aparece también en todos los problemas de análisis de varianza por su relación con
la distribución F de Snedecor, que es la distribución del cociente de dos variables
aleatorias independientes con distribución χ².
Prueba χ² de Pearson
Véase también: distribuciones de Pearson
Cuanto mayor sea el valor de , menos verosímil es que la hipótesis sea correcta.
De la misma forma, cuanto más se aproxima a cero el valor de chi-cuadrado, más
ajustadas están ambas distribuciones.
Los grados de libertad gl vienen dados por :
Criterio de decisión:
Así pues, una vez calculadas las frecuencias absolutas de cada valor o
intervalo de valores, obtendremos el número total de observaciones de la
muestra (T) sumando las frecuencias observadas
Para calcular las frecuencias esperadas repartiremos este número total
de observaciones (T) en partes proporcionales a la probabilidad de cada
suceso o grupo de sucesos. Para ello calcularemos dichas probabilidades
utilizando la función de probabilidad definida en la hipótesis nula f(x), de modo
que, cada valor Ei tendrá la siguiente expresión:
Estadístico de contraste
Una condición básica para que podamos llevar a cabo una prueba chi-
cuadrado es que las frecuencias de las distintas clases deben ser
suficientemente altas como para garantizar que pequeñas desviaciones
aleatorias en la muestra no tengan importancia decisiva sobre el valor del
estadístico de contraste.
Por tanto, todo lo que necesitamos serán unas estimas de las funciones
de probabilidad de ambas variables por separado (f(x) y f(y)) y de la función de
probabilidad conjunta (f(x,y))
Empezaremos la prueba tomando una muestra de parejas de valores
sobre la que contaremos la frecuencia absoluta con la que aparece cada
combinación de valores (xi,yj) o de grupos de valores (i,j) (Oij) La tabla
siguiente, en la que se recogen estos datos, es en realidad nuestra estimación
de la función de probabilidad conjunta multiplicada por el número total de datos
(T).
Estadístico de contraste
A este número tendremos que restarle I debido a que, para calcular las
frecuencias esperadas, necesitamos calcular las I sumas de filas en la
tabla anterior. Conocidas las sumas de filas obtenemos el número total
de observaciones sin perder ningún grado de libertad.
Como hemos visto, esta prueba no hace ninguna suposición acerca del
tipo de distribución de ninguna de las variables implicadas y utiliza únicamente
información de la muestra, es decir, información contingente. Esta es la razón
por la que, habitualmente, se le llama chi-cuadrado de contingencia.
Hipótesis nula:
Hipótesis alternativa:
lo cual no es otra cosa que el cociente entre la suma de la fila dos (F2) y el total
de observaciones (T)
observaciones
La prueba del chi cuadrado es solo un cálculo que se utiliza para ver qué tanto se parece la
distribución observada con los resultados teóricos, para determinar si un suceso es al azar o
tiene alguna tendencia. Por ejemplo, si lanzas una moneda, en teoría tienes 50% de
probabilidad de cara o cruz en cada uno. Si la lanzas y te sale un resultado más seguido que el
otro, entonces puedes determinar mediante el chi cuadrado que los resultados no son al azar.
Para interpretar este dato, el resultado que te salga lo tienes que comparar con un "nivel de
tolerancia" que quieras dar al error en una distribución. Entre más alta sea el valor de la chi
cuadrada, será mayor la probabilidad de que los datos tengan una tendencia. Normalmente se
utiliza la siguiente fórmula para aceptar o rechazar el valor del chi cuadrado.
x²<x²t(r-1)(k-1)
Donde
x²=chi cuadrada
t=Valor proporcionado por las tablas, según el nivel de significación elegido.
r=número de filas
k=número de columnas
Definición de X2
=k–1–m
en donde:
Ejemplos:
Cara 1 2 3 4 5 6
Frecuencia Observada 25 17 15 23 24 16
Solución:
Ensayo de Hipótesis:
Frecuencia esperada 20 20 20 20 20 20
Regla de decisión:
Cálculos:
Justificación y decisión:
Solución:
Ensayo de Hipótesis:
Ho; La teoría de Mendel es acertada.
lisos y amarillos
lisos y verdes
rugosos y amarillos
rugosos y verdes
Regla de decisión:
Cálculos:
Justificación y decisión:
Ensayo de Hipótesis:
Regla de decisión:
Número de niños 5 4 3 2 1 0
Número de niñas 0 1 2 3 4 5
Solución:
Ensayo de hipótesis:
H0; El nacimiento de niños y niñas es igualmente probable.
Regla de decisión:
Cálculos:
Justificación y decisión:
0 1 2
Bolas blancas 2 1 0
Número de extracciones 6 53 61
Solución:
Se tiene:
Bolas blancas 2 1 0
Número de extracciones 6 53 61
Frecuencias esperadas 10 60 50
Regla de decisión:
Cálculos:
Justificación y decisión: