LECTURA N 14
PRUEBA DE INDEPENDENCIA
Prueba de Independencia
Las pruebas de contraste de hiptesis tienen una
presuncin a favor de la hiptesis nula (), de forma
similar a como ocurre en los tribunales de justicia,
donde hay una presuncin de inocencia. Dado que
uno es inocente hasta que se demuestre lo contrario,
la evidencia aportada debe ser muy consistente para
admitir la culpabilidad
(Baxter y Babbie, 2004, p. 278).
9.1.
9.2.
las misma que presentan de forma ordenada y completa los totales obtenidos
en la tabulacin de los datos, referentes a las categoras o dimensiones de
dos variables relacionadas entre s (tablas de contingencia) las cuales son
de mucha utilidad.
Imaginemos que la Facultad de Ingeniera de la Universidad Csar Vallejo
desea obtener una proyeccin sobre el nmero de estudiantes que estn
aptos para llevar la experiencia curricular de Matemtica II.
Para cumplir con la informacin solicitada, debemos de tener en cuenta que la
Facultad de Ingeniera est compuesta por 5 escuelas: Ingeniera de
sistemas, ingeniera industrial, ingeniera civil, ingeniera ambiental e
ingeniera empresarial (cada una de ellas sern consideradas como
categoras). Adems debemos conocer la Condicin del estudiante en el
curso de Matemtica I (requisito para llevar Matemtica II); es decir si el
estudiante aprob, desaprob o se Inhabilit del curso, con lo que tendramos
3 categoras para esta variable.
Finalmente la informacin solicitada puede presentarse en la siguiente en una
tabla:
9.3.
Distribucin condicional
Cuando se elaboran tablas de contingencia suele pasar que una de las
variables (Y), es una respuesta y la otra variable (X) es una variable
explicativa o predictiva. En estos casos no es recomendable trabajar con la
distribucin conjunta, lo que debemos de hacer es estudiar el comportamiento
de una variable, manteniendo un valor fijo de la otra; de esta manera
encontraremos una distribucin de probabilidad expresado como una
probabilidad condicional.
Regresemos a nuestro ejemplo anterior e imaginemos que nos solicitan el
porcentaje de estudiantes que han aprobado Matemtica I en cada una de las
escuelas que conforman la Facultad de Ingeniera.
Para tal fin debemos elaborar la siguiente tabla y realizar las operaciones que
se indican.
Ntese que para determinar los valores de la tabla anterior, hemos tenido en
cuenta el total de cada columna. Sin embargo es posible obtener otros valores
porcentuales si consideramos los totales de cada fila, para ello la tabla a
emplear sera la que se muestra a continuacin:
Finalmente obtenemos:
Tabla N 2. Distribucin porcentual segn Escuela Profesional por Condicin
del Estudiante en el curso de Matemtica I.
Distribucin Ji-Cuadrado
La distribucin Ji-Cuadrado es una familia de distribuciones, al igual que en la
distribucin t tendremos una distribucin para cada grado de libertad. Las
aplicaciones ms usuales del estadstico Ji-Cuadrado son dos: las pruebas de
bondad de ajuste y
la
prueba
independencia
de
de
variables.
Figura 9.1
Distribucin
Cuadrado
9.5.
Ji-
H1 :
=
2
i=1
( O iE i )
Ei
en donde:
Oi :
Ei :
K :
es correcta
g .l=km1
En donde:
m :
Ejemplo 1:
Los estudiantes de la EAP de Psicologa deben de elegir la actividad
integradora que llevarn en el presente semestre, para ello pueden optar por
las siguientes opciones: Oratoria, teatro y deportes. En el pasado se observ
que el nmero de estudiantes que se matriculan en cada una de ellas es el
mismo. Para comprobar esta demanda uniforme se realiza una encuesta a
150 estudiantes, obtenindose los siguientes resultados:
Comprobar con un nivel de significacin del 10% si la demanda por estas tres
actividades integradoras es la misma.
Solucin:
Suponiendo que la demanda de las actividades integradoras es uniforme
nuestras hiptesis quedaran planteadas de la siguiente manera:
H0 :
H1 :
10
Calculamos el valor de
m=0 .
Luego obtenemos:
g .l=301=2
El valor crtico o terico es:
2 4,605
2 4,605 . Rechazar si
2 >4,605
Regin Crtica:
Figura 9.2
11
entre
las
frecuencias
observadas
esperadas
no
son
lo
12
Solucin:
Se desea comprobar si el consumo de alimentos de alto contenido de fibra
est relacionado al ndice de pacientes con diabetes, por lo tanto nuestras
hiptesis seran:
H0 :
H1 :
13
Observa que para calcular las frecuencias esperadas (Ei) como intervienen las
cantidades totales (filas y columnas) y el tamao de la muestra. Finalmente la
tabla quedara de la siguiente manera:
=
2
( OiE i )
Ei
=0,91
g .l=(f 1)(c1)
14
Donde:
f :
Nmero de filas
c:
Nmero de columnas
Luego obtenemos:
g .l=( 41)(31)=6
2 10,645
10,645 . Rechazar
>10,645
Regin Crtica:
Figura 9.3
Prueba Ji-Cuadrado
de independencia
15
16
17
El Grupo Educativo Colegios del Milenio desea comprobar que existe una
relacin de dependencia entre el Ingreso Total y el Tipo de Colegio.
Solucin:
1. Primero debemos redactar las hiptesis estadsticas:
H0 :
H1 :
18
Numrico
Anchura:
Decimales:
Valores:
Nacional
Privado no religioso
Privado religioso
Alineacin:
Centrada
Medida:
Ordinal
Escala:
Entrada
Tipo_de_colegio
Tipo:
Numrico
Anchura:
Decimales:
Valores:
Hasta 750
De 751 a 1200
De 1201 a 1500
De 1501 a 2000
Ms de 2000
Alineacin:
Centrada
Medida:
Ordinal
Escala:
Entrada
19
20
21
p . Rechazar si
p<
22
Observamos que