Anda di halaman 1dari 22

1

LECTURA N 14

PRUEBA DE INDEPENDENCIA

Prueba de Independencia
Las pruebas de contraste de hiptesis tienen una
presuncin a favor de la hiptesis nula (), de forma
similar a como ocurre en los tribunales de justicia,
donde hay una presuncin de inocencia. Dado que
uno es inocente hasta que se demuestre lo contrario,
la evidencia aportada debe ser muy consistente para
admitir la culpabilidad
(Baxter y Babbie, 2004, p. 278).

9.1.

Definicin de anlisis bivariados:


Existen investigaciones que buscan establecer la existencia o no de una
relacin entre dos variables de estudio, por ejemplo en el mbito educativo se
puede buscar establecer la relacin que existe entre el rendimiento acadmico
y el nivel de autoestima que presentan los estudiantes de una institucin
educativa, para tal fin se pueden realizar diferentes pruebas de significacin
estadstica que nos permiten establecer el tipo de asociacin de las variables
en estudio.
La relacin que se busca establecer es si las categoras de la variable
independiente influyen o no, en los valores que toma la variable dependiente.
En tal sentido las variables independientes son denominadas explicativas o
causales, ya que permiten conocer por qu vara la variable dependiente de
la forma que lo hace en una determinada poblacin (usualmente una
muestra).
El estudio estadstico de la relacin entre dos variables nos permite conocer:
la existencia o no de asociacin y si sta existe, nos permite conocer la
fuerza de dicha asociacin y la direccin de sta.

9.2.

Distribucin conjunta y marginal


En captulos anteriores se elaboraron tablas en las que podamos representar
los datos recogidos mediante un instrumento de medicin, estas tablas slo
nos permitan visualizar la informacin de las categoras de una variable
(tablas de frecuencia); sin embargo existen tablas de disposicin conjunta,

las misma que presentan de forma ordenada y completa los totales obtenidos
en la tabulacin de los datos, referentes a las categoras o dimensiones de
dos variables relacionadas entre s (tablas de contingencia) las cuales son
de mucha utilidad.
Imaginemos que la Facultad de Ingeniera de la Universidad Csar Vallejo
desea obtener una proyeccin sobre el nmero de estudiantes que estn
aptos para llevar la experiencia curricular de Matemtica II.
Para cumplir con la informacin solicitada, debemos de tener en cuenta que la
Facultad de Ingeniera est compuesta por 5 escuelas: Ingeniera de
sistemas, ingeniera industrial, ingeniera civil, ingeniera ambiental e
ingeniera empresarial (cada una de ellas sern consideradas como
categoras). Adems debemos conocer la Condicin del estudiante en el
curso de Matemtica I (requisito para llevar Matemtica II); es decir si el
estudiante aprob, desaprob o se Inhabilit del curso, con lo que tendramos
3 categoras para esta variable.
Finalmente la informacin solicitada puede presentarse en la siguiente en una
tabla:

La tabla de contingencia nos muestra las categoras de las variables


estudiadas distribuidas en columnas y filas, en los cruces de estas podemos
encontrar informacin correspondiente a ambas variables, a esta parte de la

tabla se le denomina Distribucin Conjunta. Por ejemplo, segn la


informacin de la tabla podemos afirmar que 210 estudiantes de la Escuela de
Ingeniera Civil han aprobado la experiencia curricular de Matemtica I.
Si sumamos las frecuencias absolutas presentes en la distribucin conjunta,
obtendremos el total para cada categora de las variables en estudio (total de
filas y columnas), a esta regin de la tabla se le denomina Distribucin
Marginal.

El tamao de la muestra corresponde a la suma de cada

distribucin marginal, tal y como lo podemos apreciar en la siguiente tabla.

9.3.

Distribucin condicional
Cuando se elaboran tablas de contingencia suele pasar que una de las
variables (Y), es una respuesta y la otra variable (X) es una variable
explicativa o predictiva. En estos casos no es recomendable trabajar con la
distribucin conjunta, lo que debemos de hacer es estudiar el comportamiento
de una variable, manteniendo un valor fijo de la otra; de esta manera
encontraremos una distribucin de probabilidad expresado como una
probabilidad condicional.
Regresemos a nuestro ejemplo anterior e imaginemos que nos solicitan el
porcentaje de estudiantes que han aprobado Matemtica I en cada una de las
escuelas que conforman la Facultad de Ingeniera.

Para tal fin debemos elaborar la siguiente tabla y realizar las operaciones que
se indican.

Como la informacin solicitada es el porcentaje de estudiantes desaprobados


en cada escuela, se ha procedido a dividir las frecuencias de la distribucin
conjunta entre el total de estudiantes de cada escuela. Finalmente la tabla
quedara de la siguiente forma:
Tabla N 1. Distribucin porcentual segn condicin del estudiante en el curso
de Matemtica I por Escuela Profesional.

De los valores obtenidos en la tabla podemos afirmar que en la Escuela de


Ingeniera de Sistemas el 10% de los estudiantes se inhabilitaron del curso de
Matemtica I, adems el 75% de estudiantes de la Escuela de Ingeniera
Industrial aprobaron el curso de Matemtica I, siendo este valor el ms alto de
todas las escuelas que pertenecen a la Facultad de Ingeniera.

Ntese que para determinar los valores de la tabla anterior, hemos tenido en
cuenta el total de cada columna. Sin embargo es posible obtener otros valores
porcentuales si consideramos los totales de cada fila, para ello la tabla a
emplear sera la que se muestra a continuacin:

De forma anloga la tabla de distribucin porcentual se calculara teniendo en


cuenta la siguientes operaciones:

Finalmente obtenemos:
Tabla N 2. Distribucin porcentual segn Escuela Profesional por Condicin
del Estudiante en el curso de Matemtica I.

La forma de interpretar los valores de la tabla es distinta al de la tabla N 1.


De los valores obtenidos en la presente tabla podemos afirmar, entre otros
valores, que un 22,6% de los estudiantes que aprobaron el curso de
Matemtica I pertenecen a la escuela de Ingeniera Civil o que un 12,5 de los
estudiantes que se inhabilitaron en el curso de Matemtica I estn
matriculados en la Escuela de Ingeniera Empresarial.
9.4.

Distribucin Ji-Cuadrado
La distribucin Ji-Cuadrado es una familia de distribuciones, al igual que en la
distribucin t tendremos una distribucin para cada grado de libertad. Las
aplicaciones ms usuales del estadstico Ji-Cuadrado son dos: las pruebas de
bondad de ajuste y
la

prueba

independencia

de
de

variables.
Figura 9.1
Distribucin
Cuadrado

9.5.

Prueba de hiptesis Ji-Cuadrado


Pruebas de bondad para un ajuste uniforme

Ji-

Las pruebas de bondad de ajuste se emplean cuando se desea probar alguna


hiptesis que est referida a la distribucin de la poblacin. Usualmente se
plantea que la distribucin es uniformemente, es decir que los valores que
estn presentes en el espacio muestral de un evento tienen la misma
probabilidad de ocurrir.
H0 :

La distribucin poblacional es uniforme.

H1 :

La distribucin poblacional no es uniforme.

Para entender la idea de tener una poblacin que se distribuye de manera


uniforme planteamos el siguiente caso: Cesatel es un distribuidor autorizado
de Claro y durante el mes de Junio se registr que 240 clientes adquirieron un
Iphone 5, en sus versiones 5S y 5C. Si asumimos que la distribucin de la
poblacin se da de manera uniforme, se espera que 120 clientes hayan
adquirido un Iphone 5S y los restantes (120) hayan preferido el Iphone 5C. En
general se puede afirmar que cuando una poblacin es uniforme cuando el
total de la poblacin se distribuye de forma equitativa entre las categoras o
dimensiones que presenta el objeto de estudio.
Para poder aceptar la hiptesis de que la poblacin es uniforme debemos de
contrastar esta suposicin con los datos reales obtenidos en una muestra,
para realizar este contraste debemos de emplear la prueba Ji-Cuadrado de
bondad de ajuste uniforme, la misma que est definida de la siguiente
manera:
k

=
2

i=1

( O iE i )

Ei

en donde:
Oi :

es la frecuencia de los eventos observados en los datos muestrales

Ei :

es la frecuencia esperada de los eventos esperados si la hiptesis


nula

K :

es correcta

es el nmero de categoras o clases

Los grados de libertad se calculan empleando la siguiente expresin:

g .l=km1
En donde:
m :

es el nmero de parmetros que se desea estimar.

Ejemplo 1:
Los estudiantes de la EAP de Psicologa deben de elegir la actividad
integradora que llevarn en el presente semestre, para ello pueden optar por
las siguientes opciones: Oratoria, teatro y deportes. En el pasado se observ
que el nmero de estudiantes que se matriculan en cada una de ellas es el
mismo. Para comprobar esta demanda uniforme se realiza una encuesta a
150 estudiantes, obtenindose los siguientes resultados:

Comprobar con un nivel de significacin del 10% si la demanda por estas tres
actividades integradoras es la misma.
Solucin:
Suponiendo que la demanda de las actividades integradoras es uniforme
nuestras hiptesis quedaran planteadas de la siguiente manera:
H0 :

La demanda es uniforme para las tres actividades integradoras.

H1 :

La demanda no es uniforme para las tres actividades integradoras.

Por lo tanto podemos estructurar la siguiente tabla, teniendo en cuenta los


datos del problema.

10

Calculamos el valor de

El valor obtenido debemos de compararlo con un valor crtico tomado de la


tabla C, para ello debemos de calcular los grados de libertad teniendo en
cuenta la expresin,

g .l=km1 . Para este caso no tenemos

parmetros que tienen que estimarse, por lo tanto:

m=0 .

Luego obtenemos:

g .l=301=2
El valor crtico o terico es:

2 4,605

Regla de decisin: No rechazar si

2 4,605 . Rechazar si

2 >4,605
Regin Crtica:
Figura 9.2

11

Prueba Ji-Cuadrado para las actividades integradoras

Observamos en la grfica que el valor calculado es menor que el valor terico


(1,12 < 4,605) por lo tanto la hiptesis nula no se rechaza. Las diferencias que
existen

entre

las

frecuencias

observadas

esperadas

no

son

lo

suficientemente grandes como para refutar la hiptesis nula.


Pruebas de independencia
A diferencia de la prueba de bondad de ajuste en donde solo existe un factor
que es motivo de estudio, la prueba de independencia Ji-Cuadrado, permite la
comparacin de dos factores o atributos logrando establecer una relacin
entre ellos.
Ejemplo 2:
En el Hospital Dos de Mayo se est realizando un estudio en donde se desea
conocer la posible relacin entre la ingestin de fibra y un descenso en el
riesgo de padecer diabetes en sujetos adultos. Con esta finalidad se han
registrado los casos incidentes de diabetes en sujetos adultos que durante un
periodo de 2 aos han seguido o no una dieta a base de productos ricos en
fibra.
Se desea llegar a una conclusin al nivel del 5% teniendo en cuenta la
siguiente informacin:

12

Solucin:
Se desea comprobar si el consumo de alimentos de alto contenido de fibra
est relacionado al ndice de pacientes con diabetes, por lo tanto nuestras
hiptesis seran:
H0 :

El consumo de fibra y el padecimiento de diabetes son independientes.

H1 :

El consumo de fibra y el padecimiento de diabetes son dependientes.

Esta vez no podemos suponer que la poblacin se distribuye de manera


uniforme para determinar las frecuencias esperadas (Ei) como en el caso
anterior, pero podemos realizar el clculo teniendo en cuenta las siguientes
operaciones:

13

Observa que para calcular las frecuencias esperadas (Ei) como intervienen las
cantidades totales (filas y columnas) y el tamao de la muestra. Finalmente la
tabla quedara de la siguiente manera:

Ahora procederemos a calcular el estadstico Ji-Cuadrado empleando la


siguiente expresin:
I

=
2

( OiE i )

Ei

Reemplazando los valores de las frecuencias observadas y esperadas de


forma correspondiente, obtenemos:

=0,91

El valor obtenido debemos de compararlo con un valor crtico tomado de la


tabla C, para ello debemos de calcular los grados de libertad teniendo en
cuenta la expresin:

g .l=(f 1)(c1)

14

Donde:
f :

Nmero de filas

c:

Nmero de columnas

Luego obtenemos:

g .l=( 41)(31)=6

El valor crtico o terico es:

2 10,645

Regla de decisin: No rechazar la hiptesis nula si


si

10,645 . Rechazar

>10,645

Regin Crtica:
Figura 9.3
Prueba Ji-Cuadrado
de independencia

Teniendo en cuenta los resultados obtenidos no se rechaza la hiptesis nula,


por lo tanto el consumo de fibra y el padecimiento de diabetes son
independientes.
Tabla C: Distribucin Ji-Cuadrado

15

16

El SPSS es un es un programa con funciones estadsticas, fue creado


inicialmente para realizar investigaciones en el campo de las ciencias sociales,
esto lo podemos afirmar por su acrnimo Statistical Package for the Social
Sciences, sin embargo actualmente es empleado en las investigaciones
bsicas y aplicadas; as como en los estudios de mercado en donde es de
suma utilidad porque permite trabajar con gran cantidad de informacin y
tomar decisiones en base a los datos analizados.
El empleo del programa nos facilita el procedimiento de elaboracin de tablas
de contingencia, as como el anlisis de inferencia que nos permite establecer
la validez de las hiptesis a travs de pruebas estadsticas entre ellas JiCuadrado, la cual nos permite establecer si existe relacin entre las variables
en estudio, sin embargo no brinda informacin sobre el tipo de relacin y la
fuerza, que si podemos conocer empleando otros estadsticos presentes en el
programa; tampoco determina que variable es dependiente de la otra.
A manera de ejemplo planteamos el siguiente caso: El Grupo Educativo
Colegios del Milenio pretende abrir una nueva sede en el distrito de Los
Olivos, para ello realiza un estudio con la finalidad de conocer el ingreso total
de cada familia y el tipo de colegio que prefieren para matricular a sus hijos,
entre otros datos que pueden recogerse en la investigacin.
Despus de realizar una encuesta que fue aplicada a 100 familias del Distrito
de Los Olivos, se obtuvieron los siguientes datos:

17

El Grupo Educativo Colegios del Milenio desea comprobar que existe una
relacin de dependencia entre el Ingreso Total y el Tipo de Colegio.
Solucin:
1. Primero debemos redactar las hiptesis estadsticas:
H0 :

Las variables Ingreso Total y Tipo de Colegio son independientes.

H1 :

Las variables Ingreso Total y Tipo de Colegio son dependientes.

18

2. Ingresar los datos al programa SPSS teniendo en cuenta lo siguiente:


Variable: Ingreso Total
Nombre: Ingreso_total
Tipo:

Numrico

Anchura:

Decimales:

Valores:

Nacional

Privado no religioso

Privado religioso

Alineacin:

Centrada

Medida:

Ordinal

Escala:

Entrada

Variable: Tipo de Colegio


Nombre:

Tipo_de_colegio

Tipo:

Numrico

Anchura:

Decimales:

Valores:

Hasta 750

De 751 a 1200

De 1201 a 1500

De 1501 a 2000

Ms de 2000

Alineacin:

Centrada

Medida:

Ordinal

Escala:

Entrada

19

3. Despus de ingresar los datos realizamos el siguiente proceso: Men


Analizar / Estadsticos descriptivos / tablas de contingencia

4. Se asigna las variables a la fila y columna, tal y como se muestra en las


imgenes.

20

5. Elegir la opcin Estadsticos... y activar la casilla Ji-Cuadrado, luego haz


click en Continuar y finalmente Aceptar.

6. El programa debe de generar el siguiente reporte:

21

Regla de decisin: No rechazar la hiptesis nula si

p . Rechazar si

p<

El programa calcula el valor de Ji-Cuadrado al nivel de 5% de significacin, es


decir

=0,05 . Teniendo en cuenta el reporte generado por el programa:

22

Observamos que

p=0,00< =0,05 , por lo tanto se rechaza la hiptesis

nula. Es decir segn nuestros resultados existe evidencia suficiente para


afirmar las variables Ingreso Total y Tipo de Colegio son dependientes.

Anda mungkin juga menyukai