Contenido
Presentacin...................................................................................................................................i
Agradecimientos...........................................................................................................................ii
ndice de Tablas...........................................................................................................................iii
Conceptos Bsicos........................................................................................................................1
Medicin.................................................................................................................................2
Niveles de Medicin...............................................................................................................2
Estadstica Descriptiva............................................................................................................4
Curvas de Distribucin de Frecuencias.............................................................................5
Distribucin Normal o Curva Normal (Campana de Gauss)............................................5
Calificaciones z o estandarizadas......................................................................................6
Estadstica Inferencial.............................................................................................................8
Estadstica Inferencial Univariada....................................................................................8
Tipos de problema.......................................................................................................8
Estadstica Multivariada....................................................................................................9
Estadstica Paramtrica...................................................................................................10
Estadstica No Paramtrica.............................................................................................10
Planteamiento de hiptesis estadstica............................................................................10
Hiptesis de Problemas de Comparacin..................................................................10
Hiptesis de Problemas de Asociacin.....................................................................11
Construccin de hiptesis de acuerdo al nivel de medicin.....................................12
Cul es el sentido del nivel de significancia o la probabilidad?...................................13
Decisin estadstica.........................................................................................................13
Grados de libertad...........................................................................................................15
Reglas de decisin...........................................................................................................15
Estadstica Inferencial Univariada: Pruebas Estadsticas Seleccionadas....................................17
Cmo Presentar Resultados Anlisis Estadsticos................................................................17
Criterios importantes para seleccionar el tipo de prueba en un estudio................................18
Pruebas de Comparacin.......................................................................................................19
Prueba t de Student.........................................................................................................19
Prueba t de Student para grupos independientes.......................................................19
La prueba t para muestras independientes en el paquete estadstico SPSS...............21
Reporte de resultados de la prueba t...................................................................22
Prueba t de Student para muestras relacionadas.......................................................23
La prueba t de Student para muestras relacionadas en
el paquete estadstico SPSS................................................................................25
Reporte de resultados de la prueba t para muestras relacionadas.......................25
Prueba U de Mann-Whitney............................................................................................27
La prueba U de Mann-Whitney en el paquete estadstico SPSS..............................29
Reporte de resultados de la prueba U de Mann Whitney..........................................30
Presentacin
El presente trabajo va dirigido a psiclogos en formacin y para todos
aquellos interesados en la investigacin en psicologa y reas afines,
donde la estadstica es una de las principales herramientas.
Fue escrito para servir de apoyo al profesor en cursos introductorios
estadstica inferencial, sin embargo, est diseado como una gua
autoaprendizaje y material de consulta, ya que se explica la forma
seleccionar la prueba estadstica de acuerdo con los problemas
investigacin que se plantean en las reas psicolgica y social.
de
de
de
de
Agradecimientos
ndice de Tablas
* Se presentan slo ejemplos de cmo localizar los valores crticos para cada prueba, para revisar las tablas completas se
puede acudir a:
Downie, M. y Heath, R. (1973). Mtodos estadsticos aplicados. Mxico: Harper & Row Latinoamericana.
Siegel, S. (1990, 3ra ed. ). Estadstica no paramtrica. Editorial Trillas. Mxico.
iii
Conceptos Bsicos
La estadstica es un conjunto de procedimientos para reunir, clasificar, codificar, procesar, analizar y
resumir informacin numrica adquirida sistemticamente (Ritchey, 2002). Permite hacer inferencias
a partir de una muestra para extrapolarlas a una poblacin.
Aunque normalmente se asocia a muchos clculos y operaciones aritmticas, y aunque las
matemticas estn involucradas, en su mayor parte sus fundamentos y uso apropiado pueden
dominarse sin hacer referencia a habilidades matemticas avanzadas. De hecho se trata de una forma
de ver la realidad basada en el anlisis cuidadoso de los hechos (Ritchey, 2002). Es necesaria sin
embargo la sistematizacin para reducir el efecto que las emociones y las experiencias individuales
puedan tener al interpretar esa realidad.
De esta manera la estadstica se relaciona con el mtodo cientfico complementndolo como
herramienta de anlisis y, aunque la investigacin cientfica no requiere necesariamente de la
estadstica, sta valida muchos de los resultados cuantitativos derivados de la investigacin.
La obtencin del conocimiento debe hacerse de manera sistemtica por lo que deben planearse todos
los pasos que llevan desde el planteamiento de un problema, pasando por la elaboracin de hiptesis
y la manera en que van a ser probadas; la seleccin de sujetos (muestreo), los escenarios, los
instrumentos que se utilizarn para obtener los datos, definir el procedimiento que se seguir para
esto ltimo, los controles que se deben hacer para asegurar que las intervenciones son las causas ms
probables de los cambios esperados (diseo); hasta la eleccin del plan de anlisis idneo para el tipo
de datos que se estn obteniendo, es aqu donde la estadstica entra en el estudio, aunque pueden
existir otras herramientas de anlisis si se est haciendo una investigacin de corte cualitativo.
Una buena planeacin permitir que los resultados puedan ser reproducidos, mediante la
comprobacin emprica, por cualquier investigador interesado en refutar o comprobar las
conclusiones que se hagan del estudio. De esta manera tambin se lograr la prediccin de los
fenmenos que se estn estudiando, ayudando a conocer y prevenir los problemas sociales e
individuales que forman parte del objeto de estudio de la psicologa.
El tratamiento de los datos de la investigacin cientfica tiene varias etapas:
En la etapa de recoleccin de datos del mtodo cientfico, se define a la poblacin de inters y se
selecciona una muestra o conjunto de personas representativas de la misma, se realizan experimentos
o se emplean instrumentos ya existentes o de nueva creacin, para medir los atributos de inters
necesarios para responder a las preguntas de investigacin. Durante lo que es llamado trabajo de
campo se obtienen los datos en crudo, es decir las respuestas directas de los sujetos uno por uno, se
codifican (se les asignan valores a las respuestas), se capturan y se verifican para ser utilizados en las
siguientes etapas.
En la etapa de recuento, se organizan y ordenan los datos obtenidos de la muestra. Esta ser descrita
en la siguiente etapa utilizando la estadstica descriptiva, todas las investigaciones utilizan estadstica
descriptiva, para conocer de manera organizada y resumida las caractersticas de la muestra.
En la etapa de anlisis se utilizan las pruebas estadsticas (estadstica inferencial) y en la
interpretacin se acepta o rechaza la hiptesis nula.
En investigacin, el fenmeno en estudio puede ser cualitativo que implicara comprenderlo y
explicarlo, o cuantitativo para compararlo y hacer inferencias. Se puede decir que si se hace anlisis
se usan mtodos cuantitativos y si se hace descripcin se usan mtodos cualitativos.
Medicin
Para poder emplear el mtodo estadstico en un estudio es necesario medir las variables.
Medir: es asignar valores a las propiedades de los objetos bajo ciertas reglas, esas reglas son los
niveles de medicin
Cuantificar: es asignar valores a algo tomando un patrn de referencia. Por ejemplo, cuantificar es ver
cuntos hombres y cuntas mujeres hay.
Variable: es una caracterstica o propiedad que asume diferentes valores dentro de una poblacin de
inters y cuya variacin es susceptible de medirse.
Las variables pueden clasificarse de acuerdo al tipo de valores que puede tomar como:
Discretas o categricas.- en las que los valores se relacionan a nombres, etiquetas o
categoras, no existe un significado numrico directo
Continuas.- los valores tienen un correlato numrico directo, son continuos y
susceptibles de fraccionarse y de poder utilizarse en operaciones aritmticas
De acuerdo a la cantidad de valores
Dicotmica.- slo tienen dos valores posibles, la caracterstica est ausente o presente
Policotmica.- pueden tomar tres valores o ms, pueden tomarse matices diferentes, en
grados, jerarquas o magnitudes continuas.
En cuanto a una clasificacin estadstica
Aleatoria.- Aquella en la cul desconocemos el valor porque flucta de acuerdo a un
evento debido al azar
Determinstica.- Aquella variable de la que se conoce el valor
Independiente.- aquellas variables que son manipuladas por el investigador. Define los
grupos
Dependiente.- son mediciones que ocurren durante el experimento o tratamiento
(resultado de la independiente), es la que se mide y compara entre los grupos
Niveles de Medicin
Nominal
Las propiedades de la medicin nominal son:
1) Exhaustiva: implica a todas las opciones
2) A los sujetos se les asignan categoras, por lo que son mutuamente excluyentes. Es decir, la
variable est presente o no; tiene o no una caracterstica
2
Ordinal
Las propiedades de la medicin ordinal son:
1) El nivel ordinal posee transitividad, por lo que se tiene la capacidad de identificar que esto
es mejor o mayor que aquello, en ese sentido se pueden establecer jerarquas
2) Las distancias entre un valor y otro no son iguales
Intervalar
1) El nivel de medicin intervalar requiere distancias iguales entre cada valor. Por lo general
utiliza datos cuantitativos. Por ejemplo: temperatura, atributos psicolgicos (CI, nivel de
autoestima, pruebas de conocimientos, etc.)
2) Las unidades de calificacin son equivalentes en todos los puntos de la escala. Una escala de
intervalos implica: clasificacin, magnitud y unidades de tamaos iguales (Brown, 2000).
3) Se pueden hacer operaciones aritmticas
4) Cuando se le pide al sujeto que califique una situacin del 0 al 10 puede tomarse como un
nivel de medicin intervalar, siempre y cuando se incluya el 0
Razn
1) La escala empieza a partir del 0 absoluto, por lo tanto incluye slo los nmeros por su valor
en s, por lo que no pueden existir los nmeros con signo negativo. Por ejemplo: Peso
corporal en kg., edad en aos, estatura en cm.
2) Convencionalmente los datos que son de nivel absoluto o de razn son manejados como los
datos intervalares.
Nivel
Nominal
Ordinal
Intervalar
Razn o
proporcin
Propiedades
Medidas de
tendencia central y
dispersin
Compara
moda, porcentaje
Proporciones
, =, >, <
moda, porcentajes,
mediana
moda, porcentajes,
mediana, media,
Distancias
desviacin estndar
iguales, =, ,
varianza, curtsis,
>, <, 0 relativo
sesgo, rango, decles,
cuartiles, percentiles
Igual a
intervalar, 0
igual a intervalar
absoluto
Medianas
Anlisis
Inferencial no paramtrica:
X, McNemar, Coeficiente
Phi
Inferencial no paramtrica:
U de Mann Whitney.
Kolmogorov Smirnoff,
Friedman, Wilcoxon, prueba
de los signos, correlacin
Spearman
Ejemplo
Presencia de estrs
(si o no), Religin
Calidad (Buena,
mediana, mala),
Nivel
socioeconmico
(alto, medio, bajo)
Medias
Inferencial paramtrica: t de
Student, ANOVA, regresin,
correlacin Pearson
Temperatura,
atributos
psicolgicos
Igual a
intervalar
Igual a intervalar
Las variables intervalares y de razn se pueden incluir en operaciones aritmticas y para efectos de
anlisis estadsticos se consideran con las mismas propiedades y se clasifican en un rubro general
llamado nivel escalar.
Las variables ordinales, por otro lado, aparentemente no se pueden sumar, pero cuando se tiene una
escala con reactivos calificados en un nivel ordinal, al ser sumados el resultado de esta suma puede
ser considerado como intervalar, ya que matemticamente se comporta como tal.
Al hacer anlisis estadsticos en necesario determinar las unidades de medicin y las unidades de
anlisis:
La unidad de medicin es el atributo que se va a medir o variable dependiente.
La unidad de anlisis son los sujetos, es decir a quin mido o a qu mido, est definida por la
variable independiente. Para muestras independientes, es decir cuando la unidad de medicin es
registrada una sola vez en la unidad de anlisis, se refiere a los grupos a comparar (ej. Hombres vs.
Mujeres, Grupo control vs. Grupo experimental, Fumadores vs. No fumadores, etc.), en el caso de
muestras relacionadas, en que la unidad de medicin es medida ms de una ocasin en la unidad de
anlisis, son las diferentes mediciones hechas (ej. Evaluaciones Pre-test vs. Post-test vs. seguimiento,
hermanos gemelos, grupos apareados durante la seleccin de sujetos).
La forma ms directa de tener muestras relacionadas o apareadas es hacer mediciones antes - despus
con los mismos sujetos, sin embargo, el aprendizaje puede ser una variable que pueda afectar la
ejecucin de una persona, en esos casos se usan grupos equivalentes, a uno se le hace la primera
medicin y al otro se le aplica el tratamiento y la segunda medicin, en este caso siguen manteniendo
las caractersticas de muestras relacionadas.
La idea de apareamiento o muestras relacionadas es que un sujeto tenga un equivalente en el otro
grupo, las caractersticas que se igualan depende de las variables que se desean controlar en una
investigacin, por ejemplo: mismo sexo, misma edad, mismo grado escolar, mismo barrio,
condiciones similares de una enfermedad, etc., es imposible tener sujetos iguales pero entre ms
caractersticas, de inters para el estudio, compartan sern considerados equivalentes.
Otra forma de tener muestras relacionadas de manera natural es trabajar con gemelos idnticos (igual
ambiente familiar, misma carga gentica, mismo ambiente cultural, etc.), aunque si por
requerimientos de una investigacin no comparten una caracterstica, importante para el estudio,
dejaran de considerarse como relacionados (por ejemplo, si se desea probar un tratamiento para
disminuir la hiperactividad y se tiene a gemelos que fueron adoptados por diferentes familias y se
sabe que los estilos educativos de los padres influyen sobre la hiperactividad, el hecho de provenir de
familias adoptivas diferentes cancela la equivalencia).
La metodologa estadstica puede considerarse segn sus dos planteamientos como descriptiva y
deductiva o inferencial.
Estadstica Descriptiva
Permite la organizacin de datos desestructurados de tal manera que sean ms fciles de interpretar y
de conocer las caractersticas de una muestra de forma rpida y resumida.
Incluye:
Tablas de frecuencias y porcentajes con las que se registran cuantos sujetos en la muestra
respondieron a las diferentes opciones o categoras de las variables del estudio
Mtodos de resumen o numricos que se dividen en:
Medidas de tendencia central:
Media ( X ). Promedio aritmtico de una distribucin o conjunto de valores
Mediana (Md). Valor que divide a la distribucin por la mitad
Moda (Mo). Categora o puntuacin que ocurre con mayor frecuencia
Medidas de dispersin:
Rango. Es la diferencia entre la puntuacin mayor y la menor en una distribucin y se
obtiene restndole a la puntuacin mayor, la menor
Desviacin estndar (s). Es el promedio de desviaciones de las puntuaciones con
respecto a la media. Se emplea para variables medidas por intervalos o de razn. Es un
indicador de la dispersin de las puntuaciones respecto de la media
2
Varianza (s ). Es la desviacin estndar elevada al cuadrado. La varianza se divide en:
sistemtica, es decir las variaciones debidas a los efectos de la variable independiente
o tratamiento, y de error
o no explicada o residual, que es debida al azar y a los
2
problemas de control (s = s2 s2 )
S
Grficos que son una representacin visual de los datos (medias, porcentajes, distribuciones
de frecuencias, etc.) se pueden hacer grficas de barras, de sectores o pastel, de lneas, etc.
Tablas de frecuencias y porcentajes
Descriptiva
Grficas
Medidas de tendencia central
Medidas de dispersin
Estadstica
Univariada
(una VI y una VD)
Inferencial
Multivariada
pocos genios por el otro, esto es lo que da a la curva normal su caracterstica forma de campana
(Ritchey, 2002).
Media,
Mediana
Moda
Calificaciones z o estandarizadas
La desviacin estndar proporciona una unidad de medida comn (estndar) que permite comparar
variables con medidas observadas diferentes (Ritchey, 2002). Supngase que se tienen dos escalas
para medir autoestima, la primera se califica con un puntaje entre 0 y 20, y la segunda tiene
calificaciones entre 0 y 50, si se compararan las calificaciones obtenidas por una y otra, los puntajes
crudos muy probablemente seran mayores en la segunda escala. Sin embargo, si se considera la
media de cada escala y las desviaciones estndar, es posible conocer en trminos de desviaciones
estndar que puntuacin se encuentra por arriba de la media o por debajo de la misma, al comparar a
dos personas.
Por ejemplo, el grupo calificado con la primera escala tiene una media de 15 y una desviacin
estndar de 4, para el segundo la media es de 35 con una desviacin estndar igual a 6. Supngase
que una persona tiene una calificacin de 19 en el primer caso y otra con 29 en el segundo caso. La
primera se encuentra por arriba de la media una desviacin estndar y la segunda una desviacin
debajo de la media, es decir, la primera persona tiene un nivel de autoestima mayor que el de la
segunda persona.
Las calificaciones brutas se transforman con frecuencia a otro tipo de puntuaciones, para facilitar el
anlisis y la interpretacin. Estas calificaciones son derivadas o transformadas. Un tipo de
calificacin derivada, la calificacin estndar z resulta particularmente til.
Calificacin o Puntuacin z: Es una puntuacin estandarizada. Su sentido es poder hacer
comparaciones dentro o entre sujetos, cuando han sido medidos con diferentes escalas.
La distribucin de puntuaciones z tiene una media de cero y una desviacin estndar de 1.
La X de la z es 0
La s de la z es 1
Ventajas:
Miden una escala de intervalos, en trminos de unidades de desviacin estndar.
Permite comparar calificaciones de varias pruebas en forma directa, incluso cuando se tienen
medias y desviaciones estndar diferentes
Al analizar la curva normal en trminos de puntuaciones z, y recordando que el rea bajo la curva
representa el 100% de los casos, una desviacin estndar tomada a cada lado de la media incluye un
rea de 68.26% de la total. Toda el rea incluida por 2 unidades de desviacin estndar a ambos lados
de la media comprenden el 95.44% de los casos, si se contina a la tercer desviacin estndar a cada
lado de la media, se toma otra parte igual a 2.15% del rea total. La suma de todas las reas abarcadas
por estas 6 unidades de desviacin estndar es igual a 99.74% del total. El 95% del rea bajo la curva,
est entre 1.96 y 1.96 desviaciones estndar, el 99% entre -2.58 y 2.58 y el 99.9% entre 3.90 y
3.90, estos tres grupos de desviaciones son particularmente importantes en la estadstica inferencial
como se ver ms adelante.
Para interpretar el rea bajo la curva.
El rea bajo la curva representa el 100%. La mitad representa el 50% de cada lado
El rea bajo la curva es igual a 1 (convertida en trminos de proporcin)
Para conocer el rea bajo la curva se necesitan las puntuaciones z
34.13%
-3
-2
-1
+1
+2
+3
68.26%
95%
99%
Utilizando esta informacin se puede calcular el rea comprendida entre dos puntos con base en las
puntuaciones crudas. Por ejemplo: Una poblacin de 1000 sujetos, tiene una media de edad de 75
aos y una desviacin estndar de 8, cuantas personas tienen entre 67 y 75 aos?
34.13%
341
51
59
67
75
83
91
99
Sustituyendo la media (75) en el centro y las desviaciones estndar a la izquierda o negativas (-8) y a
la derecha o positivas (+8), la respuesta es el 34.13% del total de la poblacin es decir 341 sujetos
tienen entre 67 y 75 aos.
Estadstica Inferencial
Su propsito principal es estimar los atributos de la poblacin a partir de una muestra de casos. Se
pueden probar relaciones entre variables, comparar grupos con respecto a cierta caracterstica y hacer
inferencias.
Al clasificar a la estadstica inferencial de acuerdo al nmero de variables dependientes se
tiene:
Estadstica Inferencial Univariada
Segn la definicin clsica, requiere de:
2 tipos de variables: Puede haber una o varias variables independientes, y solo una variable
dependiente.
Segn la definicin prctica hay una variable dependiente y una independiente. Para la eleccin de
las pruebas se tomar el aspecto prctico.
En la estadstica inferencial univariada existen dos tipos de problema:
COMPARACIN
Muestras relacionadas:
Muestras independientes:
Cuando la variable
Cuando la variable dependiente
dependiente es medida ms
de inters es medida slo una
de una ocasin en la unidad
vez en la unidad de anlisis
de anlisis
ASOCIACION
Aqu se puede o no tener una
variable dependiente, pero eso no
es relevante pues slo se busca
saber la relacin existente entre
dos variables
a) Asociacin.- En este tipo de problemas slo hay dos eventos que se relacionan o asocian
(correlacin)
b) Comparacin.- Tambin llamada prueba de hiptesis. Se comparan grupos o mediciones e
intervienen dos tipos de variables
Variable dependiente (V. D.), es el fenmeno o proceso que se va a medir, sus variaciones
dependen de la variable independiente
Variable independiente (V. I.), es la variable que identifica los tratamientos empleados para
influir sobre la variable dependiente, esta variable define los grupos que van a ser comparados
Cmo saber si el problema es de asociacin o comparacin?
1) Se tienen grupos?
Si la respuesta es: NO, entonces es poco probable que sea de comparacin, pero no imposible.
Si la respuesta es: SI, se est comparando.
2) Hay Tratamientos (Tx)? (Se usa un instrumento, se hace un experimento o
intervencin?) Si la respuesta es SI: se est comparando
Si la respuesta es NO: casi seguro es de asociacin
Estadstica Inferencial
No paramtrica
Paramtrica
La estadstica paramtrica necesita cumplir con cuatro requisitos para poderse aplicar:
1. La variable dependiente debe distribuirse normalmente (campana de Gauss) o muy similar
2. Homocedasticidad u homogeneidad de varianzas o varianzas iguales: que cuando se comparan
grupos estos tengan la misma dispersin con respecto a la media de la variable dependiente
3. Asignacin y Seleccin aleatoria de los grupos (muestreo completamente al azar)
4. Que la variable dependiente est medida a nivel intervalar o de razn
Estos requisitos deben ser cubiertos para poder generalizar con base en los estimadores y hacer
conclusiones de una muestra a la poblacin.
Por otro lado, la Estadstica No Paramtrica:
1. Est libre de curva, no necesita distribuirse como la curva normal
2. Se basa en frecuencias, porcentajes, modas y rangos
3. Su nivel de medicin es ordinal o nominal
Planteamiento de la hiptesis estadstica
La Hiptesis es la respuesta tentativa para la solucin de la pregunta de investigacin.
Al realizar inferencias estadsticas, se acostumbra adoptar un modelo de decisin. Este modelo consta
de cuatro elementos:
Hiptesis nula (H0)
Hiptesis alterna (H1)
Nivel de significancia que ha de utilizarse en la prueba estadstica
Regla de decisin
Hiptesis para Problemas de Comparacin
En la prueba de hiptesis se trabaja con dos hiptesis estadsticas que deben enunciarse
explcitamente: la hiptesis que debe probarse o hiptesis nula que se establece con el propsito de
ser rechazada, y la hiptesis alterna que es la conclusin a la que se espera llegar.
Con un nivel intervalar o de razn de la V. D. se comparan medias, la hiptesis nula plantea que las
dos medias son iguales:
H0: X 1 = X
H0: X 1 X 2 = 0
Para el caso de los problemas de asociacin se identifica la relacin entre las variables, y el
concepto de asociacin o relacin se debe incluir en las hiptesis.
Qu relacin hay entre la edad en aos de los sujetos y su inteligencia?
H0: No hay asociacin lineal entre la edad y la inteligencia.
H1: Hay asociacin lineal entre la edad y la inteligencia.
NOTA: La hiptesis alterna no se acepta ni se rechaza, es la hiptesis nula la que se somete a prueba.
Los planteamientos anteriores se refieren a pruebas de dos colas, que son problemas en los que no es
posible anticipar la direccin de las diferencias, es decir, no se sabe cual grupo es el que tendr el
nivel o la proporcin de casos mayor, o cual es el sentido de la relacin entre variables.
Sin embargo, pueden existir hiptesis alternas en las que se puede anticipar cual grupo presenta una
desviacin mayor o menor con respecto al otro. Este tipo se refiere a problemas de una cola o
direccin.
En estos casos, con un nivel intervalar o de razn de la V. D., la hiptesis nula plantea que las dos
medias son iguales:
H0: X 1 = X
y la hiptesis alterna plantea que un grupo tiene una media mayor o menor que otro u otros:
H1: X 1 > X
H1: X 1 < X
Zona de Aceptacin al
95% para una prueba de
dos colas
2.5 %
2.5 %
Para una prueba de una cola, a 1.64 desviaciones estndar en sentido negativo o positivo, se tiene el
95% del rea bajo la curva en la regin de aceptacin de la hiptesis nula y el 5% o 0.05 de
significancia () en la zona de rechazo, en 2.32 desviaciones el 99% ( = 0.01) y en 3.70
desviaciones el 99.9% (= 0.001)
5%
5%
Para calcular el valor de una prueba estadstica se tiene que entre mayor sea su valor se entra ms a la
zona de rechazo de la hiptesis nula, sin embargo, para la mayora de las pruebas se debe considerar
adems en la decisin a los grados de libertad, el nmero de casos o se compara la probabilidad
directamente.
Grados de libertad
Son la libertad de variaciones que puede tener una variable, suponiendo que se tuvieran 4
puntuaciones cuya media es igual a 10 al tener los valores de las tres primeras, la ltima estar
determinada por las primeras, por ejemplo: 7, 12, 15, la ltima puntuacin necesariamente es 6. La
cantidad de comparaciones independientes se determina a partir de los grados de libertad, que
normalmente se calcula teniendo el tamao de la muestra menos uno (gl = n 1). Sin embargo los
grados de libertad se obtienen de manera diferente para cada prueba, por lo que se debe estar atento a
cada uno de los procedimientos.
Reglas de decisin
El valor de las pruebas estadsticas se debe comparar con uno obtenido, con relacin al nivel de
significancia y los grados de libertad, de una tabla de valores crticos. La regla de decisin en estos
casos es: el valor de la prueba debe ser mayor o igual al de la tabla para rechazar la hiptesis
nula. Esta regla puede cambiar, por lo que es necesario revisar la regla de decisin especifica de cada
procedimiento.
Los paquetes estadsticos presentan los valores de cada prueba junto con algunos datos necesarios
para el clculo de sta (medias o porcentajes, el nmero de casos, los grados de libertad, etc.) y el
nivel de significancia o probabilidad, ste representa la posicin del valor del estadstico en el rea de
rechazo, o aceptacin, de la hiptesis nula.
Como regla de decisin, observando los resultados del paquete estadstico, a un nivel de
significancia establecido en 0.05: Si la probabilidad o nivel de significancia es menor o igual a
1.5 se rechaza la hiptesis nula.
Barras o Columnas:
comparar grupos
(porcentajes,
medianas, medias)
Para la distribucin de variables
en una muestra usamos una
grfica XY o de dispersin, este
tipo de grficas se usa para
representar correlaciones
Es
ta
gu
a
fu
e
el
ab
or
ad
a
co
n
ba
se
en
da
to
s
pr
op
or
ci
on
ad
os
po
r
el
M
tro
.
Jo
rg
e
A
m
et
h
Vi
lla
tor
o
Ve
l
zq
ue
z,
In
U de
Mann
Whit ney
Nominal
Cul es el nivel de
medicin de la
variable dependiente?
Friedman
2
XVarianza
t de
St udent
X
KruskallWallis
t de St udent
para muest
ras
relacionadas
McNemar
(dicotmica)
Variable 2
Escalar
Variable 1
Ordinal
Variable
Variable 2
2
Ordinal
Escalar
Nominal
Ordinal
Wilcoxon
Anlisis de
Spearman
(rs)
Spearman
(rs)
Ms de
dos
mediciones
Cul es el nivel de
medicin de la
variable dependiente?
Escalar
Nominal
Ordinal
Cul es el nivel de
medicin de la variable
dependiente?
Escalar
Nominal
Ordinal
Cul es el nivel de
medicin de la
variable dependiente?
Dos
mediciones
Ordinal
Ms de dos
grupos
Dos grupos
Variable 1
Escalar
Escalar
18
Anlisis de
varianza para
medidas
repet idas
Q de
Cochran
(dicotmica)
Correlacin
Biserial
Correlacin
P
unt ual
Biserial
bp)ual
P (r
unt
(rbp)
Variable 1
Dicotmica
Variable 2
Dicotmica
Dicotmica
Variable 2
Escalar u
ordinal
Pearson
(rp)
Spearman
(rs)
Spearman
(rs )
Coeficient
e Phi
Coeficient e
Phi
Cr
ite
rio
s
im
po
rt
an
tes
pa
ra
sel
ec
cio
na
r
el
tip
o
de
pr
ue
ba
en
Fr
an
ci
sc
o
Ju
r
ez
,
Jo
rg
e
A.
Vi
lla
to
ro
y
El
sa
K
Pruebas de Comparacin
Prueba t de Student
La prueba t de Student es una prueba paramtrica de comparacin de dos muestras, es decir necesita
cumplir las siguientes caractersticas:
1
sDx
n 2 n
n
n
1
2
1
2
Para calcular la suma de cuadrados de X:
X 2
2
2
x
n
Para calcular los grados de libertad:
gl = n1 + n2 2
Problema para explicar el procedimiento para calcular la prueba t para muestras independientes:
Se desea probar dos mtodos de enseanza del idioma ingls (mtodo tradicional y mtodo
multimedia), para lo cual al final de cada uno de los cursos se aplic una prueba de conocimientos.
Los puntajes obtenidos por los sujetos asistentes a cada uno de los cursos se muestran a continuacin,
donde X1 son las calificaciones del primer grupo (mtodo tradicional) y X2 las del segundo (mtodo
multimedia):
19
X1
26
24
18
17
18
20
18
X1 = 141
n1 = 7
x1 =
20.14
= 164
X 22
1444
676
576
576
900
484
X 21
676
576
324
289
324
400
324
X12 = 2913
X2
38
26
24
24
30
22
= 4656
n2 = 6
x2 = 27.33
Procedimiento:
1. Para cada problema especfico se debe determinar el tipo de problema, los grupos a comparar, si
son independientes o relacionados, el nivel de medicin, la prueba estadstica que debe utilizarse
y plantear la hiptesis nula que se va a probar de acuerdo al nivel de medicin y tipo de problema
correspondiente.
Es un problema de Comparacin
2 grupos independientes
Nivel de medicin intervalar
H0: El nivel de conocimientos del idioma ingls es igual entre el grupo del curso tradicional
(grupo 1) y el grupo del curso multimedia (grupo 2)
Prueba estadstica: Prueba t para grupos independientes
2. Se deben elevar al cuadrado los puntajes obtenidos por el grupo 1 (X1) y los del grupo 2 (X2) y
escribirlos en la columna X 12 para los puntajes elevados al cuadrado del grupo 1 y X 22 para los
puntajes elevados al cuadrado del grupo 2.
3. Sumar los puntajes obtenidos por el grupo 1 ( X1 ) y por el grupo 2 ( X 2 ), as como los
puntajes elevados al cuadrado de cada grupo ( X 1 y
2
141
x
x
22
2913
2
1
4656
7
164
6
19881
2913
4656
x1 = 73
).
2
2
26896
4656 4482.67 = 173.33
6
2
x2 = 173
73 173 1
7 6
2
246
11
0.143
0.167
22.3
636
0.3
100
6.9327 = 2.63
gl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
0.05
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
0.01
63.657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
0.001
636.619
31.598
12.941
8.610
6.859
5.959
5.405
5.041
4.781
4.587
4.437
4.318
Prueba T
En la primer seccin se describen los grupos a comparar:
Estadsticos de grupo
Calificacin de la prueba
de conocimientos
Mtodo de enseanza
Tradicional
Multimedia
Media
20.14
Desviacin
tp.
3.48
Error tp. de
la media
1.32
27.33
5.89
2.40
iguales, se debe seguir la primer lnea donde se observa un valor de t de 2.732 con 11 grados de
libertad y un nivel de significancia de 0.02 (ver datos encerrados en el rectngulo), siguiendo la
regla de decisin: si el valor de significancia calculado es menor o igual () a 0.05 se debe
rechazar la H0, este valor es menor a 0.05 por lo que se debe rechazar la H0, entonces se tiene que
afirmar que: el nivel de conocimientos del idioma ingls es diferente entre el grupo del curso
tradicional y el grupo del curso multimedia.
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas
Diferencia
Se han asumido
Calificacin de la prueba
de conocimientos
varianzas iguales
No se han asumido
varianzas iguales
F
1.342
Sig.
.271
gl
Sig. (bilateral)
de medias
Error tp. de
la diferencia
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-2.732
11
.020
-7.19
2.63
-12.98
-1.40
-2.623
7.862
.031
-7.19
2.74
-13.53
-.85
27.33
20.14
20
15
10
5
0
D
s
sD
sD
n 1
Para calcular la desviacin estndar de las diferencias:
sD
D2
n
gl = n - 1
Problema para explicar el procedimiento para calcular la prueba t para muestras independientes:
Se desea saber si un taller es efectivo para cambiar el nivel de autoestima de un grupo de pacientes,
para ello se evala la autoestima antes de iniciar el taller y al finalizar el mismo. Los datos obtenidos
se muestran a continuacin, donde X son los puntajes de la primera medicin y Y corresponde a la
segunda medicin, D son las diferencias entre los puntajes de las 2 mediciones:
2
X
Y
D
D
18
20
-2
4
16
22
-6
36
18
24
-6
36
12
10
2
4
20
25
-5
25
17
19
-2
4
18
20
-2
4
20
21
-1
1
22
23
-1
1
20
20
0
0
10
10
0
0
8
12
-4
16
20
22
-2
4
12
14
-2
4
16
12
4
16
16
20
-4
16
18
22
-4
16
20
24
-4
16
18
23
-5
25
21
17
4
16
X = 340
x = 17
Y = 380
y = 19
D = -40
D = -2
D = 244
n = 20
Procedimiento:
1. Para cada problema especfico se debe determinar el tipo de problema, los grupos a comparar, si
son independientes o relacionados, el nivel de medicin, la prueba estadstica que debe utilizarse
y plantear la hiptesis nula que se debe probar de acuerdo al nivel de medicin y tipo de problema
correspondiente.
Es un problema de Comparacin
2 grupos relacionados
Nivel de medicin intervalar
H0: El nivel de autoestima es igual entre la medicin de inicio y la medicin hecha al
finalizar el taller
Prueba estadstica: Prueba t para grupos relacionados
2. Obtener las diferencias (D) entre los puntajes obtenidos en la primera medicin y la segunda
medicin (datos de la columna X menos los datos de la columna Y).
2
244 80 164
20
20
6. Obtener la desviacin estndar de las diferencias
s D 164
20
8.2 2.864
2 3.04
0.657
gl = 20 - 1 = 19
9. Buscar el valor de t en tabla con el nivel de significancia de 0.05 y con los grados de libertad
calculados. El valor de t obtenido de las operaciones debe compararse con ese valor de tabla (ver
tabla en la pgina 17). La regla de decisin es: si el valor calculado es mayor o igual que el
valor en tabla se debe rechazar la H0.
Para este ejercicio, con 19 grados de libertad, al nivel de significancia establecido en el valor de
0.05, se tiene un valor en tabla de 2.093, el valor de t calculado es mayor al de tabla (el signo no
debe ser tomado en cuenta) por lo tanto se rechaza H0, entonces: el nivel de autoestima es
diferente entre la primera y segunda mediciones.
Prueba T
En la primer seccin se describen las mediciones a comparar y se presenta la correlacin entre las
mismas:
Estadsticos de muestras relacionadas
Par 1
Medicin 1
Media
17.00
Medicin 2
19.00
20
Desviacin
tp.
3.80
Error tp. de
la media
.85
20
4.82
1.08
Medicin 1 y Medicin 2
20
Correlacin
.793
Sig.
.000
Par 1
Medicin 1 - Medicin 2
Media
-2.00
Desviacin
tp.
2.94
Error tp. de
la media
.66
95% Intervalo de
confianza para la
diferencia
Inferior
-3.38
Superior
-.62
-3.044
19
.007
Media
20
19
17
12
8
4
0
Autoestima
Antes del
Taller
Autoestima Despue
del Taller
Prueba U de Mann-Whitney
La prueba U de Mann-Whitney pertenece a las pruebas no paramtricas de comparacin de dos
muestras independientes, es decir:
Se utiliza para comparar dos grupos de rangos (medianas) y determinar que la diferencia no se deba
al azar (que la diferencia sea estadsticamente significativa).
Se calcula mediante la siguiente frmula:
U n1n2 nx nx 1
dnde: n1, n2 = nmero de casos de cada grupo
nx
Rx
X2
4
3
2
2
1
2
n2 = 6
R1
11.5
8
3.5
3.5
1
8
3.5
R1 = 39
R2
13
11.5
8
8
3.5
8
= 52
1. Para cada problema especfico se debe determinar el tipo de problema, los grupos a comparar, si
son independientes o relacionados, el nivel de medicin, la prueba estadstica que debe utilizarse
y plantear la hiptesis nula que se debe probar de acuerdo al nivel de medicin y tipo de problema
correspondiente.
Es un problema de Comparacin
2 grupos independientes
Nivel de medicin ordinal
H0: El nivel de estrs es igual entre enfermeras de terapia intensiva (grupo 1) y enfermeras de
urgencias (grupo 2)
Prueba estadstica: Prueba U de Mann Whitney
2. En primer lugar se debe asignar un rango a cada calificacin ordenndolas como si se tratara de
un solo conjunto de datos (se juntan los grupos).
Valor
0
1
1
1
1
2
2
Rango
1
2
3
4
5
6
7
2 3 4 5
3.5
4
8
9
10
11
12
13
11.5
6 7 8 9 10 8
3. Cada uno de los rangos se debe colocar en la columna correspondiente, R1 para el grupo 1 y R2
para el segundo grupo. Una vez asignados los rangos se deben sumar para cada grupo por
separado ( R1 .y R2 ).
Esta operacin puede verificarse mediante la siguiente frmula:
N N 1
R R
1
39 52
2
1314
91 = 91
4. A continuacin debe calcularse el valor de U para cada grupo:
78
7(7 1)
56
U 76
39 42
39 42 39 42 28 39 31
1
2
2
2
67
6(6 1)
42
U 7 6
52 42
52 42 52 42 2152 11
2
2
2
2
5. Se debe encontrar el valor crtico de U en la tabla que se presenta en la pgina siguiente, con un
nivel de significancia establecido a 0.05 para una prueba de 2 colas, utilizando el nmero de casos
de cada grupo (n1 y n2). Una vez hecho sto, se debe elegir el valor de U ms bajo y compararlo
1 12
10
11
1
2
3
4
5
6
7
8
9
10
0
0
0
0
1
1
2
2
3
0
1
2
3
4
4
0
1
2
3
5
6
7
8
1
2
3
5
6
8
10
1
3
5
6
8
10
12
0
2
4
6
8
10
13
0
2
4
7
0
3
11 21
10
10
10
1.43
7
4214 588
49
12
12
2a. La regla de decisin es: si la calificacin z es mayor o igual a 1.96 (sin tomar en cuenta el
signo) se rechaza la hiptesis nula, esto es porque este valor equivale al 95% del rea bajo la
curva normal (nivel de significancia de 0.05). Con un valor menor no podemos rechazar la
hiptesis nula.
En este caso, al tener una z de 1.43 menor a 1.96 se acepta la hiptesis nula, por lo que: el nivel
de estrs es igual entre los dos grupos de enfermeras.
La prueba U de Mann-Whitney en el paquete estadstico SPSS se encuentra en Analizar /
Pruebas no paramtricas/2 muestras independientes, los resultados para el ejemplo anterior seran
los siguientes:
Pruebas no paramtricas
Prueba de Mann-Whitney
Rangos
Nivel de estrs
Grupo
Enfermeras de
terapia intensiva
Emfermeras de
urgencias
Total
Rango
promedio
Suma de
rangos
5.57
39.00
8.67
52.00
13
Estadsticos de contrasteb
U de Mann-Whitney
W de Wilcoxon
Z
Nivel de
estrs
11.000
39.000
-1.494
.135
.181
Finalmente, se presentan los valores de la U de MannWhitney y de la razn z (ver datos en los crculos), as
como el valor de significancia de la prueba, se utiliza el de
significancia bilateral (ver el nmero en el hexgono), se
debe recordar que en el paquete estadstico la regla de
decisin es: si el valor de significancia es menor o igual
a 0.05 se tiene que rechazar la hiptesis nula, en este
caso es mayor por lo que al no poder rechazar la hiptesis
nula debemos concluir que: el nivel de estrs es igual entre
los 2 grupos de enfermeras.
Mediana
1.5
1
0.5
0
Terapia intensiva
Urgencias
* z = -1.494, p = 0.181
Prueba de Wilcoxon
La prueba de rangos asignados de Wilcoxon pertenece a las pruebas no paramtricas de comparacin
de dos muestras relacionadas, es decir:
Se utiliza para comparar dos grupos relacionados de rangos (medianas) y determinar que la diferencia
no se deba al azar (que la diferencia sea estadsticamente significativa).
Problema para explicar el procedimiento:
Se desea probar si hay diferencias en el nivel de estrs laboral de los trabajadores de una empresa
antes y despus de la implementacin de un programa de mejoramiento del ambiente laboral; el nivel
de estrs se midi en una escala de 0 = nada, 1 = bajo, 2 = medio, 3 = alto, 4 muy alto, las
calificaciones se muestran a continuacin:
X
3
3
2
2
2
2
1
Y
4
2
1
1
0
2
3
D
-1
1
1
1
2
0
-2
Rangos positivos
Rangos negativos
2.5
2.5
2.5
2.5
5.5
Empate, n = 7-1 = 6
5.5
+
T = 13
T =8
n=7
1. Para cada problema especfico se debe determinar el tipo de problema, los grupos a comparar, si
son independientes o relacionados, el nivel de medicin, la prueba estadstica que debe utilizarse
y plantear la hiptesis nula que se debe probar de acuerdo al nivel de medicin y tipo de problema
correspondiente.
Es un problema de Comparacin
2 grupos relacionados
Nivel de medicin ordinal
H0: El nivel de estrs laboral de los trabajadores es igual antes y despus de implementar el
programa de mejoramiento del ambiente laboral.
Prueba estadstica: Wilcoxon
2. Se debe obtener la diferencia (D) entre los
puntajes de inicio (X) y de la segunda medicin
(Y), es decir: restar a las calificaciones de la
primera medicin los de la segunda. A estas
diferencias se les debe asignar un rango
ordenando los datos sin considerar el signo de la
diferencia, deber empezarse con el valor ms
pequeo dndole el rango 1, no deben
considerarse
las
diferencias
iguales
Ordenar las
diferencias
mayores a 0
Rango
En el caso de que existan valores repetidos, el
rango que les corresponde es igual a la suma de los
lugares asignados entre el nmero de veces que se
repite cada uno*
-1
1
1
1
-2
1
2
3
4
5
para los 1:
1 2 3 4
42.5
5 6
5.5
para el 2: 2
3. Una vez asignados los rangos se deben acomodar los correspondientes a las diferencias positivas
+
y los de diferencias negativas en la columna respectiva y despus sumarlos para obtener T y T .
+
4. Se debe encontrar el valor de probabilidad asociado a T (c) con el nmero de casos ajustado (N),
+
en la tabla de valores crticos de T . En sta se muestra la probabilidad asociada para una prueba
de una cola, para obtener la probabilidad de dos colas se debe dividir el valor correspondiente
entre 2. Como regla de decisin: esta probabilidad debe ser menor o igual a 0.05 para
rechazar la hiptesis nula..
+
En este caso con T igual a 13, al buscar este valor en los renglones y la N ajustada (6) en las
columnas, se tiene una probabilidad de 0.3438 que dividida entre 2, para obtener la probabilidad
asociada para una prueba de dos colas, da como resultado 0.1719, esta probabilidad al ser mayor a
0.05 no permite rechazar la hiptesis nula. Por lo tanto: el nivel de estrs laboral de los
trabajadores es igual antes y despus de implementar el programa de mejoramiento del ambiente
laboral.
+
N N 1(2N
1) 24
0.6250
0.3750
0.2500
0.5625
0.1250
0.4375
0.3125
0.1875
0.5000
0.1250
0.4063
10
0.0625
0.3125
11
0.2188
0.5000
12
0.1563
0.4219
13
0.0938
0.3438
14
0.0625
0.2813
15
0.0313
0.2188
3. Calcular la z con:
66 1
T 13
42
13
13 10.5 2.5
66 1(2)(6) 1 4213
24
24
22.75 4.77
546
24
2.5
z 4.77 0.53
0.5313
La regla de decisin es: si la calificacin z es mayor o igual a 1.96 (sin tomar en cuenta el signo)
se rechaza la hiptesis nula, esto es porque este valor equivale al 95% del rea bajo la curva normal
(nivel de significancia de 0.05). Con un valor menor no podemos rechazar la hiptesis nula.
En este caso, al tener una z de 0.53 menor a 1.96, no se puede rechazar la hiptesis nula, por lo que:
el nivel de estrs laboral de los trabajadores es igual antes y despus de implementar el programa de
mejoramiento del ambiente laboral.
Por otro lado, la prueba de Wilcoxon en el paquete estadstico SPSS se encuentra en Analizar /
Pruebas no paramtricas/2 muestras relacionadas, los resultados que se presentan para el ejemplo
anterior son los siguientes:
Pruebas no paramtricas
Prueba de los rangos con signo de Wilcoxon
Rangos
N
Estrs laboral al iniciar el
programa - Estrs
al finalizar el programa
Rangos negativos
Rangos positivos
Empates
Total
2
4b
1c
7
Rango
promedio
4.0
3.2
Suma de
rangos
8.0
13.0
Estadsticos de contraste
Z
Sig. asintt.
Estrs
al iniciar
programa
Estrs al
finalizar
programa
-.541a
.589
Mediana
Estrs laboral
despus del
programa
* z = -0.541, p = 0.589
Se usa para comparar dos o ms grupos independientes de proporciones organizadas en una tabla de
contingencia y determinar que las diferencias no se deban al azar (que las diferencias sean
estadsticamente significativas).
2
fo fe
X
2
fe
Donde fo son las frecuencias observadas para cada una de las celdas de la tabla y fe son las
frecuencias esperadas para cada una de estas celdas.
Problema para explicar el procedimiento:
Se desea saber si las prcticas de crianza son diferentes entre padres de una orientacin poltica
conservadora y padres de orientacin poltica liberal, las prcticas de crianza estn clasificadas como
no rgida, moderada y autoritaria:
Es un problema de Comparacin
2 grupos independientes
Nivel de medicin de la variable dependiente: nominal
H0: La proporcin de padres que emplean prcticas de crianza no rgida, moderada y autoritaria es
igual entre los que tienen una orientacin poltica conservadora y los que tienen una orientacin
liberal.
Prueba estadstica: Chi cuadrada
1. En primer lugar debe generarse una tabla de contingencia en la que por regla general los grupos
son representados en las columnas y las categoras de la variable dependiente estarn
representadas en los renglones. La tabla siguiente, representa los datos cruzados del tipo de
orientacin poltica (Variable Independiente en las columnas) por el tipo de prctica de crianza
que llevan a cabo (Variable Dependiente en los renglones). En cada celdilla se captura las
frecuencias observadas (fo), obtenidas de las respuestas de los padres segn su orientacin poltica
(ver las frecuencias en cursivas).
No rgida
Moderada
Autoritaria
Total
Conservadores
6
13.8
13
12.9
21
13.3
40
Liberales
24
16.2
15
15.1
8
15.7
47
Total
30
28
29
N = 87
2. A continuacin se deben sumar los totales marginales por cada rengln, por cada columna y
obtener el nmero total de casos (N).
3. Se debe obtener la frecuencia esperada (fe) multiplicando los totales marginales del rengln y de
la columna que corresponden a cada celdilla, y dividirlos entre el total de casos. Por ejemplo: el
total marginal del rengln para la primer celda (con frecuencia observada = 6) es igual a 30 y el
total marginal de las columnas es igual a 40, el total de sujetos es 87, entonces la frecuencia
3040
esperada para la primer celda es: fe
13.8
87
Las frecuencias restantes seran: para la segunda celda (con frecuencia observada = 24):
fe 3047
2840 12.9 ,
16.2 , para la tercera celda (con frecuencia observada = 13): fe
87
87
2847
la cuarta celda (con frecuencia observada = 15): fe
15.1 , la quinta (con frecuencia
87
2940
observada = 21): fe
13.3 y finalmente para la sexta (con frecuencia observada = 8):
87
2947
fe
15. (las frecuencias esperadas son los nmeros en negritas en la tabla).
87 7
2
4. Calcular el valor de X :
2
13 12.9
X 6 13.82 24 16.2
13.8
16.2
12.9
15
15.1
21 13.32
13.3
8 15.72
15.7
15.1
2
2
7.8 2 0.1 0.1 7.7 7.7
X 7.8
13.8
16.2
15.1
13.3
15.7
12.9
60.8 60.8 0.01 0.01 59.29 59.29
2
X
N AD BC
X2
A BC DA C B D
2
gl
0.05
3.841
5.991
0.01
6.635
9.210
12.592
7.815
9.488
11.345
13.277
Es un problema de Comparacin
2 grupos independientes
Nivel de medicin de la variable dependiente: nominal (dicotmica)
H0: La proporcin de fumadores que recayeron en el consumo de tabaco es igual entre bebedores y
no bebedores.
Prueba estadstica: Chi cuadrada
Los datos se resumen en la siguiente tabla:
No
Bebedor
bebedor
No fumaron
96
13
177 96
2
Total
109
Fumaron
48
20
68
Total
144
33
N = 177
20 13 48
177
20
1771296 88.5
1096814433
35221824
X 1771207.5
2
35221824
35221824
35221824
Se debe buscar el valor en tabla (ver la tabla de valores crticos de Chi cuadrada) con un grado de
libertad al nivel de significancia elegido para probar H0. La regla de decisin es: para rechazar la
hiptesis nula el valor obtenido debe ser mayor o igual a la chi cuadrada en la tabla.
2
Con 1 grado de libertad al nivel de significancia de 0.05 se tiene un valor de X en tabla de 3.841, en
este caso, al tener una chi cuadrada (7.33) mayor a la de la tabla, se rechaza la hiptesis nula,
entonces: la proporcin de fumadores que recayeron en el consumo de tabaco es diferente entre
bebedores y no bebedores.
La Chi cuadrada en el paquete SPSS
En el paquete estadstico la Chi cuadrada se encuentra en Analizar / Estadsticos descriptivos /
Tablas de contingencia, la variable independiente o de agrupacin se coloca siempre en las
columnas y la variable dependiente en los renglones, se debe elegir en la seccin de estadsticas la
prueba de Chi cuadrada, se presentan resultados como los siguientes:
Tablas de contingencia
Tabla de contingencia Tipo Practicas de crianza * Orientacin poltica de los padres
Tipo Practicas
de crianza
No rgida
Recuento
% de Tipo Practicas
de crianza
% de Orientacin
poltica de los padres
% del total
Total
30
20.0%
80.0%
100.0%
15.0%
51.1%
34.5%
6.9%
27.6%
34.5%
32.5%
31.9%
32.2%
14.9%
17.2%
32.2%
21
29
72.4%
27.6%
100.0%
52.5%
17.0%
33.3%
24.1%
40
9.2%
47
33.3%
87
46.0%
54.0%
100.0%
100.0%
100.0%
100.0%
46.0%
54.0%
100.0%
La primera parte
es la tabla de contingencia 13con las 15frecuencias,
los porcentajes respecto a los
Moderada Recuento
28
renglones, a las columnas
alPracticas
total, estos datos nos ayudan a describir las distribuciones de las
% deyTipo
46.4%
53.6%
100.0%
de crianza
proporciones.
% de Orientacin
poltica de los padres
% del total
Autoritaria
Total
Recuento
% de Tipo Practicas
de crianza
% de Orientacin
poltica de los padres
% del total
Recuento
% de Tipo Practicas
de crianza
% de Orientacin
poltica de los padres
% del total
Pruebas de chi-cuadrado
Valor
Sig. asinttica
(bilateral)
gl
Chi-cuadrado de Pearson
16.313
2
.000
Razn de verosimilitud
17.184
2
.000
Asociacin lineal por
16.125
1
.000
lineal
N de casos vlidos
87
a. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5.
La frecuencia mnima esperada es 12.87.
Tablas de contingencia
Tabla de contingencia Recay con el cigarro * Bebedores
Recay con
el cigarro
No
Recuento
% de Recay
con el cigarro
% de Bebedores
% del total
Bebedores
No
Si
96
13
Total
109
88.1%
11.9%
100.0%
66.7%
39.4%
61.6%
48
20
68
70.6%
29.4%
100.0%
33.3%
27.1%
60.6%
11.3%
38.4%
38.4%
Recuento
% de Recay
con el cigarro
% de Bebedores
% del total
Total
Recuento
144
33
177
% de Recay
81.4%
18.6%
100.0%
con el cigarro
% de Bebedores
100.0%
100.0%
100.0%
Pruebas de
chi-cuadrado
% del total
81.4%
18.6%
100.0%
Sig. asinttica
Sig. exacta
Sig. exacta
Valor
gl
(bilateral)
(bilateral)
(unilateral)
Chi-cuadrado de Pearson
8.441b
1
.004
Correccin apor
7.327
1
.007
continuidad
Razn de verosimilitud
1
.004
8.223
Estadstico exacto de
Fisher
Asociacin lineal por
1
.004
8.393
lineal
N de casos vlidos
177
a. Calculado slo para una tabla de 2x2.
b. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada
es 12.68.
Seguida de la prueba
estadstica, sin embargo,
se agregan dos conjuntos
de valores, la correccin
de continuidad y la prueba
exacta de Fisher, se debe
recordar que la correccin
por continuidad se calcula
para una interpretacin
ms exacta, por ello se
debe usar ese valor para
tomar una decisin (ver
datos encerrados en el
2
rectngulo), en este caso X de 7.327 con gl = 1 y una significancia = 0.007, la regla de decisin
indica que valor de significancia debe ser menor o igual a 0.05 para rechazar la hiptesis nula,
como vemos la significancia obtenida (0.007) es menor que 0.05, por lo que se rechaza la hiptesis
nula, entonces: la proporcin de fumadores que recayeron en el consumo de tabaco es diferente
entre bebedores y no bebedores.
Para esta prueba se puede utilizar una grfica de barras con los porcentajes por columna que suman el
100% en cada grupo, es importante mencionar los valores de la prueba estadstica, grados de libertad
y el nivel de significancia con que se est rechazando, o aceptando, la hiptesis nula. Se puede poner
el valor de probabilidad obtenido o simplemente decir que es menor, o mayor, al valor que hayamos
elegido para la prueba de hiptesis. Adems se debe escribir la conclusin a la que se llega. Tomando
el ejemplo de la tabla de contingencia de 2 x 2:
Se encontraron diferencias en la proporcin de fumadores
que recayeron en2 el
consumo de tabaco entre bebedores y
= 7.327,
no bebedores (X
gl = 1, p < 0.01). Como puede
observarse en la grfica, los bebedores recayeron en el
consumo de tabaco en mayor proporcin (60.6%) que los
no bebedores (33.3%).
Esta descripcin ser la base para hacer la discusin posterior
de los resultados encontrados en el estudio.
60.6
60
50
33.3
% 40
30
20
10
0
No bebedores
2
Bebedores
* X = 7.327, gl = 1, p = 0.007
Se utiliza para comparar dos grupos relacionados de proporciones organizadas en una tabla que
representa los cambios en las respuestas de los sujetos entre una primera medicin y una posterior, y
determinar que las diferencias no se deban al azar (que las diferencias sean estadsticamente
significativas).
Los datos se organizan en una tabla como la siguiente:
Despus
-
Antes
Los signos + y representan las dos categoras de la variable en cada medicin, obsrvese que las
respuestas que se mantienen en ambas mediciones se encuentran en la celdilla A (- y -) y en la D (+ y
+), las celdas donde hay cambio (-, + y +, -) son la B y la C.
2
B C
12
B C
Para la prueba de McNemar siempre se tiene un grado de libertad (gl = 1)
Donde B y C son las celdillas en las que se esperan los cambios, esta frmula incluye una correccin
2
de continuidad que mejora la estimacin de la X , esto se hace, como se aprecia en la frmula, al
restar 1 al valor absoluto de la resta de B C (quitando el signo resultante de la resta).
Problema para explicar el procedimiento:
Se desea saber si cambi la preferencia por Fox o Crdenas despus del debate televisado, para ello
se pregunt a un grupo de posibles votantes por cul candidato votara antes del da del debate, al da
siguiente del debate se volvi a preguntar a los mismos sujetos por quin votaran, los resultados se
muestran a continuacin:
Es un problema de Comparacin
2 grupos relacionados
Nivel de medicin de la variable dependiente: nominal (dicotmica)
H0: La proporcin de posibles votantes que prefieren a Fox o a Crdenas es igual antes y despus
del debate.
1. En primer lugar deben organizarse las respuestas en una tabla como la siguiente. En cada celdilla
se capturan la cantidad de sujetos que mantienen su respuesta (Fox Fox o Crdenas - Crdenas)
y los que cambian (de Fox a Crdenas o de Crdenas a Fox):
Despus
Antes
Fox
Fox
Crdenas
20
26
23
Crdenas
26 8 12
26 8
17
289
34 34
8.5
Se debe buscar el valor crtico de X en la tabla de valores de Chi cuadrada (ver pgina 35) con un
grado de libertad y al nivel de significancia establecido para probar la H0, La regla de decisin para
rechazar la hiptesis nula es: el valor obtenido debe ser mayor o igual a la chi cuadrada en la
tabla.
2
El valor de X en tabla con 1 grado de libertad al nivel de significancia igual a 0.05 es 3.841. En este
2
ejemplo se encontr que la X es igual a 8.5, mayor a la de tabla, por esa razn se rechaza la hiptesis
nula, entonces: la proporcin de posibles votantes que prefieren a Fox o a Crdenas es diferente antes
y despus del debate televisado.
McNemar en el paquete SPSS
En el paquete estadstico se tiene la prueba de McNemar en Analizar / Pruebas no paramtricas / 2
muestras relacionadas se presentan resultados como los siguientes:
Prueba de McNemar
Tablas de contingencia
Preferencias antes del debate y
Preferencias despus del debate
Preferencias
antes del debate
1
2
Preferencias despus
del debate
1
2
20
26
8
23
Estadsticos de contrasteb
Preferencias
antes del
debate y
Preferencias
despus del
debate
N
77
Chi-cuadradoa
8.500
.004
Sig. asintt.
a. Corregido por continuidad
b. Prueba de McNemar
63.6
59.7
36.4
% 40
20
40.3
Fox
Crdenas
0
Antes del debate
Despus del
debate
* X2 = 8.5, p = 0.004
El anlisis de varianza agrupa una variedad de mtodos para anlisis de datos de diseos estadsticos
muy complicados, tanto que han merecido la publicacin de diversos libros en que se describen esos
mtodos y sus aplicaciones prcticas. En este caso, se presenta la utilizacin ms simple de esta
prueba: ANOVA de una va o factor (una sola variable independiente) para probar una hiptesis
basada en las medias de tres o ms grupos independientes.
La prueba F se calcula mediante la siguiente frmula:
CM int er
F
CM int ra
dnde CMinter es el cuadrado medio intergrupos y CMintra es el cuadrado medio intragrupos, para
calcular ambos datos se deben obtener los siguientes valores:
1. Suma de cuadrados total (SCT):
SCT
X 2
X
2
n
X 2
N
er
SCint
glint er
CM int ra
SCint ra
glint ra
X2
X3
6
4
14
4
6
12
14
12
18
16
8
6
12
10
= 82
n1 = 7
X 1 = 11.71
1
X2
18
17
16
18
12
17
10
= 60
n2 = 7
144
324
256
64
36
144
100
= 108
n3 = 7
X 2 = 8.57
X =250 X
N = 21
X 3 = 15.43
2
1
X 32
X 22
= 1068
36
16
196
16
36
144
196
X 2 = 640
325
289
256
324
144
289
100
X 2 = 1727
3
=3435
X T =11.9
1. Una vez que se tienen los puntajes (X1, X2 y X3) se deben elevar al cuadrado para cada grupo ( X 1 ,
2
) y hacer un total de
estas sumatorias ( X ), posteriormente sumar los puntajes elevados al cuadrado por grupo
( X1 ,
2
2. Determinaremos el nmero de casos por grupo (n1, n2 y n3) y la suma de casos total (N) para
X )
X
)
y
el
promedio
total
(
X
SCT
3435
SC
250 2
21
3435
62500
21
2
2
108 250
6724 3600 11664
62500
int er
7
7
7
21
7
21
7
7
82
60
CM
int
er
165
2
82.5
CM int
ra
293.8
18
16.3
glinter = 3 1 = 2
glintra = (7 1) + (7 1) + (7 1) = 6 + 6 + 6 = 18
glT = 21 1 = 20
82.5
F
5.06
16.3
Los datos calculados deben ser organizados en una tabla como la siguiente:
Fuentes de Variacin
gl
Suma de Cuadrados Cuadrado medio
Intergrupos
2
165
82.5
Intragrupos
18
293.8
16.3
Total
20
458.8
F
5.06
10
11
12
14
16
20
24
30
40
50
75
100
200
500
f2
161
4.052
200
4.999
216
5.403
225
5.625
230
5.764
234
5.859
237
5.928
239
5.981
241
6.022
242
6.056
243
6.082
244
6.106
245
6.142
246
6.169
248
6.208
249
6.234
250
6.258
251
6.286
252
6.302
253
6.323
253
6.334
254
6.352
254
6.361
254
6.366
18.51
98.49
19.00
99.00
19.16
99.17
19.25
99.25
19.30
99.30
19.33
99.33
19.36
99.34
19.37
99.36
19.38
99.38
19.39
99.40
19.40
99.41
19.41
99.42
19.42
99.43
19.43
99.44
19.44
99.45
19.45
99.46
19.46
99.47
19.47
99.48
19.47
99.48
19.48
99.49
19.49
99.49
19.49
99.49
19.50
99.50
19.50
99.50
10.13
34.12
9.55
30.82
9.28
29.46
9.12
28.71
9.01
28.24
8.94
27.91
8.88
29.67
8.84
27.49
8.81
27.34
8.78
27.23
8.76
27.13
8.74
217.05
8.71
26.92
8.69
26.83
8.66
26.69
8.64
26.60
8.62
26.50
8.60
26.41
8.58
26.35
8.57
26.27
8.56
26.23
8.54
26.18
8.54
26.14
8.53
26.12
7.71
21.20
6.94
18.00
6.59
16.69
6.39
15.98
6.26
15.52
6.16
15.21
6.09
14.98
6.04
14.80
6.00
14.66
5.96
14.54
5.93
14.45
5.91
14.37
5.87
14.24
5.84
14.15
5.80
14.02
5.77
13.93
5.74
13.83
5.71
13.74
5.70
13.69
5.68
13.61
5.66
13.57
5.65
13.52
5.64
13.48
5.63
13.46
6.61
16.26
5.79
13.27
5.41
12.06
5.19
11.39
5.05
10.97
4.95
10.67
4.88
10.45
4.82
10.27
4.78
10.15
4.74
10.05
4.70
9.96
4.68
9.89
4.64
9.77
4.60
9.68
4.56
9.55
4.53
9.47
4.50
9.38
4.46
9.29
4.44
9.24
4.42
9.17
4.40
9.13
4.38
9.07
4.37
9.04
4.36
9.02
5.99
13.74
5.14
10.92
4.76
9.78
4.53
9.15
4.39
8.75
4.28
8.47
4.21
8.26
4.15
8.10
4.10
7.98
4.06
7.87
4.03
7.79
4.00
7.72
3.96
7.60
3.92
7.52
3.87
7.39
3.84
7.31
3.81
7.23
3.77
7.14
3.75
7.09
3.72
7.02
3.71
6.99
3.69
6.94
3.68
6.90
3.67
6.88
5.59
12.25
4.74
9.55
4.35
8.45
4.12
7.85
3.97
7.46
3.87
7.19
3.79
7.00
3.73
6.84
3.68
6.71
3.63
6.62
3.60
6.54
3.57
6.47
3.52
6.35
3.49
6.27
3.44
6.15
3.41
6.07
3.38
5.98
3.34
5.90
3.32
5.85
3-29
5.78
3.28
5.75
3.25
5.70
3.24
5.67
3.23
5.65
5.32
11.26
4.46
8.65
4.07
7.59
3.84
7.01
3.69
6.63
3.58
6.37
3.50
6.19
3.44
6.03
3.39
5.91
3.34
5.82
3.31
5.74
3.28
5.67
3.23
5.56
3.20
5.48
3.15
5.36
3.12
5.28
3.08
5.20
3.05
5.11
3.03
5.06
3.00
5.00
2.98
4.96
2.96
4.91
2.94
4.88
2.93
4.86
5.12
10.56
4.26
8.02
3.86
6.99
3.63
6.42
3.48
6.06
3.37
5.80
3.29
5.62
3.23
5.47
3.18
5.35
3.13
5.26
3.10
5.18
3.07
5.11
3.02
5.00
2.98
4.92
2.93
4.80
2.90
4.73
2.86
4.64
2.82
4.56
2.80
4.51
2.77
4.45
2.76
4.41
2.73
4.36
2.72
4.33
2.71
10
4.96
10.04
4.10
7.56
3.71
6.55
3.48
5.99
3.33
5.64
3.22
5.39
3.14
5.21
3.07
5.06
3.02
4.95
2.97
4.85
2.94
4.78
2.91
4.71
2.86
4.60
2.82
4.52
2.77
4.41
2.74
4.33
2.70
4.25
2.67
4.17
2.64
4.12
2.61
4.05
2.59
4.01
2.56
3.96
2.55
3.93
11
4.84
9.65
3.98
7.20
3.59
6.22
3.36
5.67
3.20
5.32
3.09
5.07
3.01
4.88
2.95
4.74
2.90
4.63
2.86
4.54
2.82
4.46
2.79
4.40
2.74
4.29
2.70
4.21
2.65
4.10
2.61
4.02
2.57
3.94
2.53
3.86
2.50
3.80
2.47
3.74
2.45
3.70
2.42
3.66
2.41
12
4.75
9.33
3.88
6.93
3.49
5.95
3.26
.5.41
3.11
5.06
3.00
4.82
2.92
4.65
2.85
4.50
2.80
4.39
2.76
430
2.72
4.22
2.69
4.16
2.64
4.05
2.60
3.98
2.54
3.86
2.50
3.78
2.46
3.70
2.42
3.61
2.40
3.56
2.36
3.49
2.35
3.46
2.32
3.41
13
4.67
9.07
3.80
6.70
3.41
5.74
3.18
5.20
3.02
4.86
2.92
4.62
2.84
4.44
2.72
4.30
2.77
4.19
2.63
4.10
2.63
4.02
2.60
3.96
2.55
3.85
2.51
3.78
2.46
3.67
2.42
3.59
2.38
3.51
2.34
3.42
2.32
3.37
2.28
3.30
2.26
3.27
14
4.60
8.86
3.74
6.51
3.34
5.56
3.11
5.03
2.96
4.69
2.85
4.46
2.77
4.28
2.70
4.14
2.65
4.03
2.60
3.94
2.56
3.86
2.53
3.80
2.48
3.70
2.44
3.62
2.39
3.51
2.35
3.43
2.31
3.34
2.27
15
4.54
8.68
3.68
6.36
3.29
5.42
3.06
4.89
2.90
4.56
2.79
4.32
2.70
4.14
2.64
4.00
2.59
3.89
2.55
3.80
2.51
3.73
2.48
3.67
2.43
3.56
2.39
3.48
2.33
16
4.49
8.53
3.63
6.23
3.24
5.29
3.01
4.77
2.85
4.44
2.74
4.20
2.66
4.03
2.59
3.89
2.54
3.78
2.49
3.69
2.45
3.61
2.42
17
4.45
8.40
3.59
6.11
3.20
5.18
2.96
4.67
2.81
4.34
2.70
4.10
2.62
3.93
2.55
3.79
2.50
3.68
2.45
3.59
2.41
18
4.41
8.28
4.38
8.18
3.55
6.01
3.16
5.09
3.13
5.01
2.93
4.58
2.77
4.25
2.66
4.01
2.58
3.85
2.51
3.71
2.46
2.63
2.55
4.35
8.10
3.49
19
20
3.52
5.93
2.90
4.50
2.87
4.43
4. Se debe encontrar el valor crtico de F en la tabla, para ello se tiene que identificar, entre el
cuadrado medio intergrupos y el cuadrado medio intragrupos, cul es el mayor; en las columnas
se debe buscar con los grados de libertad correspondientes al cuadrado medio mayor y en los
renglones los grados de libertad del cuadrado medio menor. Se debe elegir un valor de acuerdo
con el nivel de significancia elegido para la prueba de la H0. La regla de decisin para Anlisis
de Varianza es: si el valor calculado es mayor o igual al valor de tabla, se rechaza la
hiptesis nula.
El cuadrado medio mayor en este caso es el de intergrupos (CMinter = 82.5) con glinter = 2, y para
el cuadrado medio menor es el de intragrupos (CMintra = 16.3) con glintra = 18, buscando en la
tabla se tiene, para 2 grados en las columnas y 18 grados de libertad en los renglones, a un nivel
de significancia de 0.05, un valor de F = 3.55. El valor de F es mayor al de tabla por lo que se
rechaza la hiptesis nula, entonces: el nivel de conocimientos adquiridos en biologa es diferente
entre el grupo del curso multimedia, el grupo del curso tradicional y el grupo del curso que
emplea ambos mtodos.
Comparaciones Posteriores a F
Cuando se ha determinado que existen diferencias significativas entre los grupos, se debe especificar
dnde se encuentran las diferencias, para ello se analizan los grupos por pares, para hacerlo existen
varios mtodos, ms o menos estrictos, diseados para evitar el error Tipo I debido al efecto
Bonferroni.
El efecto Bonferroni se refiere al hecho de que al hacer las diferentes comparaciones entre los grupos
organizados por parejas, por ejemplo con la prueba t, el efecto acumulativo sobre el nivel de
significancia, del empleo de cada grupo ms de una vez para hacer todas las comparaciones (0.05
para la primera, aproximadamente 0.1 para la segunda, aproximadamente 0.15 para la tercera, etc.),
nos hace rechazar la hiptesis nula cuando sta no debera ser rechazada.
Uno de los mtodos es el diseado por Scheffe, en que se 2utiliza la siguiente frmula:
X 1 X 2
F
CM int ra n1 n2
n1n2
Para nuestro ejemplo, al comparar el grupo 1 y el grupo 2, la F es igual a:
2
11.71 8.57 2 3.14 9.8596
9.8596
F
2.12
14
16.30.2857 4.6571
77
16.3
16.3
49
77
Para el grupo 1 y el grupo 3, la F es: 2
11.71 15.43
F
16.3
77
77
3.72
77
77
14
16.3
6.86
16.3
49
13.8384
14
49
16.30.2857
47.0596
16.30.2857
9.8596
4.6571
2.97
47.0596
4.6571
10.1
Se debe hacer un ajuste sobre el nivel de significancia, para corregir el efecto Bonferroni,
multiplicando el valor de F en tabla, encontrado para la prueba general, por el nmero de grupos
menos 1 (k 1), para este caso el valor en tabla es 3.55 para el nivel de significancia de 0.05 con 2 y
18 grados de libertad, el ajuste se hara como sigue:
Ftabla ajustado = (3.55)(3 1) = (3.55)(2) = 7.1
X1
X2 X1
X3
X 2 = X 3 . La regla de
=
,
=
y
decisin es: el valor de F de cada comparacin debe ser mayor o igual al valor de tabla ajustado
para rechazar la hiptesis nula. Como se puede apreciar, slo el valor de F para la comparacin
entre el grupo 2 y el grupo 3 es mayor al valor de tabla ajustado, por lo que el nivel de conocimientos
adquiridos en biologa es diferente entre el grupo del curso tradicional y el grupo del curso que
emplea ambos mtodos y podemos decir que las diferencias en el Anlisis de Varianza son debidas a
este resultado.
Por otro lado, la prueba F de una va en el paquete estadstico SPSS se encuentra en Analizar /
Comparar medias / ANOVA de un Factor, se presentaran los siguientes resultados para el ejemplo
que estamos utilizando:
ANOVA de un factor
Descriptivos
Calificacin en el Examen de Conocimientos
N
Multimedia
Tradicional
Ambos
Total
7
7
7
21
Media
11.71
8.57
15.43
11.90
Desviacin
tpica
4.23
4.58
3.15
4.78
Error tpico
1.60
1.73
1.19
1.04
Mnimo
6
4
10
4
Mximo
18
14
18
18
En primer lugar se
presentan las estadsticas descriptivas
para los grupos.
Prueba de homogeneidad de
varianzas
2
gl1
gl2
2
18
ANOVA
Calificacin en el Examen de Conocimientos
Suma de
Media
cuadrados
cuadrtica
gl
Inter-grupos
164.952
2
82.476
Intra-grupos
292.857
18
16.270
Total
457.810
20
datos que se utilizan para la regla de decisin (ver datos en el crculo), la regla es: si el nivel de
significancia encontrado es menor o igual a 0.05 se rechaza H0.
La significancia de la prueba F (= 0.018) es menor a 0.05 por lo que se rechaza H0, entonces: el
nivel de conocimientos adquiridos en biologa es diferente entre el grupo del curso multimedia, el
grupo del curso tradicional y el grupo del curso que emplea ambos mtodos.
Pruebas post
hoc
Para
finalizar
se
Comparaciones mltiples
Diferencia de
medias (I-J)
3.14
-3.71
Tradicional
Error tpico
2.16
2.16
2.16
2.16
2.16
2.16
Sig.
.486
.306
.486
.016
.306
.016
Intervalo de confianza al
95%
Lmite
Lmite inferior
superior
-2.55
8.83
-9.40
1.98
-8.83
-12.55
-1.98
1.17
2.55
-1.17
9.40
12.55
2 con el 1 y el 3, y al
ltimo el 3 con el 1 y 2
(ver flechas).
Esta organizacin presenta comparaciones redundantes (en este caso se repiten dos veces cada una),
nicamente invirtiendo el orden de los grupos, se puede utilizar cualquiera no importando cual grupo
se pone primero y cual despus, teniendo cuidado de tomar los valores de significancia de todas las
comparaciones posibles.
Las hiptesis nulas que se prueban son:
X1
X2 X1
Media
16
14
12
10
8
6
4
2
0
15.43
11.71
8.57
Curso
Multimedia
Curso
Tradicional
Ambos
Se utiliza para comparar tres o ms grupos de rangos (medianas) y determinar que las diferencias no
se deban al azar (que las diferencias sean estadsticamente significativas).
Se calcula mediante la siguiente frmula:
12
dnde:
N=
n=
R =
3 N 1 (1)
KW
N N
nR
1
Sin embargo, si cuando se hace la asignacin de rangos hay observaciones empatadas, se debe hacer
una correccin a la frmula anterior como sigue:
12
2
nR
N N 1
3 N 1 (2)
KW
T
1 3
N N
dnde:
3
T t t
dnde:
t = nmero de empates en cada conjunto de rangos repetidos
Problema para explicar el procedimiento:
En un hospital, se desea probar si hay diferencias en el nivel de estrs entre enfermeras de terapia
intensiva (X1), las de ciruga (X3) y las de urgencias (X2); el nivel de estrs se midi en una escala de
0 = nada, 1 = bajo, 2 = medio, 3 = alto, 4 = muy alto, las calificaciones se muestran a continuacin:
X1
3
2
1
1
0
2
1
X2
3
3
4
4
2
2
1
X3
4
3
2
4
3
4
n1 = 7
n2 = 7
n3 = 6
R1
13
8
3.5
3.5
1
8
3.5
= 40.5
R2
13
13
18
18
8
8
3.5
= 81.5
R3
18
13
8
18
13
18
= 88
N = 20
R1 = 5.79
R2 = 11.64
R3 = 14.67
1. Para cada problema especfico se debe determinar el tipo de problema, los grupos a comparar, si
son independientes o relacionados, el nivel de medicin, la prueba estadstica que debe utilizarse
y plantear la hiptesis nula que se debe probar de acuerdo al nivel de medicin y tipo de problema
correspondiente.
Es un problema de Comparacin
3 grupos independientes
Nivel de medicin ordinal
H0: El nivel de estrs es igual entre enfermeras de terapia intensiva (grupo 1), enfermeras de
ciruga (grupo 2) y enfermeras de urgencias (grupo 3)
Prueba estadstica: Kruskal-Wallis
2. En primer lugar se debe ordenar cada calificacin como si se tratara de un solo conjunto de datos
(se juntan los datos de todos los grupos) para asignar rangos.
Valor
0
1
1
1
1
2
2
2
2
2
3
3
3
3
3
4
4
4
4
4
Rango
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
13
2 3 4 5
3.5
4
para el 2 debe considerarse que
En el caso de que existan valores
en el orden sigue es el 6:
repetidos
(llamados
tambin
6 7 8 9 10
empates), el rango que les
corresponde es igual al promedio
8
de los rangos, es decir: la suma de
5
los lugares asignados de manera
para 3, empezando con el rango secuencial entre el nmero de veces
que se repite cada nmero
11 12 13 14 15
11:
13
5
18
2a. Se considera a cada nmero repetido como un conjunto de observaciones empatadas y el nmero
de veces que se repiten es el valor t, como vemos en la tabla anterior el primer conjunto es el
correspondiente a los unos, con un rango empatado igual a 3.5, stos se repiten 4 ocasiones por lo
que le valor t para el conjunto de unos es igual a 4. Siguiendo este procedimiento, t para el rango
8 correspondiente a la calificacin 2 es 5, despus el del rango 13 de la puntuacin igual a 3 es 5
y finalmente el rango 18 para los 4 tiene un valor t igual a 5.
Se pueden resumir estos datos, obtener el valor de T y
Conjunto
t
1 (3.5)
4
2 (8)
5
T , como sigue:
3 (13)
5
4 (18)
5
t3
3
T t t
64
60
125
120
125
120
125
120
= 420
12
2
7 11.64 614.67 320 1
5.79
KW 2020 1
2
2
420
3
1
20 20
12
KW 2021
1
420
1
8000 20
12
234.64 948.43 1291.26 63 0.02862474.3363
KW 420
1 0.053
420
1 7980
= 8.18
5. Se debe buscar el valor crtico de KW en tabla
correspondiente, para ello se utiliza el nmero
de sujetos de cada grupo y se selecciona el valor
crtico de acuerdo al nivel de significancia que
se desea utilizar. Sin embargo la tabla no es til
cuando se tiene un grupo con ms de 5 casos o
se comparan ms de tres grupos. En este caso se
debe utilizar la tabla de valores crticos de Chi
cuadrada (ver pgina 35) pues podemos asumir
que la distribucin es similar a la de chi
cuadrada. Para esta tabla se necesitan calcular
los grados de libertad con gl = k 1, donde k es
el nmero de grupos y establecer el nivel de
significancia deseado para probar la hiptesis
nula. La regla de decisin es: si el valor
obtenido es mayor o igual al de tabla, se debe
rechazar la H0.
En este ejemplo se tienen ms de 5 sujetos en
todos los grupos por lo que se debe buscar el
2
valor crtico en la tabla de X con gl = 3 - 1 = 2
y el nivel de significancia establecido para
probar la hiptesis nula.
70.77 63
0.95
7.77
0.95
0.05
4.71
5.14
5.36
5.60
5.33
5.21
5.44
5.73
0.01
5
5
5
3
5
5
4
5
5
5
Muestras grandes
5.34
5.71
5.64
5.78
5.99
7.27
7.54
7.77
7.98
9.21
7.20
6.44
6.75
El valor en la tabla de chi cuadrada al nivel de significancia de 0.05 es igual a 5.991. KW obtenida
es igual a 8.18, mayor a la de tabla por lo que se rechaza la H0, entonces: el nivel de estrs es
igual entre enfermeras de terapia intensiva, enfermeras de ciruga y enfermeras de urgencias.
5a. Si se tienen 5 casos o menos en todos los grupos, se debe usar la tabla de valores crticos para KW
para rechazar o aceptar la H0, el nmero de casos de cada grupo sirve para obtener el valor en la
tabla al nivel de significancia deseado. La regla de decisin es: si el valor obtenido es mayor o
igual al de tabla, se debe rechazar la H0.
Aunque en nuestro ejemplo tenemos ms de cinco casos por grupo, podemos utilizar la tabla
utilizando el valor para muestras grandes, ya que se estn comparando slo tres grupos, en sta
encontramos, al nivel de significancia de 0.05, un valor de KW de 5.99, que es igual al de la tabla
de chi cuadrada. Al comparar KW obtenida (8.18), encontramos que es mayor al valor de tabla,
por lo que se rechaza la hiptesis nula, por lo tanto: el nivel de estrs es igual entre enfermeras de
terapia intensiva, enfermeras de ciruga y enfermeras de urgencias.
Comparaciones mltiples entre tratamientos
Cuando se ha determinado que existen diferencias significativas entre los grupos, se debe especificar
dnde se encuentran las diferencias, para ello se analizan los grupos por pares, se calcula el valor
absoluto de las diferencias entre los promedios de rangos de cada comparacin posible, en este caso
son 3: grupo 1 vs. grupo 2, grupo 1 vs. grupo 3 y grupo 2 vs. grupo 3. El nmero de comparaciones
por hacer est determinado por:
k k 1 33 1 32 6
3
#c
2
2
2
2
donde k es el nmero de grupos a comparar (3 para el presente ejemplo)
Las diferencias entre los promedios de los rangos para las tres comparaciones son:
R1 R2 5.79 -11.64 - 5.85 5.85
R1 R3 5.79 -14.67 - 8.88 8.88
R2 R3 11.64
- 3.03 3.03
-14.67
Para probar la hiptesis nula de que el nivel de estrs es igual entre cada pareja de grupos a comparar,
debe calcularse el valor crtico de la diferencia con la siguiente frmula, que debe evaluarse para cada
pareja de grupos comparada:
1
Valores crticos de z para el nmero
z / k k 1 N N
1 1
n
hiptesis bidireccional
12
n
v
u
donde:
2.690
Para cada comparacin la hiptesis a probar es si el nivel de estrs es igual entre los dos grupos
comparados. La regla de decisin es: si la diferencia encontrada entre los grupos comparados es
mayor o igual al valor crtico calculado se rechaza la hiptesis nula.
Sustituyendo en la frmula para obtener el valor crtico de la diferencia entre los promedios de rangos
de los grupos 1 y 2 es el siguiente, se prueba la hiptesis nula de que el nivel de estrs es igual entre
2021
el grupo 1 y 2:
2020
0.143
0.143
2.394
1 1 1
2.394
0.2862.394 350.286
2.394
12
420
2.394
12
12
7 7
10.01 2.3943.1647.58
Para las diferencias entre el grupo 1 y 3, as como para las del 2 y 3, se usa el mismo valor crtico ya
que nu es igual a 7 y nv es igual a 6 para ambas comparaciones, las hiptesis nulas son: Md1 = Md2 y
2021
420
Md2 = Md3:
2020
0.143
0.312.394
0.167
2.394
1 1 1
2.394
350.31
2.394
12
12
2.39
10.85 2.3943.2947.89
4
12
7 6
Como se puede apreciar, slo la diferencia de los promedios de los rangos entre el grupo 1 y el grupo
3 (8.88) es mayor al valor crtico de la diferencia para la comparacin entre esos grupos (7.89), por lo
que podemos decir que el nivel de estrs es diferente entre estos grupos. Las diferencias encontradas
en la prueba de Kruskal-Wallis son debidas a este resultado.
La prueba de Kruskal-Wallis en el paquete estadstico SPSS se encuentra en Analizar / Pruebas
no paramtricas / k muestras independientes, los resultados para el ejemplo anterior seran los
siguientes:
Prueba de Kruskal-Wallis
Rangos
Nivel de estrs
Grupo
Enfermeras de terapia
intensiva
Enfermeras de ciruga
Enfermeras de
emergencias
Total
Estadsticos de contrastea,b
Chi-cuadrado
gl
Sig. asintt.
Nivel de
estrs
8.109
2
.017
a. Prueba de Kruskal-Wallis
b. Variable de agrupacin: Grupo
Rango
promedio
N
7
5.79
11.64
14.67
20
En
prim
er
lugar
, se
prese
ntan
los
grup
os
comp
arado
s,
con
el
nme
Nota: Las comparaciones mltiples se pueden hacer mediante U de Mann Whitney, pero se debe
recordar ajustar el nivel de significancia que se obtenga en el anlisis, multiplicndolo por el
nmero de grupos menos 1: (k 1), si el nivel de significancia despus de este ajuste, es menor
a 0.05 se rechazar la hiptesis nula de la comparacin correspondiente.
Reporte de resultados de la prueba de Kruskal-Wallis
Para esta prueba se puede utilizar una grfica de barras con las medianas, aunque se puede utilizar la
media rango, obtenida de dividir la suma de rangos de cada grupo entre la cantidad de casos en el
grupo, aunque este dato es de difcil interpretacin. Se deben mencionar los valores de la prueba
estadstica y el nivel de significancia con que se est rechazando, o aceptando, la hiptesis nula. Se
puede poner el valor de probabilidad obtenido o simplemente decir que es menor, o mayor, al valor
que hayamos elegido para la prueba de hiptesis. Adems se
Nivel de Estrs entre Enfermeras de
debe describir la conclusin a la que se llega. Por ejemplo:
3.5
3
2.5
2
1.5
1
0.5
0
3.5
3
Terapia
intensiva
Ciruga
Urgencias
* X2 = 8.109, gl = 1, p = 0.17
12
Fr
Nk k
R
dnde:
1
N = nmero total de casos
k=
nmero de mediciones
R = suma de rangos de cada medicin
3N k 1 (1)
Sin embargo, si cuando se hace la asignacin de rangos hay observaciones empatadas, se debe hacer
una correccin a la frmula anterior como sigue:
2
2
2
12R 3N k k 1
(2)
Fr
3
Nk
Nk k
k 1
1
dnde:
t = nmero de empates en cada conjunto de rangos iguales por cada sujeto, se incluyen los
conjuntos con rangos nicos (empates = 1).
Problema para explicar el procedimiento:
Se desea probar si hay diferencias en el nivel de estrs laboral en trabajadores de una empresa antes y
despus de un taller sobre manejo del estrs en el trabajo, adems se realiz medicin de seguimiento
un mes despus de finalizado taller; el nivel de estrs se midi en una escala de 0 = nada, 1 = bajo, 2
= medio, 3 = alto, 4 = muy alto, las calificaciones se muestran a continuacin:
X
3
3
2
4
3
3
1
Y
2
1
1
2
1
0
2
N=7
Z
3
2
1
2
2
1
4
= 633.5
1. Para cada problema especfico se debe determinar el tipo de problema, los grupos a comparar, si
son independientes o relacionados, el nivel de medicin, la prueba estadstica que debe utilizarse
y plantear la hiptesis nula que se debe probar de acuerdo al nivel de medicin y tipo de problema
correspondiente.
Es un problema de Comparacin
3 grupos relacionados
Nivel de medicin ordinal
H0: El nivel de estrs laboral en trabajadores es igual antes del taller para el manejo del
estrs en el trabajo, despus del taller y en el seguimiento.
Prueba estadstica: Friedman
2. Se deben ordenar los datos observados de las mediciones por sujeto y asignar un rango a cada
calificacin:
Sujeto
1
2
3
4
5
6
7
2
1
1
2
1
0
1
3
2
1
2
2
1
2
3
3
2
4
3
3
4
Sujeto
1
2
3
4
5
6
7
1
1
1.5
1.5
1
1
1
2.5
2
1.5
1.5
2
2
2
2.5
3
3
3
3
3
3
Para los datos del presente ejercicio se tienen 3 mediciones por lo que el rango mnimo por
asignar a las calificaciones por sujeto es 1 y el mximo es el 3. Sin embargo, cuando existen
observaciones repetidas (empates), el rango que les corresponde es igual al promedio de los
rangos, es decir: la suma de los lugares asignados de manera secuencial entre el nmero de veces
que se repite cada nmero, por ejemplo: para el sujeto 1 existe un empate con el 3 que se repite 2
veces en las posiciones 2 y 3 por lo que el rango debe ser: 2 3 2.5 ; para el tercer sujeto el 1 se
2
repite 2 ocasiones en los lugares 1 y 2, el rango correspondiente debe calcularse como sigue:
1 2
1.5 . Finalmente para el cuarto caso el 2 se repite 2 ocasiones en las posiciones 1 y 2, el
2
1 2
rango correspondiente es:
1.5 (estos son los rangos sombreados en la tabla de arriba).
2
2a. Se considera a cada nmero repetido como observaciones empatadas y el nmero de veces que se
repiten es el valor t, que representa un conjunto de empates por sujeto: el primer conjunto es el
del rango 2.5 del caso 1, que se repite 2 veces, por lo que para este conjunto t es igual a 2; el
segundo conjunto es el correspondiente al rango empatado igual a 1.5 del sujeto 3, que se repite 2
veces, por lo que t para este conjunto es igual a 2 y el tercer conjunto es el correspondiente al
sujeto 4 en el rango 1.5, que se repite 2 veces, con un valor t igual a 2. Es decir, existen tres
conjuntos de empates, cada uno con t igual a 2.
Para esta prueba es necesario considerar adems a todos los rangos no repetidos como un
conjunto con t igual a 1, pues se deben incluir en el ajuste de la frmula.
= 39
3. Una vez obtenidos los rangos, se deben colocar en la columna correspondiente a rangos para X, Y
y Z considerando la posicin original, antes del ordenamiento, de las calificaciones por sujeto. Por
ejemplo, para el sujeto 1: la calificacin en X es 3 y el rango asignado a X para este sujeto es 2.5,
la calificacin en Y es 2 y el rango asignado a Y es 1, finalmente la calificacin en Z es 3 y el
rango asignado a Z para este sujeto es 2.5. Esto debe hacerse para cada caso.
4. Teniendo acomodados los rangos, stos se deben sumar por columna, es decir para cada medicin
2
2
2
( RX ,
y RZ ) y elevar esas sumas al cuadrado ( R X RY RZ ).
RY
,
y
5. A continuacin debe calcularse el valor de
Friedman, si no hubo rangos empatados se debe
utilizar la frmula (1) y si hay rangos empatados,
como es el caso del presente ejercicio, la frmula
(2):
12633.5 372 33 12
Fr
733 1
73 39
3 1
2
7602 34934
21 39
7 34
2
7602
7602 7056 546
7.28
349316
75
84 9
18
84 2
k
3
N
3
4
5
6
7
8
9
10
11
12
13
0.05
6.00
6.50
6.40
7.00
7.14
6.25
6.22
6.20
6.54
6.17
6.00
0.01
8.00
8.40
9.00
8.86
9.00
8.67
9.60
8.91
8.67
9.39
35) para encontrar el valor crtico para probar la hiptesis nula. Los grados de libertad se calculan
con: gl = k 1, donde k es el nmero de mediciones. La regla de decisin es: si el valor
obtenido es mayor o igual al de tabla, se debe rechazar la H0.
RY
vs. RZ y
RY
k k 1 33 1 32
2
2
2
2
donde k es el nmero de mediciones (3 para el presente ejemplo)
733
1
6
84
2.394 2.394
6
14
2.3943.7428.958
Nmero de
comaparaciones (#c)
1
2
3
4
5
6
0.05
1.960
2.241
2.394
2.498
2.576
2.638
Pruebas no paramtricas
Rangos
Rango
promedio
En Nivel
primer
lugar,
se presentan los rangos promedio, que se obtienen de dividir la suma de rangos
de estrs
antes
entredellaPrograma
cantidad de casos. 2.64
Nivel de estrs
despues del Programa
Nivel de estrs en el
seguimiento
a. Prueba de
Friedman
2.07
Estadsticos de
contrastea
N
Chi-cuadrado
gl
Sig. asintt.
1.29
7
7.280
2
.026
En este ejemplo es de 0.026, menor a 0.05, por lo que se rechaza la hiptesis nula y debemos concluir
que: el nivel de estrs laboral de los trabajadores es diferente antes del taller para el manejo del estrs
en el trabajo, despus del taller y en el seguimiento.
Nota: Las comparaciones mltiples se pueden hacer mediante la prueba de Wilcoxon, pero se debe
recordar ajustar el nivel de significancia que se obtenga en el anlisis, multiplicndolo por el
nmero de mediciones menos 1: (k 1), si el nivel de significancia, despus de este ajuste, es
menor a 0.05 se rechazar la hiptesis nula de la comparacin correspondiente.
Reporte de resultados de la prueba de Friedman
Para esta prueba se puede utilizar una grfica de barras o lneas (ms adecuada para ver variaciones
entre mediciones) con las medianas, aunque se puede utilizar la media rango, obtenida de dividir la
suma de rangos en cada medicin entre la cantidad de sujetos, aunque este dato es de difcil
interpretacin. Se deben mencionar los valores de la prueba estadstica y el nivel de significancia con
que se est rechazando, o aceptando, la hiptesis nula. Se puede poner el valor de probabilidad
obtenido o simplemente decir que es menor, o mayor, al valor que hayamos elegido para la prueba de
hiptesis. Adems se debe escribir la conclusin a la que se llega. Por ejemplo:
4
3
2
1
1
0
Estrs
laboral
antes
del
taller
Estrs
laboral
despus
del taller
Seguimiento
* X2 = 7.28, gl = 2, p = 0.026
Prueba Q de Cochran
La prueba Q de Cochran es una prueba no paramtrica de comparacin de tres o ms muestras
relacionadas:
Es libre de la curva normal, se ajusta a la distribucin de Chi cuadrada
Nivel nominal (slo variables dicotmicas) de la variable dependiente
Se utiliza para comparar tres o ms grupos relacionados de proporciones y determinar que las
diferencias no se deban al azar (que las diferencias sean estadsticamente significativas).
La formula para calcular la Q de Cochran es la siguiente:
Q
dnde:
L=
G=
k=
k 1k G 2 G2
k L L
G X2 169
GY 169
GZ 9
L
2
347
Es un problema de Comparacin
3 grupos relacionados
Nivel de medicin de la variable dependiente: nominal (dicotmica)
H0: La proporcin de usuarios de drogas es igual al finalizar el programa para eliminar el
consumo y en los seguimientos a 3 y 6 meses.
Prueba estadstica: Q de Cochran
1. En primer lugar deben contarse los aciertos por sujeto (L), es decir, cuntos unos hay por rengln,
2
y elevar L al cuadrado (L )
2
2. Sumar L y L ( L .y
4. Sumar G y G ( G .y
Nota: La
L y de G
5. Calcular la Q
3 1 3347 29 2
Q
329 63
23347841 21041-841
2200
87 - 63
24
400
24
24
16.667
6. Se tiene que encontrar el valor crtico en la tabla de valores crticos de Chi cuadrada (ver pgina
35) ya que la distribucin de esta prueba es similar a la de chi cuadrada, para ellos se tienen que
calcular los grados de libertad que se van a utilizar en la tabla con: gl = k 1, donde k es el
nmero de mediciones, adems de elegir el nivel de significancia para probar la hiptesis nula. La
regla de decisin establece que: si el valor de Q es mayor o igual al valor de la tabla se debe
rechazar la hiptesis nula.
En la tabla, al nivel de significancia de 0.05, con gl = 3 - 1 = 2 para el presente ejemplo, se tiene
un valor igual a 5.991. Q es igual a 16.667, mayor al valor de tabla, por lo que se rechaza la H0,
entonces: la proporcin de usuarios de drogas es diferente al finalizar el programa para eliminar el
consumo y en los seguimientos a 3 y 6 meses.
Q de Cochran en el paquete SPSS
En el paquete estadstico se tiene la prueba Q de Cochran est en Analizar / Pruebas no
paramtricas / k muestras relacionadas. Se presentan resultados como los siguientes:
Pruebas no paramtricas
Prueba de Cochran
Frecuencias
Valor
0frecuencia
1 de
5
13
5
13
15
3
Estadsticos de contraste
N
18
Q de Cochran
16.667a
gl
Sig. asintt.
.000
a. 0 se trata como un
xito.
72.2
72.2
60
% 40
20
16.7
Final del
programa
2
Seguimiento 3
meses
Seguimiento 6
meses
* X = 16.667, gl = 2, p = 0.000
Pruebas de Asociacin
La correlacin refleja si existe relacin o asociacin entre dos variables, no se habla de causalidad por
lo que no hay una variable dependiente y una independiente, aunque puede suceder que una variable
sea antecedente de otra.
El coeficiente de correlacin puede adquirir valores de 1 a 1, incluyendo el cero, sus caractersticas
son:
El signo indica el sentido de la relacin, una correlacin negativa representa una asociacin
inversamente proporcional, es decir, a medida que una variable se incrementa, la otra
disminuye; por otro lado, en una correlacin positiva o directamente proporcional, a medida
que aumenta una, la otra tambin se incrementa.
La magnitud de la relacin esta dada por el valor del coeficiente y se interpreta como sigue:
de 0 hasta 0.299 no hay asociacin lineal entre las variables, desde 0.3 hasta antes de 0.499 es
baja, desde 0.5 hasta antes de 0.799 es moderada y desde 0.8 a 1 hay una correlacin alta
entre las variables.
La ausencia de asociacin lineal no significa necesariamente que las variables no tengan
relacin entre s. Existen muchas variables con una correlacin de tipo curvilneo y debe ser
evaluada de otra manera.
Una forma grfica de ver la relacin entre variables son las grficas de dispersin, donde cada punto
representa el lugar en que se cruzan las calificaciones de la primer variable (X) y la segunda variable
(Y) para cada sujeto. Si se traza una lnea que cruce la mayora de los puntos se puede apreciar el tipo
de relacin (ver la siguiente figura). En las relaciones curvas, para algunas magnitudes de X, Y
incrementa, pero disminuye en otros valores de X.
Tipos de Correlacin
Directamente proporcional
Inversamente proporcional
Sin relacin
X
Correlacin curvilnea
X
Correlacin curvilnea
dnde:
N = nmero de sujetos
X, Y = calificaciones de las variables a relacionar
Problema para explicar el procedimiento para calcular la correlacin de Pearson:
Se desea saber si existe relacin entre la autoestima y la depresin en estudiantes de preparatoria.
Para ello, un investigador aplica una escala de depresin (X) en la que los estudiantes con
calificaciones ms altas tienen mayor depresin; tambin utiliza una escala de autoestima (Y) en la
que los puntajes mayores indican mayor autoestima. Los resultados se muestran a continuacin:
X
26
24
18
17
18
7
15
20
18
Y
8
12
26
29
30
31
19
18
28
X = 163
Y = 201
X 2 = 26569 Y 2 = 40401
X
676
576
324
289
324
49
225
400
324
= 3187
Y
64
144
676
841
900
961
361
324
784
= 5055
XY
208
288
468
493
540
217
285
360
504
XY = 3363
N=9
Procedimiento:
1. Se debe determinar el tipo de problema, el nivel de medicin, la prueba estadstica que debe
utilizarse y plantear la hiptesis nula que va a probar de acuerdo al nivel de medicin y tipo de
problema correspondiente.
Es un problema de Asociacin
Nivel de medicin intervalar para ambas variables
H0: No hay relacin lineal entre el puntaje de depresin y el de autoestima en estudiantes de
preparatoria.
Prueba estadstica: Correlacin Pearson
2. Se deben elevar al cuadrado los puntajes obtenidos para la primer variable (X) y los de la segunda
2
2
(Y) y escribirlos en las columnas X y Y . Multiplicar las dos calificaciones y colocar los
resultados en la columna correspondiente (XY).
3. Sumar los puntajes de las variables, as como los puntajes elevados al cuadrado de cada variable
( X y
Y 2 ).
30267 32763
28683 2656945495
- 2496
40401
21145094
- 2496
- 2496
10768716 3281.572 -0.761
gl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
0.05
.99692
.95000
.8783
.8114
.7545
.7067
.6664
.6319
.6021
.5760
.5529
.5324
5139
.1973
0.01
.999877
.990000
.95873
.91720
.8745
.8343
.7977
.7646
.7348
.7079
.6835
.6614
.6411
.6226
0.001
.9999988
.99900
.99116
.97406
.95074
.92493
.8982
.8721
.8471
.8233
.8010
Correlaciones
Correlaciones
Puntaje de depresin
Puntaje de autoestima
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Puntaje de
depresin
1.000
.
9
-.761*
.017
9
Puntaje de
autoestima
-.761*
.017
9
1.000
.
9
35
30
25
20
15
10
* r = -0.761, p = 0.017
5
0
7
15
17
18
18
18
20
24
26
Depresin
* p < 0.05
Autoestima
N 3 N 6 d 2 TX TY
2
T
rS
(2)
3
3
Y
N N TX Y
N N 2 TX
dnde:
T
T t t
3
dnde:
Procedimiento:
1. Se debe determinar el tipo de problema, el nivel de medicin, la prueba estadstica que debe
utilizarse y plantear la hiptesis nula que se va a probar de acuerdo al nivel de medicin y tipo de
problema correspondiente.
Es un problema de Asociacin
Nivel de medicin ordinal para ambas variables
H0: No hay relacin lineal entre la actitud hacia el psiclogo y la actitud hacia la
psicoterapia, en padres de familia.
Prueba estadstica: Correlacin Spearman
2. En primer lugar se deben ordenar los datos de cada variable de la calificacin menor a la mayor y
asignarles un rango:
Datos
ordenados de la
Variable 1 (X)
Rango
1
2
2
1
2
3
2
3
4
5
6
7
4
5
6
7
8
9
Datos
ordenados de la
Variable 2 (Y)
1
2
Rango
1
2
4
5
6
7
6
7
8
9
2a. Si se tuvieron observaciones empatadas, como en este caso, se debe determinar t para cada
conjunto de observaciones repetidas para cada variable por separado, t es el nmero de veces que
3
se repite cada calificacin, y T la sumatoria de t - t. Al observar los empates por variable, se tiene
para X un conjunto de observaciones repetidas en la calificacin 2 que tienen el rango 3, este se
repite 3 veces por lo que t para este conjunto es igual 3. Para la variable Y, hay dos conjuntos de
tangos empatados, uno en la calificacin 2 con rango asignado igual a 2.5, ste se repite dos veces
por lo que t para este conjunto es igual a 2; el segundo es para la calificacin 3 con rango 4.5
repetido dos veces, por lo que t para este conjunto es igual a 2.
Se pueden resumir estos datos y obtener el valor de T para cada variable como sigue:
Conjuntos
Conjuntos
2 (3)
2 (2.5)
3 (4.5)
de X
de Y
3
2
2
t
t
27
8
8
t33
t33
T = 24
TY = 12
24
6
6
t t
t t
X
Es importante considerar que, si slo una de las variables presenta rangos empatados, el valor de
T para la variable sin empates debe ser igual a 0 (T = 0).
3. Calcular la correlacin de Spearman, en este caso, como hay empates en los rangos asignados a
las variables, debe utilizarse la frmula (2):
93 9 627 24 12
2
rS
3
3
Valores crticos del coeficiente
9 92 24 129
9 2412
729 9162
36
2
540
518400 25920 288
720 162 18
7202
36720 288
540
540
492768 701.974
0.769
de correlacin de Spearman
(rS) de rangos ordenados, para
una prueba bidireccional
N
5
6
7
8
9
10
11
12
0.05
1.000
0.886
0.786
0.738
0.700
0.648
0.618
0.587
0.01
0.001
1.000
0.929
0.881
0.833
0.794
0.755
0.727
1.000
0.976
0.933
0.903
0.873
0.860
hiptesis nula.
El coeficiente en la tabla de valores crticos de correlacin Spearman, con 9 casos al 0.05 de
significancia, es igual a 0.700, el coeficiente Spearman obtenido (0.769) es mayor al de tabla por
lo que se rechaza la hiptesis nula, entonces: existe relacin lineal entre la actitud hacia el
psiclogo y la actitud hacia la psicoterapia, en padres de familia.
Esta relacin es moderada (est en el rango entre 0.5 y 0.8) y directamente proporcional (tiene
signo positivo).
Muestras grandes
Cuando la cantidad de sujetos llega a 20 casos y ms, se puede verificar la significancia de la prueba
convirtiendo el coeficiente de correlacin a calificaciones z pues se asume que muestras grandes se
distribuyen normalmente:
z
N 1
rS
Por ejemplo, para el presente ejercicio:
z .769 9 1 .769 8 .7692.8282.175
Recurdese que la z es significativa al nivel de 0.05, cuando es mayor o igual a 1.96, por lo que la
regla de decisin es: si el valor de z es mayor o igual a 1.96 se rechaza la hiptesis nula. En
nuestro ejemplo la z (2.175) es mayor a 1.96, entonces: existe relacin lineal entre la actitud hacia el
psiclogo y la actitud hacia la psicoterapia, en padres de familia. Adems la correlacin es moderada
(est en el rango entre 0.5 y 0.8) y directamente proporcional (tiene signo positivo).
Correlaciones no paramtricas
Correlaciones
Actitud hacia
el psiclogo
Rho de Spearman
Actitud hacia la
psicoterapia
Coeficiente de
correlacin
Sig. (bilateral)
N
Coeficiente de
correlacin
Sig. (bilateral)
N
1.000
.
9
.769*
.015
9
Actitud hacia
la
psicoterapia
.769*
.015
9
1.000
.
9
A+B
C+D
A+C
B+D
Total
80
30
110
21
30
Total
89
51
N = 140
Procedimiento:
1. Se debe determinar el tipo de problema, el nivel de medicin, la prueba estadstica que debe
utilizarse y plantear la hiptesis nula que va a ser probada de acuerdo al nivel de medicin y tipo
de problema correspondiente.
Es un problema de Asociacin
Nivel de medicin nominal (dicotmico) para ambas variables
H0: No hay relacin entre el consumo de alcohol del padre y el consumo de alcohol de
estudiantes de preparatoria.
Prueba estadstica: Correlacin Phi
2. Se tiene que organizar la informacin en una tabla de contingencia de dos por dos y obtener los
totales por rengln y por columna (A + B, C + D, A + C y B + D).
3. Calcular la correlacin Phi:
930 8021
r
110308951
270 1680
-1410
1410
0.364 14978700
3870.233 3870.233
4. El coeficiente Phi est relacionado con la prueba de Chi cuadrada, por esa razn debe calcularse
la Chi cuadrada de 2 x 2 (frmula de la pgina 35) y comparar el resultado con la tabla de valores
crticos que se encuentra en la misma pgina, la regla de decisin para rechazar la hiptesis
nula al depender de la prueba de Chi cuadrada es: si se rechaza la H0 relacionada con la
prueba de Chi cuadrada, tambin debe ser rechazada la hiptesis nula de la correlacin Phi.
4a. Calcular la chi cuadrada:
140 80
X
9
21 30
11030895
1
140
2
2
1401680
70 - 270
14978700
14021340 140179560
0
14978700
14978700
251384000
2
X 14978700 16.783
Recurdese que se tiene que comparar la Chi cuadrada obtenida con el valor de tabla de valores
crticos de Chi cuadrada (ver la tabla en la pgina 35), este valor se busca utilizando un grado de
libertad y el nivel de significancia elegido para probar la hiptesis nula. La regla de decisin es:
2
si el valor de X obtenido es mayor o igual al de tabla se rechaza la hiptesis nula.
2
Con 1 grado de libertad al nivel de significancia de 0.05 se tiene un valor de X en tabla de 3.841,
2
el valor obtenido de X (16.783) es mayor al de tabla por lo que se rechaza la hiptesis nula, por
lo tanto la hiptesis nula de la prueba Phi se rechaza tambin, entonces: existe relacin entre el
consumo de alcohol del padre y el consumo de alcohol de estudiantes de preparatoria. Adems
esta relacin es baja (est en el rango de 0.3 a 0.5) y directamente proporcional (tiene signo
positivo).
La correlacin Phi en el paquete SPSS
En el paquete estadstico la Phi se encuentra en Analizar / Estadsticos descriptivos / Tablas de
contingencia, no es tan importante determinar cul de las variables va en las columnas y cul en los
renglones ya que no hay variable dependiente e independiente. Se debe elegir en la seccin de
estadsticas la Phi. Se presentan resultados como los siguientes:
Tablas de contingencia
Tabla de contingencia Consumo de alcohol del estudiante * Consumo de
alcohol del padre
Recuento
Medidas simtricas
Nominal por
nominal
Phi
V de Cramer
N de casos vlidos
Valor
.364
.364
140
Sig.
aproximada
.000
.000
Consumo de
Alcohol del
Padre
Consumo de
r = 0.364*
* p < 0.001
Alcohol de
Estudiantes de
Preparatoria
Referencias Bibliogrficas
Brown, F. G. (2000, 1ra. ed.). Principios de la medicin en psicologa y educacin. Mxico: El
Manual Moderno.
Daniel, W. (1999). Bioestadstica. Bases para el anlisis de las ciencias de la salud. Mxico: Ed.
Noriega.
Downie, M. y Heath, R. (1973). Mtodos estadsticos aplicados. Mxico: Harper & Row
Latinoamericana.
Ferrn, M. (1996). SPSS para Windows: Programacin y anlisis estadstico. Madrid: Mc Graw Hill.
Levin, J (1979, 2da. ed.). Fundamentos de estadstica en la investigacin social. Mxico: Editorial
Harla.
Ritchey, F. J. (2002). Estadstica para las Ciencias Sociales: El Potencial de la Imaginacin
Estadstica. Mxico: Mc Graw Hill.
Paquete Estadstico para las Ciencias Sociales (SPSS) para Windows versin 10.0.7 en espaol
[Software de computadora]. (2000). Chicago, E. U.: SPSS, Inc.
Siegel, S. (1990, 3ra. ed.). Estadstica no Paramtrica. Editorial Trillas. Mxico.
Consumo de alcohol
del estudiante
Total
No bebedor
Bebedor
Total
110
30
140