Herramientas de Anlisis
SEMANA 4 de
MTODO
CUANTITATIVO
NDICE
Objetivos
-Aprender
a
analizar
descriptivamente
los
datos
numricos
Contenido
- Distribuciones
de
frecuencia
- Medidas
de
tendencia
central
- Medidas
de
variabilidad.
ANLISIS
DESCRIPTIVOS
La
estadstica
resulta
til
para
los
anlisis
psicolgicos
ya
que
nos
permite
tanto
describir
como
inferir
a
partir
de
un
conjunto
de
informacin
recopilada.
Existen
dos
tipos
de
anlisis
estadsticos:
los
descriptivos
y
los
inferenciales.
En
esta
ocasin
nos
centraremos
en
los
anlisis
descriptivos.
2, 5, 7, 8, 3, 7,
La
mediana,
informa
del
valor
central
de
un
conjunto
de
datos.
El
paso
para
calcularla
depende
de
que
los
datos
estn
ordenados
ascendentemente.
As,
en
el
ejemplo
anterior,
tendramos
que
ordenar
los
datos
de
la
siguiente
manera:
2, 3, 5, 7, 7, 8.
En
este
ejemplo
no
hay
un
solo
dato
en
la
mitad
sino
dos,
el
5
y
el
7.
Cuando
esto
sucede
(porque
el
nmero
de
datos
es
par)
se
toman
estos
datos
y
se
calcula
su
promedio
(5
+
7
y
se
divide
por
2),
lo
cual
da
un
valor
de
6,
como
dato
intermedio
entre
5
y
7.
M : 6
La
moda,
es
el
valor
que
ms
se
repite,
o
el
dato
que
tiene
una
mayor
frecuencia
de
aparicin.
En
el
ejemplo
anterior
es
bastante
fcil
ver
que
el
dato
que
ms
se
repite
es
7,
por
tanto,
esta
sera
la
moda
para
este
ejercicio.
m: 7
Medidas
de
dispersin
Para
el
investigador
no
slo
es
importante
conocer
hacia
dnde
tienden
los
datos
sino
tambin
qu
tan
dispersos
se
encuentran
unos
de
otros.
Dentro
de
los
tipos
de
medida
de
dispersin
encontramos:
[ METODOS CUANTITATIVOS DE PSICOLOGA ] 3
Rango.
Se
entiende
el
rango
como
la
distancia
entre
los
valores
superior
e
inferior
de
un
conjunto
de
datos.
El
clculo
se
consigue
restndole
al
mayor
de
los
datos
el
menor,
y
sumando
1.
As,
en
el
ejemplo
anterior,
el
Rango
sera:
R: (8 2) + 1 : 5.
(!" !)!
!" =
! 1
1. Calcular
la
media
2. Restar,
a
cada
uno
de
los
valores
el
valor
de
la
media,
para
obtener
la
serie
de
desviaciones
3. Calcular
el
cuadrado
de
cada
resta
4. Sumar
estas
desviaciones
5. Dividir
el
resultado
entre
el
nmero
de
datos
menos
1
6. Calcular
la
raz
de
ste
valor.
2, 3, 5, 7, 7, 8
c. (-0.33)2
:
0,1
d. (1,67)2
:
2,78
e. (1,67)2
:
2,78
f. (2,67)2
:
7,12
4. Sumamos
estos
valores
:
29,3
5. Dividimos
este
valor
entre
(6
1)
:29,3/5
:
5,85
6. Calculamos
la
raz
de
este
valor
:
2,42.
Para calcular la varianza simplemente elevamos este valor al cuadrado. S2: (2,42)2 :5,85
En
nuestra
base
de
SPSS
vamos
a
insertar
una
variable
que
se
llame
ejemplo,
desde
la
vista
de
variables.
Aqu
debemos
revisar
que
el
tipo
de
medida
aparezca
como
[Escalar].
Luego
de
ello
vamos
a
ir
a
la
vista
de
datos
e
incluiremos
los
valores
utilizados
en
el
ejercicio
anterior
(2,
3,
5,
7,
7,
8).
Debe
quedarnos
algo
como
esto:
[ METODOS CUANTITATIVOS DE PSICOLOGA ] 5
Debe
aparecernos
un
cuadro
de
dilogo
como
el
que
sigue:
Pasamos
la
variable
ejemplo
al
cuadro
que
dice
[Variables],
ya
sea
arrastrando
EJEMPLO
o
simplemente
seleccionando
la
variable
y
oprimiendo
la
flecha
que
aparece
en
la
parte
central
del
cuadro
de
dilogo.
Luego
de
esto
damos
a
la
opcin
que
dice
[Estadsticos].
All
aparecer
un
cuadro
de
dilogo
como
el
que
sigue,
desde
donde
nos
es
posible
especificar
las
tendencias
centrales
que
queremos,
al
igual
que
las
medidas
de
dispersin.
Seleccionamos
entonces,
para
este
ejercicio,
la
Media
y
la
Desviacin
tpica.
Damos
a
[Continuar]
y
a
[Aceptar].
SPSS
abrir
una
ventana
de
resultados
como
la
que
sigue,
en
donde
informa
del
valor
de
la
media
y
la
desviacin.
[ METODOS CUANTITATIVOS DE PSICOLOGA ] 7
Si
comparamos,
los
valores
arrojados
por
SPSS
son
exactos
a
los
que
arroja
el
anlisis
manual
de
los
datos.
Frecuencias
y
distribuciones
Es
muy
probable
que,
con
un
conjunto
de
datos,
existan
algunos
de
ellos
que
se
repitan
en
cada
uno
de
los
casos.
La
frecuencia
hace
referencia
justamente
a
estas
repeticiones
de
los
valores
en
los
datos.
La
distribucin
es
la
forma
en
la
cual
los
datos
se
encuentran
repartidos
en
una
muestra
o
poblacin.
Generalmente
es
posible
representarla
con
una
curva
de
distribucin
o
curva
normal
(de
la
cul
hablaremos
ms
adelante).
Vamos
a
volver
a
la
pequea
base
que
hemos
elaborado
en
SPSS
anteriormente
con
los
datos
de
la
tabla
que
aparece
al
inicio
de
la
cartilla
(base
que
tiene
una
variable
de
gnero
y
3
variables
escalares
VAR1,
VAR2
y
VAR3,
y
que
se
encuentra
anexa
a
este
mdulo).
SPSS
permite
que
los
pasos
para
el
anlisis
se
hagan
tanto
en
la
ventana
de
la
base
como
en
la
de
resultados.
Si
recuerdan,
cuando
realizamos
los
pasos
para
el
anlisis
descriptivo
de
frecuencia,
utilizamos
la
siguiente
cadena
de
comandos:
Al
hacer
esto,
verifico
que
el
cuadro
de
dialogo
tenga
seleccionada
la
opcin
Mostrar
tablas
de
frecuencias,
como
aparece
abajo.
Luego,
selecciono
las
tres
variables
escalares:
VAR1,
VAR2
y
VAR
3
y
las
paso
al
cuadro
[Variables:].
Selecciono
el
botn
que
dice
[Estadstico]
Debemos
recordemos
que,
al
ser
escalares,
es
posible
realizar
mediciones
de
tendencia
central
y
dispersin
sin
problemas.
De
preferencia
vamos
a
tomar
la
media,
la
mediana
y
la
moda
como
medidas
de
tendencia
central,
y
de
dispersin
la
desviacin
tpica,
la
varianza
y
el
rango.
Luego
de
esto
damos
a
[Aceptar].
Debe
aparecernos
en
la
ventana
de
resultados
un
cuadro
como
este:
[ METODOS CUANTITATIVOS DE PSICOLOGA ] 9
All,
vemos
que
los
valores
21,
30,
45
y
50
se
repiten
dos
veces
en
la
VAR3.
Este
cuadro
nos
muestra,
en
las
columnas,
tanto
los
valores
de
frecuencia
o
repeticin
de
los
datos
como
el
valor
de
porcentaje,
que
representa
el
porcentaje
de
cada
dato
respecto
del
total
de
datos
(100%).
Podemos
resumir
estos
grficos
en:
grfica
de
barras,
barras
agrupadas,
grficas
lineales,
histogramas,
diagramas
de
cajas
y
bigotes
y
diagramas
de
dispersin.
Grfica
de
barra
Las
grficas
de
barras
son
unos
de
los
grficos
ms
comunes
en
los
trabajos
descriptivos.
Permiten
representar
visualmente
los
resmenes
de
las
variables
medidas.
En
el
eje
x
aparecern
los
valores
categricos,
de
forma
agrupada,
mientras
que
en
el
eje
y
la
frecuencia
o
porcentaje
de
la
variable
medida.
Para
entender
cmo
se
grafican
estos
datos
vamos
a
volver
a
nuestra
base
anterior
en
SPSS
(base
que
tiene
una
variable
de
gnero
y
3
variables
escalares
VAR1,
VAR2
y
VAR3).
En
esta
ocasin
vamos
a
seleccionar
el
botn
que
dice
[Grficos].
Aqu
aparecern
tres
opciones:
1.
Grfico
de
barras,
2.
De
sectores
y3.
Histograma
(el
cual
permite
la
opcin
de
mostrar
curva
normal).
Adems,
este
paso
permite
decidir
si
trabajar
con
frecuencias,
como
valores
del
grfico,
o
con
porcentajes.
Generalmente
esta
decisin
depende
del
estudio
y
de
lo
que
se
quiera
mostrar
en
l,
pero,
en
muchas
ocasiones
resulta
til
presentar
los
datos
en
trminos
de
porcentajes
por
cuanto
permite
comparar
una
categora
respecto
a
otra
de
un
total
de
datos
(100%).
Los
grficos
de
barras,
adems,
permiten
observar
en
detalle
la
distribucin
de
los
datos,
por
ello
no
es
recomendable
utilizar
variables
escalares
para
este
tipo
de
grficos,
ya
que
este
ejercicio
me
arrojara
una
barra
por
cada
dato,
los
cuales
son
generalmente
extensos
en
las
variables
escalares,
hecho
que
no
aportara
informacin
relevante
para
el
estudio.
Vamos
a
utilizar
para
este
ejercicio
la
variable
Gnero
del
ejemplo
anterior.
Un
aspecto
importante
a
tener
en
cuenta
es
que
esta
variable
es
nominal.
As,
no
pueden
realizarse
10
Otro
elemento
importante
para
proceder
es
la
atribucin
de
las
categoras
de
las
variables.
Para
ello
hemos
de
ir
a
la
vista
de
variables.
Si
seleccionamos
la
casilla
de
valores,
aparecern
unos
puntos
suspensivos
[]
le
damos
a
esta
opcin
y
aparecer
el
siguiente
cuadro
de
dilogo
de
etiquetas
de
valor:
En
esta
parte
hay
que
asignar
valores
a
las
categoras.
Como
mencionaba
arriba,
la
mejor
opcin
es
asignar
el
valor
de
1
a
la
categora
de
hombres
y
2
a
las
mujeres
(aunque
no
hay
un
orden
preestablecido
para
esto).
Lo
importante
es
que
se
tenga
en
cuenta
esta
categora
cuando
se
pasen
los
datos
a
la
variable
o
utilizar
las
categoras
preestablecidas
cuando
se
coloquen
las
etiquetas.
Colocamos
en
Valor:1
y
en
Etiqueta:
Hombres,
y
damos
a
la
opcin
de
aadir.
Luego
colocamos
el
valor:
2
y
en
etiqueta
Mujeres
y
damos
aadir
y
aceptar.
[ METODOS CUANTITATIVOS DE PSICOLOGA ] 11
Grficas
lineales
Este
tipo
de
grficas
me
permite
describe
el
progreso
de
algn
grupo.
Me
permite
mostrar
evoluciones
o
cambios
a
lo
largo
del
tiempo.
En
este
caso
es
comn
representar,
en
el
eje
x,
el
valor
tiempo
y,
en
el
eje
y,
los
cambios
asociados
a
la
variable
en
ese
sentido.
Vamos
a
continuar
con
nuestra
base
para
ejemplificar
este
tipo
de
grfico,
pero
vamos
a
hacerlo
desde
otra
opcin
de
SPSS,
utilizando
el
comando
siguiente:
12
En
la
opcin
[Lneas]
que
aparece
en
la
imagen
en
gris,
me
aparecern
dos
cuadros.
Selecciono
el
primero
(por
tratarse
slo
de
un
conjunto
de
datos
a
visualizar)
y
arrastro
la
imagen
en
el
cuadro
que
dice
arrastre
hasta
aqu
un
grfico.
Luego
de
eso
el
programa
nos
presentar
un
cuadro
con
puntos
en
el
eje
x
y
en
el
eje
y.
Como
el
eje
x
indica
la
medida
de
tiempo,
vamos
a
seleccionar,
del
conjunto
de
variables,
la
variable
ID,
ya
que
esta
es
una
variable
de
orden
de
secuencia.
En
el
eje
y
estara
la
variable
de
cambio,
que
para
este
pequeo
ejemplo
ser
la
VAR1,
y
damos
a
la
opcin
de
aceptar.
Nos
debe
producir,
en
la
ventana
de
resultados,
una
imagen
como
la
siguiente:
[ METODOS CUANTITATIVOS DE PSICOLOGA ] 13
Histograma
El
histograma
permite
visualizar
un
conjunto
de
barras
agrupadas
que
representa,
cada
barra,
los
valores
por
cada
categora.
El
total
de
todas
las
reas
de
las
columnas
representarn
a
toda
la
muestra.
Es
importante
notar
que
las
barras,
en
el
histograma,
slo
pueden
representar
frecuencias,
a
diferencia
del
grfico
de
barras
en
donde
era
posible
representar
tambin
porcentajes.
SPSS
permite
adems
trazar
una
curva
para
el
histograma.
Esta
curva
llega
a
ser
importante,
como
veremos
ms
adelante,
para
entender
si
la
distribucin
de
los
datos
es
o
no
normal.
14
Diagrama
de
dispersin
Este
tipo
de
grafico
permite
visualizar,
en
un
plano
x-y,
los
puntos
de
relacin
de
dos
variables
(x1,
y1),
(x2,
y2),,
(xn,
yn).
Generndose
un
cuadro
de
puntos
donde
es
posible
ver
la
tendencia
o
dispersin
de
los
datos.
Tal
grfico,
como
veremos
ms
adelante,
resulta
muy
til
para
entender
las
correlaciones.
[ METODOS CUANTITATIVOS DE PSICOLOGA ] 15
Distribucin
normal
Otra
forma
importante
de
describir
los
datos
tiene
que
ver
con
la
distribucin
normal
de
los
mismos.
Generalmente
esta
se
realiza
a
travs
de
la
curva
que
vimos
al
hacer
el
histograma,
llamada
tambin
curva
gaussiana.
Esta
curva
representa
la
distribucin
y
tiene
las
siguientes
caractersticas:
Ahora
bien,
existen
diferentes
formas
de
dividir
esta
curva.
Estas
divisiones
tendrn
el
propsito
de
ubicar,
en
porcentaje
y
en
dispersin,
un
dato
especfico.
Una
de
las
formas
ms
comunes
para
dividir
una
distribucin
es
utilizar
las
desviaciones
estndar
como
referente
de
un
conjunto
de
datos.
Dependiendo
de
la
desviacin
tendremos
una
unidad
de
separacin
y
un
porcentaje
correspondiente.
16
En el ejemplo inicial:
2, 3, 5, 7, 7, 8.
Puntuaciones
z
As,
la
puntuacin
z
o
puntaje
z
es
la
puntuacin
que
representa
el
valor
estndar
de
conversin
a
partir
de
la
desviacin,
es
decir,
es
el
nmero
de
desviaciones
estndar
a
las
que
est
una
puntuacin
de
la
media.
La
frmula
para
calcularla
es
la
que
sigue:
!" !
! =
!"
Siendo
Sx
la
desviacin
estndar.
Como
les
vena
diciendo,
esta
es
til
como
medida
de
identificacin
o
ubicacin
de
unos
datos
respecto
a
un
conjunto
de
datos
ya
que,
a
ms
unidades
o
puntajes
z
est
un
dato,
sabremos
que
ese
dato
estar
ms
alejado
de
la
media.
Con
esta
informacin
damos
por
finalizada
la
Unidad
Dos
y
la
presentacin
de
los
anlisis
descriptivos.
En
una
prxima
cartilla
hablaremos
de
los
anlisis
inferenciales
y
las
formas
de
proceder
con
ellos
desde
SPSS.
[ METODOS CUANTITATIVOS DE PSICOLOGA ] 17