Anda di halaman 1dari 17

Anlisis Descriptivos y uso

Herramientas de Anlisis
SEMANA 4 de

[ MTODOS CUANTITATIVOS DE PSICOLOGA ]


MTODO CUANTITATIVO

NDICE

NCLEO TEMTICO 2. ANLISIS DESCRIPTIVOS Y USO DE HERRAMIENTAS DE ANLISIS ......... 2


Objetivos 2
Contenido 2
ANLISIS DESCRIPTIVOS 2
Medidas de tendencia central 3
Medidas de dispersin 3
Pasos para calcular medidas de tendencia central y dispersin en SPSS 5
Frecuencias y distribuciones 8
Graficacin de los datos 10
Distribucin normal 16

ANALISIS DESCRIPTIVOS Y USO DE HERRAMIENTAS DE ANLISIS

Objetivos
-Aprender a analizar descriptivamente los datos numricos

Contenido
- Distribuciones de frecuencia
- Medidas de tendencia central
- Medidas de variabilidad.

ANLISIS DESCRIPTIVOS
La estadstica resulta til para los anlisis psicolgicos ya que nos permite tanto describir como
inferir a partir de un conjunto de informacin recopilada. Existen dos tipos de anlisis
estadsticos: los descriptivos y los inferenciales. En esta ocasin nos centraremos en los anlisis
descriptivos.

Los anlisis descriptivos me permiten, como su nombre lo indica, describir un conjunto de


datos. En ese sentido, esta estadstica est relacionada con el ordenamiento u organizacin de
los datos, ya sea a travs del informe de porcentajes o, en mayor medida, de la tendencia de los
datos o de la dispersin de los mismos. Comenzaremos con las medidas de tendencia.

Medidas de tendencia central


Existen distintas medidas de tendencia. Para este mdulo hablaremos de tres de ellas: la media,
la mediana y la moda.

La media, o promedio, o media aritmtica, es la medida de proporcin que se obtiene al sumar


un conjunto de datos y dividirlos por el nmero de datos. Es, en ese sentido, el punto
intermedio exacto de todos los valores combinados. Veamos esto con un ejemplo:

Si llego a tener este conjunto de datos:

2, 5, 7, 8, 3, 7,

La media se calcular sumando esos valores 2 + 5 + 7 +8 +3 +7 y dividindolos por el nmero de


datos (n = 6). El resultado en este caso es 5,33.

As, la frmula que identifica la media es:


!
! =
!
x : 5,33

La mediana, informa del valor central de un conjunto de datos. El paso para calcularla depende
de que los datos estn ordenados ascendentemente. As, en el ejemplo anterior, tendramos
que ordenar los datos de la siguiente manera:

2, 3, 5, 7, 7, 8.

En este ejemplo no hay un solo dato en la mitad sino dos, el 5 y el 7. Cuando esto sucede
(porque el nmero de datos es par) se toman estos datos y se calcula su promedio (5 + 7 y se
divide por 2), lo cual da un valor de 6, como dato intermedio entre 5 y 7.

M : 6

La moda, es el valor que ms se repite, o el dato que tiene una mayor frecuencia de aparicin.
En el ejemplo anterior es bastante fcil ver que el dato que ms se repite es 7, por tanto, esta
sera la moda para este ejercicio.

m: 7

Medidas de dispersin
Para el investigador no slo es importante conocer hacia dnde tienden los datos sino tambin
qu tan dispersos se encuentran unos de otros. Dentro de los tipos de medida de dispersin
encontramos:


[ METODOS CUANTITATIVOS DE PSICOLOGA ] 3

Rango. Se entiende el rango como la distancia entre los valores superior e inferior de un
conjunto de datos. El clculo se consigue restndole al mayor de los datos el menor, y sumando
1. As, en el ejemplo anterior, el Rango sera:

R: (8 2) + 1 : 5.

Desviacin estndar. La mejor forma de entenderla es como un tipo de media. Es el promedio


de las distancia de separacin de todos los valores respecto al valor medio de ellos. Su frmula
es la siguiente:

(!" !)!
!" =
! 1

Varianza. sta es simplemente el cuadrado de la desviacin estndar. Su clculo se realizara


con la frmula anterior pero sin utilizar la raz cuadrada.

Manualmente podemos calcular la desviacin estndar y la varianza como sigue:

1. Calcular la media
2. Restar, a cada uno de los valores el valor de la media, para obtener la serie de
desviaciones
3. Calcular el cuadrado de cada resta
4. Sumar estas desviaciones
5. Dividir el resultado entre el nmero de datos menos 1
6. Calcular la raz de ste valor.

Miremos estos pasos con el ejemplo anterior:

2, 3, 5, 7, 7, 8

1. Sabemos que la media es 5, 33


2. Restamos a cada dato la media
a. (2 5,33) : -3,33
b. (3 5,33) : -2,33
c. (5 5,33) : - 0,33
d. (7 5,33) : 1,67
e. (7 5,33) : 1,67
f. (8 5,33) : 2,67
3. Calculamos el cuadrado de cada uno de los valores
a. (-3,33)2 : 11,08
b. (-2,33)2 : 5,43

c. (-0.33)2 : 0,1
d. (1,67)2 : 2,78
e. (1,67)2 : 2,78
f. (2,67)2 : 7,12
4. Sumamos estos valores : 29,3
5. Dividimos este valor entre (6 1) :29,3/5 : 5,85
6. Calculamos la raz de este valor : 2,42.

Este sera el valor de Sx

Para calcular la varianza simplemente elevamos este valor al cuadrado. S2: (2,42)2 :5,85

Pasos para calcular medidas de tendencia central y dispersin en SPSS


Vamos a seguir el mismo ejemplo utilizado anteriormente.

En nuestra base de SPSS vamos a insertar una variable que se llame ejemplo, desde la vista de
variables. Aqu debemos revisar que el tipo de medida aparezca como [Escalar].

Luego de ello vamos a ir a la vista de datos e incluiremos los valores utilizados en el ejercicio
anterior (2, 3, 5, 7, 7, 8). Debe quedarnos algo como esto:


[ METODOS CUANTITATIVOS DE PSICOLOGA ] 5

Vamos a seguir la siguiente secuencia:

Comando :Analizar/Estadsticos descriptivos/Frecuencias


Debe aparecernos un cuadro de dilogo como el que sigue:

Pasamos la variable ejemplo al cuadro que dice [Variables], ya sea arrastrando EJEMPLO o
simplemente seleccionando la variable y oprimiendo la flecha que aparece en la parte central
del cuadro de dilogo.

Luego de esto damos a la opcin que dice [Estadsticos]. All aparecer un cuadro de dilogo
como el que sigue, desde donde nos es posible especificar las tendencias centrales que
queremos, al igual que las medidas de dispersin. Seleccionamos entonces, para este ejercicio,
la Media y la Desviacin tpica. Damos a [Continuar] y a [Aceptar].


SPSS abrir una ventana de resultados como la que sigue, en donde informa del valor de la
media y la desviacin.


[ METODOS CUANTITATIVOS DE PSICOLOGA ] 7


Si comparamos, los valores arrojados por SPSS son exactos a los que arroja el anlisis manual de
los datos.

Frecuencias y distribuciones
Es muy probable que, con un conjunto de datos, existan algunos de ellos que se repitan en cada
uno de los casos. La frecuencia hace referencia justamente a estas repeticiones de los valores
en los datos. La distribucin es la forma en la cual los datos se encuentran repartidos en una
muestra o poblacin. Generalmente es posible representarla con una curva de distribucin o
curva normal (de la cul hablaremos ms adelante).

La distribucin de frecuencias es entonces la organizacin de la frecuencia en un cuadro que me


permite observar el nmero de veces que se repite cada dato en el conjunto de la investigacin.
A continuacin veremos los pasos en SPSS para obtener este cuadro de distribucin de
frecuencias.

Vamos a volver a la pequea base que hemos elaborado en SPSS anteriormente con los datos
de la tabla que aparece al inicio de la cartilla (base que tiene una variable de gnero y 3
variables escalares VAR1, VAR2 y VAR3, y que se encuentra anexa a este mdulo).

SPSS permite que los pasos para el anlisis se hagan tanto en la ventana de la base como en la
de resultados. Si recuerdan, cuando realizamos los pasos para el anlisis descriptivo de
frecuencia, utilizamos la siguiente cadena de comandos:

Comando: Analizar/Estadsticos descriptivos/Frecuencias

Al hacer esto, verifico que el cuadro de dialogo tenga seleccionada la opcin Mostrar tablas de
frecuencias, como aparece abajo.


Luego, selecciono las tres variables escalares: VAR1, VAR2 y VAR 3 y las paso al cuadro
[Variables:]. Selecciono el botn que dice [Estadstico] Debemos recordemos que, al ser
escalares, es posible realizar mediciones de tendencia central y dispersin sin problemas. De
preferencia vamos a tomar la media, la mediana y la moda como medidas de tendencia central,
y de dispersin la desviacin tpica, la varianza y el rango. Luego de esto damos a [Aceptar].
Debe aparecernos en la ventana de resultados un cuadro como este:


[ METODOS CUANTITATIVOS DE PSICOLOGA ] 9

All, vemos que los valores 21, 30, 45 y 50 se repiten dos veces en la VAR3. Este cuadro nos
muestra, en las columnas, tanto los valores de frecuencia o repeticin de los datos como el
valor de porcentaje, que representa el porcentaje de cada dato respecto del total de datos
(100%).

Graficacin de los datos


Una parte importante del proceso descriptivo tiene que ver con la visualizacin grfica de los
datos, ya que ello facilita su interpretacin y permite clarificarlas caractersticas de los mismos.

Podemos resumir estos grficos en: grfica de barras, barras agrupadas, grficas lineales,
histogramas, diagramas de cajas y bigotes y diagramas de dispersin.

Grfica de barra
Las grficas de barras son unos de los grficos ms comunes en los trabajos descriptivos.
Permiten representar visualmente los resmenes de las variables medidas. En el eje x
aparecern los valores categricos, de forma agrupada, mientras que en el eje y la frecuencia
o porcentaje de la variable medida.

Para entender cmo se grafican estos datos vamos a volver a nuestra base anterior en SPSS
(base que tiene una variable de gnero y 3 variables escalares VAR1, VAR2 y VAR3).

Algunos comandos permiten que, durante el procedimiento de anlisis, se tenga la opcin de la


presentacin grafica de los resultados. Vamos a explicar tanto este como el paso por fuera del
comando de anlisis.

En el ejercicio de ms arriba utilizamos la siguiente cadena de comandos:

Comando: Analizar/Estadsticos descriptivos/Frecuencias

En esta ocasin vamos a seleccionar el botn que dice [Grficos]. Aqu aparecern tres
opciones: 1. Grfico de barras, 2. De sectores y3. Histograma (el cual permite la opcin de
mostrar curva normal).

Adems, este paso permite decidir si trabajar con frecuencias, como valores del grfico, o con
porcentajes. Generalmente esta decisin depende del estudio y de lo que se quiera mostrar en
l, pero, en muchas ocasiones resulta til presentar los datos en trminos de porcentajes por
cuanto permite comparar una categora respecto a otra de un total de datos (100%).

Los grficos de barras, adems, permiten observar en detalle la distribucin de los datos, por
ello no es recomendable utilizar variables escalares para este tipo de grficos, ya que este
ejercicio me arrojara una barra por cada dato, los cuales son generalmente extensos en las
variables escalares, hecho que no aportara informacin relevante para el estudio.

Vamos a utilizar para este ejercicio la variable Gnero del ejemplo anterior. Un aspecto
importante a tener en cuenta es que esta variable es nominal. As, no pueden realizarse


10

medidas de dispersin o medidas de tendencia central. Algunos autores sugieren clculo de


modas como nica alternativa para este tipo de nivel de medida. Por ello, si se ha realizado un
anlisis previo de estas estadsticas, es importante quitar la seleccin de las medidas de
tendencia para luego s continuar con los anlisis.

Otro elemento importante para proceder es la atribucin de las categoras de las variables. Para
ello hemos de ir a la vista de variables. Si seleccionamos la casilla de valores, aparecern unos
puntos suspensivos [] le damos a esta opcin y aparecer el siguiente cuadro de dilogo de
etiquetas de valor:


En esta parte hay que asignar valores a las categoras. Como mencionaba arriba, la mejor opcin
es asignar el valor de 1 a la categora de hombres y 2 a las mujeres (aunque no hay un orden
preestablecido para esto). Lo importante es que se tenga en cuenta esta categora cuando se
pasen los datos a la variable o utilizar las categoras preestablecidas cuando se coloquen las
etiquetas. Colocamos en Valor:1 y en Etiqueta: Hombres, y damos a la opcin de aadir. Luego
colocamos el valor: 2 y en etiqueta Mujeres y damos aadir y aceptar.


[ METODOS CUANTITATIVOS DE PSICOLOGA ] 11

Hecho esto, en nuestros grficos podemos tener el siguiente grfico de barras:


Grficas lineales
Este tipo de grficas me permite describe el progreso de algn grupo. Me permite mostrar
evoluciones o cambios a lo largo del tiempo. En este caso es comn representar, en el eje x, el
valor tiempo y, en el eje y, los cambios asociados a la variable en ese sentido.

Vamos a continuar con nuestra base para ejemplificar este tipo de grfico, pero vamos a hacerlo
desde otra opcin de SPSS, utilizando el comando siguiente:

Comando: Grficos/Generador de grficos

Debe aparecer una pantalla como la siguiente:


12


En la opcin [Lneas] que aparece en la imagen en gris, me aparecern dos cuadros. Selecciono
el primero (por tratarse slo de un conjunto de datos a visualizar) y arrastro la imagen en el
cuadro que dice arrastre hasta aqu un grfico. Luego de eso el programa nos presentar un
cuadro con puntos en el eje x y en el eje y. Como el eje x indica la medida de tiempo, vamos
a seleccionar, del conjunto de variables, la variable ID, ya que esta es una variable de orden de
secuencia. En el eje y estara la variable de cambio, que para este pequeo ejemplo ser la
VAR1, y damos a la opcin de aceptar. Nos debe producir, en la ventana de resultados, una
imagen como la siguiente:


[ METODOS CUANTITATIVOS DE PSICOLOGA ] 13

Histograma
El histograma permite visualizar un conjunto de barras agrupadas que representa, cada barra,
los valores por cada categora. El total de todas las reas de las columnas representarn a toda
la muestra. Es importante notar que las barras, en el histograma, slo pueden representar
frecuencias, a diferencia del grfico de barras en donde era posible representar tambin
porcentajes.

SPSS permite adems trazar una curva para el histograma. Esta curva llega a ser importante,
como veremos ms adelante, para entender si la distribucin de los datos es o no normal.


14

Un ejemplo de este tipo de grafico quedara as:

Diagrama de cajas y bigotes


Este tipo de diagrama es til cuando se quiere representar la distribucin de un conjunto de
datos, y los extremos del mismo. Es til para conocer la distribucin de los datos respecto de la
media y para saber si existen datos que se alejan del conjunto. Generalmente estos datos
alejados estarn representados con un signo: o con un signo: *. Este tipo de grficas es muy
utilizado para comparar las medias de dos grupos. Por ejemplo:


Diagrama de dispersin
Este tipo de grafico permite visualizar, en un plano x-y, los puntos de relacin de dos variables
(x1, y1), (x2, y2),, (xn, yn). Generndose un cuadro de puntos donde es posible ver la tendencia o
dispersin de los datos. Tal grfico, como veremos ms adelante, resulta muy til para entender
las correlaciones.


[ METODOS CUANTITATIVOS DE PSICOLOGA ] 15

Distribucin normal
Otra forma importante de describir los datos tiene que ver con la distribucin normal de los
mismos. Generalmente esta se realiza a travs de la curva que vimos al hacer el histograma,
llamada tambin curva gaussiana. Esta curva representa la distribucin y tiene las siguientes
caractersticas:

1. Es simtrica alrededor del punto intermedio del eje horizontal


2. El punto en torno al cual es simtrica es el punto en el que caen la media, la mediana y la
moda
3. Las colas de la curva (asntotas) nunca tocan el eje horizontal.

Si bien, se habla de distribuciones normales, ninguna curva en realidad es perfectamente


simtrica. Si vemos el histograma de ms arriba nos daremos cuenta que su distribucin tiene
una pequea tendencia hacia la izquierda. Este tipo de distribucin resulta comn de encontrar
cuando trabajamos con datos psicolgicos.

Ahora bien, existen diferentes formas de dividir esta curva. Estas divisiones tendrn el propsito
de ubicar, en porcentaje y en dispersin, un dato especfico.

Una de las formas ms comunes para dividir una distribucin es utilizar las desviaciones
estndar como referente de un conjunto de datos. Dependiendo de la desviacin tendremos
una unidad de separacin y un porcentaje correspondiente.


16

Explicaremos esto con ms detalle.

En el ejemplo inicial:

2, 3, 5, 7, 7, 8.

La media tiene un valor de 5,33, y el valor de desviacin es de 2,42 (calculados, ambos, ms


arriba). Entre la media y el valor de desviacin habrn 2,91 unidades (calculado al restar a 5,33
2,42). Estas podrn representar nuestra primera unidad 1 (1: 2,91). Tanto por encima como por
debajo de la media. Es decir que de 2,42 a 5,33 habr una primera unidad (con un valor de
rango de 2,91). A este tipo de unidad estndar d conversin se le denominar puntuacin z.

Puntuaciones z
As, la puntuacin z o puntaje z es la puntuacin que representa el valor estndar de conversin
a partir de la desviacin, es decir, es el nmero de desviaciones estndar a las que est una
puntuacin de la media. La frmula para calcularla es la que sigue:
!" !
! =
!"
Siendo Sx la desviacin estndar.

Como les vena diciendo, esta es til como medida de identificacin o ubicacin de unos datos
respecto a un conjunto de datos ya que, a ms unidades o puntajes z est un dato, sabremos
que ese dato estar ms alejado de la media.

Con esta informacin damos por finalizada la Unidad Dos y la presentacin de los anlisis
descriptivos. En una prxima cartilla hablaremos de los anlisis inferenciales y las formas de
proceder con ellos desde SPSS.


[ METODOS CUANTITATIVOS DE PSICOLOGA ] 17

Anda mungkin juga menyukai