Anda di halaman 1dari 42

Estadstica Bsica

en SPSS
1

Clase 2:
Presentacin de datos en la
Estadstica Descriptiva:

Juan Ignacio Venegas

Clase Anterior
2

Definicin de lo Cuantitativo
Variables: escalas de medida y niveles de medicin.
Algunos conceptos relevantes:
Poblacin y Muestra
Estadstica Descriptiva y Estadstica Inferencial.
El software SPSS.

Clase N 2
3

Presentacin de Datos en la Estadstica Descriptiva:


Tablas de frecuencia
Histogramas y grficos de barras.
Tablas de contingencia

Taller N1

Estadstica Descriptiva
4

La estadstica descriptiva puede definirse como un


mtodo para organizar y describir datos utilizando
tablas, grficos y diferentes medidas de resumen.
Todo anlisis a ser realizado a los datos va a depender
de los niveles de medicin de las variables.

Por qu ordenar los datos?


5

Permiten una
informacin.

presentacin

ms

clara

de

la

Informacin clara hace ms til el dato respecto al


origen de su generacin.
Posibilita visibilizar futuros anlisis a los datos.

Ejemplo: Percepcin de la Calidad de la Democracia


6

Contexto:
Opinin
Pblica
democrtica en Chile.

sobre

la

calidad

Encuesta aplicada por la SEGPRES a nivel nacional con


un tamao muestral de 3456 casos.
Se pregunt por el nivel de acuerdo con la siguiente
frase:
Me gusta como funciona la democracia en nuestro
pas
Alternativas de Respuesta:
(1)
(2)
(3)
(4)
(5)
(8)

Muy de Acuerdo
De Acuerdo
Ni de Acuerdo Ni en Desacuerdo
En Desacuerdo
Muy en Desacuerdo
No Se

Base de datos de esa Encuesta


7

Datos Ordenados
8

Nivel de Acuerdo con la frase:


Me gusta como funciona la democracia en nuestro pas

Muy de Acuerdo
De Acuerdo
Ni de Acuerdo Ni en Desacuerdo
En Desacuerdo
Muy en Desacuerdo
No Sabe
Total
45%
4 0%
35%
3 0%
25%
2 0%
15%
1 0%
5%
0%

Frecuencia
58
384
500
1392
1034
88
3456

Porcentaje %
1,7%
11,1%
14,5%
40,3%
29,9%
2,5%
100%

4 0 .3 %
2 9 .9 %

1 1 .1 %
1 .7 %

1 4 .5 %
2 .5 %

Distribucin de Frecuencias
9

Como se ve en el ejemplo anterior, los datos deben


presentarse de manera ordenada para que as tengan
una mayor utilidad.
Una forma de resumir y ordenar los datos es el
anlisis de la distribucin de las respuestas o anlisis
de frecuencias.
Lo anterior, puede hacerse tanto mediante tablas de
frecuencias y/o grficos.

Tabla de Frecuencia
10

Forma de presentacin de datos de una sola variable


que tabula estos en base a identificar el listado de
valores posibles de esta variable y la frecuencia en
que cada valor se da en la muestra .

Tabla de Frecuencia
11

Forma de presentacin de datos de una sola variable


que tabula estos en base a identificar el listado de
valores posibles de esta variable y la frecuencia en
que cada valor se da en la muestra.
Ej: Con qu equipo de ftbol simpatiza ms, Colo
Colo o Universidad de Chile?
Muestra:

Tabla de Frecuencia
12

Forma de presentacin de datos de una sola variable


que tabula estos en base a identificar el listado de
valores posibles de esta variable y la frecuencia en
que cada valor se da en la muestra.
Ej: Con qu equipo de ftbol simpatiza ms, Colo
Colo o Universidad de Chile?
Muestra:
Tabla de Frecuencia:
Equipo

Frecuencia

Frec. relativa

Colo Colo

6/10 = 0.6 =60%

Universidad de Chile

4/10= 0.4= 40%

Total

10

Tabla de Frecuencia
13

Es una forma simple de cuantificacin y


descripcin de datos.

72

Genera un listado que asocia cada valor de


una variable con su frecuencia.

161

151

161

x representa a las categoras de una variable


y f es el n de veces que aparece el valor en
la muestra

115

84

49

24

18

10

13

11

14

Total

862

til para variables con un nmero reducido


de categoras de respuesta.
Variables nominales u ordinales
Variable numricas
discretas de bajo
rango

Elementos de una tabla de Frecuencias


14

Frecuencias absolutas: Contabilizan el nmero de


veces que se da cada categora en la muestra.
Frecuencias relativas (porcentajes): dem, pero
dividido por el total de la muestra y multiplicado por
100
Frecuencias acumuladas: Suma de las frecuencias
relativas (Ms relevante en variables ordinales y
numricas de bajo rango).

Ejemplo Variable Ordinal


15
Encuesta CEP : Opinin sobre Nicols Eyzaguirre.

35.8% de los encuestados no conoce a N.E.


De aquellos que lo conocen, un 36,6% tienen una
opinin que no es ni negativa ni positiva de N.E .
De aquellos que lo conocen, un 25,9% de ellos opina
negativamente de N.E

Ejemplo Variable Numrica


16
Encuesta Ministerio Desarrollo Social sobre Maternidad: pregunta sobre nmero de hijos

El 27,8% de las mujeres chilenas


declara no tener hijos.

Nmero de hijos

Slo 17 de las 1517 mujeres


Vlidos
0
encuestadas tienen 8 o ms hijos.
1
El 69,5% de las encuestadas
tienen 2 o menos hijos.
El 12% de las mujeres declara
tener entre 4 y 5 hijos.
Perdidos
Total

2
3
4
5
6
7
Ocho o ms
Total
No contesta

Frecuencia
419
255
375
215
127
54
24
23
17
1509
8
1517

Porcentaje
27,6
16,8
24,7
14,2
8,4
3,6
1,6
1,5
1,1
99,5
,5
100,0

Porcentaje
vlido
27,8
16,9
24,9
14,2
8,4
3,6
1,6
1,5
1,1
100,0

Porcentaje
acumulado
27,8
44,7
69,5
83,8
92,2
95,8
97,3
98,9
100,0

Ejercicio
17

Qu porcentaje de la muestra responde 7 a esta


pregunta?
Qu porcentaje responde 3 o menos ?
Qu porcentaje responde 4 o ms?

Tablas de Frecuencias en variables Numricas


18

Se deben usar slo si son variables numricas


discretas con pocos valores como alternativas de
respuesta.

Representaciones Grficas
19

Las
distribuciones
de
frecuencias
representarse tambin grficamente.

pueden

Son representaciones visuales que permiten develar


patrones de comportamiento de las variables.
Existen diversos tipos de representaciones grficas,
cuyo uso depende del nivel de medicin de las
variables y del concepto a representar.
3 ms comunes: grfico de barras,
sectores (tarta) y histograma.

grfico de

Grfico de Barra
20

Se utiliza para graficar frecuencias de variables nominales, ordinales o numricas discretas de bajo rango.

Cada barra corresponde a una categora y la altura representa su frecuencia o porcentaje, debindose adaptar el eje.

Las barras no se tocan para simbolizar el carcter discreto de las categoras (no continuo).

Se parte desde el cero y se excluyen las categoras dejadas como perdidas.

El orden de las categoras debe tener un sentido lgico (ordinal, nominal, etc).

Ejemplo: Variable ordinal con porcentajes


21

Ms del 80% de la muestra opina que la desigualdad de ingreso en Chile ha aumentado o se ha mantenido.

Slo aproximadamente un 15% de la muestra sostiene que la desigualdad de ingreso en Chile ha disminuido
en los ltimos 10 aos.

Ejemplo: Variable numrica con frecuencias


22

En una escala de 1 a 10 respecto a la satisfaccin con la vida, 299 encuestados declaran tener un grado de
satisfaccin de 5 puntos.

124 de 1422 encuestados declaran tener un grado de satisfaccin con la vida menor a 4 en una escala de 1 a
10.

Grfico de Sectores
23

Representacin grfica de frecuencias mayormente


utilizada para variables nominales.

El rea de cada sector representa la frecuencia de cada


categora en la variable, ya sea absoluta o relativa,
siendo proporcional a esta.

Ejemplo porcentajes
24

El 73,38% de los encuestados no se identifica con ningn partido.

El partido con mayor identificacin es el PDC, con un 6,5%

Ejemplo Frecuencias
25

782 de 1307 encuestados consideran que M.B. ha actuado sin destreza y habilidad en relacin a las
presiones de instituciones, grupos y personas.

Histogramas
26

Representacin grfica utilizada para examinar visualmente el comportamiento de variables numricas continuas.

Describe una distribucin de frecuencias utilizando una grfica de barras cuya


altura es proporcional a la frecuencia que representa.

Las barras se tocan para simbolizar el carcter continuo de la variable original.

El rea que hay bajo el histograma entre dos puntos indica la cantidad
(porcentaje o frecuencia) de individuos/unidades en el intervalo.

250

200

Permite ver pautas que son difciles de observar en una simple tabla numrica.
150

100

50

20

40

60

Edad del encuestado

80

Ejemplo
27

Distribucin de niveles de alfabetizacin de 109 pases en base a la variable porcentaje de la poblacin que sabe leer.

Frec.

0 x < 20

20 x < 40

10

40 x < 60

14

60 x < 80

20

80 x 100

62

Ejemplo 2
28

La mayora de la gente tiene entre 10 y 15 aos de estudio.

Ningn encuestado no ha estudiado nada.

El mximo de aos de estudio de la muestra es 25.

Tablas de Contingencia
29

Tipo de anlisis descriptivo utilizado para examinar


relaciones entre 2 o ms variables mediante la
construccin de 1 o ms tablas.
Contingencia: depende de..
Solamente pueden ser variables de tipo nominal u
ordinal (categricas), pudindose usar variables
numricas slo si se recodifican en variables
ordinales.

Muestran el nmero de observaciones (o la


Sexo/ Pos.de
A favor de En contra
Total
proporcin
ellas)
cada
combinacin
de
Aborto
respuestas
de las categoras
de
cada variable.
Hombre
25
21
46
Mujer

33

18

51

Elementos de una Tabla de Contigencia de doble


entrada
30
Variable
Fila

Variable
Columna

Celda: interseccin de una


fila y una columna

Mrgenes: frecuencias
totales de una fila o columna
por separado

Distribucin Conjunta:
distribuciones descritas por
la frecuencia de unidades
que tiene cada combinacin
de las variables fila y
columna

Distribucin marginal:
distribuciones descritas por
los mrgenes de las filas y
columnas = tabla de una
entrada.

Distribucin
Condicional:
distribucin de la
variable
dependiente
dentro de quienes
responden una
categora en
particular de la
variable
explicativa (Aqu
hombres)

Elementos de una Tabla de Contigencia


31

Porcentaje Fila

Porcentaje Columna

Tablas de Contingenia
32

Si se utilizan porcentajes, se debe tener cuidado en la eleccin de la categora que ir en cada lugar de la tabla y si elegir porcentaje fila (la suma de los % de cada fila da 100%) o porcentaje columna (la fila de los % de cada columna da 100%).

Esto lo define el carcter independiente o explicativo de cada variable,


siendo lo habitual poner la independiente en el lugar de la fila y elegir
porcentaje fila.

Esto ltimo llevar a examinar cmo se distribuyen los porcentajes de cada


categora de la variable independiente segn las categoras de la variable
dependiente.

Tablas de Triple entrada


33

Se utilizan para examinar la asociacin entre tres


variables,
donde se construyen tablas de doble
entrada que examinan la relacin entre dos variables
categricas para cada una de las categoras de una
tercera variable.
Sirven para controlar por una tercera variable.
Sin Hijos

Con Hijos

Sexo/ Pos.
Aborto

A
favor

En
contra

Total

Sexo/ Pos.
Aborto

A
favor

En
contra

Total

Hombre

50%

50%

100%

Hombre

49%

51%

100%

Mujer

58%

42%

100%

Mujer

51%

49%

100%

El hecho que las mujeres se encuentren ms a favor del aborto que los
hombres ocurre nicamente en aquellas personas que no tienen hijos.

Aplicacin SPSS
34

Tablas de Frecuencia:

Analizar>Estadsticos descriptivos>Frecuencias

Aplicacin SPSS
35

Tablas de Frecuencia:

Mover la o las variables para las cuales se quieran obtener tablas de


frecuencias a la derecha (Variables). Asegurarse de que Mostrar tablas
Analizar>Estadsticos
descriptivos>Frecuencias
de
frecuencias est seleccionado.
Seleccionar Aceptar.

Aplicacin SPSS
36

Tabla de Frecuencia

Los resultados aparecen en una nueva ventana (visor de resultados).


Las tablas pueden copiarse (control+c) y pegarse (control+v) en Word
o Excel. En Word es posible pegar como. imagen para mantener la
estructura de la tabla. Excel mantiene las filas y columnas originales y
permite editar la tabla.

Aplicacin SPSS
37

Grficos de Barra, Grficos de Sectores e Histogramas

Analizar>Estadsticos descriptivos>Frecuencias>Grficos

Aplicacin SPSS
38

Tablas de Contingencia

Analizar>Estadsticos descriptivos>Tablas de Contingencia

Aplicacin SPSS
39

Tablas de Contingencia

Analizar>Estadsticos descriptivos>Tablas de Contingencia>Casillas

Aplicacin SPSS
40

Para el caso de la sintaxis, en vez de apretar aceptar


poner Pegar y los comandos se abrirn en un
archivo de sintaxis.
Ej:
FREQUENCIES VARIABLES=REGION
/BARCHART PERCENT
/ORDER=ANALYSIS.

Ejercicio Prctico
41

Desde la base de la encuesta CEP examinar por separado


la distribucin de frecuencias de las variables CISSP_21_C
y POSICION_POLITICA mediante las herramientas (tablas o
grficos) que le sean atingentes y concluir que sealan los
datos.
Construir una tabla de contingencia de doble entrada con
las variables CISSP_21_C y POSICION_POLITICA en base a
porcentajes y comentar sobre la asociacin entre estas dos
variables.
Examinar la relacin entre estas mismas dos variables
segn el sexo de los encuestados.

Taller N1
42

Leer instrucciones del documento en Word Taller N1


Se puede trabajar durante esta clase y aclarar dudas.
Entregar el da Jueves 21 de Abril va email al profesor
juanignacio.venegas@gmail.com y a la ayudante
catalina.tapiap@mail.udp.cl hasta las 17:00 hrs.

Anda mungkin juga menyukai