Anda di halaman 1dari 36

Universidad Alberto Hurtado

Distribuciones de Frecuencia
Tablas y Grficos

Paulina Gajardo Serrano

Sntesis de contenido

Repaso de la clase anterior:

Categorizaciones de variables

Variables cualitativas vs. variables cuantitativas


Variables y Escala de medida
Categorizacin de variables cuantitativas:
Variables discretas
Variables continuas

Estructura de una base de datos


Diccionario de datos
Bases de datos y software: Estructura en Excel y
en SPSS

VARIABLES Y ESCALAS DE
MEDIDA
En general:

Las variables que se miden en escala de


medida nominal y ordinal son clasificadas
como cualitativas (categricas)
Las variables que se miden en escala de
intervalo y de ratio son clasificadas como
cuantitativas

Variables discretas vs. continuas

Las unidades de medida de variables


discretas no pueden ser subdivididas

Las unidades de medida de variables


continuas pueden ser subdivididas sin
lmites

Matriz de datos

La informacin de variables para cada


observacin se presenta en lo que se
denomina una Matriz de Datos

Tambin se le llama Base de datos

4/15/2014

Footer Text

Frecuencias

Frecuencias Absolutas:
Cantidad de repeticiones de cada valor
observado de la variable
Se denota generalmente como ni o fi
La suma de las frecuencias absolutas es
igual al tamao de la muestra (o de la
poblacin segn sea el caso)
Valor mnimo = 0 y mximo = n

Frecuencias

Frecuencias Relativas:

Proporcin (porcentaje) que cada valor de la


variable tiene en relacin con el total de las
observaciones
Se denota generalmente por hi
La suma de todas las frecuencias
relativas es igual a 1 (o 100%)
Valor mnimo = 0 y mximo = 100
4/15/2014

Footer Text

TABLAS DE DISTRIBUCIN DE
FRECUENCIAS,
EJEMPLOS

4/15/2014

Footer Text

Tabla de distribucin de frecuencias para


EDUC
Frecuencias
Absolutas ni

Frecuencias
Relativas hi

NIVEL EDUCACIONAL
TECNICA O UNIV. COMPLETA

TEC. O UNIV. INCOMPLETA.

M.TEC COMPLETA

M.HUM. COMPLETA

M.TEC .PROF. INCOMPLETA

M.HUM. INCOMPLETA

BASICA COMPL.

BASICA INCOM.

SIN EDUC. FORMAL

Rec uento

Grfico de Barras (EDUC)

30

Las barra s mu estran frecuenci as

20

10

Tabla de Distribucin de Frecuencias para Ingreso


Autnomo Individual (1)
Frecuencia
Vlidos

Perdidos
Total

Porcentaje

494
988
6667
25000
29290
35000
39520
50000
50500
50670
78820

1
1
1
1
1
1
2
1
1
1
1

0,5
0,5
0,5
0,5
0,5
0,5
1
0,5
0,5
0,5
0,5

5226750
8255160
10251675
Total
Sistema

1
1
1
96
104
200

0,5
0,5
0,5
48
52
100

Porcentaje
vlido
1,0
1,0
1,0
1,0
1,0
1,0
2,1
1,0
1,0
1,0
1,0

Porcentaje
acumulado
1,0
2,1
3,1
4,2
5,2
6,3
8,3
9,4
10,4
11,5
12,5

1,0
1,0
1,0
100,0

97,9
99,0
100,0

Tabla de Distribucin de Frecuencias para Ingreso


Autnomo Individual (2)
Intervalos de Ingreso autnomo

Vlidos

Perdidos
Total

0-100.000
100.001-200.000
200.001-300.000
300.001-400.000
400.001-500.000
500.001-600.000
600.001-700.000
900.001-1.000.000
1.000.000 y ms
Total
Sistema

Frecuencia
22
35
17
5
4
1
2
1
9
96
104
200

Porcentaje
11,0
17,5
8,5
2,5
2,0
,5
1,0
,5
4,5
48,0
52,0
100,0

Porcentaje
vlido
22,9
36,5
17,7
5,2
4,2
1,0
2,1
1,0
9,4
100,0

Porcentaje
acumulado
22,9
59,4
77,1
82,3
86,5
87,5
89,6
90,6
100,0

Histograma para Ingreso Autnomo


Individual

Recuento

75

50

25

0
250 0000

500 0000

750 0000

Ingreso Autnomo

100 00000

Resumiendo:
Para variables continuas con muchos valores

Las tablas de distribucin de frecuencias y los grficos de


barra funcionan mejor para una pequea cantidad de
valores observados de la variable (variables en escalas de
medida nominal, ordinal o variables discretas).

Cuando los valores son muchos (especialmente en el caso


de variables continuas) se necesitan modificaciones

Solucin: resumir la informacin para valores de la


variables agrupados
Tablas de distribucin de frecuencias con intervalos
Histogramas en lugar de grficos de barras

Tablas de contingencia
Dos o ms variables en una sola tabla
Frecuencias absolutas (n)
Frecuencias relativas (%)

En relacin con el total


Por fila
Por columna

Al cruzar una variable con n categoras


en las filas y m categoras en las
columnas se crean n*m subcategoras

Pobreza vs. educacin


Frecuencias ABSOLUTAS
Pobres
no
extremos

Nivel educacional y nivel de pobreza


Sin Educ. Formal
3
Bsica Incom.
3
Bsica Compl.
1
M. Hum. Incompleta
2
M. Tc. Prof. Incompleta
0
M. Hum. Completa
3
M. Tc Completa
0
Tcnico Nivel Superior o Profesional Incompleta 2
Tcnico Nivel Superior o Profesional Completa 0
Total
14

No
pobres

Total

9
17
14
19
2
14
3
11
9
98

12
20
15
21
2
17
3
13
9
112

Presenta las cantidades en cifras absolutas (18 subcategoras)

Qu tipo de anlisis permite efectuar directamente (sin ningn cambio adicional) y cuales
no?

Pobreza vs. educacin


Frecuencias relativas (totales)
Pobres
no
extremos
Sin Educ. Formal
2,7%
Bsica Incom.
2,7%
Bsica Compl.
0,9%
M. Hum. Incompleta
1,8%
M. Tc. Prof. Incompleta
0,0%
M. Hum. Completa
2,7%
M. Tc Completa
0,0%
Tcnico Nivel Superior o Profesional Incompleta
1,8%
Tcnico Nivel Superior o Profesional Completa 0,0%
Total
12,5%

No
pobres

Total

8,0%
15,2%
12,5%
17,0%
1,8%
12,5%
2,7%
9,8%
8,0%
87,5%

10,7%
17,9%
13,4%
18,8%
1,8%
15,2%
2,7%
11,6%
8,0%
100,0%

Presenta cantidades en porcentaje

Proporciona la importancia relativa de cada subcategora en relacin con el total de


observaciones

Qu tipo de anlisis permite efectuar directamente (sin ningn cambio adicional) y cuales no?

Pobreza vs. educacin


Frecuencias relativas (filas =100)
Pobres
no
extremos
Sin Educ. Formal
25,0%
Bsica Incom.
15,0%
Bsica Compl.
6,7%
M. Hum. Incompleta
9,5%
M. Tc. Prof. Incompleta
0,0%
M. Hum. Completa
17,6%
M. Tc Completa
0,0%
Tcnico Nivel Superior o Profesional Incompleta
15,4%
Tcnico Nivel Superior o Profesional Completa 0,0%
Total
12,5%

No
pobres

Total

75,0%
85,0%
93,3%
90,5%
100,0%
82,4%
100,0%
84,6%
100,0%
87,5%

100,0%
100,0%
100,0%
100,0%
100,0%
100,0%
100,0%
100,0%
100,0%
100,0%

Presenta cantidades en porcentaje

Proporciona la importancia relativa de cada subcategora en relacin cada categora de las filas

Qu tipo de anlisis permite efectuar directamente (sin ningn cambio adicional) y cuales no?

Pobreza vs. educacin


Frecuencias relativas (colm. =100)
Pobres
No
no
pobres
extremos
Sin Educ. Formal
21,4%
Bsica Incom.
21,4%
Bsica Compl.
7,1%
M. Hum. Incompleta
14,3%
M. Tc. Prof. Incompleta
0,0%
M. Hum. Completa
21,4%
M. Tc Completa
0,0%
Tcnico Nivel Superior o Profesional Incompleta
14,3%
Tcnico Nivel Superior o Profesional Completa 0,0%
Total
100,0%

9,2%
17,3%
14,3%
19,4%
2,0%
14,3%
3,1%
11,2%
9,2%
100,0%

Total
10,7%
17,9%
13,4%
18,8%
1,8%
15,2%
2,7%
11,6%
8,0%
100,0%

Presenta cantidades en porcentaje

Proporciona la importancia relativa de cada subcategora en relacin cada categora de las


columnas

Qu tipo de anlisis permite efectuar directamente (sin ningn cambio adicional) y cuales no?

REPRESENTACIN GRFICA DE
VARIABLES

Distribucin grfica de frecuencias

Conceptos bsicos
Grficos de barras
Histogramas
Ojivas
Diagramas de dispersin (nube de puntos)
Series de tiempo

Ejemplos: Excel y SPSS

CONCEPTO

Un grfico es una representacin pictrica del


comportamiento de variables

Sintetiza informacin en una forma que debe resultar


ms sencilla de entender y/o ms atractiva a quin lo
observa

Pueden presentar (entre otras):

Distribuciones de frecuencias de variables: grficos de


barras, histogramas, grficos de torta, etc.
El comportamiento de una variable cuantitativa en funcin
del tiempo (series de tiempo)
El comportamiento (asociacin) de dos variables
cuantitativas (diagramas de dispersin o nubes de puntos)

Caractersticas para graficar datos


(Edward R. Tufte)
Las caractersticas bsicas de una presentacin grfica
adecuada incluyen:
a.
b.
c.
d.
e.
f.

Mostrar los datos


Hacer que el observador se concentre en lo
sustancial del grfico, y no en como se desarroll
Evitar distorsiones
Facilitar la comparacin de datos
Cumplir con un objetivo claro
Que estn integradas las descripciones estadsticas
y verbales de las grficas

Principios de excelencia grafica


(Edward R. Tufte)
La excelencia estadstica es una presentacin
bien diseada de los datos que proporciona
sustancia, estadsticas y diseo.
b. La
excelencia grfica comunica ideas
complejas con claridad, precisin y eficiencia.
c. La
excelencia grfica proporciona al
observador el mayor nmero de ideas en el
menor tiempo y con el mnimo de tinta.
d. La excelencia grfica casi siempre involucra
varias dimensiones.
e. La excelencia grfica requiere decir la verdad
acerca de los datos.
a.

Variables que se trabajarn

EDUC: Variable cualitativa ordinal que


representa el nivel educacional de las personas.
ESC: Variable numrica en escala de medida de
ratio (discreta) que representa los aos de
estudio completos de las personas.
CORTE: Variable categrica que indica si la
persona pertenece a un hogar no pobre
pobre no indigente (o extremo).
IAI: Variable numrica en escala de ratio
(continua) que representa el Ingreso autnomo
individual de cada encuestado.

Grfico de barras(1)

Caractersticas:
Puede aplicarse a cualquier tipo de variable
Relacionado con lo anterior el eje horizontal
no necesariamente requiere estar ordenado.

Eje horizontal: valores de la variable.


Eje vertical: Frecuencias (absolutas o
relativas).

Grfico de barras(2)
Eje horizontal: valores de la variable
Eje vertical: Frecuencias (absolutas o relativas)

Grfico de barras (3)

Variante(1):
Dos variables por barra: Cada barra suma las
frecuencias absolutas para cada categora de una
variable en el eje horizontal y la segunda variable
se representa mediante subcategoras de la
primera 25
20
15
10
5
0

No pobres
Pobres no extremos

Grfico de barras (4)

Variante(2):
Dos variables por barra: Similar a la anterior slo
que cada barra representa el 100% de cada
categora del eje horizontal y en su interior se
presenta el % para cada categora de la 2 variable
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%

No pobres
Pobres no extremos

Grfico de barras (5)

Observacin: Cada una de las barras del


grfico anterior puede representarse tambin
mediante una torta que totaliza 100% para
cada nivel educacional. Ej:

Sin Educ. Formal

25%

75%

Bsica Incom.

Bsica Compl.
7%

15%
Pobres no
extremos

Pobres no
extremos

Pobres no
extremos

No pobres

No pobres

No pobres

85%

93%

HISTOGRAMA(1)

Eje horizontal: valores de la variable CUANTITATIVA


Eje vertical: Frecuencias (absolutas o relativas)

Algunas observaciones:
La variable IAI toma muchsimos valores en las
64 obs.
por lo que no tendra sentido hacer un
histograma de los datos sin agruparlos en
intervalos
La seleccin de un ancho de intervalo no era
necesaria en el caso de variables cualitativas
En este caso, cada intervalo tiene base de
$250.000
Observe que no hay separacin entre las barras
porqu?

HISTOGRAMA(2)
Algunas observaciones:
Ej: La primera barra indica que hay 34
personas con ingresos entre $0 y $250.000
Al disponer la informacin de esta forma no
sabemos cuanto gana cada uno de ellos
Podramos escoger el punto medio de cada
intervalo(valor de la variable) como el
representante del intervalo.
As para el 1 intervalo sera $125.000, el 2
$375.000, el 3 $625.000 y as
sucesivamente

Cada uno de dichos puntos recibe el nombre genrico de Marca de Clase


Se puede unir las marcas de clase con una lnea a la que denominaremos poligonal
Un tipo especial de poligonal es aquel que surge al graficar las frecuencias acumuladas

HISTOGRAMA(3)

La poligonal que une las frecuencias acumuladas


se denomina OJIVA

LAS
OJIVAS
DECRECIENTES

NUNCA

SON

Diagramas de dispersion (1)

En muchas ocasiones resulta til observar el


comportamiento simultaneo de dos variables
(no slo de una y sus frecuencias)
Por ejemplo, se trata de analizar si los aos de
estudio de las personas tienen algn efecto
sobre sus ingresos
Al igual que en los histogramas se utiliza un
grfico con un eje vertical y otro horizontal
Eje vertical (y) para la variable dependiente. Ej: IAI
Eje horizontal(x) para la variable independiente. Ej:
EDUC

Diagramas de dispersion (2)


Algunas observaciones:
Observe que no tiene sentido unir los
puntos cual sera el orden correcto
para unirlos?
Si slo las personas con mayor
cantidad de aos de escolaridad
pueden acceder a los mayores ingresos
ello constuitira una evidencia de que
existe relacin directa entre ambas
variables
Respalda el grfico dicha intuicin?

Qu forma tendra la nube de puntos si la relacin entre ambas variables no


existiese o bien si existiese una relacin inversa?
Nota: Los diagramas de dispersin se utilizan generalmente para variables
cuantitativas

Series de tiempo(1)

Es un tipo especial de grfico de dos dimensiones.


Una serie de tiempo est constituda por un nmero
determinado de mediciones efectuadas sobre una variable
durante un perodo de tiempo.

Los grficos de series de tiempo representan la evolucin


de una variable (eje y) para varios aos (eje x)
A diferencia de los diagramas de dispersin los puntos
suelen unirse mediante una lnea ya que existe una sola
observacin para cada periodo de tiempo analizado.

Estos grficos son particularmente usados para describir el


comportamiento de variables econmicas y financieras

Series de tiempo(2)
Algunas observaciones:
El eje horizontal representa el tiempo
medido con la periodicidad con que la
variable fue medida
Por ello el eje puede estar expresado
en aos, en meses, etc.

Anda mungkin juga menyukai