Anda di halaman 1dari 32

Variable cualitativa

Variable cuantitativa: Discreta


Variable cuantitativa: Continua

Estadstica descriptiva: Presentacin de datos


Giancarlo Sal y Rosas
Departmento de Ciencias
Pontificia Universidad Catlica del Per

March 16, 2016

EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Outline

Variable cualitativa

Variable cuantitativa: Discreta

Variable cuantitativa: Continua

EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Distribucin de frecuencias

Durante un mes se monitoreo el estado de la calidad del aire


en una ciudad, estos fueron los resultados:
Bueno
Malo
Moderado
Moderado
Malo

Moderado
Moderado
Moderado
Moderado
Moderado

Bueno
Malo
Moderado
Malo
Moderado

Malo
Malo
Malo
Moderado
Bueno

Moderado
Malo
Muy Malo
Moderado
Moderado

Malo
Moderado
Malo
Malo
Malo

Cul es la manera apropiada de presentar esta informacin?

EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Distribucin de frecuencias
Una tabla de frecuencias est constituida por
Una lista de las posibles categoras
El nmero de veces que ocurre cada una de ellas.

Asumiendo que la variable tiene k categoras diferentes,


se define:
nj : la frecuencia nmero de veces que ocurre la
categora j.
fj : la frecuencia relativa o proporcin de la categora j,
calculada como
nj
fj =
n
siendo n el nmero total de datos.
EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Distribucin de frecuencias

pj : el porcentaje de la categora j, calculado como


pj = 100 fj
Es claro que se cumple que:
k
X
j=1

nj = n,

k
X
j=1

EST 103

fj = 1 y

k
X

pj = 100%

j=1

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Distribucin de frecuencias
j

Categoras

1
2
3
4

Bueno
Moderado
Malo
Muy Malo
Total

Frecuencia
nj
3
14
12
1
30

Frecuencia relativa
fj
0.10
0.467
0.40
0.033
1

Porcentaje
pj
10
46.7
40
3.3
100

donde, por ejemplo


f3 =

n3
n

12
30

= 0.4 , p3 = 100

n3
n

= 40%

Interpretacin: El porcentaje de dias (en el mes) que tuvieron


una mala calidad del aire es del 40%.
EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Distribucin de frecuencias
La informacin contenida en la tabla de frecuencias puede ser
representada a travs de grficos como:
Grfico de barras:
En el eje horizontal se especifica el nombre de cada
categoria
En el eje vertical se especifica la frecuencia relativa o
porcentual

Grfico de sectores circulares:


Cada categora se la representa por un sector del crculo
proporcional a la frecuencia con que ocurre:
Anguloj = 360 fj
EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Distribucin de frecuencias

Durante un mes se monitoreo el estado de la calidad del aire


en una ciudad, estos fueron los resultados:
Bueno
Malo
Moderado
Moderado
Malo

Moderado
Moderado
Moderado
Moderado
Moderado

Bueno
Malo
Moderado
Malo
Moderado

Malo
Malo
Malo
Moderado
Bueno

Moderado
Malo
Muy Malo
Moderado
Moderado

Malo
Moderado
Malo
Malo
Malo

Cul es la manera apropiada de presentar esta informacin?

EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

0.3
0.2
0.1
0.0

Frecuencia relativa

0.4

Grfico de barras

Bueno

Malo

Moderado

Muy Malo

Calidad del aire

EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Sectores circulares

Los ngulos necesarios son:


Malo: 360 0.4 = 144
Bueno: 360 0.1 = 36
Muy Malo: 360 0.033 = 11, 88
Moderado: 360 0.467 = 168, 12

EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Sectores circulares

Malo , 40%

Bueno , 10%
144

168,12

36
Muy Malo , 3%

Moderado , 47%

EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Solucin: Sectores circulares

Malo , 40%

Bueno , 10%

Muy Malo , 3%

Moderado , 47%

Figure: Distribucin de calidad de aire en el mes


EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Tablas o distribuciones de frecuencias: Caso


cuantitativo discreto
En un cierto distrito durante un mes (de 30 dias) se registr el
nmero de accidentes de trnsito por da, estos fueron los
resultados:
1
1
0

2
1
2

0
2
1

3
0
0

1
1
4

0
1
0

1
0
1

0
3
2

4
1
2

2
1
2

Note que la variable nmero de accidentes de trnsito por da


en un distrito puede tomar los siguientes valores: 0, 1, 2, 3 y 4.

EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Tablas o distribuciones de frecuencias: Caso


cuantitativo discreto
En este caso la tabla de frecuencias estar constituida por
una lista de las posibles valores que puede tomar la
variable acompaadas por el nmero de veces que ocurre
cada uno de estos valores.
En este caso asumiremos que la variable X tiene k valores
distintos x1 , ..., xk y consideraremos la siguiente notacin
nj : la frecuencia nmero de veces que ocurre el valor xj .
fj : la frecuencia relativa del valor xj , calculada como
fj = nj /n
siendo n el nmero total de datos.
EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Tablas o distribuciones de frecuencias: Caso


cuantitativo discreto
Notacin (continuacin)
pj : el porcentaje del valor xj , calculado como pj = 100 fj .
Pj : el porcentaje acumulado hasta el valor xj , calculado
como
X
Pj = 100
fk
k j

Grfico de bastones
Herramienta para resumir la tabla de frecuencias para
datos discretos
El eje horizontal representa a cada valor de x
El eje horizontal esta dado por la frecuencia relativa.
EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Ejemplo:

En un cierto distrito durante un mes (de 30 dias) se registr el


nmero de accidentes de trnsito por da, estos fueron los
resultados:
1
1
0

2
1
2

0
2
1

3
0
0

1
1
4

0
1
0

1
0
1

0
3
2

4
1
2

2
1
2

Note que la variable nmero de accidentes de trnsito por da


en un distrito puede tomar los siguientes valores: 0, 1, 2, 3 y 4.

EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Solucin:
A continuacin presentamos la tabla de frecuencias para este
conjunto de datos
Nmero de
accidentes
0
1
2
3
4
Total

Frecuencia
nj
8
11
7
2
2
30

Frecuencia
relativa fj
0.267
0.367
0.233
0.067
0.067
1

Porcentaje
pj
26.7
36.7
23.3
6.7
6.7
100

donde
P3 = 26.7 + 36.7 + 23.3 = 86.7%
EST 103

Estadstica descriptiva

Porcentaje
acumulado Pj
26.7
63.4
86.7
93.4
100

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Solucin:
ITULO 1. ORGANIZACION
6
Y RESUMEN DE DATOS
La informacin
contenidaCAP
en
esta tabla se presenta
en forma
grfica en la siguiente figura

0.3

0.2

0.1

Frecuencia relativa

0.0

2
Nmero de accidentes

Figura
1.2: Grafico de bastones
Figure: Distribucin de
accidentes
de transito en el mes

Establecer el numero de clases k, usualmente se consideran entre 5 y 10 intervalos, esEST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Solucin:

Resumen de los resultados:


Solo en el 26,7 % (8) dias del mes no se reporto accidentes de
transito. En 11 (36,7%) de los dias del mes evaluado se reporto
un accidente de transito. Lamentablemente, en el 13,7% de
dias evaluados se reportaron entre 3 y 4 accidentes de transito.

EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Distribuciones de frecuencias: Caso cuantitativo


continuo
En este caso es necesario agrupar las observaciones en
clases.
Considerando las clases como intervalos de igual
amplitud, podemos seguir el siguiente procedimiento:
1

Establecer el nmero de clases k (usualmente entre 5 y


10), esta es una decisin subjetiva y depende de la
experiencia pero una sugerencia es seguir la Regla de
Sturges:
k = 1 + 3.3 log10 (n)
donde k se aproxima por exceso.

EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Determinar la amplitud de los datos:


A = valor mximo valor mnimo

Determinar el tamao de la clase:


c=

A
k

y se debe redondear por exceso al nmero de decimales


de los datos.
4

Usar c para construir los intervalos de cada clase, en este


caso consideraremos intervalos cerrados por la derecha y
abiertos por la izquierda, con excepcin del primero que
es cerrado en ambos lados.

Construir la tabla, calculando la frecuencia de cada clase.


EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Se considera la siguiente notacin:


Lj : Extremo derecho de la clase j.
xj : Marca de clase o punto medio del intervalo de clase j.
nj : Frecuencia de la clase j.
fj =

nj
n

: Frecuencia relativa de la clase j.

pj = 100 fj : Porcentaje de la clase j.


P
Nj = jh=1 nh : Frecuencia acumulada de la clase j.
P
Fj = jh=1 fh : Frecuencia relativa acumulada de la clase j.
P
Pj = jh=1 ph : Porcentaje acumulado de la clase j.

EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Ejemplo: Consumo de electricidad

Se registr el consumo de electricidad en kWh de 50 hogares


en un cierto distrito estos fueron los resultados:
589
300
398
596
384

493
439
372
567
497

531
464
488
466
438

355
430
481
477
501

469
403
620
580
521

EST 103

432
525
484
555
452

415
478
509
520
508

468
392
522
525
462

Estadstica descriptiva

617
432
488
425
457

426
459
502
650
577

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Solucin:
De no tener mayor experiencia o no indicarse, usaremos la
regla de Sturges con
k = 1 + 3.3 log10 (50) = 6.6 7
El valor mnimo de los datos es 300 kWh y el mximo 650 kWh,
por la tanto la amplitud es
A = 650 300 = 350 kWh
con lo que obtenemos que el ancho de cada intervalo de clase
ser de:
c = 350/7 = 50 kWh.
A partir de estos resultados obtenemos la siguiente tabla de
frecuencias para este conjunto de datos.
EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Solucin:

Table: Tabla de frecuencias: Consumo de electricidad


Intervalo
clase
[300, 350]
(350, 400]
(400, 450]
(450, 500]
(500, 550]
(550, 600]
(600, 650]
Total

Marca
de clase
xj
325
375
425
475
525
575
625

Frec.
nj
1
5
9
16
10
6
3
50

Frec.
relativa
fj
0.02
0.1
0.18
0.32
0.2
0.12
0.06
1

Porcentaje
pj
2
10
18
32
20
12
6
100

Frec.
acum.
Nj
1
6
15
31
41
47
50

Frec. Rel.
acumulada
Fj
0.02
0.12
0.3
0.62
0.82
0.94
1

Porcentaje
acumulado
Pj
2
12
30
62
82
94
100

Interpretacin:
La mayoria de los hogares tiene un consumo intermedio:
entre 400 y 550 kWh
EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Representacin Grfica
Las tablas de frecuencias suele ser representada grficamente
a travs del:
Histograma: Conjunto de barras sin espacio entre ellas
donde:
Eje horizontal: Los intervalos que formas las clases.
continua.
Eje vertical: La altura es proporcional a la frecuencia con
que ocurre la clase.

Polgono de frecuencias: Es formada uniendo los puntos


medios altos de cada barra del histograma.
Grfico de frecuencias acumuladas u ojiva: Utiliza las
frecuencias acumuladas y los limites superiores de cada
intervalo de clase.
EST 103

Estadstica descriptiva

Frecuencia

10

15

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

300

350

400

450

500

550

600

650

Consumo de electricidad

Figure: Histograma del consumo de electricidad en los 50 hogares


del distrito.

EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

10

15

Frecuencia

300

350

400

450

500

550

600

650

Consumo de electricidad

Figure: Poligono de frecuencias para el consumo de electricidad en


los 50 hogares del distrito.

EST 103

Estadstica descriptiva

1.0

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

0.6

0.4

Frecuencia acumulada

0.8

0.2

0.0

350

400

450

500

550

600

650

Consumo de electricidad

Figure: Ojiva de frecuencias para el consumo de electricidad en los


50 hogares del distrito.

EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Solucin:

Interpretacin:
El consumo de electricidad mas frecuente oscilo entre 450 y
500 kWh y representa el 32% de los hogares evaluados. Mas
aun, el 70% de hogares evaluados registro consumos entre
400 y 550 kWh. Solo un hogar (2%) reporto un consumo
menor a 350 kWh, mientras que solo 3 hogares reportaron un
consumo mayor a 600 kWh.

EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Ejercicio
Ejercicio 2 (pag. 33 de Intro Stats)
Fatalidades en no ocupantes de vehiculos

Frecuencia

1000

2000

3000

4000

4092

630

150

Ciclista

Otros

Peaton

Tipo de persona afectada

Convertir este grafico de barras a uno con frecuencias


relativas. Es correcto afirmar que mas del 90% de fatalidades
se dan en peatones ?
EST 103

Estadstica descriptiva

Variable cualitativa
Variable cuantitativa: Discreta
Variable cuantitativa: Continua

Ejercicio
Los siguientes datos son las respuestas de 79 pacientes con
tuberculosis a la pregunta: Con cuntas personas vives en
casa?
7
2
7
6
2
1
4
5

3
12
5
1
4
2
8
1

1
1
1
6
2
4
12
3

1
3
5
7
1
8
5
1

2
5
2
16
4
2
2
4

5
6
2
1
2
14
7
4

13
4
3
3
7
3
6
7

3
3
7
5
3
2
3
5

4
2
3
1
3
5
4
6

4
2
3
6
6
6
4

Escriba un prrafo describiendo estos datos en base a las


tablas y/o graficos apropiado
EST 103

Estadstica descriptiva

Anda mungkin juga menyukai