Estadstica descriptiva
Trabajo Colaborativo 2
Presentado por:
DAYANA POLET URIBE TOVAR
CODIGO: 1103099984
Tutor:
Wilson Arturo Herrera
Grupo:
204040_12
INTRODUCCION
La estadstica es una ciencia formal y una herramienta que estudia usos y anlisis provenientes de una
muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenmeno fsico o
natural, de ocurrencia en forma aleatoria o condicional.
En este caso la estadstica descriptiva est constituida por un conjunto de tcnicas cuyo objetivo es clasificar,
presentar, describir, resumir y analizar los datos relativos a una o ms caractersticas de los individuos de una
poblacin, a partir de la informacin sobre todos y cada uno de ellos. Para cubrir estos objetivos se vale de
tablas, grficos y resmenes estadsticos.
La estadstica descriptiva univariante se centra en el anlisis de una nica caracterstica o cualidad del
individuo. Las caractersticas a analizar presentan modalidades, exhaustivas y mutuamente excluyentes.
Dependiendo del tipo de modalidades, las caractersticas, que de forma general denominaremos variables.
Al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir la informacin con
un solo nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la distribucin de datos se
denomina medida o parmetro de tendencia central o de centralizacin. Cuando se hace referencia
nicamente a la posicin de estos parmetros dentro de la distribucin, independientemente de que sta est
ms o menos centrada, se habla de estas medidas como medidas de posicin
Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una
distribucin, indicando por medio de un nmero si las diferentes puntuaciones de una variable estn muy
alejadas de la media. Cuanto mayor sea ese valor, mayor ser la variabilidad, y cuanto menor sea, ms
homognea ser a la media. As se sabe si todos los casos son parecidos o varan mucho entre ellos.
JUSTIFICACION
OBJETIVOS
Identificar las variables discretas y dentro de ellas seleccionar la ms representativa segn el problema
plasmado y elaborar una tabla de frecuencias para datos no agrupados y calcular las medidas de tendencia
central: media, mediana, moda, los cuartiles, deciles 5, 7 y percentiles 30, 50 con su respectiva
interpretacin.
Calcular las medidas univariantes absolutas y relativas de dispersin para variables cuantitativas discreta y
calcular: rango, varianza, desviacin tpica y coeficiente de variacin. Interpretar los resultados obtenidos y
asociarlos con el problema objeto de estudio.
Elegir una variable Continua que sea representativa, disear una tabla de frecuencia para datos agrupados,
calcular las medidas de tendencia central, los cuartiles, deciles 5, 7 y percentiles 50 y 75 e Interpretar sus
resultados.
Determinar las medidas univariantes absolutas y relativas de dispersin para variables cuantitativas Continua
y calcular: rango, varianza, desviacin tpica y coeficiente de variacin. Interpretar los resultados obtenidos y
asociarlos con el problema
DISCRETA
NUMERO DE
HERIDOS
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
5
5
5
6
6
6
6
6
8
8
9
9
11
15
18
No
DE
fa
HERIDOS
fr %
Xi*fa
0
1
2
3
4
5
6
8
9
11
15
18
Total
15,00
14,17
31,67
11,67
15,00
2,50
4,17
1,67
1,67
0,83
0,83
0,83
100
0
17
76
42
72
15
30
16
18
11
15
18
330
18
17
38
14
18
3
5
2
2
1
1
1
120
MEDIA
Para el clculo de la media se toman todos los datos se suman y el resultado de dicha suma se
divide en el nmero de datos.
330/120= 2.75
MEDIANA
En este ejemplo como son 120 datos seria: 120 / 2 = 60 por lo tanto la mediana seria Me=
(X60+X61)/2.
(2+2)/2=2
MODA
La moda en este caso seria 0heridos pues es el dato que ms se repite, presenta una frecuencia de
18 o representa el 15%
NUMERO DE
MUERTOS
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
4
MEDIA
Para el clculo de la media se toman todos los datos se suman y el resultado de dicha suma se
divide en el nmero de datos.
103/120= 0.85
MEDIANA
En este ejemplo como son 120 datos seria: 120 / 2 = 60 por lo tanto la mediana seria Me=
(X60+X61)/2.
(2+2)/2=2
MODA
La moda en este caso seria 1muerto pues es el dato que ms se repite, presenta una frecuencia de
48 o representa el 40%
Con la variable Discreta elegida calcular: rango, varianza, desviacin tpica y coeficiente de
variacin. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio.
R//:
Medidas de dispersin
a) Rango:
El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica.
18-0=18
Rango es 18
b) Varianza:
La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una
distribucin estadstica.
La varianza se representa por:
=2
c) Desviacin Tpica:
Tanto para datos agrupados, como para datos no agrupados, La desviacin tpica es la raz
cuadrada de la varianza.
= 1.41
d) Coeficiente de Variacin:
Para una muestra se emplea la siguiente frmula:
S
CV = 100
X
Donde:
CV= coeficiente de variacin.
S= desviacin estndar de la muestra.
X = media aritmtica de la muestra.
CV =
1.41
100
2
CV =70.5
CONTINUA
EDAD
17
17
17
17
17
18
18
18
18
18
19
19
19
19
21
21
21
21
21
21
21
22
22
22
22
22
22
22
23
23
24
29
29
29
29
29
30
31
31
32
32
32
32
33
33
33
33
33
33
33
34
34
35
35
35
35
35
36
36
36
36
38
38
38
38
38
38
38
42
42
42
42
42
43
43
44
45
45
45
46
46
46
46
46
46
46
46
46
46
46
46
46
46
46
48
50
52
52
52
52
52
52
53
54
54
54
54
54
54
55
55
55
55
55
55
56
56
56
60
60
MEDIA
Para el clculo de la media se toman todos los datos se suman y el resultado de dicha suma se
divide en el nmero de datos.
4441/120= 37.00
MEDIANA
En este ejemplo como son 120 datos seria: 120 / 2 = 60 por lo tanto la mediana seria Me=
(X60+X61)/2.
(36+36)/2=36
MODA
La moda en este caso seria 45 aos pues es el dato que ms se repite, presenta una frecuencia de
15 o representa el 12.5%
CUARTILES
El primer cuartil es el mismo percentil del 25%
Q1 = (120*25) /100 = 30 es un nmero entero, por lo que se deber de agregar 0.5, entonces el
Q1 se encuentra en la posicin 30.5, entonces est entre 30 y 31avo dato.
Q1 = (1+1)/2 = 2/2 = 1
El segundo cuartil es el mismo percentil del 50% o la misma Mediana
Q2 = (120*50) /100 = 60 es un nmero entero, por lo que se deber de agregar 0.5, entonces el
Q2 se encuentra en la posicin 60.5, entonces est entre 60 y 61avo dato.
Q2 = (2+2)/2 = 4/2 = 2
El Tercer Cuartil es el mismo percentil del 75%
Q3 = (120*75) /100 = 90 es un nmero entero, por lo que se deber de agregar 0.5, entonces el
Q3 se encuentra en la posicin 90.5, entonces est entre 90 y 91avo dato.
Q3 = (4+4)/2 = 8/2 = 4
DECILES
El Tercer Decil es el mismo percentil del 30%
D3 = (120*30) /100 = 36 es un nmero entero, por lo que se deber de agregar 0.5, entonces el
D3 se encuentra en la posicin 36.5, entonces est entre 36 y 37 avo dato.
D3 = (2+2)/2 = 4/2 = 2
El Quinto Decil es el mismo percentil del 50% o la misma mediana
D5 = (120*50) /100 = 60 es un nmero entero, por lo que se deber de agregar 0.5, entonces el
D5 se encuentra en la posicin 60.5, entonces est entre 60 y 61 avo dato.
D5 = (2+2)/2 = 4/2 = 2
PERCENTILES
El Percentil del 30%
P30= (120*30) /100 = 36 es un nmero entero, por lo que se deber de agregar 0.5, entonces el
P30 se encuentra en la posicin 36.5, entonces est entre 36 y 37 avo dato.
P30 = (2+2)/2 = 4/2 = 2
El Percentil del 50% o la misma Mediana
P50 = (120*50) /100 = 60 es un nmero entero, por lo que se deber de agregar 0.5, entonces el
P50 se encuentra en la posicin 60.5, entonces est entre 60 y 61 avo dato.
P50 = (2+2)/2 = 4/2 = 2
Medidas de dispersin
e) Rango:
El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica.
60-17=43
Rango es 43
f) Varianza:
La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una
distribucin estadstica.
La varianza se representa por:
2
| = 24.5
g) Desviacin Tpica:
Tanto para datos agrupados, como para datos no agrupados, La desviacin tpica es la raz
cuadrada de la varianza.
= 4.94
h) Coeficiente de Variacin:
Para una muestra se emplea la siguiente frmula:
S
CV = 100
X
Donde:
CV= coeficiente de variacin.
S= desviacin estndar de la muestra.
X = media aritmtica de la muestra.
CV =
4.94
100
24.5
CV =20.16
ANALISIS E INTERPRETACION
DISCRETA:
Para el valor de la Mediana tenemos que el 50% de los accidentes reportados por la
secretaria de transito ha dejado como resultado de 0 a 2 heridos, y en el otro 50% de los
accidentes informados, da como resultado de 0 a 2 heridos.
Tenemos para el caso de la Moda, de los 120 accidentes reportados por la secretaria de
transito la tendencia es de 18 heridos en 15 accidentes.
Tenemos para el caso de la media o promedio para este problema de heridos en accidentes
en la ciudad de Medelln durante el ao 2015 es de 2.75.
CONTINUA:
Para el valor
CONCLUSIONES
Con este trabajo podemos concluir que estamos en excelentes condiciones para solucionar un
problema y hallar las medidas univariables de tendencia central y medidas de dispersin
correspondientes.
Estamos en pticas condiciones en utilizar simuladores en el programa Excel.
Analizamos que algunos resultados de cuartiles deciles y percentiles son iguales a algunos
valores de media moda y mediana.
Concluimos que sabemos cmo y con qu formulas hallar frecuencia absoluta y frecuencia
relativa.
BIBLIOGRAFIAS