PRESENTADO POR:
CAMILO ANDRES PEREZ
EDNA VIVIANA LAVAO
PEDRO ALONSO BEDOYA
DIANA CAROLINA GONZALEZ
PRESENTADO A:
OSCAR ANDRES SALAMANCA
El presente trabajo hace un anlisis estadstico detallado tanto de las variables discretas (enteras)
como de las variables continuas (decimales) de la base de datos de desempleo en Colombia
suministrada. El anlisis se logra gracias al uso de las medidas de tendencia central como Media,
Mediana, Moda, Cuartiles, Deciles y Percentiles y las medidas de dispersin como el rango, la
varianza, la desviacin y el coeficiente de varianza, acompaado de tablas de frecuencia con datos
agrupados y no agrupados y grficos que permiten un anlisis visual de la informacin.
JUSTIFICACIN
La realizacin de este trabajo del anlisis sobre el Desempleo en Colombia, aplicando las
diferentes herramientas para agrupar la informacin, analizar resultados obtenidos y se estudia la
informacin requerida que permitir desarrollar una lnea de accin para solucionar el problema
detectado.
OBJETIVOS
GENERAL
ESPECFICOS
6.000.000
4.000.000
2.000.000
-
43
141
1
8
15
22
29
36
50
57
64
71
78
85
92
99
106
113
120
127
134
148
155
162
169
176
183
190
Personas Sin Empleo f
MTC CUARTILES
Media 5.148.582 Q1 4437637,34
Mediana 5.193.946 Q2 5193945,7
Moda Todos Q3 5896374,77
DECILES PERCENTILES
D5 97,5 5166635,5 P30 58,5 4589372,45
D7 136,5 5736447,86 p50 97,5 5166635,5
RANGO VARIANZA
5591252 1238887287204
DESVIACIN COEFICIENTE
1113053,138 0,216186349
ANLISIS
Como se puede apreciar, para la variable discreta elegida (Personas sin empleo) todos
los 195 datos son moda, pues su frecuencia absoluta es igual y equivale a 1. Presenta
una media de 5.148.582 con un mnimo de 2.282.953 y un mximo de 7.874.204.
Debido a que la divisin para los cuartiles, deciles y percentiles no da un numero
entero, se deben sumar y dividir parejas de satos para encontrar el nmero exacto.
Como se puede observar la tasa de desempleo es alta y millones de personas sufren
con este flagelo. Los datos se encuentran dispersos en un 21,6% segn el coeficiente
de variacin. La desviacin corresponde a la raz cuadrada de la varianza.
Para junio de 2004 la poblacin era de 42.351.366 y en promedio haba 5.193.946 personas que no
tenan empleo, con una tasa de desempleo de 14 %.
En agosto de 2006, el 25% de las personas que no tena empleo era de 4.411.976, para un poblacin
de 43.942.128.
El 75% de las personas que no tena empleo corresponda a 5.902.438 para Julio de 2009.
El 70% de las personas que no tienen empleo se encuentran entre 2.282.953 y 5.479.360.
El 30% de las personas que no tienen empleo se encuentran entre 2.282.953 y 4.577.320 y el 50%
entre el 2.282.953 y 5.193.946.
Anlisis
En Colombia el promedio de personas sin empleo desde enero de 2001 hasta marzo de 2017, es de
5.193.946 personas, con una poblacin promedio de 44.808.392 y una tasa de desempleo de 11.64.
Mediana 2.262
Cuartiles Valor
Q1 49 1.903
Q2 98 2.262
Q3 147 2.585
Deciles Valor
D5 98 2.262
D7 137 2.485
Percentiles Valor
P30 59 1.916
P50 98 2.262
Rango
1.950
Varianza 208035,6
Anlisis: Se tiene que el valor de dlar en promedio para el periodo para el cual fueron
suministrados lo datos fue de 2,295.36 y su mediana igual a 2,262 lo cual quiere decir que el 50%
de los datos se encuentra por debajo de 2,262 y el otro 50% por encima de ese valor, y como la
media es mayor que la mediana esto podra indicar la existencia de una distribucin sesgada hacia
la derecha. En el clculo de los Cuartiles, los Deciles y los Percentiles lo primero a tomar en cuenta
es los valores de Q2, D5 y P50 coinciden con el valor de la mediana indicando as que estn
ubicados en la posicin correcta, cada uno de estos valores representan que los datos se encuentras
agrupados, por encima de cierto porcentaje de valores. Con las medidas de dispersin calculadas
para los datos, podemos decir que estos se encuentran dispersos en un 20% con respecto de la
media (2295.361 +- 20%).
MEDIA
24.660.494
MEDIANA
24.084.615
Q1 - 25%
22.430.695
Q2 - 50%
24.084.615
Q3 - 75%
26.950.925
D5 - 50%
98
23.134.706
D7 - 70%
137
26.340.399
P30 - 30%
59
23.362.050
P50 - 50%
98
23.134.706
MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL Y DE DISPERSIN PARA
VARIABLES CONTINUAS
Media
Mediana
Moda
Cuartiles
Deciles
Percentiles
Elaborado por: Camilo Andrs Prez
Variable: Tasa de empleo (%)
Marca de
Intervalo Rango clase f F h H xi*f
1 [48,5-50,5) 49,5 19 19 0,0974359 0,0974359 940,5
2 [50,5-52,5) 51,5 23 42 0,11794872 0,21538462 1184,5
3 [52,5-54,5) 53,5 57 99 0,29230769 0,50769231 3049,5
4 [54,5-56,5) 55,5 31 130 0,15897436 0,66666667 1720,5
5 [56,5-58,5) 57,5 35 165 0,17948718 0,84615385 2012,5
6 [58,5-60,5) 59,5 24 189 0,12307692 0,96923077 1428
7 [60,5-62,5) 61,5 6 195 0,03076923 1 369
Total 195 1 10704,5
FRECUENCIA ABSOLUTA
60
50
40
30
20
10
0
49,5 51,5 53,5 55,5 57,5 59,5 61,5
FRECUENCIA ABSOLUTA
60
50
40
30
20
10
0
49,5 51,5 53,5 55,5 57,5 59,5 61,5
FRECUENCIA RELATIVA
61,5 49,5
59,5
51,5
57,5
53,5
55,5
MTC
Media 54,89487179
Mediana 52,44736842
Moda 53,63333333
CUARTILES
No agrupados Agrupados
Q1 52,62021033 2 53,0869565
Q4 54,41905098 4 54,4032258
Q3 57,39571353 6 56,9375
DECILES PERCENTILES
No agrupados Agrupados No agrupados Agrupados
D5 97,5 54,4117301 54,4473684 P25 48,75 52,5634895 53,0869565
D7 136,5 56,8420834 56,8714286 P50 97,5 54,4117301 54,4032258
RANGO COEFICIENTE
12 0,052071599
VARIANZA DESVIACIN
8 2,863935223
ANLISIS
Como se puede observar el rango es estrecho y la media se encuentra en 54,89 con un valor mnimo
de 48,97 y un mximo de 61,41. El anlisis en datos agrupados es menos exacto, ya que se trabaja
por intervalos. Todas las medidas de tendencia central se ubican en intervalos diferentes. Se puede
concluir que el ndice de empleo es apenas superior a la mitad de la poblacin segn los datos
obtenidos. Los datos se encuentran dispersos en un 5,2% segn el coeficiente de variacin. Lo que
es lgico debido a que el rango es tan solo de 12. La desviacin corresponde a la raz cuadrada de la
varianza.
Indice de Precios
40
35
30
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9
Media
=
Moda
= +
+ +
Mediana
= +
1
= + 4
El 25% del ndice de precios esta entre 62.6 y 81.47, el 50% entre 62.6 y 99.37 y el 75% entre 62.6
y 112.46.
1
= + 4
1
= + 4
Anlisis
Desde enero de 2001 hasta marzo de 2017, se ve a simple vista que el ndice de precios siempre ha
ido ascendiendo, la media es de 97.84. El 25% del ndice de precios se encuentra entre 62.6 y 81.47
y el 50% entre 62.6 y 99.37.
Frecuencia Absoluta
Series1
20
18
16
14
12
10
8
6
4
2
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Frecuencia Absoluta
Acumulada
Series1
250
200
150
100
50
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Frecuencia Relativa
Porcentual
5% 9%
8%
7%
7%
9%
6%
7% 10%
8%
7%
5% 8%
4%
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Media
23990826,43
Moda
15763602,33
Mediana
22458807,22
Cuartiles Intervalo
Q1 15028857,7 3
Q2 22458807,2 6
Q3 33108379,3 10
Deciles Intervalo
D5 22458807,2 6
D7 31339121,3 10
Percentiles Intervalo
P25 15028857,7 3
P50 22458807,2 6
Varianza
1,07864E+14
Desv. Tipica
10385779,94
Coef. Pearson
0,432906302
Anlisis: El intervalo que tiene la mayor frecuencia absoluta es el nmero 4, con una frecuencia
absoluta de 19, este ser el intervalo que usaremos para el clculo de la moda. Con el coeficiente
de dispersin obtenidos podemos decir que los datos se encuentran dispersos en un 43% por encima
o por debajo de la media.
marca frecuencia
limite limite de clase frecuencia absoluta
NUMERO DE CLASES DE INTERVALOS inferior superior (x) absoluta acumulada
1 48,97 50,35 49,66 4 4 198,64
2 50,35 51,73 51,04 20 24 1020,8
3 51,73 53,11 52,42 46 70 2411,32
4 53,11 54,49 53,8 29 99 1560,2
5 54,49 55,87 55,18 18 117 993,24
6 55,87 57,25 56,56 25 142 1414
7 57,25 58,63 57,94 25 167 1448,5
8 58,63 60,01 59,32 20 187 1186,4
9 60,01 61,39 60,7 8 195 485,6
195 10718,7
10000,00
8000,00
6000,00
4000,00
2000,00
0,00
1 2 3 4 5 6 7 8 9
Con la realizacin de este trabajo fue posible analizar el comportamiento de las variables discretas
y continas seleccionadas por cada participante del grupo de acuerdo a sus resultados de media,
mediana, moda, cuartiles, deciles, percentiles, varianza, rango, desviacin estndar, coeficiente de
varianza y a travs del anlisis de tablas de frecuencia y grficos tanto de frecuencias como de
barras.
REFERENCIAS BIBLIOGRFICAS