Anda di halaman 1dari 25

ESTADISTICA DESCRIPTIVA

FASE 3. TRABAJO COLABORATIVO


GRUPO: 100105_195

PRESENTADO POR:
CAMILO ANDRES PEREZ
EDNA VIVIANA LAVAO
PEDRO ALONSO BEDOYA
DIANA CAROLINA GONZALEZ

PRESENTADO A:
OSCAR ANDRES SALAMANCA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
PROGRAMA INGENIERA ELECTRNICA
NEIVA - HUILA
2017
INTRODUCCIN

El presente trabajo hace un anlisis estadstico detallado tanto de las variables discretas (enteras)
como de las variables continuas (decimales) de la base de datos de desempleo en Colombia
suministrada. El anlisis se logra gracias al uso de las medidas de tendencia central como Media,
Mediana, Moda, Cuartiles, Deciles y Percentiles y las medidas de dispersin como el rango, la
varianza, la desviacin y el coeficiente de varianza, acompaado de tablas de frecuencia con datos
agrupados y no agrupados y grficos que permiten un anlisis visual de la informacin.
JUSTIFICACIN

La temtica de medidas de tendencia central y de dispersin es la base de la estadstica descriptiva


y la forma inicial para analizar informacin mediante tablas de frecuencia, grficos, Media,
Mediana, Moda, Varianza, Desviacin, entre otros muchos indicadores que permiten analizar una
poblacin en alguna variable especfica, es por esta razn que la temtica es importante y
obligatoria.

Se considera a los conceptos de Estadstica bsica necesarios para abordar un problema de


investigacin, la oportunidad de tomar como referencia una problemtica actual y general del diario
vivir, permite crear una conciencia como futuro profesional sobre los diferentes entornos que
pueden afectar nuestro espacio al igual que la aplicacin de los conocimientos que se adquieren en
el trascurso de la carrera.

La realizacin de este trabajo del anlisis sobre el Desempleo en Colombia, aplicando las
diferentes herramientas para agrupar la informacin, analizar resultados obtenidos y se estudia la
informacin requerida que permitir desarrollar una lnea de accin para solucionar el problema
detectado.
OBJETIVOS

GENERAL

Realizar el anlisis de variables discretas y continuas ms importantes para el tema de desempleo


en Colombia.

ESPECFICOS

- Calcular las medidas de tendencia central a cada variable discreta y continua.


- Realizar el clculo de las medidas de dispersin a cada variable discreta y continua.
- Realizar las tablas de frecuencia.
- Generar los grficos.
MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL Y DE DISPERSIN PARA
VARIABLES DISCRETAS

Elaborado por: Camilo Andrs Prez

Variable: Personas sin empleo

PERSONAS SIN EMPLEO


8.000.000

6.000.000

4.000.000

2.000.000

-
43

141
1
8
15
22
29
36

50
57
64
71
78
85
92
99
106
113
120
127
134

148
155
162
169
176
183
190
Personas Sin Empleo f

MTC CUARTILES
Media 5.148.582 Q1 4437637,34
Mediana 5.193.946 Q2 5193945,7
Moda Todos Q3 5896374,77

DECILES PERCENTILES
D5 97,5 5166635,5 P30 58,5 4589372,45
D7 136,5 5736447,86 p50 97,5 5166635,5

RANGO VARIANZA
5591252 1238887287204

DESVIACIN COEFICIENTE
1113053,138 0,216186349

ANLISIS
Como se puede apreciar, para la variable discreta elegida (Personas sin empleo) todos
los 195 datos son moda, pues su frecuencia absoluta es igual y equivale a 1. Presenta
una media de 5.148.582 con un mnimo de 2.282.953 y un mximo de 7.874.204.
Debido a que la divisin para los cuartiles, deciles y percentiles no da un numero
entero, se deben sumar y dividir parejas de satos para encontrar el nmero exacto.
Como se puede observar la tasa de desempleo es alta y millones de personas sufren
con este flagelo. Los datos se encuentran dispersos en un 21,6% segn el coeficiente
de variacin. La desviacin corresponde a la raz cuadrada de la varianza.

Elaborado por: Edna Viviana Lavao

- Variable: Personas sin empleo

Para junio de 2004 la poblacin era de 42.351.366 y en promedio haba 5.193.946 personas que no
tenan empleo, con una tasa de desempleo de 14 %.

En agosto de 2006, el 25% de las personas que no tena empleo era de 4.411.976, para un poblacin
de 43.942.128.
El 75% de las personas que no tena empleo corresponda a 5.902.438 para Julio de 2009.

El 70% de las personas que no tienen empleo se encuentran entre 2.282.953 y 5.479.360.

El 30% de las personas que no tienen empleo se encuentran entre 2.282.953 y 4.577.320 y el 50%
entre el 2.282.953 y 5.193.946.

Anlisis
En Colombia el promedio de personas sin empleo desde enero de 2001 hasta marzo de 2017, es de
5.193.946 personas, con una poblacin promedio de 44.808.392 y una tasa de desempleo de 11.64.

Elaborado por: Pedro Alonso Bedoya


- Variable: Valor dlar

Media. Aritmetica 2.295,36

Mediana 2.262

Cuartiles Valor

Q1 49 1.903

Q2 98 2.262

Q3 147 2.585

Deciles Valor

D5 98 2.262

D7 137 2.485

Percentiles Valor

P30 59 1.916

P50 98 2.262

Rango
1.950

Varianza 208035,6

Desv. Tipica 456,1092

C.V Pearson 0,198709

Anlisis: Se tiene que el valor de dlar en promedio para el periodo para el cual fueron
suministrados lo datos fue de 2,295.36 y su mediana igual a 2,262 lo cual quiere decir que el 50%
de los datos se encuentra por debajo de 2,262 y el otro 50% por encima de ese valor, y como la
media es mayor que la mediana esto podra indicar la existencia de una distribucin sesgada hacia
la derecha. En el clculo de los Cuartiles, los Deciles y los Percentiles lo primero a tomar en cuenta
es los valores de Q2, D5 y P50 coinciden con el valor de la mediana indicando as que estn
ubicados en la posicin correcta, cada uno de estos valores representan que los datos se encuentras
agrupados, por encima de cierto porcentaje de valores. Con las medidas de dispersin calculadas
para los datos, podemos decir que estos se encuentran dispersos en un 20% con respecto de la
media (2295.361 +- 20%).

Elaborado por: Diana Carolina Gonzlez

- Variable: Personas con empleo

MEDIA
24.660.494

MEDIANA
24.084.615

Q1 - 25%
22.430.695

Q2 - 50%
24.084.615

Q3 - 75%
26.950.925

D5 - 50%
98
23.134.706

D7 - 70%
137
26.340.399

P30 - 30%
59
23.362.050

P50 - 50%
98
23.134.706
MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL Y DE DISPERSIN PARA
VARIABLES CONTINUAS

MTC PARA DATOS AGRUPADOS

Media

Mediana

Moda

Cuartiles

Deciles

Percentiles
Elaborado por: Camilo Andrs Prez
Variable: Tasa de empleo (%)

Marca de
Intervalo Rango clase f F h H xi*f
1 [48,5-50,5) 49,5 19 19 0,0974359 0,0974359 940,5
2 [50,5-52,5) 51,5 23 42 0,11794872 0,21538462 1184,5
3 [52,5-54,5) 53,5 57 99 0,29230769 0,50769231 3049,5
4 [54,5-56,5) 55,5 31 130 0,15897436 0,66666667 1720,5
5 [56,5-58,5) 57,5 35 165 0,17948718 0,84615385 2012,5
6 [58,5-60,5) 59,5 24 189 0,12307692 0,96923077 1428
7 [60,5-62,5) 61,5 6 195 0,03076923 1 369
Total 195 1 10704,5

FRECUENCIA ABSOLUTA

60

50

40

30

20

10

0
49,5 51,5 53,5 55,5 57,5 59,5 61,5

FRECUENCIA ABSOLUTA
60

50

40

30

20

10

0
49,5 51,5 53,5 55,5 57,5 59,5 61,5
FRECUENCIA RELATIVA

61,5 49,5
59,5
51,5
57,5

53,5
55,5

49,5 51,5 53,5 55,5 57,5 59,5 61,5

MTC
Media 54,89487179
Mediana 52,44736842
Moda 53,63333333

CUARTILES
No agrupados Agrupados
Q1 52,62021033 2 53,0869565
Q4 54,41905098 4 54,4032258
Q3 57,39571353 6 56,9375

DECILES PERCENTILES
No agrupados Agrupados No agrupados Agrupados
D5 97,5 54,4117301 54,4473684 P25 48,75 52,5634895 53,0869565
D7 136,5 56,8420834 56,8714286 P50 97,5 54,4117301 54,4032258

RANGO COEFICIENTE
12 0,052071599

VARIANZA DESVIACIN
8 2,863935223
ANLISIS
Como se puede observar el rango es estrecho y la media se encuentra en 54,89 con un valor mnimo
de 48,97 y un mximo de 61,41. El anlisis en datos agrupados es menos exacto, ya que se trabaja
por intervalos. Todas las medidas de tendencia central se ubican en intervalos diferentes. Se puede
concluir que el ndice de empleo es apenas superior a la mitad de la poblacin segn los datos
obtenidos. Los datos se encuentran dispersos en un 5,2% segn el coeficiente de variacin. Lo que
es lgico debido a que el rango es tan solo de 12. La desviacin corresponde a la raz cuadrada de la
varianza.

Elaborado por: Edna Viviana Lavao

- Variable: ndice de Precios

Tabla de frecuencia para datos agrupados


Datos para la creacin de la Tabla de Frecuencia
Indice de Precios
Frecuancia Absoluta
40
35
30
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9

Indice de Precios
40
35
30
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9

Media

=

Moda

= +
+ +

Mediana


= +


1
= + 4

El 25% del ndice de precios esta entre 62.6 y 81.47, el 50% entre 62.6 y 99.37 y el 75% entre 62.6
y 112.46.

1
= + 4


1
= + 4

Anlisis
Desde enero de 2001 hasta marzo de 2017, se ve a simple vista que el ndice de precios siempre ha
ido ascendiendo, la media es de 97.84. El 25% del ndice de precios se encuentra entre 62.6 y 81.47
y el 50% entre 62.6 y 99.37.

Elaborado por: Pedro Alonso Bedoya

- Variable: Inversin nacional e internacional en el pas en billones


F. F. Abs Freq. Freq. Marca de M. Clase x F. Feq %.
Intervalo Lim. Inf Lim. Sup
Abs Acum Relativa Porcentual Clase Abs Acum
1 7295359 9835832 17 17 0,087 8,718 8565595,5 145615123,5 8,718
2 9835832 12376305 14 31 0,072 7,179 11106068,5 155484959 15,897
3 12376305 14916778 17 48 0,087 8,718 13646541,5 231991205,5 24,615
4 14916778 17457251 19 67 0,097 9,744 16187014,5 307553275,5 34,359
5 17457251 19997724 15 82 0,077 7,692 18727487,5 280912312,5 42,051
6 19997724 22538197 16 98 0,082 8,205 21267960,5 340287368 50,256
7 22538197 25078670 8 106 0,041 4,103 23808433,5 190467468 54,359
8 25078670 27619143 13 119 0,067 6,667 26348906,5 342535784,5 61,026
9 27619143 30159616 11 130 0,056 5,641 28889379,5 317783174,5 66,667
10 30159616 32700089 14 144 0,072 7,179 31429852,5 440017935 73,846
11 32700089 35240562 12 156 0,062 6,154 33970325,5 407643906 80,000
12 35240562 37781035 13 169 0,067 6,667 36510798,5 474640380,5 86,667
13 37781035 40321508 15 184 0,077 7,692 39051271,5 585769072,5 94,359
14 40321508 42861981 11 195 0,056 5,641 41591744,5 457509189,5 100,000
195 100,000

Frecuencia Absoluta
Series1

20
18
16
14
12
10
8
6
4
2
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14

Frecuencia Absoluta
Acumulada
Series1

250

200

150

100

50

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Frecuencia Relativa
Porcentual

5% 9%
8%
7%
7%
9%
6%
7% 10%

8%
7%
5% 8%

4%

1 2 3 4 5 6 7 8 9 10 11 12 13 14

Media
23990826,43

Moda
15763602,33

Mediana
22458807,22

Cuartiles Intervalo
Q1 15028857,7 3
Q2 22458807,2 6
Q3 33108379,3 10

Deciles Intervalo
D5 22458807,2 6
D7 31339121,3 10

Percentiles Intervalo
P25 15028857,7 3
P50 22458807,2 6

Varianza
1,07864E+14

Desv. Tipica
10385779,94

Coef. Pearson
0,432906302

Anlisis: El intervalo que tiene la mayor frecuencia absoluta es el nmero 4, con una frecuencia
absoluta de 19, este ser el intervalo que usaremos para el clculo de la moda. Con el coeficiente
de dispersin obtenidos podemos decir que los datos se encuentran dispersos en un 43% por encima
o por debajo de la media.

Elaborado por: Diana Carolina Gonzlez

- Variable: Tasa de empleo (%)

marca frecuencia

limite limite de clase frecuencia absoluta
NUMERO DE CLASES DE INTERVALOS inferior superior (x) absoluta acumulada
1 48,97 50,35 49,66 4 4 198,64
2 50,35 51,73 51,04 20 24 1020,8
3 51,73 53,11 52,42 46 70 2411,32
4 53,11 54,49 53,8 29 99 1560,2
5 54,49 55,87 55,18 18 117 993,24
6 55,87 57,25 56,56 25 142 1414
7 57,25 58,63 57,94 25 167 1448,5
8 58,63 60,01 59,32 20 187 1186,4
9 60,01 61,39 60,7 8 195 485,6
195 10718,7

NUMERO DATOS 195


MINIMO 48,97
MAXIMO 61,41
RANGO 12,44
k= LOG(N)*3,332+1 8,607494979
AMPLITUD 1,382698
Media 54,9676923
Moda 52,2932653
Mediana 54,4186207

Valor por Cuartil


Q1 Q2 Q3
195 195 195
48,75 97,5 146,25
24 70 142
46 29 25
51,73 53,11 57,25
1,38 1,38 1,38
52,26 53,62 57,42

Valor por Decil


D5 D7
195 195
9,75 13,65
4 4
20 20
50,35 50,35
1,38 1,38
50,63 50,83

Valor por Percentil


P25 P50
195 195
48,75 97,5
24 70
46 29
51,73 53,11
1,38 1,38
52,26 53,62
12000,00

10000,00

8000,00

6000,00

4000,00

2000,00

0,00
1 2 3 4 5 6 7 8 9

limite inferior limite superior


marca de clase (x) frecuencia absoluta
frecuencia absoluta acumulada
CONCLUSIONES

Con la realizacin de este trabajo fue posible analizar el comportamiento de las variables discretas
y continas seleccionadas por cada participante del grupo de acuerdo a sus resultados de media,
mediana, moda, cuartiles, deciles, percentiles, varianza, rango, desviacin estndar, coeficiente de
varianza y a travs del anlisis de tablas de frecuencia y grficos tanto de frecuencias como de
barras.
REFERENCIAS BIBLIOGRFICAS

Montero, J. M. (2007). Conceptos Generales Estadstica descriptiva. Madrid: Paraninfo.


Pgina 3 - 16 Recuperado de
:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100007&v=2.1&u=unad&it=r&p
=GVRL&sw=w&asid=0a7332df0d4700de0bd272caa41e1718

Montero, J. M. (2007). Caractersticas de Una Distribucin de Frecuencias. Statistical


Descriptive. Cengage Learning Paraninfo, S.A. Pgina 4 10 Recuperado
de:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052900008&v=2.1&u=unad&it=r
&p=GVRL&sw=w&asid=84a84913a25d9dfd21d0a0d3deb41dea

Montero, J.M. (2007).Regresin y Correlacin Simple. Madrid: Paraninfo. Paginas. 130


172. Recuperado
de: http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r
&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219

Churchill, G.A.(2009).Anlisis de Correlacin y de Regresin Simple. Mexico City:


Cengage Learning. Pginas 675 686 Recuperado
de:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it=r
&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41

Churchill, G.A.(2009). "Anlisis de Regresin Mltiple." Investigacin de mercados.


Mexico City: Cengage Learning. Pginas 686 695.Recuperado
de:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900234&v=2.1&u=unad&it=r
&p=GVRL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9

Pacheco, P. N., Vergara, S .C (2013). Universidad Nacional de Colombia. Bogot.


Estadstica Fundamental. Recuperado
de:http://168.176.60.11/cursos/ciencias/1000012/un2/html/leccion1.html

Garca, J.E (2005).Anlisis de Datos Unidimensionales.et al. Madrid: Paraninfo. Pgina


26 -51 Recuperado
de: http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052300007&v=2.1&u=unad&it=r
&p=GVRL&sw=w&asid=03f8699ec7ccf10e8745c0ceb7b85bf1

Anda mungkin juga menyukai