Estudiantes
100105_130
Presentado a
15 de abril de 2018
1
INTRODUCCION
2
JUSTIFICACIÓN
El presente trabajo se hace con el propósito de que cada uno de los integrantes
aprendan a analizar, para ello dan distintas medidas de tendencia central, de
dispersión y univariantes las cuales permiten a los estudiantes analizar datos de
una manera diferente un poco más profunda obteniendo información que a
simple vista no se puede hallar, como encontrar el promedio de una calificación,
por ejemplo, que estudiante saco mayor puntaje o el menor, cuántos de los
estudiantes tienen cierto puntaje, que tan confiable es la información, que
comportamientos influyen para que algunos estudiantes tengan información tan
baja según las variables, etc.
3
OBJETIVOS
Objetivo general:
Objetivos específicos:
4
MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL
VARIABLE DISCRETA
Definir las medidas de tendencia central y las fórmulas a utilizar para datos no
agrupados (variables discretas).
MEDIA 25.286.286
MEDIANA 25.173.301
MODA #N/A amodal
CUARTIL 1 23.091.274
CUARTIL 2 25.173.301
CUARTIL 3 27.423.183
DECIL 5 25.173.301
DECIL 7 26.980.170
PERCENTIL 30 23.352.442
PERCENTIL 50 25.173.301
Gráfica:
30,000,000
25,000,000
20,000,000
15,000,000
10,000,000
5,000,000
-
46
151
1
6
11
16
21
26
31
36
41
51
56
61
66
71
76
81
86
91
96
101
106
111
116
121
126
131
136
141
146
156
5
Estudiante 2: Ingrid Yuraine Roa Daza
Variable discreta: Precio del dólar
MEDIA 2.235
MEDIANA 2.066
MODA N/A
CUARTIL 1 1885
CUARTIL 2 2066
CUARTIL 3 2514
DECIL 5 2066
DECIL 7 2340
PERCENTIL 30 1902
PERCENTIL 50 2066
Gráfica:
11
16
21
26
31
36
41
46
51
56
61
66
71
76
81
86
91
96
101
106
111
116
121
126
131
136
141
146
151
156
6
Estudiante 3: María Angelica Torres Aguilar
Variable discreta: Producción por persona
MEDIA 1.048.005
MEDIANA 1.059.331
MODA Modal
CUARTIL 1 827.707
CUARTIL 2 1.059.331
CUARTIL 3 1.273.786
DECIL 5 1.059.331
DECIL 7 1.232.176
PERCENTIL 30 827.707
PERCENTIL 50 1.059.331
Gráfica:
25 22 23
21 20
18 18 18 19
20
15
10
5
0
Marca clase
7
Producción por persona
159
Frecuencia Absoluta Acomulada 160 136
140 114
120 94
100 73
80 54
60 36
40 18
20
0
Marca clase
Marca Clase
8
Producción por persona
1.0
1.0 0.9
0.8 0.7
Frecuencia %
0.6
0.6 0.5
0.3
0.4 0.2
0.2 0.1
0.0
Marca clase
• La mediana fue el 50% del total de personas encuestadas con un total del
25.173.301 de los hogares colombianos con empleo durante el periodo
comprendido entre enero del 2004 hasta el mes de marzo del 2017.
• Para el 01 cuartil podemos deducir que corresponde al valor del 25% del
conjunto de datos de las personas que cuentan con empleo para los periodos
comprendidos entre enero del 2004 hasta el mes de marzo del 2017.
9
• El 03 cuartil nos muestra el 75% del conjunto de datos de las personas
que cuentan con empleo para los periodos comprendidos entre enero del 2004
hasta el mes de marzo del 2017.
• El decil 07 nos muestra el valor del 70% menos del 100% de personas
encuestadas con empleo del conjunto de datos tomados del caso estudio con un
valor de 26.980.170 durante los periodos comprendidos entre enero del 2004
hasta el mes de marzo del 2017.
10
Maria Angelica Torres
Según los datos escogidos se halla una relación entre cuartil 1 y el percentil 25,
los cuales se hallan en la posición 40 con un valor determinado en 827.707.
Además se hallan más similitudes como en el cuartil 2, decil 1 y percentil 50, los
cuales están es posición 80 con un valor determinado de 1.059.331 los que
equivalen a la producción por persona; El cuartil 3 tiene una posición de 120 con
un valor de 1.273.786 de producción por persona en el periodo de enero de 2004
y marzo de 2017 y el decil 7 tiene posición de 112 con un valor de 1.232,176 de
producción por persona en el periodo de enero de 2004 y marzo de 2017.
MEDIDAS DE DISPERSIÓN
VARIABLE DISCRETA
RANGO 5.591.251
𝑅 = 𝐷𝐴𝑇𝑂 𝑀𝐴𝑌𝑂𝑅 − 𝐷𝐴𝑇𝑂 𝑀𝐸𝑁𝑂𝑅
1063464,497
DESVIACIÓN
1,13096E+12
VARIANZA
21,50460983
COEFICIENTE DE VARIACIÓN
11
Estudiante 2: Ingrid Yuraine Roa Daza
Variable discreta: Precio del Dólar
1951
RANGO
DESVIACIÓN
466,9
VARIANZA
217994,2
COEFICIENTE DE VARIACIÓN
20,89
RANGO 884813
𝑅 = 𝐷𝐴𝑇𝑂 𝑀𝐴𝑌𝑂𝑅 − 𝐷𝐴𝑇𝑂 𝑀𝐸𝑁𝑂𝑅
257462,3483
DESVIACIÓN
6,6287E+10
VARIANZA
24,56690149
COEFICIENTE DE VARIACIÓN
5% a 20% homogéneo
Personas sin empleo durante el periodo de enero del 2004 a marzo del 2017
el promedio de hogares colombianos encuestados según el DANE de personas
sin empleo es 4.945.286 personas.
El promedio más bajo de las personas sin empleo es de 4.260.931.
El promedio más algo de las personas sin empleo es de 5.671.435
Según el coeficiente de variación muestra un resultado del 21.50% lo cual indica
que es una variación heterogénea por lo tanto la información es poco confiable
los índices de las personas sin empleo mes a mes durante los periodos a estudio
varían a gran escala.
𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑒𝑠𝑒𝑚𝑝𝑙𝑒𝑎𝑑𝑜𝑠
Si relacionamos la tasa de desempleo que son: ∗ 100
𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑎𝑐𝑡𝑖𝑣𝑎
podemos concluir que aunque la variabilidad del número de personas sin empleo
es grande, de acuerdo a la tasa de desempleo, las personas se han ocupado
más reduciendo el número de personas desempleadas durante los periodos mes
a mes de estudio, es decir ya que el índice de empleo no mostro gran variabilidad
el empleo incremento y las personas sin empleo redujeron.
13
Ingrid Roa Daza
Precio del Dólar
Definir cada una de las medidas de tendencia central y las fórmulas utilizadas
para datos agrupados (variables continuas).
No de datos n 159
Valor mínimo 7,27
Valor máximo 17,00
Rango 9,73
No de intervalos (k) 8,00
Amplitud de clase
(A) 1,22
%
Clase Frecuencia acumulado
8,59 12 7,55%
9,80 32 27,67%
11,02 38 51,57%
12,24 45 79,87%
13,45 21 93,08%
14,67 8 98,11%
15,89 2 99,37%
17,00 1 100,00%
y mayor... 0 100,00%
Histograma:
Histograma
50
45
40
35
FRECUENCIA
30
25
20
15 Frecuencia
10
poligono de frecuencias
5
0
CLASE
Polígono de frecuencias:
15
POLIGONO DE FRECUENCIAS
50
40
FRECUENCIA
30
20
poligono de frecuencias
10
0
1 2 3 4 5 6 7 8 9
CLASE
fk-1 29
fk+1 45
Ak 1,22
Lk 9,70
MODA #N/A
n/2 79,5
n 159
Fk-1 40
fk 40
Ak 1,22
Lk 79,5
MEDIANA 10,91
𝑘∗𝑁
, 𝑘 = 1,2 … 99
100
16
n 159 n 159
Fk-1 40 Fk-1 11
fk 40 fk 29
Ak 1,22 A 1,22
Lk 9,70 Lk 8,49
P50% 10,90592687 P25% 9,627717495
n 159
Min 9,37
Max 17,37
Rango 8
K 8
A 1
Frecuencia Frecuencia
Número de Límite Límite Marca de
absoluta absoluta
clases inferior superior clase
(f) acumulada
1 9,37 10,37 9,87 63 63
17
2 10,37 11,37 10,87 36 99
3 11,37 12,37 11,87 30 129
4 12,37 13,37 12,87 18 147
5 13,37 14,37 13,87 8 155
6 14,37 15,37 14,87 2 157
7 15,37 16,37 15,87 1 158
8 16,37 17,37 16,87 1 159
TOTAL 159
60
50
FRECUENCIAS
40
30
20
10
0
9.87 10.87 11.87 12.87 13.87 14.87 15.87 16.87
MARCA DE CLASE
fk-1 No hay
fk+1 36
Ak 1
Lk 9,37
MODA 10,07
n/2 79,5
18
n 159
Fk-1 63
fk 36
Ak 1
Lk 10,37
MEDIANA 10,83
39,75
K(n/100) 79,5 K(n/100)
n 159 n 159
Fk-1 63 Fk-1 0
fk 36 fk 63
Ak 1 A 1
Lk 10,37 Lk 9,37
P50% 10,825 P25% 9,998
N 159
Min 48,97
Max 61,41
Rango 12,4442861
K 8,31304125
A 1,56
Frecuencia
Número de Límite Límite Marca de Frecuencia
absoluta
clases inferior superior clase absoluta f
acumulada
20
Histograma:
HISTOGRAMA
50 45
45 40
40
Frecuencia Absoluta
35
29
30
25 22
20
15 11
10 8
5 3
1
0
7.88 9.10 10.31 11.53 12.75 13.96 15.18 16.39
Marca Clase
Polígono de frecuencias:
POLIGONO
50
45 45
40 40
Frecuencia Absoluta
35
30 29
25
22
20
15
10 11
8
5
3
0 1
7.88 9.10 10.31 11.53 12.75 13.96 15.18 16.39
Marca Clase
21
fk-1 19
fk+1 22
Ak 1,56
Lk 52,08
MODA 52,80
n/2 79,5
n 159
Fk-1 76
fk 23
Ak 1,56
Lk 55,19
MEDIANA 55,43
MEDIA 55,43
22
n/2 79,5 K(n/100) 111,3
n 159 n 159
Fk-1 76 Fk-1 99
fk 23 fk 25
Ak 1,56 A 1,56
Lk 55,19 Lk 56,74
D5 55,43 D7 57,51
El cuartil 01 nos muestra el 25% de los 159 datos estudiados referente a la tasa
de desempleo cuyo valor es del 9.62% y posición ordenada de 39.75 en la tabla
de datos del caso a estudio, lo que quiere decir que el 25% hace referencia a la
tasa de desempleo con un valor del 9.62% durante el periodo del mes de enero
del 2004 al mes de marzo del 2017.
El cuartil 02 nos muestra el valor del 50% del conjunto de datos seleccionados;
es decir el valor central de la tasa de desempleo durante enero del 2004 y marzo
del 2017 fue de 10.90%
El cuartil 03 nos muestra el 75% del conjunto de datos seleccionados el cual tiene
un valor del 12.00% de la tasa de desempleo durante el periodo del mes de enero
del 2004 al mes de marzo del 2017.
23
El decil 07 es la séptima parte de la serie de datos, al igual que el cuartil 03 nos
muestra el 75% del conjunto de datos seleccionados el cual tiene un valor del
12.00% de la tasa de desempleo durante el periodo del mes de enero del 2004
al mes de marzo del 2017.
El percentil 25 es el valor que toma la serie de datos que al igual que el cuartil 01
nos muestra el 25% de los 159 datos estudiados referente a la tasa de desempleo
cuyo valor es del 9.62% y posición ordenada de 39.75 en la tabla de datos del
caso a estudio, lo que quiere decir que el 25% hace referencia a la tasa de
desempleo con un valor del 9.62% durante el periodo del mes de enero del 2004
al mes de marzo del 2017.
El percentil 50 es el valor que toma la serie de datos que al igual que el cuartil
02 nos muestra el valor del 50% del conjunto de datos seleccionados; es decir el
valor central de la tasa de desempleo durante enero del 2004 y marzo del 2017
fue de 10.90%.
Durante el periodo del mes de enero del 2004 al mes de marzo del 2017 el
promedio de la tasa de desempleo fue del 10.9 %.
La tasa más alta de desempleo promedio fue del 12%.
La tasa de desempleo más baja promedio fue del 9.63%
El coeficiente de variación es del 16% lo que indica que los datos son
homogéneos por lo tanto la información es confiable las diferencias de los índices
de la tasa de desempleo han tratado de cierto modo mantenerse estables.
Los 159 datos de muestra, tienen una tendencia de 10,18, los cuales demuestran
una tasa de desempleo más frecuente durante el periodo de enero de 2004 y
marzo de 2017.
Los 159 datos de muestra, tienen una mediana de 10,91, valor central de los
datos muestra.
24
MEDIDAS DE DISPERSIÓN
VARIABLE CONTINUA
Definir las medidas de dispersión y las fórmulas utilizadas para datos agrupados
(variables continuas).
RANGO 9,73
𝑅 = 𝐷𝐴𝑇𝑂 𝑀𝐴𝑌𝑂𝑅 − 𝐷𝐴𝑇𝑂 𝑀𝐸𝑁𝑂𝑅
1,72767299
DESVIACIÓN
2,984853962
VARIANZA
15,8378331
COEFICIENTE DE VARIACIÓN
RANGO
DESVIACIÓN
1,4113
VARIANZA
1,9918
COEFICIENTE DE VARIACIÓN
25
12,6461
Estudiante 3:
Variable continua:
RANGO 0
DESVIACIÓN Na
VARIANZA Na
COEFICIENTE DE VARIACIÓN Na
26
CONCLUSIONES
REFERENCIAS BIBLIOGRÁFICAS
28
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&i
t=r&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41
29