Presentado Por:
EMMA MARIA AROCA C.C.: 39070092
ANDREA MARCELA MORA
EDINSON MANUEL MARTINEZ
AURA ESTRELLA SAUMETH
RUTH TATIANA MONTES
Tutor:
CARLOS AUGUSTO GONZALEZ
Grupo: 204040_163
INTRODUCCION
Descripción de la actividad.
Descripción de la actividad.
Una vez ajustada la base de datos, el grupo deberá tomar mínimo cinco
solicitada a continuación:
Variable cualitativa
Descripción de la actividad
Los cálculos de los parámetros los podrán realizar con el programa Excel
o Infostat,
Las Variables cualitativas escogidas son el tipo de riesgo al que se
expone la población y el grado de Marginación.
Tipo de Riego al que
se expone la
población frecuencia
Movimientos en masa 11
Sequías 5
Vulcanismos 9
Heladas 4
Sismos 11
Avenidas torrenciales 7
Desbordamientos 3
Total 50
Tipo de Riesgo al que se expone la población
Desbordamientos
,3
Avenidas Movimientos en
torrenciales, 7 masa, 11
Sequías, 5
Sismos, 11
Vulcanísmos, 9
Heladas, 4
Sequía 2 2 1
POBLACIÓN
Vulcanismo 1 5 3
Heladas 1 3
Sismo 1 4 5 1
Avenidas torrenciales 3 3 1
Desbordamientos 1 2
Descripción de la actividad
Media
∑𝑁
𝑗=1 𝑗 398.237
= = =
𝑁 50
̅ = 7.964,74
Mediana:
Mediana
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 5 = 4.854
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 4.854
Moda: Moda
No existe la moda porque ningún dato se repite
Cuartiles
Cuartiles
Primer Cuartil (Q1)
1 1
𝑄1 = 1 + 13 = 2.311 + 2.960 =
2 2
𝑄1 = 2.635,5
Segundo Cuartil (Q2)
𝑄 = 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 4.854
Tercer Cuartil (Q3)
1 1
𝑄3 = 37 + 38 = 8.352 + 9.159 =
2 2
𝑄3 = 8.759
Rango (R)
𝑅 = 50 1= 73.296 678 =
𝑅 = 72.618
2
Varianza (s ):
∑𝑁=1 5.713.733.527,62
𝑠 = = =
𝑁 50
𝑠 = 114.274.670,55
Desviación típica(s=)
𝑠 = √𝑠
𝑠 = √114.274.670,55 =
𝑠 = 10.689,93
Coeficiente de variación (V)
𝑠 10.689,93
𝑉= = =
7.964,74
𝑉 = 1,34
Para la variable continúa elegida, se deberán calcular las medidas
univariantes de tendencia central: Media, Mediana, Moda. Todos los
cuartiles Así mismo deberán calcular las medidas univariantes de
dispersión: Rango, Varianza, Desviación típica y Coeficiente de variación.
Los cálculos de los parámetros los podrán realizar con el programa Excel
o Infostat,
% de % de
Población de Población de
N° 15 años o N° 15 años o
más más
analfabeta analfabeta
1 2,11 26 8,14
2 3,46 27 8,20
3 3,79 28 8,27
4 4,01 29 8,31
5 4,18 30 8,31
6 4,23 31 8,52
7 4,80 32 9,20
8 4,89 33 9,43
9 5,14 34 9,55
10 5,16 35 9,57
11 5,24 36 9,80
12 5,45 37 10,13
13 5,52 38 10,13
14 5,66 39 10,18
15 5,83 40 10,56
16 6,38 41 10,82
17 6,50 42 10,95
18 6,81 43 11,02
19 7,13 44 11,27
20 7,16 45 11,36
21 7,17 46 13,77
22 7,45 47 14,57
23 7,57 48 16,18
24 7,91 49 17,09
25 7,98 50 19,47
Fórmula de Sturges
𝑐 = 1 + 3,322 ∗ log 𝑁
𝑐 = 1 + 3,322 ∗ 𝐿𝑜𝑔 50 =
𝑐 = 6,64 ≈ 7𝑐𝑙𝑎𝑠𝑒𝑠
Amplitud (a)
𝑀𝑎𝑦𝑜𝑟 𝑚𝑒𝑛𝑜𝑟
𝑎= =
𝑐
19,47 2,11
𝑎= =
7
𝑎 = 2,48
Distribución de frecuencias
% de Población de 15
frecuencias
años o más analfabeta
2,10 4,58 6
4,59 7,07 12
7,08 9,56 16
9,57 12,05 11
12,06 14,54 1
14,55 17,03 2
17,04 19,52 2
50
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 8,17
La Moda
∆1
𝑀𝑜𝑑𝑎 = 𝐿1 + ( )∗𝑐
∆1 + ∆
𝐿1: frontera inferior de la clase modal
∆1: exceso de la frecuencia modal sobre la clase inferior inmediata
∆ : exceso de la frecuencia modal sobre la clase superior inmediata
c: anchura del intervalo de la clase modal
La clase modal es la tercera clase
4
𝑀𝑜𝑑𝑎 = 7,075 + ( ) ∗ 2,49 =
5+4
𝑀𝑜𝑑𝑎 = 8,18
Cuartiles
Primer Cuartil (Q1)
𝑁
∑𝑓
𝑄1 = 𝐿1 + ( 4
1
)∗𝑐
𝑓𝑐𝑢𝑎𝑟𝑡 𝑙
donde:
L1: Límite inferior de la clase cuartil
N: número de datos (frecuencia total)
∑ 𝑓 1: suma de las frecuencia de la clases inferiores a la clase cuartil
fcuartil: frecuencia de la clase cuartil
c: anchura del intervalo de la clase cuartil
𝑁
∑𝑓 1
𝑄1 = 𝐿1 + ( 4 )∗𝑐
𝑓𝑐𝑢𝑎𝑟𝑡 𝑙
La clase cuartil es la segunda
50
6
𝑄1 = 4,59 + ( 4 ) ∗ 2,49 =
12
𝑄1 = 5,94
Segundo Cuartil (Q2) es igual a la mediana:
𝑄2 = 8,17
Tercer Cuartil (Q3):
3𝑁
∑𝑓 1
𝑄3 = 𝐿1 + ( 4 )∗𝑐
𝑓𝑐𝑢𝑎𝑟𝑡 𝑙
La clase cuartil es la cuarta clase
37,5 34
𝑄3 = 9,57 + ( ) ∗ 2,49 =
11
𝑄3 = 10,36
Medidas de Dispersión:
Rango (R)
𝑅 = 𝑀𝑎𝑦𝑜𝑟 𝑚𝑒𝑛𝑜𝑟 =
𝑅 = 19,47 2,11 =
𝑅 = 17,36
2
Varianza (s )
∑𝑁
𝑗=1 𝑗 211,95
𝑠 = = =
𝑁 50
𝑠 = 4,24
7
6
disponibles
5
4
3
2
1
0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
poblacion total (habitantes)
Podemos concluir según el diagrama que si existe correlación entre las dos
variables, que su dirección es positiva
b. Encontrar el modelo matemático que permite predecir el efecto de una variable
sobre la otra. ¿Es confiable?
y = 7E-06x + 3,1979
R² = 0,1405
r: 0,3748964
la correlación entre las variables es mínima
Resumen
Estadísticas de la regresión
Coeficiente de0,41406899
correlación múltiple
Coeficiente de0,17145313
determinación R^2
R^2 ajustado 0,13619582
Error típico 3,32155862
Observaciones 50
En los datos obtenidos se observa que partir del coeficiente de correlación r2 que nos da un
valor de 0,136 un valor que se encuentra entre menor a 0,30 y nos muestra que la relación
que existe entre las variables múltiples según el grado de correlación lineal en nula lo que
quiere decir que no hay correlación entre las variables múltiples.
cantidad
nivel de
mayoritario de servicios
Sisbén públicos
disponibles
1 4
1 5
2 7
2 5
1 4
1 4
2 4
1 3
1 2
1 2
2 4
1 5
1 4
1 1
1 7
1 3
1 0
2 4
1 3
2 3
1 3
1 1
1 6
1 3
2 5
1 3
1 2
1 1
1 4
1 3
1 3
1 2
1 2
2 5
1 5
1 4
2 3
1 2
1 7
2 3
1 0
1 3
2 1
2 5
1 4
1 4
2 5
1 3
1 4
1 2
7
6
5
4
3
2
1
0
0 0.5 1 1.5 2 2.5
CANTIDAD DE SERVICIOS PUBLICOS DISPONIBLES
g. Encontrar el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?
y= 0,09647x+2,2245
En las dos variables escogidas y según el diagrama de dispersión a mayor nivel de sisbén,
más cantidad de servicios públicos disponibles.
Va en aumento, lo que quiere decir que se presenta una dispersión positiva entre las variantes,
un aumento dado de X (nivel mayoritario de sisbén) determina con exactitud otro de Y
(cantidad de servicios públicos disponibles)
Cantidad de servicios
publicos disponibles
8
6
4
2
0
0 10 20 30 40 50 60
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,260104397
k. Relacionar la información
Coeficiente de determinación R^2 0,067654297 obtenida con el problema.
R^2 ajustado 0,048230429
Error típico 1,603173827
Observaciones 50
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadradosPromedio de los cuadrados F Valor crítico de F
Regresión 1 8,952016632 8,952016632 3,48305 0,068116274
Residuos 48 123,3679834 2,57016632
Total 49 132,32
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción 2,224532225 0,689609252 3,225786515 0,00226 0,837979894 3,611084555 0,837979894 3,611084555
Variable X 1 0,964656965 0,516883987 1,866292995 0,06812 -0,074607946 2,003921875 -0,074607946 2,003921875
En el caso de análisis de varianza se obtiene p-valor menor a 0,05 lo que
significa que el modelo es válido globalmente para hacer una predicción.
El p-valor para la constante (B0) es también menor a 0,05 lo mismo ocurre
para el p-valor correspondiente a B1 lo que quiere decir que ambos
estimadores pueden permanecer en el modelo.
El r2 es de 0,92 los que quiere decir que el 92% de la Población de 15
años sin Educación Básica Primaria Completa se explica por cambios en
la Población Total
l. Realizar regresión múltiple en caso de que se determine
dependencia entre las variables cuantitativas
Descripción de la actividad.
Hay 34 municipios cuyo % de la población ocupada con ingresos de hasta
2 salarios mínimos se encuentra entre 42,92 % y 51,07 % con una media
de 46,99 % lo que indica que una cantidad importante de la población
tiene esos ingresos.
Hay 6 municipios cuyo % de la población ocupada con ingresos de hasta
2 salarios mínimos se encuentra entre 18,45 % y 26,61 % con una media
de 22,53 % lo que es indica menores ingresos.
Los resultados obtenidos indican que el promedio de la población de los
125 municipios de Colombia la población ocupada con ingreso hasta 2
salarios mínimos es 43,49% lo que se puede considerar bastante
aceptable teniendo en cuenta que la mayoría de la población debe ganar
solamente el salario mínimo.
Los valores de moda y media están muy cercanos al promedio lo que
indican que la mayoría de los datos se encuentran muy cerca del valor
promedio.
Esto también aparece reflejado en los resultados obtenidos en las medidas
de dispersión que para el rango o amplitud de los datos los valores
muestran poca dispersión.
Se puede concluir que el porcentaje de la población ocupada con ingresos
hasta 2 salarios mínimos es cercano a la mitad en los 125 municipios.
Con la información procesada y la propuesta de solución, el grupo
colaborativo deberá consolidar un informe Descriptivo de la
problemática planteada y trabajada durante el periodo académico. El
informe debe consolidar las variables cualitativas, las variables
cuantitativas discretas y las cuantitativas continuas con sus respectivas
conclusiones.
NOTA: Describir es explicar, representar, definir con detalle, las
cualidades características o las circunstancias de algo o de alguien.
Evaluación Formativa:
actividad
Conclusiones
situación que nos permite tomar las decisiones adecuadas que conducen
se hizo el estudio.
Referencias Bibliográficas