Anda di halaman 1dari 10

0

Facultad de Ingeniería y Ciencias Básicas

Estadística II

Modalidad Virtual

Contexto

A continuación, se tiene la información de la Gran encuesta integrada de Hogares (GEIH), realizada por el DANE [1].
Esta encuesta se hace en las 13 ciudades principales del Colombia
(Bogota,Medellin,cali,barranquilla,Bucaramanga,manizalez,pasto,Pereira,ibague,cucuta,villavivencio,montería,Cartagena)
y 11 ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva, Riohacha, Santa Marta, Armenia,
Sincelejo, San Andrés). Esta encuesta, se solicita información sobre las condiciones de empleo de las personas (Si
trabajan, en que trabajan, cuánto ganan, si tienen seguridad social en salud o si están buscando empleo), además de las
características generales de la población como sexo, edad, estado civil y nivel educativo, se pregunta sobre sus fuentes
de ingresos. La GEIH proporciona al país información a nivel nacional, cabecera resto, regional, departamental, y para
cada una de las capitales de los departamentos.

Parte 1.

Tamaño de Muestra

Utilizando la variable edad (P6040), realice lo siguiente:

 Realice un Histograma y describa la información según la forma y la curtosis de los datos.


Primero contamos cuantas personas hay en cada una de las edades clasificadas mediante una tabla dinámica.
 Definimos el rango restando el mayor de los datos y restándole el menor de los datos

RANGO 101

 Definimos los intervalos con la formula (1+3,322)*LOG (60356)

INTERVALOS 20,7

 Definimos la amplitud dividiendo el rango entre la cantidad de intervalos obtenidos

AMPLITUD 5
 Definimos el inicio y el fin de cada intervalo, en el primer caso vemos que el primer intervalo inicia en 0 y termina
en 5, después definimos la frecuencia que es la cantidad de datos que están entre cada intervalo.

INTERVALOS LI LS MARCA DECLASE FRECUENCIA


1 0 5 5 4775
2 5 10 8 5237
3 10 15 13 5751
4 15 20 18 5722
5 20 25 23 5490
6 25 30 28 5023
7 30 35 33 4333
8 35 40 38 3825
9 40 45 43 4007
10 45 50 48 3846
11 50 55 53 3277
12 55 60 58 2598
13 60 65 63 1975
14 65 70 68 1501
15 70 75 73 1213
16 75 80 78 857
17 80 85 83 513
18 85 90 88 282
19 90 95 93 99
20 95 100 98 29
21 100 105 103 3
60356
Por ultimo graficamos la cantidad de datos en cada intervalo

HISTOGRAMA
6000
5000
4000
3000
2000
1000
0
5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 105

CURTOSIS -1,2

Se trata de una platicurtica y hay una menor concentración de datos en torno a la media
 Realice una descripción numérica y descripción como es la población.

DESCRIPCION NUMERICA:
CANTIDAD DE DATOS 60356
SUMATORIA 1869360
MEDIA 30,97
MODA 11,00
VARIANZA 430,77
DESVIACION 20,75

DESCRIPCION POBLACION: la mayoría de la población del censo se encuentra entre los 15 y 25 años de edad, se
evidencia que hay muchas más personas jóvenes que ancianos.

 Calcule una nueva variable que sea el P6040 new = P6040 2/3

Tomamos cada uno de los datos de la columna P6040 y lo elevamos a la 2/3 como se ilustra en la siguiente imagen.

P6040 P6040new
2 1,59 primer dato
60 15,33 último dato
 Teniendo en cuenta la variable anterior realice el cálculo del tamaño de muestra, utilizando la siguiente
formula:

Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95% y un margen de error absoluto que
no supere 0,5.

R/ calculamos la desviando estandar para todos los datos de la P6040new

Donde, se tiene lo siguiente:

=+DESVEST.P(B2:B60358)

S Desviación Estándar 4,57

Margen de Error 0,035


Z : Es el cuantil de la distribuccion normal estandar al nivel de significancia que se establezca.

cuantil Z 1,96
Hallamos la muestra

˳
n : (1,96²)*(4,57²) = 65493,8316
0,035²
n: 65493.8316 = 31410
1+(65493.8316/60358)

 Teniendo en cuenta los resultados anteriores, realice una selección de elementos para una muestra,
utilizando el algoritmo del coordinado negativo.

=+ALEATORIO.ENTRE (1; 60358)

P6040new aleatorio
7,61 37059
16,98 7704
12,84 54518
3,30 14431
2,52 9620
4,00 39878
14,29 42051
17,63 20666
8,55 2896
8,78 25134

 Compara la media poblacional con la media muestral y determine la variación negativa

MEDIA MUESTRAL 9,3202


MEDIA POBLACION 9,2881
VARIACION RELATIVA -0,344%

Nombre: Marlín González Romero

Código: 1721981807