Anda di halaman 1dari 14

CONSOLIDACION DEL TRABAJO COLABORATIVO SEMANAS 3, 4, 5.

ALUMNOS:
ANDRES FELIPE ZAPATA ARREDONDO 1811021415.
SANDRA MILENA JARAMILLO VALENCIA 1711023667.
LUZ AMPARO ESPITIA MESA 1621022312.

PROFESOR:
FABIO ORTEGON.

POLITECNICO GRAN COLOMBIANO

ESTADISTICA II

2019
OBJETIVOS.

La función principal de la estadística II es la recolección y agrupamiento de datos


de diversos tipos para construir con ellos informes estadísticos que nos den ideas
diferentes y muy variados temas.

Este trabajo colaborativo se basó en el aprendizaje del módulo Estadística II, donde
aprendimos temas como tipos de muestreo, estadística descriptiva, distribuciones
muestrales, estimación de intervalos, pruebas de hipótesis y análisis de datos; los
cuales son de real aprovechamiento para nuestra vida cotidiana.
DESARROLLO DE LA ACTIVIDAD.

A. SELECCIÓN DE LA MUESTRA.

1. En ocasiones en que no es posible o conveniente realizar un censo (analizar a


todos los elementos de una población), se selecciona una muestra,
entendiendo por tal una parte representativa de la población. En ese sentido,
escoja un tipo de muestreo y argumente la viabilidad de esta técnica para la
base de datos dada. Para seleccionar una muestra debe tenerse en cuenta el
cómo seleccionar los elementos que formarán parte de la muestra (tipo de
muestreo) y cuántos elementos debemos seleccionar (Tamaño de muestra).

R/ El muestreo que escogimos fue el muestreo por conglomerados ya que en este


podemos dividir la población en grupos y así obtener datos más exactos.

2. Utilizando la variable género P (6020) determine el tamaño de la muestra1


seleccionando adecuadamente justificando:
a. Fórmula a desarrollar
b. Estimación de la proporción de mujeres
c. Nivel de confiabilidad
d. Error de estimación

R/ Para poder desarrollar el punto A primero tuvimos que determinar la


estimación de la proporción de mujeres en este caso lo solucionamos
directamente en Excel usando la siguiente fórmula:

=CONTAR.SI (G2:G60357;G60355) en este identificamos la cantidad de mujeres


en la base de datos. Que da un total de 31969.

=CONTAR.SI (G2:G60357;G60352) en este identificamos la cantidad de


hombres en la base de datos. Da un total de 2887.
El porcentaje se halla dividiendo la cifra de cantidad de hombres o de mujeres
por la cantidad total de personas en total y luego multiplicándolos por 100 por
ejemplo: en el caso de las mujeres se realiza de la siguiente manera
31969
∗ 100 = 52,967
60356
La cual aproximamos a 53% de la cantidad de mujeres en dicha población.

Para el caso de los hombres es lo mismo, es decir:


28387
∗ 100 = 47,032
60356
dejando un 47% de la población restante que serían los hombres.

Ahora que obtuvimos estos resultados pasamos a resolver el punto A, en este


usamos la siguiente fórmula:
𝑁 ∗ 𝑍2𝑎 ∗ 𝑃 ∗ 𝑄
𝑛= 2
𝑑 ∗ (𝑁 − 1) + 𝑍 2 𝑎 ∗ 𝑃 ∗ 𝑄
Donde:
N: tamaño de la población P: proporción esperada Z: parámetro
estadístico
D: error de ocurrencia Q: proporción no esperada

Para poder dar solución a la fórmula debemos hallar Z que es el parámetro


estadístico, el cual se halla así en Excel:

Debemos de tener varios datos tales como: tamaño de la muestra, nivel de


significación y la desviación estándar.

El tamaño de la muestra lo tenemos, el nivel de significación elegimos ponerlo


como 0,05 y la desviación estándar la hallamos con la fórmula =desvest.

La fórmula para hallar el parámetro es =Intevalo.confianza; donde se toman los


resultados y se hallo como total final 20,2072474, el cual aproximaremos y
dejaremos como 20,2.
Quedaría así:

N: 60356 P:0,53 Z:20,2 Q:0,47 D:50

60356 ∗ (20,2)2 ∗ 0,53 ∗ 0,47


𝑛=
(50)2 ∗ (60356 − 1) + (20,2)2 ∗ 0,53 ∗ 0,47
Se cancelan factores comunes quedando:
60356
𝑛=
(50)2 ∗ (60356 − 1)
Resolvemos paréntesis, multiplicación y resultado final
60356 60356 60356 60356
𝑛= 2
= 2
= = = 239,6047
(50) ∗ 60355 (50) ∗ 60355 2500 ∗ 60355 150887599

Tenemos que el tamaño de la población es de 239.

c. Para determinar el nivel de confiabilidad usamos la fórmula:

Donde es la proporción de la muestra, X es el número de éxitos el cual


reemplazamos con la probabilidad de éxitos y n el número de elementos de la
muestra, entonces quedaría así:

Como porcentaje quedaría en 39,74% de nivel de confiabilidad.

D) El error de estimación lo podemos calcular del total del nivel de confiabilidad


restando a base del 100%, entonces;
100- 39,74= 60,26% este sería el nivel de error a estimar.
B. Intervalo de confianza para dos variables numéricas.

Un investigador, cree determinar que existen diferencias entre los niveles de estudio
de los hombres y las mujeres en Colombia. Para determinar lo anterior, use la
“muestra” encontrada en la semana 3:

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma


para los hombres y mujeres. Según los resultados, ¿Existen diferencias?

R/ Aquí usamos la función =contar.si para hallar los valores. En total hicimos el
conteo con 401 personas de las cuales 209 son mujeres y 192 hombres. Con estos
datos hallamos la tabla.

Nivel de estudios Grados Hombres Mujeres Total


Sin estudios 0 o nada 44 14 58
Primaria Grados 1-5 50 57 107
Bachiller Grados 6-11 80 77 157
Técnico/Tecnólogo Grados 12- 13 29 42
15
Universitario Grados 16- 5 32 37
22
Superiores Grados 23- 0 0 0
25
Total 192 209 401

Histograma
450
400
350
300
250
200
150
100
50
0
0 o nada Grados 1- Grados 6- Grados Grados Grados Total
5 11 12-15 16-22 23-25

Hombres Mujeres Total


Existen diferencias en la cantidad diferencial de mujeres y hombres y su rango de
preparación.

2. Asumiendo que los datos son normales, calcule un intervalo de confianza del
95% para estimar, la escolaridad promedio de los hombres y de las mujeres de
forma individual, en los niveles de estudio de Bachiller, Tecnólogo y
Universitario.

R/ Intervalo de confianza de escolaridad promedio de mujeres

𝜎
Fórmula a usar: 𝑥̅ ± 𝑍𝑎/2 ∗
√𝑛

𝑥̅ : 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑍𝑎/2 : 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝜎: 𝑑𝑒𝑠𝑐𝑖𝑎𝑐𝑖ó𝑛 𝑛: 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛

Debemos despejar la desviación, quedaría así:

2
∑(𝑥𝑖 − 𝑥̅ )2
𝜎 =
𝑛−1

Hallamos la muestra: cantidad de bachilleres, técnicos, universitarios.

77 + 29 + 32 138
𝑥= = = 46
3 2

X ̅
𝒙 Xi
X1 77 31
X2 29 -17
X3 32 -14
∑ 138 46

Hallamos la sumatoria:
∑(𝑥𝑖 − 𝑥̅ )2 = (𝑥1 − 𝑥̅ )2 + (𝑥2 − 𝑥̅ )2 + (𝑥3 − 𝑥̅ )2
= (77 − 46)2 + (29 − 46)2 + (32 − 46)2
= 961 + 289 + 196 = 1446
Despejamos:
∑(𝑥𝑖 − 𝑥̅ )2
𝜎2 =
𝑛−1

1446
𝜎2 = = 10.55
138 − 1

Despejamos o:
𝜎 = √10.55 = 3.24

Ahora reemplazamos en la fórmula inicial.

𝜎
𝑥̅ ± 𝑍𝑎/2 ∗
√𝑛

3.24
46 + 95 ∗ = 72,20
√138

En el intervalo de hombres se hace lo mismo y el resultado sería: 89,37.

3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95%
para estimar la diferencia promedio de escolaridad para los hombres y mujeres,
en los niveles de estudio de Bachiller, Tecnólogo y Universitario.

Usaremos la fórmula:

(𝑥̅ 1 − 𝑥̅ 2) − (𝜇1 − 𝜇2)


𝑡=
𝑆12 𝑆2
√ + √ 2
𝑛1 𝑛2
(46 − 32.66) − (4.4 − 3.6) (13.34) − (0.8) 12.54
𝑡= = =
2 2 √0,07 + 0,35
√3.24 + 5.91 √10.49 + 34.92
138 98 138 98

12.54 12.54
𝑡= = = 19.59375
√0,42 0.64

La diferencia promedio de escolaridad para hombres y mujeres es del 19.59375 %

C. PRUEBA DE HIPÓTESIS PARA DOS VARIABLES CUALITATIVAS.

Un investigador, cree determinar que los hombres asisten más a un colegio oficial
que las mujeres en Colombia. Para determinar lo anterior, use la “muestra”
encontrada en la semana 3:

1. Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175)


y sexo (P6020), realice un diagrama de barras comparativo para los hombres y
mujeres en un solo gráfico. Según los resultados, ¿Existen diferencias?

Cuadro comparativo
Cantidad Asisten No No participaron en la
encuestados asisten encuesta
Mujeres 147 31 10 204
Hombres 142 45 8
Total 289 76 18
Comparación
289
300
250 204
200
147 142
150
76
100
45
31
50 10 8 18
0
Cantidad Asisten No asisten No participaron
encuestados en la encuesta

Mujeres Hombres Total

Si existen diferencias, hay hombres y mujeres que no asisten a establecimientos


oficiales, como hay otros que sí.

2. A. Con un nivel de confianza del 95%, estime e interprete la proporción de


hombres y de mujeres que asisten a un establecimiento oficial.

Para hallar la proporción usaremos la fórmula:

𝜎12 𝜎22
𝜇1 − 𝜇2 = (𝑥̅ 1 − 𝑥̅ 2) ± 𝑧 √ +
𝑛1 𝑛2

Dado a que en la solución de anteriores ejercicios se explicó como sacar la


desviación estándar y la media, decidimos dar solución directa.

−8612 −20002
𝜇1 − 𝜇2 = (20,5 − 26,5) ± 0,95 √ +
41 53
741321 4000000
𝜇1 − 𝜇2 = (−6) ± 0,95√ +
41 53

𝜇1 − 𝜇2 = (−6) ± 0,95√17240,02 + 75472.69

𝜇1 − 𝜇2 = (−6) ± 0,95√92712,71

𝜇1 − 𝜇2 = (−6) ± 0,95 ∗ (304,48)

𝜇1 − 𝜇2 = (−6) ± 289,25

Entonces tenemos varios resultados el de suma y resta, sería así:

𝜇1 − 𝜇2 = (−6) + 289,25 = 283,25


𝜇1 − 𝜇2 = (−6) − 289,25 = −295,25

B. Realice una prueba de hipótesis para determinar la afirmación del


investigador. Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo
anterior?

Se usa la fórmula:

𝑝 − 𝜋0
𝑍=
√𝜋0 (1 − 𝜋0 )
𝑛
Donde:
P=los que asisten
n=total de la población (asisten y no)
π=mitad del total de población

0,76 − 0,47
𝑍=
√0,47(1 − 0,47)
94

𝑍 = 145

De lo anterior se puede decir que si existe una diferencia a la hipótesis inicial.


CONCLUSIONES.

 Aprendimos a usar cada uno de los aspectos de la semana 3, 4, 5, en


situaciones cotidianas.

 Aprendimos las aplicaciones estadísticas en casos de la vida real.

 Comparamos cada uno de los resultados llegando a la corrección de


errores mediante el trabajo en grupo.
Referencias.
 Formula determinar el tamaño de una muestra:
https://www.psyma.com/company/news/message/como-determinar-el-tamano-
de-una-muestra
 Método de como calcular el intervalo de confianza en Excel:
https://support.office.com/es-es/article/intervalo-confianza-funci%C3%B3n-
intervalo-confianza-75ccc007-f77c-4343-bc14-673642091ad6
 Proporciones:
http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap01d.html

Anda mungkin juga menyukai