Anda di halaman 1dari 8

TRABAJO DE ESTADÍSTICA II

PRESENTADO POR
ABNER MONTOYA VELÁSQUEZ

PRESENTADO A
PATRICIA CASTILLA – TUTOR

FACULTAD DE INGENIERÍA Y CIENCIA BÁSICAS – ESTADÍSTICA II


FUNDACIÓN UNIVERSITARIA POLITÉCNICO GRANCOLOMBIANO
28 DE JUNIO DE 2018
CONTEXTO

A continuación, se tiene la información de la Gran Encuesta Integrada de


Hogares (GEIH), realizada por el DANE[ 1]. Esta encuesta se hace en las 13
ciudades principales del Colombia (Bogotá, Medellín, Cali, barranquilla,
Bucaramanga, Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio,
Montería, Cartagena) y 11 ciudades intermedias (Tunja, Florencia, Popayán,
Valledupar, Quibdó, Neiva, Riohacha, Santa Marta, Armenia, Sincelejo, San
Andrés). Esta encuesta, se solicita información sobre las condiciones de
empleo de las personas (si trabajan, en qué trabajan, cuánto ganan, si
tienen seguridad social en salud o si están buscando empleo), además de
las características generales de la población como sexo, edad, estado civil
y nivel educativo, se pregunta sobre sus fuentes de ingresos. La GEIH
proporciona al país información a nivel nacional, cabecera - resto, regional,
departamental, y para cada una de las capitales de los departamentos.
Este trabajo colaborativo, tiene 5 actividades diferentes. Cada actividad
corresponde a un tema de los cuales se desarrolla durante el módulo. El
grupo debe resolver cada actividad e ir plasmando los resultados en el
documento en línea. Los niveles de cada actividad varían según el tema
que se esté desarrollando. Sin embargo, cabe aclarar que las actividades
son independientes. Los temas que se desarrollan en este documento van
hasta la semana 7.
PARTE 1

TAMAÑO DE MUESTRA

Utilizando la variable edad (P6040), realice lo siguiente:

• Realice un histograma y describa la información según la forma y la


curtosis de los datos.

• Realice una descripción numérica y descripción como es la


población.

• Calcule una nueva variable que sea el

• Teniendo en cuenta la variable anterior realice el cálculo del tamaño


de muestra, utilizando la siguiente
fórmula:

Donde, se tiene lo siguiente:

Z: Es el cuantil de la distribución normal estándar al nivel de significancia que


se establezca.

S: Es la desviación estándar de la variable.

Es el margen de error absoluto.

Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95%


y un margen de error de absoluto que
no supere 0.5.

• Teniendo en cuenta los resultados anteriores, realice una selección de


elementos para una muestra, utilizando el algoritmo del coordinado
negativo.

• Compara la media poblacional, con la media muestral y determine la


variación relativa.
INTERVALO DE CONFIANZA PARA DOS VARIABLES NUMÉRICAS

Un investigador, cree determinar que existen diferencias entre los niveles de


estudio de los hombres y las mujeres en Colombia. Para determinar lo
anterior, se sugiere utilizar la base de la hoja “muestra” y realizar lo siguiente:

• Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un


histograma para los hombres y mujeres. Según los resultados, ¿Existen
diferencias?

• Teniendo en cuenta lo anterior, realice un estudio descriptivo de


ambas variables. Realice lectura de resultados.

• Asumiendo que los datos son normales, calcule un intervalo de


confianza del 95% y determine, la escolaridad de los hombres y de las
mujeres de forma individual.

• Asumiendo que los datos son normales, calcule un Intervalo de


confianza al 95% para la diferencia de los niveles de escolaridad para
los hombres y mujeres.

PARTE 2

PRUEBA DE HIPÓTESIS PARA DOS VARIABLES NOMINALES

Un investigador, cree determinar que los hombres asisten más a un colegio


oficial que las mujeres en Colombia.

Para determinar lo anterior, se sugiere utilizar la base de la hoja de “muestra”


y realizar lo siguiente:

• Utilizando la variable si actualmente asiste a un establecimiento oficial


(P6175) y sexo (P6020), realice un diagrama de barras comparativo
para los hombres y mujeres en un solo gráfico. Según los resultados,
¿Existen diferencias?

• Con un nivel de confianza del 95%, realice una estimación de los


hombres que asisten a un establecimiento oficial.

• Con un nivel de confianza del 95%, realice una estimación de las


mujeres que asisten a un establecimiento oficial.
• Realice una prueba de hipótesis para determinar la afirmación del
investigador. Utilice un nivel de significancia del 5%. ¿Qué se puede
decir de lo anterior?

Solución

• El Histograma nos muestra el histograma realzada para los datos.

• Al analizar el comportamiento numérico de los datos, se ve


claramente que tiene una tendencia a datos de (0-15). Esta variable
se puede asociar a la edad de una población, donde hay más
cantidad de personas o seres con corta edad. Según el link enviado
es una población con más de 30,000 habitantes. Lo cual podemos
decir que estos datos pertenecen a una cantidad muy pequeña de
una ciudad o que pertenecen a un pueblo.

• La nueva variable con los datos es la columna que tiene fondo rosado,
calculados por el programa.

• Una muestra buscada para el tamaño de la población que no supere


el 0,5 de error es de 1944 personas o datos.

• Al hacer una comparación entre la media poblacional y la media


muestral, concluimos que hay una diferencia menor del 0,05. Es decir
que es correcta la toma de estos valores como muestra, son las celdas
de color azul.
• La celda de color verde muestra la variación relativa entre la muestra
y la población y nos arroja un valor de 0,000539
PARTE 2

PRUEBA DE HIPÓTESIS PARA DOS VARIABLES NOMINALES

• Hay una diferencia de 26 por cada 450 personas de la población, es


decir que hay más mujeres que hombres.

• La estimación es que hay 39 hombres que asisten a establecimientos


oficiales por cada 450 personas que haya en una población.

• Por cada 125 personas que estudian de una muestra de 450 personas,
86 mujeres están en establecimientos públicos, es decir que, en la
población de 60357 personas, se estima que 11535 son mujeres que
están en establecimientos públicos

• De lo anterior podemos decir que a las mujeres les gusta estar en los
colegios o establecimientos públicos según los análisis y muestras
obtenidas. En conclusión, la prueba va en contra de la hipótesis del
investigador.

Anda mungkin juga menyukai