Anda di halaman 1dari 13

Trabajo colaborativo 1 Inferencia Estadstica

Presentado por:

Presentado a: Diego Fernando Pulecio Grupo: 100403-138

Universidad Nacional Abierta y a Distancia UNAD Colombia Abril de 2011

Introduccin

Por medio de la resolucin de problemas planteados, se pretende mostrar en este trabajo la aprehensin de los temas guiados en el transcurso de la unidad uno de este curso de Inferencia Estadstica; en grupo colaborativo, se hace entrega de este trabajo que contiene los datos necesarios para la comprensin del desarrollo de los asuntos propuestos en la gua de actividades.

Objetivos

Con el desarrollo de problemas acordes a los tpicos vistos en la primera unidad de este curso, se espera la prctica, la aclaracin de dudas y comprensin de puntos inciertos por parte de los integrantes del grupo colaborativo que participen con disciplina en la entrega de este trabajo.

*Asentar conocimientos vistos sobre los principios del muestreo en las operaciones estadsticas de investigacin.

*Manejar con propiedad los intervalos de confianza que hacen parte de los problemas de los cuales se solicita respuesta.

*Alcanzar los requisitos mnimos para la aprobacin del curso de Inferencia Estadstica.

*Hacer parte de un desarrollo de trabajo en grupo colaborativo, demostrando las capacidades de interaccin y resolucin de problemas con un grupo de personas del mismo curso.

1. Explique la diferencia entre cada par de trminos: Diferencias entre muestreo por conglomerados y muestreo estratificado:

En el muestreo por conglomerados se elige tan solo una subpoblacion para el muestreo, por el contrario en el estratificado se toman todas para muestreos posteriores. Y en el muestreo por conglomerados se busca heterogeneidad en los elementos cuando en el estratificado lo que se busca es homogeneidad en los mismos.

Diferencias entre error muestral y error no muestral:

El error muestral est en el diseo del muestreo, en el tamao especificado y en la heterogeneidad de la muestra, por el contrario el error no muestral se basa en el poco cuidado con el diseo definido a la hora de llevar a cabo el muestreo y en la tasa de respuesta de los elementos de la poblacin.

Diferencias entre muestreo simple y muestreo sistemtico:

El muestreo simple es totalmente aleatorio donde cada elemento de la poblacin tiene la misma posibilidad de ser elegido, en cambio en el muestre sistemtico se lleva una formula en la que los elementos van siendo elegidos, dejando de por medio la misma cantidad de elementos libres.

Diferencias entre muestra aleatoria y muestra no aleatoria:

En las muestras aleatorias todos los elementos tienen la misma posibilidad de caer en la muestra, mientras que en la aleatoria no, ya que son elegidos por medio de otros procedimientos en los que son discriminados algunos elementos por distintas razones que sean determinadas en el proceso.

2. La estimacin se puede hacer a su vez por dos procedimientos cules son? Qu ventajas tiene cada uno? Procedimientos de la estimacin La estimacin se conoce como el valor especifico de un estimador, por lo que asigna uno o varios valores numricos a un parmetro de una poblacin sobre los bases de datos de muestra. TIPOS DE ESTIMACION: ESTIMACION PUNTUAL: consiste en un solo estadstico muestral que se usa para estimar el valor verdadero de un parmetro de una poblacin que es desconocido. Por ejemplo, la media muestral es un estimador puntual de la media poblacional y la proporcin muestral es un estimador puntual de la verdadera proporcin poblacional p. Cuando usamos una estimacin puntual, sabemos que aunque usemos un mtodo bueno de estimacin es prcticamente improbable que el valor de la estimacin coincida con el verdadero valor del parmetro, as que sera conveniente acompaar nuestra estimacin con alguna medida que nos

permitiera expresar la cercana del estimador al parmetro. Una solucin a ello no los brindan los estimadores por Intervalos de Confianza. ESTIMACION POR INTERVARLOS: es la estimacin de un parmetro de la poblacin dado por dos nmeros que forman un intervalo que contiene al parmetro con una cierta probabilidad.

3. A qu se refiere el margen de error en un intervalo de confianza.

El margen de error proviene de dos fuentes: de una parte, la imprecisin inherente a todas las mediciones (las reglas no son muy exactas y la gente no necesariamente responde la verdad en las encuestas) y por otra parte, del carcter muestral de las mediciones. Con esto me refiero a que para obtener un resultado casi siempre no consultas a todos los individuos sino a unos pocos "representativos". Estos ltimos te pueden hacer obtener una conclusin (de hecho lo ms probable es que sea as) distinta de la "verdadera" de todos los individuos.

El grado de inexactitud de la respuesta muestral que obtienes se mide a travs del margen de error, que es el rango en el cual se encuentra la respuesta correcta para toda la poblacin que ests investigando.

4. Explique cules son los criterios que debe cumplir una muestra seleccionada de poblacin para considerarla representativa de dicha poblacin.

Se debe tener en cuenta los siguientes criterios para garantizar que la muestra de la poblacin es representativa: - Naturaleza Destructiva: existen casos donde se requiere destruir los elementos de la muestra para medir la caracterstica. Ejemplo: medir la resistencia de un material. - Imposibilidad Fsica de Medir Todos los Elementos de la Poblacin: se sabe que existen poblaciones muy grandes, consideradas infinitas y es casi imposible conocer todos los elementos de la misma. - Costos: Estudiar todos los elementos de la poblacin es muy costoso, tanto en tiempo como en dinero, por lo que es ms rentable hacer un estudio Muestral. - Confiabilidad del Estudio Muestral: Est demostrado con soporte matemtico que una muestra representativa arroja resultados que permiten inferir sobre la poblacin con una confiabilidad muy alta.

5. Explique el tipo de relacin directa o inversamente proporcional de cada uno de los factores involucrados en el clculo del tamao de la muestra de una poblacin finita, para estimar la media de la poblacin. Para calcular el tamao de una muestra hay que tomar en cuenta tres factores: 1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la poblacin total. 2. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin. 3. El nivel de variabilidad que se calcula para comprobar la hiptesis. La confianza o el porcentaje de confianza es el porcentaje que nos permite estimar cualquier parmetro de la poblacin por medio de un estadstico. Es decir, si se quiere estimar que la confianza sea del 100% esto significa que no hay ninguna duda de los resultados obtenidos pero esto no esto en muchos casos puede resultar imposible debido al tamao de la poblacin y a los altos costos del estudio estadstico, por tal motivo; se suele utilizar una confianza del 95% o una ms precisa del 99%. El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hiptesis que sea falsa como si fuera verdadera, o la inversa, al igual que la confianza si no se desea tener error alguno es decir del 0% entonces la muestra tendra que ser del mismo tamao de la poblacin por lo que es ms conveniente correr un riesgo bajo de equivocarse, comnmente se aceptan del 4% y 6% de error. La variabilidad es el porcentaje o probabilidad con el que se acept o rechaz una hiptesis, es decir si el porcentaje nos indica que la hiptesis se acepta se denomina variabilidad positiva y se denota por la letra p, por el contrario si el porcentaje nos indica que la hiptesis se rechaza se denomina variabilidad negativa y se denota por la letra q. La varianza de una poblacin de una manera uniforme, con distribucin finita de poblacin con tamao N est dada por la media poblacional y esta es simplemente un caso especial de la definicin general de la varianza que est dada por la distribucin de la probabilidad en intervalos de la poblacin, que estn en relacin directa de proporcionalidad del tamao de los intervalos.

6. Una de las formas de realizar inferencia estadstica, es por medio de estimacin de parmetros de una poblacin. explique las ventajas y desventajas de este mtodo para inferir las caractersticas de una poblacin. La estimacin de parmetros consiste en el clculo aproximado del valor de un parmetro en la poblacin, utilizando la inferencia estadstica, a partir de los valores observados en la muestra estudiada. Para el clculo del tamao de la muestra en una estimacin de parmetros son necesarios los conceptos de Intervalo de confianza, variabilidad del parmetro, error, nivel de confianza, valor crtico y valor . VENTAJA. -El objetivo de la estimacin de parmetros es usar una muestra para obtener nmeros que en algn sentido, sean los que mejor representan a los verdaderos valores de los parmetros.

DESVENTAJA. -resulta a menudo insuficiente, debido a que solo tiene dos opciones: es correcta o est equivocada.

7.

El margen de error de una estimacin es controlado por tres factores: Nivel de confianza, tamao de la muestra y desviacin estndar. Explique los criterios que tiene un investigador para su determinacin en una investigacin estadstica.

El investigador normalmente toma el riesgo en la representatividad de los datos o informacin, llamado el riesgo de "error de tipo 1", descartando equivocadamente la hiptesis nula y aceptando la hiptesis de investigacin, a pesar del hecho de que la hiptesis de investigacin en realidad ya no sea vlida. A pesar del riesgo, el investigador no debe poner el listn de la representatividad innecesariamente alto, porque entonces hay la amenaza del llamado "error de tipo 2", en que el investigador acepta la hiptesis nula y descarta equivocadamente la hiptesis de investigacin a pesar de ser en realidad verdadera.

8. Cul es el criterio a seguir si queremos determinar un tamao de muestra y no conocemos la varianza poblacional. Explique cmo se resuelve el problema. Cuando no se conoce la varianza poblacional y para una muestra pequea.

podemos utilizar la muestra en su lugar.

Se determina entonces un nivel de significacin para la realizacin del contraste y se plantea en el supuesto de realizar una muestra aleatoria de tamao n.

As: conocemos que

x u t n1 de forma que la hiptesis nula es: H0 s n

0.

El estadstico est dado por: t

x u0 s n

9. Explique cmo se define la confiabilidad y cul es su interpretacin en la construccin de un intervalo de confianza. Presente un ejemplo. Un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parmetro, con una probabilidad determinada. La probabilidad de que el verdadero valor del parmetro se encuentre en el intervalo construido se denomina nivel de confianza, y se denota

1- . La probabilidad de equivocarnos se llama nivel de significancia y se simboliza . Generalmente se construyen intervalos con confianza 1- =95% (o significancia =5%). Menos frecuentes son los intervalos con =10% o =1%. Para construir un intervalo de confianza, se puede comprobar que la distribucin Normal Estndar cumple 1: P (-1.96 < z < 1.96) = 0.95 De lo anterior se puede comprobar con una tabla de probabilidades o un programa computacional que calcule probabilidades normales. Luego, si una variable X tiene distribucin N ( , ), entonces el 95% de las veces se cumple:

Despejando

en la ecuacin se tiene:

El resultado es un intervalo que incluye al el 95% de las veces. Es decir, es un intervalo de confianza al 95% para la media cuando la variable X es normal y es conocido. II- Intervalo de confianza para un promedio: Generalmente, cuando se quiere construir un intervalo de confianza para la media poblacional , la varianza poblacional es desconocida, por lo que el intervalo para construido al final de II es muy poco prctico. Si en el intervalo se reemplaza la desviacin estndar poblacional muestral, el intervalo de confianza toma la forma: por la desviacin estndar

La cual es una buena aproximacin para el intervalo de confianza de 95% para Esta aproximacin es mejor en la medida que el tamao muestral sea grande.

con

desconocido.

Cuando el tamao muestral es pequeo, el intervalo de confianza requiere utilizar la distribucin t de Student (con n-1 grados de libertad, siendo n el tamao de la muestra), en vez de la distribucin normal (por ejemplo, para un intervalo de 95% de confianza, los lmites del intervalo ya no sern construidos usando el valor 1,96).

Ejemplo: Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresin (mayor puntaje significa mayor depresin). 2 11 14 16 19 5 11 15 16 19 6 13 15 17 19 8 13 16 17 19 8 14 16 17 19 9 14 16 18 19 9 14 16 18 19 10 14 16 18 20 11 14 16 19 20

Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los datos tienen distribucin normal, con varianza poblacional desconocida. Como es desconocido, lo estimamos por s =18,7. Luego, un intervalo de confianza aproximado es:

Luego, el intervalo de confianza para es (13,2, 15,8). Es decir, el puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.

III. Intervalo de Confianza para una Proporcin. En este caso, interesa construir un intervalo de confianza para una proporcin o un porcentaje poblacional (por ejemplo, el porcentaje de personas con hipertensin, fumadoras, etc.) Si el tamao muestral n es grande, el Teorema Central del Lmite nos asegura que:

O bien:

Donde p es el porcentaje de personas con la caracterstica de inters en la poblacin (o sea, es el parmetro de inters) y p es su estimador muestral.

Luego, procediendo en forma anloga al caso de la media, podemos construir un intervalo de 95% de confianza para la proporcin poblacional p.

Ejemplo:

En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres mayores de 15 aos en la Regin Metropolitana, se encontr que el 17.6% eran hipertensas. Un intervalo de 95% de confianza para la proporcin de mujeres hipertensas en la Regin Metropolitana est dado por:

Luego, la proporcin de hipertensas vara entre (0,139, 0,212) con una confianza de 95%. IV. Uso de Intervalos de Confianza para verificar Hiptesis. Los intervalos de confianza permiten verificar hiptesis planteadas respecto a parmetros poblacionales. Por ejemplo, supongamos que se plantea la hiptesis de que el promedio de peso de nacimiento de cierta poblacin es igual a la media nacional de 3250 gramos. Al tomar una muestra de 30 recin nacidos de la poblacin en estudio, se obtuvo: = s= n= 30 Al construir un intervalo de 95% de confianza para la media poblacional, se obtiene: 2930 450

Luego, el peso de nacimiento vara entre 2769 y 3091 gramos, con una confianza de 95%. Como el intervalo no incluye el valor =3250 gramos planteado en la hiptesis, entonces esta es rechazada con confianza 95% (o un valor p menor a 0,5). De igual manera se deben tener en cuenta estas claves para determinar los niveles de confianza:

1. Un intervalo de confianza aporta ms informacin que un estimador puntual cuando se quiere hacer inferencias sobre parmetros poblacionales.

2. Existen intervalos de confianza bilateral y unilateral. 3. La amplitud de un intervalo de confianza est determinado por: el nivel de confianza establecido; la variabilidad de los datos; el tamao de la muestra. 4. En un estudio Caso-Control o uno de Cohorte, es posible (y frecuentemente deseable) construir intervalos de confianza para Odds Ratios y Riesgos Relativos. 5. Un intervalo de confianza permite verificar hiptesis planteadas acerca de parmetros poblacionales.

10. Consulte los registros sobre las tarifas de un servicio pblico (agua, telfono, luz, gas, etc.), de por los menos 300 usuarios de estrato 3, de un barrio de su ciudad de origen, en una empresa de servicios pblicos: Determine la varianza de muestreo, con una muestra de 15 tarifas seleccionadas al azar, utilcela para calcular el tamao de muestra necesario para estimar la media y el total de la poblacin, con un error de $500 y una confianza de 99%. Obtenga con base en esta muestra (seleccionada con el muestreo aleatorio simple y sistemtico), los intervalos de confianza para estos dos parmetros. Vuelva a calcular los valores de los dos parmetros (media y el total) con todos los datos de la poblacin de tarifas consultadas. Compare los valores estimados con los valores reales y concluya: qu tan buenas son las estimaciones realizadas por usted?, estn las estimaciones calculadas de acuerdo con los valores reales?

Conclusiones

Se han determinado con certeza y seguridad las respuestas de los tems propuestos para el trabajo colaborativo No 1 de Inferencia estadstica y se dan por comprendidos los tpicos que han sido objeto de estudio en la unidad uno del mismo curso. En la participacin colaborativa de los integrantes se ha podido demostrar el cumplimiento y el compromiso que tienen los integrantes de este grupo con el debido aprendizaje que de una u otra forma van a ser utilizados en nuestra vida profesional.

Bibliografa www.wikipedia.com www.ringondelvago.com http://www2.uiah.fi/projekti/metodi/252.htm Presentacin de diapositivas, universidad de valencia. Sin datos adicionales