Software
CONSTRUIMOS FUTURO
Facultad de Ingenieras Fsico-Mecnicas Escuela de Ingenieras Elctrica, Electrnica y de Telecomunicaciones Centro de Innovacin y Desarrollo para la Investigacin en Ingeniera del Software
CONSTRUIMOS FUTURO
CEPI_II_2009_C09_M_03_V2.0
CONSTRUIMOS FUTURO
Material aprobado para uso pblico. Distribucin limitada por el CIDLIS. Copyright CIDLISUIS 2009
Introduccin
INTRODUCCIN A LA INFERENCIA ESTADSTICA Un estudio estadstico plantea, extraer conclusiones sobre la naturaleza de una poblacin grande, que no puede estudiarse en su totalidad, y por lo tanto hay que analizar y valorar una parte de ella. Este hecho permite justificar y establecer diferentes tcnicas de muestreo. Los trminos bsicos, que tratar este mdulo, son: estadstico y estimacin (especficamente, estimador), asumiendo que un estadstico o estimador es una variable aleatoria con una determinada distribucin, en dos amplias categoras de inferencia estadstica: estimacin y prueba (docimasia o contraste) de hiptesis.
Por otra parte, deducir leyes de probabilidad en determinadas caractersticas de una poblacin, si slo se conoce una muestra, es el principal problema a resolver, cuando se estudian relaciones especficas y se intenta extenderlas desde una muestra particular hacia el resto de individuos de la poblacin. Es decir, La tarea fundamental de la estadstica inferencial, es hacer deducciones de la poblacin, a partir de una muestra extrada de la misma !.
lunes, 13 de mayo de 2013
CEPI_II_2009_C09_M_03_V2.0
Introduccin
MODOS DE INFERENCIA
"En la filosofa occidental, es habitual, considerar dos modos bsicos de razonar: la deduccin (inferencia desde causas a efectos) y la induccin (inferencia desde los efectos hacia las causas). Adems de estos modos de inferencia tradicionales, existe un primer modo -la abduccin- definida como gnesis de hiptesis en el razonamiento cientfico, proceso de razonamiento mediante el cual, se crean nuevas ideas, hiptesis explicativas y teoras cientficas como primer paso en toda investigacin". Considerando la investigacin un proceso:
CEPI_II_2009_C09_M_03_V2.0
Objetivos de la Conferencia
CEPI_II_2009_C09_M_03_V2.0
Guin de la Conferencia
Conocimiento. Motivacin: Qu es y para qu sirve un estudio estadstico? Sesgo de seleccin Poblacin objetivo Y Poblacin de estudio Otros sesgos Tcnica de respuesta aleatoria Tcnicas de muestreo No probabilistas Probabilistas MAS Sistemtico Estratificado Conglomerados Resumen Pos-test Agenda de actividades de la semana Actividad: Leccin 3.1. Tcnicas de Muestreo
lunes, 13 de mayo de 2013
CEPI_II_2009_C09_M_03_V2.0
Motivacin
Qu es y para qu sirve un estudio estadstico?
"El mtodo cientfico parte de la observacin de una realidad, elaborada con hiptesis explicativas, que deben contrastarse o probarse, y si dicha hiptesis se acepta, inducir una formalizacin, con principios, leyes y proposiciones, para conformar una teora cientfica". El modelo general del planteamiento de un estudio, sigue la siguiente secuencia: 1. Hiptesis de trabajo 8. Seleccin de la muestra (Cuntos? Quines?) 2. Objetivos 9. Recogida de datos 3. Diseo de estudio 10. Automatizacin de los datos 4. Seleccin de variables 11. Depuracin de los datos 5. Definicin de 12. Anlisis variables 13. Resultados 6. Escala de medida 14. Conclusiones 7. Protocolo de recogida de datos
CEPI_II_2009_C09_M_03_V2.0
Motivacin
Objetivos de un Estudio
Definir objetivos es fundamental al estructurar un estudio. Deben estar claramente definidos para tomar decisiones en: el tipo de estudio ms apropiado, la seleccin de la muestra, el tamao muestral, las variables a medir y el anlisis estadstico a realizar. Investigar se fundamenta en la incertidumbre de algn hecho o fenmeno que el investigador desea resolver, realizando mediciones en los objetos del estudio". En el establecimiento de objetivos, es esencial, la revisin bibliogrfica, como: Fuente de ideas susceptibles de investigacin. Valoracin de los conocimientos actuales sobre el tema. Valoracin sobre la pertinencia y viabilidad del proyecto. Provisin del marco conceptual para la investigacin. Ayuda en la delimitacin del objetivo especfico. Informacin sobre aspectos concretos del diseo: Estrategias Procedimientos Pautas de seguimiento Criterios de seleccin Determinacin del tamao de la muestra Definicin de variables Instrumentos de medicin Prevencin de problemas Anlisis estadstico
Es necesaria la Comparacin de los propios resultados con estudios similares y la Contribucin a la valoracin de la validez extrema.
lunes, 13 de mayo de 2013
CEPI_II_2009_C09_M_03_V2.0
10
Motivacin
la pregunta de investigacin
debe caracterizarse como:
FACTIBLE NOVEDOSA
Nmero adecuado de individuos Experiencia tcnica adecuada Abordable en cuanto a tiempo y dinero Manejable en cuanto al alcance
Confirma o refuta hallazgos previos Amplia hallazgos previos Proporciona nuevos resultados
TICA Y RELEVANTE
Conocimiento cientfico Polticas Lneas de investigacin futuras factibles, interesantes, novedosas, ticas y relevantes
La no claridad en la pregunta limita calcular el tamao muestral del estudio, dado, que se necesita precisar y conocer: seguridad de estimacin, precisin de inferencia, poder estadstico o capacidad de detectar diferencias.
lunes, 13 de mayo de 2013
CEPI_II_2009_C09_M_03_V2.0
11
Motivacin
ESTUDIO EXPERIMENTAL O NO EXPERIMENTAL? Amenazas o riesgos en los estudios:
Si los pasos enunciados son correctos, se decide por el tipo de estudio a realizar;
Experimental como ensayos clnicos, de
campo o comunitarios, para la exposicin a grupos de objetos de estudio comparables con otros grupos en el que no se intervine o al que se expone a otra intervencin. Al decidir el tipo de estudio, hay que considerar sus amenazas o riesgos implcitos; los sesgos del estudio; Sesgo de seleccin, los grupos no son comparables por su forma de escogencia (eleccin inadecuada en grupos de control o espacios muestrales, prdidas de seguimiento y supervivencia selectiva). Sesgo de informacin, tampoco, los grupos son comparables debido al como se obtienen los datos (instrumento de medida inadecuado, diagnstico incorrecto, omisiones, imprecisiones, vigilancia desigual en expuestos y no expuestos, errores de clasificacin, errores en los cuestionarios o procedimientos). Sesgo de confusin, hay mezcla de efectos debido a una tercera o ms variables, esta variable est asociada con la exposicin a estudio, e independientemente de la exposicin, es un factor de riesgo adicional.
Cuando hay minas por todas partes, uno, no debe aventurarse, sin un detector de minas (M. Susser).
lunes, 13 de mayo de 2013
CEPI_II_2009_C09_M_03_V2.0
12
CEPI_II_2009_C09_M_03_V2.0
13
Motivacin
A partir de los conceptos de la teora muestral; se ha mencionado que las poblaciones estn formadas por individuos, denominados unidades de muestreo o unidades de estudio: Personas, clulas, familias, hospitales, pases La poblacin ideal que se pretende estudiar se denomina poblacin objetivo. No es fcil estudiarla por completo. Aproximamos mediante muestras que den idealmente la misma probabilidad a cada individuo de ser elegido. Tampoco es fcil elegir muestras de la poblacin objetivo: Si llamamos por telfono excluimos a los que no tienen. Si elegimos individuo en la calle, olvidamos los que estn trabajando...
El grupo que en realidad podemos estudiar (los que tienen telfono) se denomina poblacin de estudio.
lunes, 13 de mayo de 2013
CEPI_II_2009_C09_M_03_V2.0
14
Fuentes de sesgo
Las poblaciones objetivo y de estudio pueden diferir en cuanto a las variables que estudiamos.
El nivel econmico de la poblacin de estudio es mayor que la objetivo,... Los individuos que se eligen en la calle pueden ser mayores de edad (jubilados)
En este caso, las muestras que seleccionadas son sesgadas. El tipo de sesgo debido a diferencias sistemticas entre poblacin objetivo y poblacin de estudio se denomina sesgo de seleccin.
Hay otras fuentes de error/sesgo: No respuesta a encuestas embarazosas
Consumo de drogas, violencia domstica, prcticas poco ticas,
CEPI_II_2009_C09_M_03_V2.0
15
Cmo se hace?
Ejemplo: Solicitar que lance una moneda antes de responder y
Si sale cara que diga la opcin compremetida (no tiene por qu avergonzarse, la culpa es de la moneda) Si sale cruz que diga la verdad (no tiene por qu avergonzarse, el encuestador no sabe si ha salido cara o cruz)
Aunque no se sabe cul es la verdad en cada individuo, se puede hacer una idea porcentual sobre la poblacin, viendo en cunto se alejan las respuestas del 50%.
lunes, 13 de mayo de 2013
CEPI_II_2009_C09_M_03_V2.0
16
100% No
No sinceros!!
Diferencia entre los que han dicho s y los que deban hacerlo por que as lo indicaba la moneda
No son mitad y mitad! Porcentaje estimado de ndice de consumo de drogas es: Los que deben decir la verdad
lunes, 13 de mayo de 2013
CEPI_II_2009_C09_M_03_V2.0
17
PRODUCTOS
Mtodo de muestreo a utilizar. Tamao de la muestra de la poblacin a estudiar.
DISEO MUESTRAL
MUESTREO ESTADSTICO
Muestreo Sistemtico
Muestreo Estratificado
Muestreo de Conglomerados
Tamao de Muestra
Tamao de Muestra
Tamao de Muestra
Tamao de Muestra
Aplicaciones
Aplicaciones
Aplicaciones
Aplicaciones
CEPI_II_2009_C09_M_03_V2.0
18
Muestreo sistemtico
Muestreo estratificado
Muestreo de grupo
CEPI_II_2009_C09_M_03_V2.0
19
En adelante se trata exclusivamente muestreos con la menor posibilidad de sesgo (probabilistas): aleatorio simple, sistemtico, estratificado y por grupos.
lunes, 13 de mayo de 2013
CEPI_II_2009_C09_M_03_V2.0
20
Muestreo aleatorio simple (MAS) MUESTREO ALEATORIO: Considerando una poblacin finita, de la que se
desea extraer una muestra, el proceso de extraccin es tal, que hay que garantizar que cada uno de los elementos de la poblacin, tengan la misma oportunidad de ser incluidos en dicha muestra, este proceso se denomina seleccin muestral aleatoria y puede plantearse bajo dos puntos de vista:
No interviene el orden
CEPI_II_2009_C09_M_03_V2.0
21
El muestreo aleatorio con reposicin es tambin denominado muestreo aleatorio simple, se caracteriza por que cada elemento de la poblacin tiene la misma probabilidad de ser elegido, y las observaciones se realizan con reemplazo. De este modo, cada observacin se realiza sobre la misma poblacin (no disminuye en las extracciones sucesivas).
lunes, 13 de mayo de 2013
CEPI_II_2009_C09_M_03_V2.0
22
Sntesis,
Se eligen individuos de la poblacin de estudio, de manera que todos tienen la misma probabilidad de aparecer, hasta alcanzar el tamao muestral deseado. Se puede realizar partiendo de listas de individuos de la poblacin, y eligiendo individuos aleatoriamente con un computador. Normalmente tiene un coste bastante alto su aplicacin. En general, las tcnicas de inferencia estadstica suponen que la muestra ha sido elegida usando MAS, aunque en realidad se use alguna de las que veremos a continuacin.
CEPI_II_2009_C09_M_03_V2.0
23
Muestreo sistemtico
Se tiene una lista de los individuos de la poblacin de estudio. Si se desea una muestra de un tamao dado, elegimos individuos igualmente espaciados de la lista, donde el primero ha sido elegido al azar. CUIDADO: Si en la lista existen periodicidades, obtendremos una muestra sesgada. Cuando los elementos de la poblacin estn ordenados en fichas o en una lista, una manera de muestrear consiste en: Elegir aleatoriamente un nmero m, entre 1 y k; Tomar como muestra los elementos de la lista: Esto es muestreo sistemtico. Si el criterio de ordenacin de los elementos en la lista, es tal, que los elementos ms parecidos tienden a estar ms cercanos, el muestreo sistemtico suele ser ms preciso que el aleatorio simple, porque recorre la poblacin de un modo ms uniforme. Por otro lado, es a menudo ms fcil, no cometer errores con un muestreo sistemtico que con un muestreo aleatorio simple. El mtodo tal como se ha definido anteriormente es sesgado? Por qu? Un caso real: Se eligi una de cada cinco casas para un estudio de salud pblica en una ciudad donde las casas se distribuyen en manzanas de cinco casas. Salieron con mucha frecuencia las de las esquinas, que reciben ms sol, estn mejor ventiladas,
EJEMPLO
CEPI_II_2009_C09_M_03_V2.0
24
Muestreo estratificado
Aplica cuando se saben ciertos factores (variables, sub-poblaciones o estratos) que pueden influir en el estudio y hay que asegurar cierta cantidad mnima de individuos de cada tipo: -Hombres y mujeres, - Jvenes, adultos y ancianos Se realiza un MAS de los individuos de cada uno de los estratos. Al extrapolar los resultados a la poblacin hay que tener en cuenta el tamao relativo del estrato con respecto al total de la poblacin. Un muestreo aleatorio estratificado es aquel, en el que se divide la poblacin de N individuos, en k sub-poblaciones o estratos, atendiendo criterios importantes en el estudio de tamaos respectivos N(1), ..., N(k), realizando en cada una de estas sub-poblaciones muestreos aleatorios simples de tamao n(i). Hay 2 tcnicas: asignacin
EJEMPLO
CEPI_II_2009_C09_M_03_V2.0
25
DIFERENCIA
CEPI_II_2009_C09_M_03_V2.0
26
El marco de la muestra es una representacin de los elementos de la poblacin meta. Consiste en una lista o grupo de indicaciones para identificar la poblacin sobre la que se quiere realizar el estudio. Algunos ejemplos de marco de muestra incluyen el directorio telefnico, una lista de universidades, una lista de estudiantes de un curso o materia. Si no puede compilarse una lista, deben especificarse, por lo menos, algunas indicaciones para identificar la poblacin meta.
Seleccionar la tcnica de muestreo a utilizar implica la toma de varias decisiones, pues se debe decidir, se utiliza una estrategia de muestra bayesiana o tradicional, muestra con o sin reemplazo y si emplear una muestra de probabilidad o no probabilidad
lunes, 13 de mayo de 2013
CEPI_II_2009_C09_M_03_V2.0
27
2 2
p*q
E2
n Z p * q * N
2 2 2
( N * E 2 ) ( Z
* p * q)
CEPI_II_2009_C09_M_03_V2.0
28
EJEMPLO
CEPI_II_2009_C09_M_03_V2.0
29
Qu se vio en la Conferencia?
Motivacin: Qu es y para qu sirve un estudio estadstico? Sesgo de seleccin Poblacin objetivo Poblacin de estudio Otros sesgos Tcnica de respuesta aleatoria Tcnicas de muestreo No probabilistas Probabilistas MAS Sistemtico Estratificado Conglomerados
lunes, 13 de mayo de 2013
CEPI_II_2009_C09_M_03_V2.0
30
Actividad
CEPI_II_2009_C09_M_03_V2.0
31
Crditos
Operacin: Ing. (c) Diana Patricia Bautista Otlora Planificacin: Ing. Sergio Enrique Mndez Aceros Autora, Instruccin y Administracin: Phd. Ricardo Llamosa Villalba
CEPI_II_2009_C09_M_03_V2.0
Facultad de Ingenieras Fsico-Mecnicas Escuela de Ingenieras Elctrica, Electrnica y de Telecomunicaciones Centro de Innovacin y Desarrollo para la Investigacin en Ingeniera del Software
CONSTRUIMOS FUTURO