PRESENTADO POR:
PRESENTADO A:
DANYS BRITO
GRUPO COLABORATIVO
100403_33
Con el presente documento se pretende dar a conocer las conocimientos y destrezas adquiridas con la
manipulación, lectura y tratamiento que se le dio a la UNIDAD 1 “PRINCIPIOS DE MUESTREO E
INTERVALOS DE CONFIANZA” del modulo de Inferencia Estadística de la UNAD.
Para tales fines fue necesario el conocimiento de conceptos como: población y muestra, clases de
muestreo, intervalos de confianza, teoría de estimación, muestreo aleatorio, muestreo sistemático,
muestreo por conglomerado, distribución muestral, estimación de intervalos, teorema de central de
limite y otros conceptos que se encuentran en cada uno de los temas de ésta unidad. Es necesario tener
estos conceptos claros para la buena complementación y desarrollo de las actividades propuestas,
además es importante la aplicación de estos conocimientos en la solución de los problemas cotidianos.
Día a día, debemos encaminar nuestras metas en el propósito de encuadernar en nuestras mentes
nuevos conocimientos que nos permitan surgir en un futuro no muy lejano como profesionales, como
personas de bien, con calidad de vida, es por ello que la temática de esta materia INFERNCIA
ESTADISTICA nos permite ver las cosas de diferente manera, nos permite idealizar mejor un problema
y nos muestra como podemos enfocar su solución y a través de que lo podemos hacer.
OBJETIVOS
Aplicar las técnicas de muestreo y de intervalos de confianza, realizando inferencias sobre los
parámetros de la media y el total poblacional y determinar su validez estadística comparándolos
con los datos reales.
Uno de estos dos procedimientos, de inferir de una muestra a una población, se llama
estimación de un parámetro; el otro, prueba de una hipótesis acerca de un parámetro.
En el primer procedimiento, la estimación de un parámetro puede tener por resultado un solo
punto (estimación puntual), o un intervalo dentro del cual exista cierta probabilidad de
encontrarlo (estimación por intervalos).
Si a partir de las observaciones de una muestra se calcula un solo valor como estimación de un
parámetro de la población desconocido, el procedimiento se denomina estimación puntual.
Por ejemplo queremos estimar la nota media de los alumnos de bachiller en la asignatura de
matemáticas que notaremos . Sea X la variable aleatoria que indica la nota obtenida por cada
estudiante. Tomamos una muestra de tamaño n y denotamos la nota media de la muestra. Si al
tomar una muestra de 100 estudiantes obtenemos que la media es 6´2, este número lo
tomaríamos como estimativo de . Decimos que 6´2 es una estimación puntual de .
Un estimador por intervalo se construye sobre el concepto de un estimador puntual, pero
además, proporciona algún grado de exactitud del estimador. Como el término lo sugiere, un
estimador por intervalo es un rango o banda dentro de la cual el parámetro se supone va a caer.
Si hablamos de intervalos de confianza para estimar el valor medio de una variable aleatoria,
entonces el margen de error es la cantidad que se puede alejar su valor real del que se ha
estimado con un cierto nivel de confianza.
Por tanto el margen de error no es el tamaño de un intervalo de confianza, si no la mitad de su
tamaño.
4. Explique cuáles son los criterios que debe cumplir una muestra seleccionada de población
para considerarla representativa de dicha población.
Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de toda la
población porque el manejo de un menor número de dato provoca también menos errores en su
manipulación. En cualquier caso, el conjunto de individuo de la muestra son los sujetos
realmente estudiados.
El número de sujetos que componen la muestra suele ser inferior que el de la población, pero
suficiente para que la estimación de los parámetros determinados tenga un nivel de confianza
adecuado. Para que el tamaño de la muestra sea idóneo es preciso recurrir a su cálculo.
Técnica de muestreo: son importantes en la medida que se utilice en forma adecuada para la
situación que se requiera. De las técnicas más conocidas y utilizadas se tienen el Muestro
Aleatorio Simple (M.A.S), Muestreo Aleatorio Estratificado (M.A.E), Muestro Sistemático
(M.S) y Muestreo por Conglomerados (M.C). Se tratara de analizar estas técnicas,
especialmente el M.A.S y M.A.E
Determinar el número de observaciones que harán parte de la muestra, para estimar µ, con un
límite de estimación B definido, se obtiene a partir de la ecuación del error de estimación.
Despejando n, se obtiene:
6. Una de las dos formas de realizar inferencia estadística, es por medio de estimación de
parámetros de una población. Explique las ventajas y desventajas de este método para
inferir las características de una población.
VENTAJAS:
DESVENTAJAS:
El margen de error es una medida de la precisión del reporte y proyección estadísticos asociados
a una investigación. En ciertos casos se predefinirá un margen de error (por ejemplo, ±4%),
mientras que en otros se predefinirá un tamaño de muestra, tras lo cual se procederá a calcular el
margen de error asociado (cuando, por ejemplo, tras elegir un total de 400 individuos hallamos
que el margen de error de esta investigación es ±4.90%). En muchos casos se opta por lo
primero. Así, resulta que no calculamos el margen de error, sino que debemos más bien calcular
el tamaño de la muestra para nuestra investigación
Error de la estimación:
Es una medida de su precisión que se corresponde con la amplitud del intervalo de confianza.
Criterios:
Cuanta más precisión se desee en la estimación de un parámetro, más estrecho deberá ser el
intervalo de confianza y, si se quiere mantener o disminuir el error, más ocurrencias deberán
incluirse en la muestra estudiada.
En caso de no incluir nuevas observaciones para la muestra, más error se comete al aumentar la
precisión. Se suele llamar E.
Nivel de Confianza
Tamaño de la muestra
Es el número de sujetos que componen la muestra extraída de una población, necesarios para
que los datos obtenidos sean representativos de la población. Con el objetivo de:
1. Estimar un parámetro determinado con el nivel de confianza deseado.
2. Detectar una determinada diferencia, si realmente existe, entre los grupos de estudio con
un mínimo de garantía.
3. Reducir costes o aumentar la rapidez del estudio.
Desviación estándar
Es una medida del grado de dispersión de los datos del valor promedio. En otras palabras, la
desviación estándar es simplemente la variación esperada con respecto de la media aritmética.
Una desviación estándar grande indica que los puntos están lejos de la media, y una desviación
pequeña indica que los datos están agrupados cerca a la media.
A la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar en cuenta
varios factores: el tipo de muestreo, el parámetro a estimar, el error muestral admisible, la
varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos sencillos
de cálculo del tamaño muestral delimitemos estos factores.
Estadístico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una
estimación de los parámetros.
Vamos a presentar dos fórmulas, siendo la primera la que se aplica en el caso de que no se
conozca con precisión el tamaño de la población, y es:
Donde:
n es el tamaño de la muestra;
Z es el nivel de confianza;
p es la variabilidad positiva;
q es la variabilidad negativa;
E es la precisión o error.
Hay que tomar nota de que debido a que la variabilidad y el error se pueden expresar por medio
de porcentajes, hay que convertir todos esos valores a proporciones en el caso necesario.
Por ejemplo: Si se quiere un porcentaje de confianza del 95%, entonces hay que considerar la
proporción correspondiente, que es 0.95. Lo que se buscaría en seguida es el valor Z para la
variable aleatoria z tal que el área simétrica bajo la curva normal desde -Z hasta Z sea igual a
0.95, es decir, P(-Z<z<Z)=0.95.
Donde
n es el tamaño de la muestra;
Z es el nivel de confianza;
p es la variabilidad positiva;
q es la variabilidad negativa;
N es el tamaño de la población;
E es la precisión o el error.
Valor α
También llamado nivel de significación. Es la probabilidad (en tanto por uno) de fallar en
nuestra estimación, esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-α).
Por ejemplo, en una estimación con un nivel de confianza del 95%, el valor α es (100-
95)/100 = 0,05.
Valor crítico
Se representa por Z α/2. Es el valor de la abscisa en una determinada distribución que deja
a su derecha un área igual a α/2, siendo 1-α el nivel de confianza. Normalmente los valores
críticos están tabulados o pueden calcularse en función de la distribución de la población.
Por ejemplo, para una distribución normal, de media 0 y desviación típica 1, el valor crítico
para α = 0,05 se calcularía del siguiente modo: se busca en la tabla de la distribución ese
valor (o el más aproximado), bajo la columna “Área”; se observa que se corresponde con
−0,64. Entonces Z α/2 = 0,64. Si la media o desviación típica de la distribución normal no
coinciden con las de la tabla, se puede realizar el cambio de variable t=(X-μ)/σ para su
cálculo.
Con estas definiciones, si tras la extracción de una muestra se dice que “3 es una
estimación de la media con un margen de error de 0,6 y un nivel de confianza del 99%”,
podemos interpretar que el verdadero valor de la media se encuentra entre 2,7 y 3,3, con
una probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen restando y sumando,
respectivamente, la mitad del error, para obtener el intervalo de confianza según las
definiciones dadas.
Para un tamaño fijo de la muestra, los conceptos de error y nivel de confianza van
relacionados. Si admitimos un error mayor, esto es, aumentamos el tamaño del intervalo de
confianza, tenemos también una mayor probabilidad de éxito en nuestra estimación, es
decir, un mayor nivel de confianza.
10. Consulte los registros sobre las tarifas de un servicio público (agua, teléfono, Luz, gas, etc.), de
por los menos 300 usuarios de estrato 3, de un barrio de en su ciudad de origen, en una empresa
de servicios públicos: Determine la varianza de muestreo, con una muestra de 15 tarifas
seleccionadas al azar, utilícela para calcular el tamaño de muestra necesario para estimar la
media y el total de la población, con un error de $500 y una confianza de 99%. Obtenga con
base en esta muestra (seleccionada con el muestreo aleatorio simple y sistemático), los
intervalos de confianza para estos dos parámetros. Vuelva a calcular los valores de los dos
parámetros (media y el total) con todos los datos de la población de tarifas consultadas.
Compare los valores estimados con los valores reales y concluya: ¿qué tan buenas son las
estimaciones realizadas por usted?, ¿están las estimaciones calculadas de acuerdo con los
valores reales?
2 108630 32 170610 62 41330 92 61650 122 115940 152 153700 182 85490 212 122610 242 69430 272 65760
3 52960 33 176470 63 126840 93 85540 123 180530 153 176010 183 199950 213 101580 243 106710 273 135480
4 69940 34 108840 64 139400 94 181080 124 61730 154 141310 184 83520 214 90300 244 102070 274 102640
5 50630 35 63450 65 89550 95 32710 125 88330 155 46070 185 42350 215 172660 245 45740 275 91550
6 41760 36 55710 66 63810 96 140040 126 77060 156 131920 186 37590 216 101760 246 160310 276 63200
7 112980 37 91890 67 48830 97 87380 127 188550 157 39690 187 85490 217 66670 247 135770 277 63300
8 50200 38 52810 68 187840 98 34430 128 43190 158 120560 188 151890 218 115800 248 182990 278 54090
9 30410 39 78690 69 57280 99 108020 129 166920 159 35900 189 87570 219 46210 249 83520 279 130870
10 95690 40 139210 70 88670 100 61690 130 96220 160 76060 190 158020 220 35830 250 82170 280 110360
11 48380 41 176870 71 126380 101 138850 131 102860 161 186150 191 85490 221 184320 251 184990 281 40710
12 41190 42 42776 72 31790 102 151610 132 91230 162 41220 192 76920 222 52940 252 80040 282 118560
13 97880 43 52700 73 121970 103 85840 133 144940 163 153350 193 32530 223 168790 253 32500 283 43270
14 45200 44 193950 74 102020 104 102890 134 182640 164 53740 194 115080 224 69790 254 42640 284 99790
15 178180 45 97010 75 132270 105 137110 135 72970 165 168110 195 153560 225 48390 255 52130 285 101740
16 42810 46 49650 76 61650 106 124530 136 95220 166 37640 196 42510 226 180700 256 36200 286 93580
17 105760 47 196020 77 147410 107 69630 137 160490 167 45970 197 134540 227 46340 257 59700 287 151860
18 44710 48 103630 78 102750 108 32440 138 97030 168 139190 198 47710 228 36780 258 188610 288 155080
19 83820 49 176740 79 109180 109 41510 139 31180 169 32290 199 68710 229 171660 259 162220 289 58170
20 99760 50 45270 80 172380 110 41510 140 127340 170 95460 200 63790 230 88020 260 118480 290 120180
21 139610 51 91870 81 32050 111 173800 141 48180 171 157850 201 114880 231 113620 261 135360 291 108140
22 82590 52 47150 82 166110 112 118580 142 30000 172 67230 202 118560 232 30020 262 85490 292 128020
23 35150 53 48390 83 191510 113 35830 143 73600 173 46280 203 67470 233 109000 263 61650 293 155520
24 64900 54 116920 84 158300 114 162160 144 31980 174 157440 204 166400 234 48050 264 93820 294 126430
25 33980 55 105970 85 47710 115 139030 145 49610 175 94710 205 85760 235 101830 265 85490 295 95110
26 72720 56 30400 86 48670 116 91230 146 36750 176 67760 206 112770 236 192060 266 124730 296 64350
27 182320 57 61940 87 67480 117 64850 147 160570 177 54650 207 145600 237 86590 267 92160 297 70670
28 31320 58 63620 88 31780 118 101900 148 47980 178 63360 208 113270 238 61650 268 85490 298 84570
29 113860 59 39780 89 176970 119 66580 149 94740 179 36700 209 106900 239 30020 269 129310 299 85490
30 78600 60 31790 90 65580 120 48720 150 155140 180 151470 210 167220 240 171190 270 42620 300 138950
Valor seleccionado con el muestreo aleatorio simple y sistemático en Excel con la formula entero
(aleatorio ()*300)
11
7 2.980
6
263 1.650
10
79 9.180
83
184 .520
126
71 .380
85
187 .490
17
89 6.970
15
195 3.560
10
55 5.970
52
3 .960
73
143 .600
87
97 .380
3
139 1.180
3
146 6.750
6
66 3.810
Media 90.759
Total de
la
Población 1.361.380
1 N
2
15 i 1
(112 .980 90759) 2 ... (63.810 90759) 2 1,570,975,264
Desviación Estándar
Extraemos la raíz cuadrado a la varianza y obtenemos la desviación estándar. 39.636
Z (21 / 2) N 3 2
n
( N 1) B 2 Z (21 / 2) 2 N 2
Los datos:
N = 300
σ2 = 1,570,975,264
B = 500
Entonces:
Z (21 / 2) N 3 2
n
( N 1) B 2 Z (21 / 2) 2 N 2
( 2,576 ) 2 (300)31570975264
n
2
(1570975264 1)(500) 2 ( 2,576 ) 2 (300) 1570975264
n 1
Por consiguiente para estimar el promedio de las tarifas de la población objeto de estudio, con un nivel
de confianza del 99% y el error de estimación de $500, se debe tomar una muestra de 1 persona.
96.112
La estimación de la media por muestreo aleatorio simple y sistemático fue bastante cercana al valor
real de la población.
CONCLUSIONES
Luego de terminado el trabajo colaborativo No.1 del curso de Inferencia estadística se puede concluir
lo siguiente:
La inferencia estadística abarca muchos tema, por eso es importante conoce, estudiarlos y
saberlos aplicar debidamente.
Se estudiaron todos los temas relacionados con muestras y población y se pusieron en practica
en los ejercicios propuestos en la guía
JORGE ELIECER RONDON DURAN - DANIS BRITO ROSADO, agosto 2008, Módulo
Inferencia estadística, UNAD.
Wikipedia, http://es.wikipedia.org/wiki/Muestreo_en_estad%C3%ADstica.