Anda di halaman 1dari 50

ESTADISTICA II

Según las últimas estadísticas, mueren ahogadas


más personas en la bañera de casa que en la
playa. Al leerlas, una señora , contrató a un
profesor de natación para que le enseñara a
nadar en la bañera.
AGENDA
1. Puntos de interés
2. Repaso Distribución normal
3. Teoría muestreo
4. Distribuciones muestrales
5. Teorema Central del Limite

2
Cronograma de Actividades
Programa de estudio del curso - ESTADÍSTICA II

Resumen del curso:


Fecha - Inicio Actividad Fecha límite de presentación
Quiz 1 - Semana 3
Examen parcial - Semana 4
Quiz 2 - Semana 6
Autoevaluación - Semana 7
Sustentación trabajo
colaborativo
Examen final - Semana 8
Calificación Trabajo colaborativo - Semana 7

!!!Ya participe en Elluminate - Conferencias!!!


1. Repaso Distribución normal

El precio por galón de gasolina en las estaciones de una


ciudad colombiana tiene distribución normal con una
media de $8.500 y desviación estándar de $250 ¿Qué
proporción de las estaciones tienen un precio por galón:

a. Menor a $8.300? Z = (X - µ)/ σ


b. Más de $8.700?
c. ¿Entre cuáles dos valores simétricamente
distribuidos en torno a la media de la población
recaerá el 80% de los precios?

Solución: X ≈ Normal ( µ = 8.500$ ; V(x) = 62.500 $²)

Recuerde σ = √ V(x), esto es σ = √ 62500$²=250$

a. P(X ≤ 8.300) = P(x- µ / σ ≤ (8.300 – 8.500)/250)= Φ(-0.8) = 0.21186


4
Tabla Distribución normal

5
1. Repaso Distribución normal

a. P(X ≤ 8.300) = P(Z ≤ (8.300 – 8.500)/250)= Φ(-0.8) = 0.21186

0.78 0.78230
Tabla 0.79 0.78524
Distribución 0.80 0.78814
Normal 0.81 0.79103
0.82 0.79389

b. P(X ≥ 8.700) = 1- P(x - µ / σ ≤ 8.700 – 8.500 / 250) = 1 – Φ(0.8) = 1 – 0.78814 = 0.21186

P(X ≥ 8.700) = 1 – P(X ≤ 8700) -1.29 0.09853


-1.28 0.10027
c. P( X ≤ Xo) = 0.10 entonces Φ ( Xo – 8500 / 250 ) = 0.10 -1.27 0.10204

Buscando en la tabla para una probabilidad de 0.10 el valor Z es - 1.28

Xo – 8500 / 250 = -1.28 Por tanto Xo = $ 8.180


6
Similar para P( X ≤ X1) = 0.90, entonces X1 – 8500 / 250 = 1.28, Luego X1 = $ 8.820
1. Repaso Distribución normal

a. ¿Entre cuáles dos valores simétricamente distribuidos en


torno a la media de la población recaerá el 80% de los
precios?

-1.29 0.09853
-1.28 0.10027
c. P( X ≤ Xo) = 0.10 entonces Φ ( Xo – 8500 / 250 ) = 0.10 -1.27 0.10204

Buscando en la tabla para una probabilidad de 0.10 el valor Z es - 1.28

Xo – 8500 / 250 = -1.28 Por tanto Xo = $ 8.180

Similar para P( X ≤ X1) = 0.90, entonces X1 – 8500 / 250 = 1.28, Luego X1 = $ 8.820

7
¿Cuál es la probabilidad que el precio de un galón
de gasolina este entre $8440 y $9000?

P(8440 ≤ X ≤ 9000) =

P((8440 – 8500)/250 ≤ Z ≤ (9000 – 8.500)/250)=


P(-0.24 ≤ Z ≤ 2) = Φ(2) - Φ(-0.24) = 0.97725 - 0.40517 = 0.572

RESUMEN

P(Z ≤ a) = Φ (a) DONDE Z = (X – MEDIA)/DESVIACIÓN

P (a ≤ Z ≤ b) = Φ(b) – Φ(a)

P(z ≥ a) = 1 – P(z ≤ a)

P(X ≤ X0) = probabilidad, entonces (X0 - µ)/σ = valor Z

8
2. Introducción teoría de muestreo

INFERENCIA ESTADÍSTICA Estimación


Estimación de Puntual , σ²,
= Estadística II Parámetros
Estimación
Intervalos de
Confianza
Inferencia
Estadística

Paramétricas
Prueba de Hipótesis
No Paramétricas

Población
Muestra
Parámetros
µ, ², P Estadísticos
, S², p
2. Introducción teoría de muestreo

INFERENCIA ESTADÍSTICA
Proceso y resultado de extraer conclusiones
respecto a una población a partir de una o
más muestras.
obtención de la
muestra

conclusiones

P
M

Según la últimas estadísticas, tomando


medio litro de leche todas las mañanas
durante 1200 meses se consigue vivir
10 más de 100 años.
2. Introducción teoría de muestreo

 Las poblaciones están formadas por individuos,


objetos, es mejor denominarlas unidades de
muestreo o unidades de estudio:

 Vehículos, sitios de parqueo, bahías, vías, semáforos,


cruces, giros, personas, familias, hospitales, países,
animales, estudiantes, universidades, edificios…

11
Introducción teoría de muestreo

 La población ideal que se estudiará se denomina


población objetivo.

 No es fácil estudiarla por completo.


 Es necesario estimarla o aproximarse mediante
muestras que den (idealmente) la misma probabilidad
a cada individuo u objeto de ser elegido.
 Tampoco es fácil elegir muestras de la población
objetivo:
 Si se llama por teléfono se excluye a los que no
tienen.
 Si se elige en la calle, olvidamos los que están
trabajando...
 El grupo que se puede estudiar (por ejemplo, los que
tienen teléfono) se denomina población de estudio. 12
2. Introducción - conceptos

Al elegir una muestra, se espera que sus propiedades sean


extrapolables a la población. Este proceso permite ahorrar
recursos, obteniendo resultados parecidos que si se realizase
un estudio de toda la población.

Para que el muestreo sea válido y se pueda realizar un estudio


fiable (que represente a la población), debe cumplir ciertos
requisitos, lo que lo convertiría en una muestra representativa.

En el muestreo, si el tamaño de la muestra es más pequeño que


el tamaño de la población, se puede extraer dos o más muestras
de la misma población. Al conjunto de muestras que se pueden
obtener de la población se denomina espacio muestral. La
variable que asocia a cada muestra su probabilidad de
extracción, sigue una distribución muestral.

13
3. Introducción teoría de muestreo

 ¿Cuando muestrear ?

 Cuando los costos de realizar un censo son económicamente altos


 Operativamente es imposible de realizar.
 Se requiera rapidez en los resultados
 Cuando se deben aplicar pruebas destructivas

Ventajas :

 Rapidez y facilidad de realizar el estudio


 Menor número de individuos a estudiar
 Menor costo
 Mayor validez del estudio
 Mayor número de variables a estudiar
 Controlar y ajustar posibles variables de confusión

14
3. Introducción teoría de muestreo

Requisitos de la Muestra
Cualquier muestra debe reunir dos condiciones para ser
representativa del UNIVERSO:

CUALITATIVAMENTE debe ser :

 Homogénea: estar compuesta sólo por elementos que


pertenecen al Universo previamente definido.

 Adecuada: al incluir todas las variables esenciales de los


elementos que existen en el universo.

 No viciada : al presentar variaciones de determinadas variables en


más o menos la misma frecuencia que en el universo.

CUANTITATIVAMENTE debe ser lo suficientemente grande.

15
3. Introducción teoría de muestreo

Los elementos se
Elementos de organizan como
la población Unidades de muestreo
en la población

Selección de la muestra Unidades listadas


de unidades en el marco
listadas de muestreo

16
3. Introducción teoría de muestreo

 Existen dos métodos para seleccionar muestras de


poblaciones; el muestreo no aleatorio o de juicio y el
muestreo aleatorio o de probabilidad.

 En el muestreo aleatorio o de probabilidad todos los


elementos de la población tienen una probabilidad de ser
escogidos en la muestra.

17
3. Introducción teoría de muestreo

Muestreo probabilístico
 Forman parte de este tipo de muestreo todos aquellos métodos
para los que puede calcularse la probabilidad de extracción de
cualquiera de las muestras posibles.

 Este conjunto de técnicas de muestreo es el más aconsejable,


aunque en ocasiones no es posible optar por él.

 En este caso se habla de muestras probabilísticas, pues no es


razonable hablar de muestras representativas dado que no
conocemos las características de la población.
3. Introducción teoría de muestreo

MUESTREO ALEATORIO SIMPLE

El muestreo aleatorio simple puede ser de dos tipos:

 Sin reposición de los elementos: cada elemento extraído se


descarta para la subsiguiente extracción. Por ejemplo, si se extrae
una muestra de una "población" de bombillas para estimar la vida
media de las bombillas que la integran, no será posible medir más
que una vez la bombilla seleccionada.

 Con reposición de los elementos: las observaciones se realizan con


reemplazamiento de los individuos, de forma que la población es
idéntica en todas las extracciones. En poblaciones muy grandes, la
probabilidad de repetir una extracción es tan pequeña que el
muestreo puede considerarse sin reposición aunque, realmente, no lo
sea.

Para realizar este tipo de muestreo, y en determinadas situaciones, es


muy útil la extracción de números aleatorios mediante ordenadores,
calculadoras o tablas construidas al efecto.
19
3. Introducción teoría de muestreo

Muestreo Aleatorio Simple (MAS)


Consiste en seleccionar sin Cuando se selecciona el primer
reposición y en forma elemento de la muestra la
equiprobable, al interior de cada probabilidad es igual para todos
extracción, un elemento hasta 1/N, en la segunda selección la
completar un total de n, valor probabilidad es 1/(N-1), y
establecido antemano. sucesivamente.

No. Aleatorio Individuo


5 A
2 B
C
D
E
F 20
Tabla de núm eros al azar (Random Num bers)

0 a 10 11 a 20 21 a 30 31 a 40 41 a 50

12345 67890 12345 67890 12345 67890 12345 67890 12345 67890
1 80336 94598 26940 36858 70297 34135 53140 33340 42050 82341
2 44104 81949 85157 47954 32979 26575 57600 40881 22222 6413
3 12550 73742 11100 12040 12860 74697 96644 89439 28707 25815
4 63606 49329 16505 34484 40219 52563 43651 77082 27207 31790
5 61196 90446 26457 47774 51924 33729 65394 59593 42582 60527
6 15474 45266 95270 79953 59367 83848 82396 10118 33211 59466
7 94557 28573 67897 54387 54622 44431 91190 42592 92927 45973
8 42481 16213 97344 38721 16868 48767 43071 12059 25701 46670
9 23523 78317 73208 89837 68935 91416 26252 29663 55522 82562
10 64493 52494 75246 33824 45862 51025 61962 79335 65337 12472
11 70549 97654 64051 88159 96119 63896 54692 82391 23287 29529
12 35963 15307 26898 89354 33351 35462 77974 50024 90103 39333
13 59808 98391 45427 26842 83609 49700 13021 24892 78565 20106
14 46058 85236 11390 92286 77281 44077 93910 83647 70617 42941
15 32179 20597 87379 25241 35567 47007 86743 17157 85394 11838
16 69234 61406 20117 45204 15956 60000 18743 92423 97118 96338
17 19565 41430 51758 75379 40419 21585 66674 36806 84962 85207
18 45155 14938 19476 67246 43667 94543 59047 90033 20826 69541
19 94864 31994 36168 10851 34888 81553 71540 35456 85014 51176
20 98086 24826 45240 28404 44999 98896 39094 73407 35441 31880
21 33185 16232 41941 50949 89435 48581 88695 41994 37548 73043
22 80951 10406 96382 70774 20151 23387 25016 25298 94624 61171
23 79752 49140 71961 28296 69861 22591 77852 20539 30387 59579
24 18633 32537 98145 46571 31010 24674 55455 61427 77938 91936
25 74029 43902 77557 32270 97790 17119 52527 58021 80814 51748
26 54178 45611 80993 37143 65335 12969 56127 19255 36040 90324
27 11664 49853 52079 84827 59381 71539 79973 33440 88461 23356
28 48324 77928 31249 64710 82295 36870 32307 57546 15020 99994
29 69074 94138 87637 91976 35584 14401 10518 21615 21848 76938
30 10997 32533 76520 13586 34673 54876 80959 39117 39292 74945
3. Introducción teoría de muestreo

Problemas que se pueden presentar en el muestreo:


• No están anotados en el marco.
• Haya elementos de más en el marco.
• La unidad de muestreo no exista.

5 11
4 10 19
2 18 7
1 13
16 12
9 15
3
8 6 20
14 17

n
4
12 5
18

22
3. Introducción teoría de muestreo

Ventajas y desventajas del Muestreo


Aleatorio Simple
Ventajas:
 Rapidez
 Sencillez
 Bajos costos

Desventajas:
 Se aplica solo a poblaciones pequeñas y
homogéneas

23
3. Introducción teoría de muestreo

Muestreo Sistemático (MS)


Es útil por su versatilidad y las
Consiste en dividir el universo en posibilidades de control y
grupos de igual tamaño (I), en el supervisión.
primer grupo, mediante un
muestreo MAS se seleccionan Inconvenientes, si K=1 no se cuenta
replicas (K) de elementos; los con un buen estimador y si existe un
restantes elementos se obtienen orden sistemático en el mismo orden
saltando la cantidad a partir de los de selección de la muestra la varianza
aleatorios. crece considerablemente.

N
AI 
n
K  Ran  A
R I
24
3. Introducción teoría de muestreo

Muestreo Sistemático
5 11
4 10 19 20
2 18 7 AI   5
1 13 4
16 12
R  ((2  5)  5)  ...
9 15
3 K
8 6 20
14 17

2 7 12 17

25
3. Introducción teoría de muestreo

Muestreo Aleatorio Sistemático

Ventajas :
 Fácil de realizar.
 Bajos costos de muestreo
 Útil trabajo de campo – rapidez

Desventajas :
 Es inapropiado cuando los elementos
entran en un patrón secuencial.
26
3. Introducción teoría de muestreo

Muestreo Sistemático (MS)


Es útil por su versatilidad y las
Consiste en dividir el universo en posibilidades de control y
grupos de igual tamaño (A), en el supervisión.
primer grupo, mediante un
muestreo MAS se seleccionan Inconvenientes, si r=1 no se cuenta
replicas (R) de elementos; los con un buen estimador y si existe un
restantes elementos se obtienen orden sistemático en el mismo orden
de selección de la muestra la varianza
brincando la cantidad a a partir de
crece considerablemente.
los aleatorios.

N
A
n
R  Ran  A 27
3. Introducción teoría de muestreo

5 11
4 10 19 20
2 18 7 A 5
1 13 4
16 12
R  ((2  5)  5)  ...
9 15
3
8 6 20
14 17

2 7 12 17

28
3. Introducción teoría de muestreo

Muestreo Estratificado (ME)


Es aquel que define subconjuntos
homogéneos respecto a la variable
principal en la población objetivo.
En él todas las unidades se dividen en– La población es heterogénea pero
subconjuntos llamados estratos, en su interior se definen
dentro de ellos se muestrea de perfectamente dos o más grupos
que son parecidos en sus
acuerdo al MAS o el MS, según características internas respecto a
convenga a cada estrato. la variable principal. Garantizando
que se minimice la varianza y la
muestra no resulte ser muy grande.
– No todos los subconjuntos de la
población presenta marco
muestral.
– Las características físicas,
regionales, económicas, raciales u
otras sean tan importantes como
para generar estudios por
separado.
29
3. Introducción teoría de muestreo

Muestreo Estratificado (ME)


Por ejemplo, para un estudio
de opinión, puede resultar
interesante estudiar por 19
10 6
separado las opiniones de 5 4
hombres y mujeres pues se 18
9
estima que, dentro de cada
2
16 7 13
uno de estos grupos, puede 12
1 17
haber cierta homogeneidad. 15 11
8
Así, si la población está 20 3
compuesta de un 55% de
14

mujeres y un 45% de
hombres, se tomaría una n
muestra que contenga
también esa misma
proporción. 5 13
12 18 1 4 6
14 11

30
3. Introducción teoría de muestreo
Muestreo Estratificado (ME)
Según la cantidad de elementos de la muestra que se han de elegir
de cada uno de los estratos, existen tres técnicas de muestreo
estratificado:

 Afijación igual: el tamaño de cada estrato en la muestra es


distribuido con el mismo numero de elementos

 Afijación proporcional: el tamaño de cada estrato en la muestra es


proporcional a su tamaño en la población.

 Afijación óptima: la muestra recogerá más individuos de aquellos


estratos que tengan más variabilidad. Para ello es necesario un
conocimiento previo de la población.

31
3. Introducción teoría de muestreo

Muestreo Estratificado (ME)

Ventajas:
* Aumento de la precisión sobre el MAS.
* Estimaciones separadas para cada estrato.
* Bajos costos de muestreo.

Desventajas:
* Es necesario un marco para cada estrato.

32
3. Introducción teoría de muestreo

Muestreo De Conglomerados (MC)

Se tiene la participación del universo U


en subconjuntos U1, U2,..., UN. Una
partición significa que cumple:
•Ninguno de los conglomerados es
vacío
•Todos son disjuntos dos a dos
•La unión de todos los
Se caracteriza por que los objetos a ser conglomerados reconstruye el
seleccionados, no son elementos sino universo
agrupaciones de elementos llamados
conglomerados, en cada uno de ellos se
estudian todos los elementos que lo
Del conjunto total de conglomerados se
conforman.
pueden escoger con cualquier tipo de
muestreo anterior.

En los conglomerados de la muestra, se


observan todos los elementos.
33
Muestreo de Conglomerados (MC)
 Cuando la población se 12
encuentra dividida, de manera 5 6
10 20
natural, (grupos que se 13 19 2
suponen contienen toda la 17
variabilidad de la población), 18
es decir, la representan
fielmente respecto a la
característica a elegir, pueden 16 3
8
seleccionarse sólo algunos 1 7 14
de estos grupos o 11 4
9 15
conglomerados para la
realización del estudio.

 Dentro de los grupos


seleccionados se ubicarán las
unidades elementales, por
n
ejemplo, las personas a
encuestar, y podría
aplicársele el instrumento de 16 12
medición a todas las 6
1 10
unidades, es decir, los 11 19
miembros del grupo, o sólo
se le podría aplicar a algunos
de ellos, seleccionados al
azar. Este método tiene la
ventaja de simplificar la
recogida de información
muestral. 34
Muestreo de Conglomerados (MC)
Ventajas :
 Reduce costos.
 En caso que no exista una lista de elementos de la
población.
Desventajas:
 Las inferencias que se hacen en dicho muestreo no
son tan confiables como las del Muestreo Aleatorio,
sistemático o estratificado.
 Menor precisión en las estimaciones.

35
Muestreo Multietápico (MM)
Se tiene la participación del universo U
en subconjuntos U1, U2,..., UN.
Denominadas unidades primarias del
muestreo, UPM, Una partición significa
Es un diseño de conglomerados en dos que cumple:
etapas. Cuando la correlación •Ninguna de los UPMs es vacío
intraclásica es muy alta, es decir •Todos son disjuntos dos a dos
cuando al interior del conglomerado la •La unión de todos las UPMs
semejanza entre los elementos es muy reconstruye el universo
alta, entonces de estudiar a todos los
elementos se puede aplicar un
muestreo probabilístico. Del conjunto de UPMs se escogen
algunas con cualquier tipo de muestreo
anterior.

En cada UPM de la muestra se extrae, En las UPMs de la muestra se construye


con independencia e invarianza una el marco de elementos, procedimiento
muestra probabilística con un muestreo conocido con el nombre de
anterior. enlístamiento.
36
12
6
5 10 20
13 19 2
17
18

16 3
8
1 7 14
11 4
9 15

n
16 12 3
6
1a Etapa 1
11
10
14
19 15

n
2a Etapa 11 10 15

37
Tamaño de Muestra

La selección del tamaño de muestra puede hacerse desde


dos perspectivas:
 Punto de vista teórico: no conduce a directamente a resultados
concretos, pero constituye la base sobre la cual se construye la
siguiente posibilidad.

 Simulación: Es conveniente dejar fijo un esquema de selección


muestral para jugar únicamente con los tamaños en las diferentes
etapas y en las distintas Unidades Primeras de Muestreo.

38
Tamaño de Muestra
La precisión de una proporción muestral es
aproximadamente igual a uno dividido por la raíz
cuadrada del tamaño de la muestra

Tamaño de Muestra Precisión Valor


100 1/100 0,10 - 10%
400 1/400 0,05 - 5%
1600 1/1600 0,025 - 2,5%
10000 1/10000 0,01 - 1%

En la practica suelen elegirse tamaños entre 400 y 1600


individuos para obtener una precisión de +/-5% o +/-2,5%

39
Determinación Del Tamaño
De La Muestra
Variable de Escala / cuantitativas
Parámetros:
n = muestra
-Zc  +Zc e = error
Zc = nivel de confianza
Variable Cualitativa 2 = varianza poblacional
Parámetros: S2 = varianza muestral
n = muestra N = tamaño población
e = error
Zc = nivel de confianza
P(1-P) = varianza poblacional
N = tamaño población

40
Variables
cuantitativas
-Zc  +Zc
N 2
n
( N  1)e
Z 2 2
n 2
2 c
2
 2
e
Zc

N  2 2
NS 2
Z S
n n 2 c
( N  1)e 2
e
2
S 2

Zc 41
Variables
cualitativas
Proporción
-Zc  +Zc
P(1  P) N
n
( N  1)e 2
 P(1  P)
Zc2 Z P(1  P)
2
n c
2
e
N N 
n Z 2
1  Ne 2
n c
2
4e
42
3. Distribucones muestrales

Distribución en el muestreo de la
Media Muestral

Es la distribución de probabilidad
de todas la medias muestrales
posibles de un tamaño de muestra
dado, seleccionadas de una
población, y la probabilidad de
ocurrencia asociada con cada
media muestral.
EJEMPLO 1:

Consideremos el número de hermanos de tres


estudiantes. X: {X1, X2, X3} X: {2,4,6}

• Si se seleccionan al azar dos


n1 estudiantes del total, ¿cuántas
muestras diferentes son posibles?
N
n2
• Organice las medias muestrales en
n3 una distribución de muestreo.

n4 • Calcular la media de las medias


muestrales y compárela con la media
poblacional
nm
EJEMPLO 1:

Consideremos el número de hermanos de tres


estudiantes. X: {X1, X2, X3} X: {2,4,6}

• Si se seleccionan al azar dos


estudiantes del total, ¿cuántas muestras
diferentes son posibles?
3 3!
n1    3
N=3
n2  2  2!*(3  2)!
n3 Muestras:
X1, X2
X1, X3
X2, X3
• Organice las medias muestrales en una distribución
de muestreo.
Distribución de medias muestrales

Muestras Valores Medias P(x)


X1, X2 2,4 3 1/3

X1, X3 2,6 4 1/3

X2, X3 4,6 5 1/3

246
Media poblacional = µ = 4 E(x) = M(x) = µ
3
E(x) = Σ X P(X) = µ
3 45
Media de medias = 4
3 46
4. Teorema del límite central

Teorema del límite central


Para una población con media  y
variancia 2, la distribución de muestreo
de las medias de todas las muestras
posibles de tamaño n obtenidas de una
población tendrá una distribución normal
aproximada, con la media de la
distribución de muestreo igual a  y la
variancia igual a 2/n, si se supone que el
tamaño de la muestra es suficientemente
grande.
4. Teorema del límite central

Teorema del límite central


x Usar factor de corrección
Z por finitud si n/N ≥ 0.05
 x
Z 
 N n
n n N 1

Los gastos en miles de pesos de una población de


trabajadores tiene media 202 y desviación estándar 14

a. Si se selecciona una muestra de 36 trabajadores,


¿Cuál es la probabilidad de que la media muestral de
los gastos de los trabajadores este entre 198 y 206?
48
4. Teorema del límite central

Recordar:

Z=( - µ) / σ/√n ~ N( 0, 1)

P(198 ≤ ≤ 206) = P((198 - µ )/ σ/√n ≤ ( - µ) / σ/√n ≤ 206 - µ )/ σ/√n )=

P((198-202)/(14/√36) ≤ ( - µ )/ σ/√n ≤ (206-202)/(14/√36)) = P(-1,714 ≤ Z ≤ 1,714) =

Φ(1,714) - Φ(-1,714) = buscar tabla normal = 0,95637 – 0,04363 = 0,91274

49
¿Preguntas?

Gracias por su atención


(preguntas mensajes
plataforma virtual)

50

Anda mungkin juga menyukai