TEMA5:InferenciaEstadstica
Muestreo:
Tamaoycalidaddelamuestra
Muestreoaleatorio
Inferenciaestadstica:
Estimacindeunaproporcin
Estimacindeunamedia
Estimacindeunavarianza
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Muestreo
muestra
poblacin
estudiantes
de
la
MuestreoAleatorio
Todosloselementostienenlamismaprobabilidaddeser
incluidosenlamuestra.
Sinreposicindeloselementos:nosepermitequeunmismo
individuoseaseleccionadomsdeunavez.
Conreposicin:unelementopuedeserextradovariasveces.
Cuandolapoblacinesgrandeladiferenciaentreamboscasos
esmnima.
11
12
13
.
31
.
MaraDoloresFras,JessFernndezyCarmenMaraSordo
65
InferenciaEstadstica
Elproblemaqueaparececonmsfrecuenciaenlaprcticaes
el de la estimacin de parmetros de la poblacin, que son
desconocidos.
Existeuna
utilizadosparadescribirla
p a r m e tro s
p o b la c i n
P O B L A C I N
utilizados
paraestimar
dedondese
extraeuna
m u e s tra
a le a to r ia
lamuestra
genera
d a to s
n u m r ic o s
utilizados
paraevaluar
e s ta d s tic o s
InferenciaEstadstica
SedeseaconocerlaalturadelosalumnosdelaUniversidadde
Cantabria.
utilizadosparadescribirla
POBLACIN:
alumnos de la
U.C
parmetro
poblacin
utilizados
paraestimar
dedondese
extraeuna
muestra aleatoria:
Alumnos
de 1 de
Grupoalumnos
Ingenieria Civil
lamuestra
genera
V.A.Altura
utilizados
paraevaluar
1.72,1.69,1.57...1.90
23,18,20,
x = 21.71m
0.5
S n = 0.53m
1 .7
InferenciaEstadstica
Estimacin puntual: Obtener un pronstico numrico
nicosobreunparmetrodeladistribucin.
Muestra,estimadorparmetro
proporcinP
proporcinp
media
media x
varianza2
VarianzaSn2
Objetivo :min
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Estimacindeunaproporcin
Dada una poblacin con N individuos de los cuales M poseen
cierta propiedad (e.g. mujeres) que no poseen los dems, la
proporcinpoblacionalsedefinecomoP=M/N
Si se elige una muestra de esa poblacin de tamao n, en la
que aparecen m individuos con esa propiedad, entonces la
proporcinmuestralsedefinecomop=m/n
p 1p1
p
Laproporcinpoblacional(P)es
constantemientrasquecada
muestrapuedeteneruna
proporcinmuestral(p)distinta.
pp2 2
pp3 3
pp4
Laproporcinmuestralesunavariablealeatoriaporloque
esimportantedeterminarsudistribucin.
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Distribucindelaproporcinmuestral
Ladistribucindelaproporcinmuestralesladistribucinde
probabilidad de todos los valores posibles de la proporcin
muestral(p)
Muestreoconreemplazamientoopoblacininfinita:
El nmero de individuos (m) que poseen la propiedad en la
muestraesunavariablealeatoriabinomial.
Lamediayvarianzadelaproporcinmuestralsern:
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Distribucindelaproporcinmuestral
Ladistribucindelaproporcinmuestralesladistribucinde
probabilidad de todos los valores posibles de la proporcin
muestral(p)
Muestreosinreemplazamientoypoblacinfinita:
El nmero de individuos (m) que poseen la propiedad en la
muestraesunavariablealeatoriahipergeomtrica.
Lamediayvarianzadelaproporcinmuestralsern:
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Distribucindelaproporcinmuestral
Elvalormediodelafuncindeprobabilidadcoincidecon
laproporcinpoblacionalP.
Ladistribucindelaproporcinmuestralpseaproximaa
la distribucin normal (=E[p] y 2=Var[p]) para n
tendiendoainfinito.
Intervalosdeprobabilidaddeunaproporcin
Conocidalaproporcinpoblacional,P,yladistribucindela
proporcinmuestral,podemosobtenerunintervalodondela
v.a.ptieneunaprobabilidaddada(1)deestar.
El 100(1)% de las muestras aleatorias dan un valor de la
proporcinmuestraldentrodeesteintervalo.
Eseintervalosedenomina
intervalodeprobabilidad
deunaproporcincon
confianza1.
E.CastilloyR.E.Pruneda
EstadsticaAplicada.
Ed.Moralea(2001)
P+e
Intervalosdeprobabilidaddeunaproporcin
1(niveldeconfianza,valores
tpicos:90%95%99%)
eselniveldesignificacin
Existeninfinitosintervalos1.
Nosquedaremosconun
intervalosimtricorespecto
alvalorcentralPque,enel
casoladistribucinnormal,es
eldemenortamaoparauna
confianzadada.
[
Pe
P+e
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Intervalosdeprobabilidaddeunaproporcin
Si el tamao de la muestra es suficientemente grande, la
variable aleatoria p tiende a la ley normal y los intervalos de
probabilidad pueden obtenerse con las tablas de la ley normal.
Donde
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Intervalosdeprobabilidaddeunaproporcin
Pe
Muestreosinreemplazamientoy
poblacinfinita
Muestreoconreemplazamientoo
poblacininfinita
Condiciones
devalidez
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Intervalosdeprobabilidaddeunaproporcin
Pe
Muestreosinreemplazamientoy
poblacinfinita
Muestreoconreemplazamientoo
poblacininfinita
Condiciones
devalidez
Ejemplo
Lapoblacindeinternadosenuncentromdicoesde1000enfermos,delos
cuales el 20% padecen afecciones cardiacas. Se elige una muestra de 50
enfermos del fichero de registro. Calcular el intervalo de probabilidad al 0.95
depparaelcasodemuestreosinyconreemplazamiento.
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Intervalosdeprobabilidaddeunaproporcin
Ejemplo
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Estimadoresdeunaproporcin
Enlarealidad,elproblemamsfrecuenteeseldelaestimacinde
los parmetros de la poblacin. Para ello se extrae de la poblacin
unamuestradetamaonyconocidastasetratadeestimarP.
Nodainformacinalgunadelaprecisindelaestimacin.
P(a P b) = 1
Complementalaestimacinpuntualprecisandolaexactituddelaestimacin.
MaraDoloresFras,JessFernndezyCarmenMaraSordo
IntervalosdeConfianzadeunaProporcin
Se dice que el intervalo (a,b] es un intervalo de confianza
paraPalnivel(1)siseverifica:
P(a P b) = 1
Partiendodelintervalodeprobabilidad(1):
P(P e p P + e) = 1
Estaexpresinsepuedeescribircomo:
P(p e P p + e) = 1
Por lo que el intervalo [pe, p+e] tiene una probabilidad
asociadade(1)deconteneralparmetroP.
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Intervalosdeconfianzadeunaproporcin
pe
Muestreosinreemplazamientoy
poblacinfinita
Muestreoconreemplazamientoo
poblacininfinita
n( p e) > 5
n(1 p e) > 5
n / N < 0.9
Ejemplo
Condiciones
devalidez
n( p e) > 5
n(1 p e) > 5
Enunamuestraaleatoriade50rocastomadasdeunaminaseobservaque20deellas
son ricas en contenido mineral. Estimar puntualmente la proporcin de rocas con alto
contenido mineral en la mina. Calcular un intervalo de confianza 0.95 de esta
proporcin.
MaraDoloresFras,JessFernndezyCarmenMaraSordo
IntervalosdeConfianzadeunaProporcin
E.CastilloyR.E.Pruneda
EstadsticaAplicada.
Ed.Moralea(2001)
Losintervalosdeconfianzascambianconlasmuestras.
El100(1)%delasmuestrasdanintervalosdeconfianza
quecontienenalaproporcinpoblacional.
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Tamaodemuestraparaestimarproporcin
Enlaprcticaelexperimentadorseplanteaconquerrorynivel
deconfianzadeseaestimarlaproporcinysecalculaeltamao
delamuestranecesario.
Esdecir,seconoceney1ysebuscacalcularn.
Muestreosinreemplazamientoy
poblacinfinita
Muestreoconreemplazamiento
opoblacininfinita
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Tamaodemuestraparaestimarproporcin
El clculo de n implica elconocimiento
previo de la proporcin poblacional
(que, como mucho, se podr estimar
DESPUSdetomarlamuestra)
Sinosetieneideadelrangodevalores
de P(1P), se puede usar el valor
queeslacotasuperiordeP(1P).
Muestreosinreemplazamientoy
poblacinfinita
Muestreoconreemplazamientoo
poblacininfinita
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Ejercicio
Se quiere estimar la proporcin de zurdos en una poblacin con una confianza del
95%yunaprecisinde0.01.
1.Culdebesereltamaodelamuestraescogida?
2. Mediante un muestreo previo se estima que p0.1, qu tamao debe tener la
muestrasiparacalcularloseutilizalaestimacindepobtenida?
Estimacindeunamedia
DadaunapoblacinconNindividuosqueposeen
cierta propiedad (altura), esa propiedad o
variable tendr su media poblacional , an
cuandosuvalornumricosedesconozca.
Siseeligeunamuestraaleatoriadeesapoblacindetamaon,
sepuedeobservardichavariableyobtenerlamediamuestral
Lamediamuestralesunavariablealeatoriayaquecadamuestra
tieneunvalordistinto,porloquetieneintersestudiarsufuncin
deprobabilidadyenespecialsumediaysuvarianza.
La distribucin de la media muestral es la distribucin de
probabilidaddetodoslosvaloresposiblesdelamediamuestral.
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Distribucindelamediamuestral
Muestreosinreemplazamientoy
poblacinfinita
Muestreoconreemplazamientoo
poblacininfinita
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Intervalosdeprobabilidaddeunamedia
Sedenominaintervalodeprobabilidaddeunamediaaaquel
intervalo para el cual se sabe con una confianza 1 que la
mediamuestralseencuentraendichointervalo.
El intervalo (a,b] es un intervalo para la media muestral con
probabilidad1siseverifica:
P(a x b) = 1
Al igual que para proporciones, para la media el intervalo de
especial inters es el simtrico respecto de la media de la
poblacin.
P( e x + e) = 1
[ e, + e]
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Intervalosdeprobabilidaddeunamedia
Varianzadelapoblacinconocidayngrande(n30):
Ladistribucinmuestralsepuedeaproximarporunanormal,(Teor.centraldellmite)
Muestreosinreemplazamientoy
poblacinfinita
Muestreoconreemplazamientoo
poblacininfinita
Varianzadelapoblacindesconocidaynespequea.
Nosepuedeemplear 2/n,ensulugarsetomaS2/n.NtesequeS2 esuna
variableaaleatoria(dependedelamuestra)porloqueyanosigue
unadistribucinnormaltipificada.
En este caso, si la distribucin de partida es normal, se considera el
estadstico t que se distribuye segn una t de Student con n1 grados de
libertad.
MaraDoloresFras,JessFernndezyCarmenMaraSordo
tdeStudent,t(n)
Distribucin contnua con forma de campana, simtrica y
unimodal.Elparmetronsedenominagradosdelibertad.
EjedesimetraenlarectaX=0,porloquesumediana=0
n=1,4,16,
Cuandontiendeainfinitoladistribucint(n)tiendealaN(0,1)
MaraDoloresFras,JessFernndezyCarmenMaraSordo
tdeStudent,t(n)
Loscuantilesdela
distribucint(n)
aparecenenmuchas
frmulasdeinferencia
estadsticayse
aproximanmediante
tablasomediante
programasde
ordenador.
n=10
1=0.95
Rtip
>#tn1,/2
>qt(0.975,9)
[1]2.2622
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Ejercicio
En un instituto se sabe que la estatura de los alumnos se ajusta a una
N(165,82) en cm. Calcular la probabilidad de que la altura media de 64
alumnos,elegidosalazar,estentre163y167cm.
Estimadoresdeunamedia
Como ya se ha mencionado antes, en la realidad, el problema ms
frecuente es el de la estimacin de los parmetros de la poblacin.
Para ello se extrae de la poblacin una muestra de tamao n y
conocidastasetratadeestimar.
Estimacinpuntual:Lamediamuestralesunbuenestimadordela
mediadelapoblacin.
Nodainformacinalgunadelaprecisindelaestimacin.
P(a b) = 1
Complementalaestimacinpuntualprecisandolaexactituddelaestimacin.
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Intervalosdeconfianzadeunamedia
Sedicequeelintervalo(a,b]esunintervalodeconfianzapara
alnivel(1)siseverifica:
P(a b) = 1
Usando la hiptesis de normalidad y de la misma manera que se
hizoparalasproporciones:
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Intervalosdeconfianzadeunamedia
xe
Varianzadelapoblacinconocidayngrande(n30):
Muestreosinreemplazamientoy
poblacinfinita
Nn
e = z / 2
n(N 1 )
Muestreoconreemplazamientoo
poblacininfinita
e = z / 2
Varianzadelapoblacindesconocidaynespequea.
e = tn 1, / 2
S
n
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Tamaodemuestraparaestimarmedia
Aligualqueconlaproporcin,enlarealidadelproblemaquese
plantea se centra en estimar el tamao de muestra necesario
paraestimarunamediaconunerroryniveldeconfianzadados.
Esdecir,seconoceney1ysebuscacalcularn.
e = z / 2
SilaaproximacinNormalnoesvlida,esteclculosecomplica
yaquenapareceimplcitamenteentn1,/2.Adems,S2tambines
desconocidohastatomarlamuestra.
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Ejercicio
Silavidaenhorasdeunabombillaelctricade75watiossedistribuye
deformanormalconunadesviacintpicade5horasyelegimosuna
m.a.s.de30bombillascuyavidamediaesde1014horas,sepide:
1. Construir un intervalo de confianza para la vida media de las
bombillasconunniveldesignificacindel0.05.
2.Siqueremostenerunniveldeconfianzadel95%dequeelerroren
laestimacindelavidamediafueramenordeunahora,Qutamao
delamuestraelegiramos?
Estimacindeunavarianza
Sx
Sx
2
24
2
14
2
1
2
3
S 2 , S n2
Distribucindelavarianzamuestral
4eselmomentodeordencuatrorespectodelamedia:
[Estaeslarazndehaberintroducidoesteestadsticoenestadsticadescriptiva!]
Intervalosdeprobabilidaddeunavarianza
Se denomina intervalo de probabilidad de una varianza a
aquelintervaloparaelcualsesabeconunaconfianza1que
lavarianzamuestralseencuentraendichointervalo.
P(a S b) = 1
2
n
Intervalosdeprobabilidaddeunavarianza
Si asumimos que la poblacin sigue una distribucin N(, 2),
entonceslavariablealeatoria
MaraDoloresFras,JessFernndezyCarmenMaraSordo
DistribucinChicuadrado, (n)
Esunadistribucincontnua,queslotomavalorespositivos.
Porlotanto,NOessimtrica.
Esladistribucinquesiguelasumadenvariablesaleatorias
independientesN(0,1)elevadasalcuadrado.Elparmetron
sedenominagradosdelibertad.
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Intervalosdeprobabilidaddeunavarianza
Si asumimos que la poblacin sigue una distribucin N(, 2),
entonceslavariablealeatoria
Portanto:
Intervalosdeprobabilidaddeunavarianza
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Intervalosdeprobabilidaddeunavarianza
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Intervalosdeprobabilidaddeunavarianza
n=30
n1,/2
Rtip
># 2n1,/2
>qchisq(0.05,29)
># 2n1,1/2
>qchisq(0.95,29)
MaraDoloresFras,JessFernndezyCarmenMaraSordo
n1,1/2
Intervalosdeprobabilidaddeunacuasivarianza
Paralacuasivarianzaelintervalodeprobabilidadsecalcularadela
mismamanera:
n1 S
Elintervalodeprobabilidadvendradadodelaforma:
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Estimadoresdeunavarianza
En la realidad, el problema ms frecuente es el de la estimacin de
los parmetros de la poblacin. Para ello se extrae de la poblacin
unamuestradetamaonyconocidastasetratadeestimar2.
Nodainformacinalgunadelaprecisindelaestimacin.
P(a 2 b) = 1
Complementalaestimacinpuntualprecisandolaexactituddelaestimacin.
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Intervalosdeconfianzadeunavarianza
Delamismamaneraquesehizoparaelintervalodeprobabilidad(1):
esunintervalodeconfianzaparalavarianzapoblacionalsilapoblacin
departidaesnormal.Porladefinicindelacuasivarianzamuestral,este
intervalotambinsepuedeescribircomo:
MaraDoloresFras,JessFernndezyCarmenMaraSordo
Ejercicio
Se sabe que elpeso por bloque deun ciertopreparado de hormign
sedistribuyedeformanormal.Conelobjetodeestudiarlavarianzade
la distribucin, se extrae una m.a.s de 6 bloques. Sabiendo que la
varianza muestral es igual a 40, estimar la varianza poblacional
medianteunintervalodeconfianzaal90%.