'".-'\'t'qFrt'
-,
."'o^,,
*a]h;'\it"
t, i-toI
f\
cr,
'r
\
*"
Guaneiueta, Mxiea
Revisin tcnica:
VXICO
. BOGOT.
LISBOA. MADRID AUCKLAND. LONDRES. VILN . MONTREAL. NUEVA DELHI SAN FRANCISCO. SINGAPUR. SAN LUIS. SIDNEY. TORONTO _t / L-'
BUENOS AIRES
-'
l'-t
,--,*==#
Contenido
.lcer.ca de los autores
XI
:decimientos -eiacio.
xill
XV
cpinro
2
4 6
10
Ei diseo de experimentos hoy. Definiciones bsicas en el diseo de experimentos . . Etapas en el diseo de experimentos . . Consideraciones prcticas sobre el uso de mtodos estadsticos Principios bsicos. Clasificacin y seleccin de los diseos experimentales. . . .
IZ I2
l4
CIPTULO
t8
20
.I
23 29 30 34 36
5t
39 43
dependientes)....
Resumen de frmulas para procedimientos de prueba de hiptesis. . . Uso de un software estadstico.
44
49 49
(PTULO
Experimentos con un solo factor (anlisis de varianza). . . . . Diseo completamente al azar y ANOVA Comparaciones o pruebas de rango mltiples Verificacin de los supuestos del modelo Eleccin del tamao de la muestra. . . . . uso de software computacional . . .
60
6l s;
89
91
CAPruLO
Diseos de
bloques
l oo
azar
l0Z
109
Csrnfo
Diseo en cuadro grecolatino. Uso de software
115
116
cAPTUto
Diseos
factoriales.
factoriales.
126 I28
Experimentacin factorial vs. mover un factor Diseos factoriales con dos factores
alavez
132
I34
143
Diseos factoriales con tres factores Transformaciones para estabilizar varianza Diseo factorial general Modelos de efectos aleatorios
I49
150 153
Cmohacerloconsoftware....
CAPTULO 6 Diseos factoriales 2k Diseofactorial 22... Experimento 22: ejemplo integrador Diseo factorial 23 . . . Experimento 23: ejemplo integrador Diseo factorial general 2k . . . Diseo factorial 2r no replicado. . . Experimento 25 no replicado: ejemplo integrador Cuando la significancia de los efectos es menos clara: un ejemplo. . ' Factoriales 2k con punto al centro Factoriales 2k en bloques . . . .
.
l5'l
r66
168
173
183 185
r92
19:
t9s 20
2lt 2l(
22(
CAPTUIO
23(
231
24',
25(
CAPTULO
qr
Diseos factoriales fraccionados 2k-p. Diseo factorial fraccionado zk-t . . El concepto de resolucin . . . . Construccin de fracciones 2k-1 Experiment o 2s-r : ejemplo integrador
Diseos factoriales fraccionados 2r-2 Diseo factorial fraccionado 2k-p Experimento 21a: ejemplo integrador Tpicos adicionales sobre factoriales fraccionados. Uso de
25t
26
26:
26:
26t 26.
27. 27t
software
27' 28.
fPiTULO
29,
29,
29 29 30
Contenido
Diseo con arreglo interno y externo (diseo de parmetros) . . . . . . . Razn seaVruido. Uso de software
CAF*,Y{.Ef;"S
ffi
307 307
312
x*
318
320
3Zz 323
330
aprendizaje
El diseo de experimentos y el ciclo de Deming Etapas y actividades de la planeacin y anlisis de un experimento . . . Control de factores de bloque y de ruido Qu sigue despus del primer experimento Qu hacer cuando ningn efecto es significativo. . .
cAp$?.r,rE"ff
33I
334
E Anlisis de regresin
.
338
340 346
351 351 360 365
Regresin lineal simple . . . . Pruebas de hiptesis en la regresin linea] simple Calidad del ajuste en regresin lineal simple. . . .
Estimacin y prediccin por intervalo en regresin simple Regresin lineal mltiple. . . . Pruebas de hiptesis en regresin lineal mltiple . . Intervalos de confianza y prediccin en regresin mltiple. Uso de un software estadstico.
.
37r
-)t-)
CAF$?$JL&
?P
384
386
*3
432
434 436
441
Optimizacin simultnea Mtodo grfico. Mtodo de la funcin de deseabilidad Trabaio con un software estadstico.
446
CAPITl{-*
g4
452
,<
--<.<
Diseos anidados Modelo y anlisis estadstico del diseo anidado Diseos en parcelas divididas
-f
-,
+6,i
111
3E
480
482
486
y caracteizacltii:.l1:5.f":I
de una mezcla
*:::::-
i:#;;;t
APNDTCE
"t
r"- componentes
509
TAbIAS
APNDIGE '--
521
<a1
<.r,1
analizar un
Sistema StatgraPhics
526 528
529
'
SistemaJMP" """."^
;i;"
533
537
BIBTIOGRATiA REFERENCIAS Y
fnolcr ANALico
#mptulo
htroduccin al diseo
de experimentos
$xxsmmr*
*? El diseo de exPerimentos hoY
r. Definiciones bsicas en el diseo de experimentos
tF :;:
i*
PrinciPios bsicos
....Clasificacinyseleccindelosdiseosexperimentales
ffimtiv*s
dm ffiffs-*sldmffijt
ffi I
juega el diseo de Conocer el papel fundmental que y en la experimentos en el meioramiento de Procesos
investlgacin'
IDescribirlasetapasmsimportantesenlainvestigacin
experimental.
ffiHmpa tronceptual
Diseo de experimentos
fl&pgYCJt$ I
',.{
i:
{r:!i.}l'i i
rj ts'*!"i
* **
*xpeli ment*s'
(*e*:*$'1r'$ eEag*
" Aleatorizacin
ffi&
Sises de *xpffie-&wxffiffi&ws
: :'-=:::: t*]ii;;-'
:
&xmy
,.Enor aleatorio
" Enor exPerimental
t; io' tnut"'i";;;;t
d u n r :r,
'
:'
l-
ProcesDr-
--::=----
,.
i-,aoie de respu:sia
l.Compararadosomsmaterialesconelfindeelegiralquemejorcumple
2.
con la los requerimientos' para verificar s i trabajan medicin de Comparar uu'io' i"tt'omentos
I
4.
;:X-*ti:"Jril:[:t'l- .
sobre una o
*a'
velocidad' humedad'
porejemplo)d;;;;"dozcanlosdefectosselogreunmejordesempeno
::scilaciones de variables :. l:::ru ;l:'JJllff[i: 3::fiff o procesos' de nuevos productos
ambientares
de
dos quiere mejorar'un procesoexisten r'a heEn general, cuando se observar o monitorear para ello: unu ", mejorarlo: se dice obtener ta inrormaJ,
nuevos materiales'
manetas bstcas
,"."r*t^
rramientas estadsticai,l"r,"
"o*"". oY
,.n"r.i,iiii"'
U"1t*"1-1a1
qo" permitan experimentar' es decir' manera consiste en dichas seales proceso para provocar
Al
"tp".ii"ito '"
,.3Je S se concretan en mejoras sustanciales del proceso. En este :-.--.:-, -:-: : r":-.r--l:ttr es mejor que sentarse a esperar a que el proceso nos indiqul:-: ' :.:-,r mejorarlo. El diseo de experimenlos (DDE) es un conjunto de tcnr;"s las seales tiles' sina -, ', :-:. =r e1 sentido de que no esperan que el pfoceso mande para su . -: ., i .j "manipula" paraque proporcione la informacin que se requiere
T
t,
..
:
,,ber diseo de experimentos y offas tcnicas estadsticas, en combinacin con al responsable del mismo como un obseruador per,--3nros del proceso, sitan , _ , proactivo que es capazde pfoponer mejoras y de observar algo interesante
l I
S.
-**Jadesdemejora)enelprocesoyenlosdatosdondeotrapersonanoVenada.
t-
!i;,0 d* *npcrirn*rlt*s* *n
_ ,
{m
i*vestg*c!*e"l
!-
lr iof
rS.
de
SC
_ _; : ha dicho hasta el momento tambin es vlido en el campo de la investiga. - : _.:ilca o aplicada, ya que a fin de cuentas, el objetivo es generar nuevas ideas - : :: s respuestas a las interrogantes del investigador sobre el objeto de estudio' - - bjetivo cle los mtoclos estadsticos'es lograr que el proceso de generar coI - -_:--,io y aprendizaje sea lo ms eficiente posible. En este proceso, que ha deii ":.:: ser secuencial, interactan dos polos (vase figura 1'1)' por un lado estn ,. : :_:. los modelos, las hiptesis, las conjeturas y los supuestos; por el otro, esy los datos. As, como se --* . ::lidad, los hechos, los fenmenos, |a evidencia lleva a trn proceso de deduccin
:
tes
: *i las consecuencias derivadas de ia hiptesis pueden ser comparadas con los ;,: . : ,l lando las consecuencias y los datos no coffesponden, entonces la discrepan-.
.:..:
en Box et at.
[:
cndc
las consecuercias
\'er
lon
.
la hiptesis origi- : -, r-- llevar a tn proceso de induccin, en el cual se modifica - - ; ssta manera inicia un segundo ciclo de la interaccin de teora y datos, en el
rpie
-* ,::
(|os :onsecuencias de la hiptesis modificada son comparadas con los datos ios que se obtengan en este nuevo ciclo); esto puede llevar a futuras modifide conocimiento.
Fsotes* dq
Es
<1e
inxj$a:q*dlr*
nla
acto dad,
peo
proceso interactivo de aprendizaje puede visualizarse como un ciclo de .: -- . ,trrntacin (figural.)),en el cual las discrepancias entre los datos y las conH2, y de la verifica": - _-:: -is de la hiptesis fy'1, llevan a una hiptesis modificada
{es.
a travs de su
decir,
eales ir. que
Realidad, hechos, fenmenos, datos
Figura
l.l
CepT{.tS
lnduccin
*--+
HiPtesis
modificada H,
Hiptesis
H'
Deduccin
----J>
-,-a=-)zzaaH,
o*:ni: . ' -:- .: -:"' :'tisacin agrcola'.t" con muestras :.-l -, ,, .: ::,-:,-:-,:-' exPerimentos de tot .:se dio "titados - | - t'-tt' = :-:> : Fi:her -:;--: :: : ':radica en que este investigador ' ' ::;:: -: :l' = *: aniisis : el :":: -::- " -: : -tr' : --''-_-.,=:=",ipr"pot.ion -'- t'"f t'i*tntos obstaculizaba disear -t " -:r --': :,-= mtodos para ,-..r, :: ,-t.;1:';::-;:--:_-_ factores. ;: .. :-r*-,:-; _-_' t .=- - -..ara in-rulranea de varios
mtodos (ahora
;'Sil:'::-! : -i-''-':-:: fUerOn enCabeZadOS i)ipiiIl,illi'-: . -= --:- ."O-.,',antOS - '" -:- ll'-:pc's:ali'];;s la indus,o, ,1esarr.',l1os :urante och o aos en t'::]'' tlaba quien "ttit'ir;'-' s'ue, cie de respuestas nor George E' P' eor' desanoll.ila mt,j..is,'. "i: 1, r'grurJlu iria qumica.n
tegia Para u n".'u*'enta de aplicacin se convirti apli1970' o. "n ei diseo Hasta la caa de "r"t"if"' "^p".r-"ni", V 'a ar"uJ"-i*"riigu"iOn tu, pero slo
"n cacinanivelptuntuopfocesosdemanufacturanoestabageneralizada,debidoala faltadefecufsoscomputacionales.yaquelosingenierosyespecialistasenmanufacy, a apli c ac i n i* ilf; "j,T:X :".l1"tTen,o japonesa' El ;;;;;1J;i:":jndustria debido Ishikawa' promovlo "l del diseo o' "'p"'il*os gures ?"rnt"9 : calidad' la movimiento por f:t el Jiseo de experimentos demostr su "n:19"1d: donde "t calidad, producel uso de la estadr;i;;.; para disear mejor los
ffi
*:::*;t?
para;;il
:l;i.lff fi, i
d.;;;;"
utilidad ranto
problemas
desmca
"t,r"O"r" tos y los procesos.;;;;;; tu,,'uin tuvieron;#;;" sobre diseo pJt la calidad 'ouu' ,"rprr"rr" *;;iJi"tt" "l mundo occidental. o*o
como
en los ltimos veinte cesos,iasindustriasempezafonaentrenarasusingeniefosenlaaplicacindeldisejL * como materla "*ttoio;.rnctuso' o de experr-"rr"r. "ontir,,iu el diseo de experimentos t'un aos, 1as oniu""liluJ"' "t"o'porado de las ingenieras' en la mayora obligatoria u on"'i'*u
diseo de exPerrsqentms
EIdiseodeexperne,l/oseslaaplicacindelmtodocientficopafagenerarconocimientoacercadeunsistemaopfoceso'n",'.'"u'"depruebasplaneadasadecuadamente.Estametodoioglu,"t'aloconsolidandocomounconjuntodetcnicas
experl-:-::
:: .' - :r-,'ilS ' de ingeniea, que permiten entender mejor situaciones compiejas at -: --.- r causa-efecto.
ir:erimento
--
. t.:ritnento es Ltn cambio en las condiciones de operacin de un sistema o pro-: !.. que se hace con el ob.jetivo de medir el efecto del cambio sobre una o varias :: :-:dades del producto o resultado. Asimismo, el experimento permite aumentar . :::ocimiento acerca del sistema. Por ejemplo, en un proceso qumico se pueden
lr
Experimer::
fJ u ,a - n< a: - _:_: _
:: . ::i diferentes temperaturas y presiones, y medir el cambio observado en el rendi-: -:,r (.vield, ppm, defectivo) del proceso. Al analizar los efectos (datos) se obtiene
-. -:imiento acerca del proceso qumico, lo cual permite mejorar su desempeo.
ei a!:jetirio a=
a
'' -
lti'
propieclade: de
sr-rltcic.
:--:,
"
ffim
que se iliza para generar un
[Jnldad experinrental
nruesire(s) que se ulrltza S:ara gene rr un vlor qr* sra repres*ntativo rlel re:ulteda de !a prlleba. Piezals)
:,r que sea representativo del resultado del experimento o prueba. En cada diseo
:rperimentos es importante definir de manera cuidadosa la unidad experimental, ; !3 sta puede ser una pieza o muestra de una sustancia o un conjunto de piezas :::,.Jucidas, dependiendo del proceso que se estudia. Por ejemplo, si se quiere inves,.:r alternativas para reducir el porcentaje de piezas defectuosas, en un proceso que ::-'duce muchas piezas en un lapso corto de tiempo, es claro que no sera muy con.."rle que la unidad experimental fuera una sola pieza, en la cual se vea si en una - - r,licin experimental estaba defectuosa o no. Aqu, la unidad experimental ser
t.a
:.
- ::ta cantidad de piezas que se producen en las mismas condiciones experimentales, .l irnal se analizarcuntas de ellas estn defectuosas y cuntas no.
,
ariabNes,
fadores y niveles
)n
E1
::
i
SU
to'lo proceso intervienen distintos tipos de variables o factores como los que se :-- i.slran en la figura I .3, donde tambin se aprecian algunas interrogantes al planear :, erperimento.
lc:OS
ffi
Variable de resp*esta
A lravs de esta{s) varirble(s)
e1
rosente
Variable(s) de respuesta. A travs de esta(s) variable(s) se conoce el efecto o los ::sultados de cada prueba experimental (vase figura 1.3), por 1o que pueden ser -.:actersticas de la calidad de un producto y/o variables que miden el desempeo de
Entrada
Factores
conlTotaDtes
Salida
:ria
***'*_r>
Factores no
Proceso
-*_-*---ts
controlables
\,du5d5
_----_--}}
*_--_-+b
iCules caractersticas de calidad se van a medir? iCules factores controlables deben incluirse en el experimento?
ZQu niveles debe utilizar cada factor?
lnocuacas
r
I
CAPTULO
un proceso. El objetivo de muchos estudios experimentales es encontrar ia forma de mejorar lar s I variable(s) de respuesta. Por lo general. estas \ ariables se denotan con la letra 1.
Fatores controlables
>On
Caf
Fares cottolables.
:
i:
y n:
er u. - . -
erp'enmentde> que se pueden fijar en un nivel dado. Algunos de stos son 1os que usul-filene :e ;ontrolan durante la operacin normal del proceso rr'ase frgura 1.3), :e snrgeri Frrque. para cada uno de ellos, existe la manera o el men--anismo para crrntiii" :r;ry;lo su nir el de operacin. Esto ltimo es lo que hace posible que se pueda erFer-:rri: can l1as. Por ejemplo, si en el proceso se usa agua a 60"C entonces detre -rs:;i ncnismo que permita fijar la temperarura del asua dentro de
un rango
Jr
trolan
:*--o'n"
r:tri\i fo "rgr:.Jin. r-elocidad, presin, etc. A los factc'res '-ontrolables tarnt'iu:e h -''tr. ',r;riihles de entrada, condiciones de proceso-variables de direactil-1f,-
=rFi";rrrr-
';5:mr*--.i1. -{lgunos f'actores o caractersticas que generelrnente se conriempn de residencia, cantidad de cierto reactir-o. tipo de
I*
Factores no controlables
Fadrc
Si I
1 n:*"trx
o de ruido. Son variables o caractestica-i de materiales rhl :e pueden controlar durante el experimento o la operacin normal ,:*- r-.-ceo. Por e_jemplo. algunos factores que suelen ser no controlables son las ""'e:-L"l* :rmtlirnrales (luz, humedad, temperatura, partculas. ruido. etc. l. el animo
{t".r
n crlroltes
fu
tl:
la calidad del material que se recibe del proleedor t interno o exes no controlable puede convertirse en controloble ctana e ,-renta con el mecanismo o la tecnologa para ello.
l':nr'
""pteraJores.
Fadures esdiados. Son las variables que se investigan en el experimento, resFwtrl de cmo influyen o afectan a la(s) variable(s) de respuesta. Los factores estudiair--'s pueden ser controlables o no controlables, a estos ltimos quiz fue posible y
de iters controlarlos durante el experimento. Para que un factor pueda ser estudiado es necesario que durante el experimento se haya probado en, al menos, dos niveles o condiciones.
En principio, cualquier factor, sea controlable o no, puede tener alguna influencia en la variable de respuesta que se refleja en su media o en su variabilidad. Para fines de un diseo de experimentos deben seleccionarse los factores que se considera. por conocimiento del objeto de estudio, que pueden tener efecto sobre la respues-
ta de inters. Obviamente, si se decide o interesa estudiar el efecto de un factor no controlable, parte de la problemtica a superar durante el diseo es ver la manera en que se controlar durante el experimento tal factor.
Niveles y tratamientos. Los diferentes valores que se asignan a cada factor estudiado en un diseo experimental se llaman niveles. Una combinacin de niveles de todos los factores estudiados se llama tratamiento o punto de dse.o. Por ejemplo, si en un erperimento se estudia la influencia de la velocidad y la temperatura, y se de.::i :robar cada una en dos niveles, entonces cada combinacin de niveles (veloci-.'.r" ::::Frrurar es un tratamiento. En este caso habra cuatro tratamientos, como : :L"f: r .. -b1r 1.1. Es necesario probar cada tratamiento y obtener el corres;mUinr''rie ", 1;{lf ;
-,
Tabla
l.l
l:
"
.,: : '::
"cuerdo
nir.e1 es un tratamiento.
i-
e
:S
E*rw aleatorio y erfor experimental, Siempre que se realiza un estudio experit*,rr -'-. :arte de la variabilidad observada en la respuesta no se podr explicar por los
'i.r.-.
-
:-!
t-
ES
ral
las
natural del proceso. Esta ..:-,idad constituye el llamado error aleatorio. Por ejemplo, ser parte de este :'- - ''-atorio el pequeo efecto que tienen los factores que no se estudiaron, siem:r: , ::ando se mantenga pequeo o despreciable, as como la variabilidad de las :':-;-rnes hechas bajo las mismas condiciones. Sin embargo, el emor aleatorio
ffi
Frrsr atr*ntorio
[s
la vribiliCaei obsenaile
no 3\an-
--:.:r absorber todos los errores que el experimentador comete durante los expe* -:.:. -',:. y si stos son graves, ms que error aleatorio hablaremos de error experiii,ir - --, . De predominar ste,
to:.ei :r
expenmenial.
la deteccin de cules de
difcil, si no
es que imposible.
ffifr_
a$3
,.
res-
sturie y
,Juando se corre un diseo experimental es importante que la variabilidad obu* -; de la respuesta se deba principalmente a los factores estudiados y en menor n--i al eror aleatorio, y adems que este enor sea efectivamente aleatorio. Cuan- , :,J.\'or parte de la variabilidad observada se debe a factores no estudiados o a r.n -:rlr no aleatorio, no se podr distinguir cul es el verdadero efecto que tienen los
Error experirnenta
f, 'rr,,r:rl-:l,rr.n (I ,, \L"PUrCrr!Ur. ',.'r;, r' r,:,r,1,.1 art,Jr':
:U': :ellci,
lr..'..
.dia-
r'euenPara sidepues-
x1 x2...
ttt sf
xk
or no
:ra en ','.ieria
prima
Yt Y2
Proceso
Yk
Caractersticas de calidad:
+ + f
: estu:les de
Lplo, si se de-
), ),...)o
. Parmetros de calidad del proveedor . Qumica del plstico . Otras variables del proceso . Variables ambientales
Figura 1.4
Factores de ruido (difciles de controlar):
veloci. como
COITES.
/
t0
eApiTUf,-
factores estudiados, con 1o que el experimento no alcanzara su objetivo principal. De aqu la importancia de no dejar variar libremente a ningn factor que pueda influir de manera significativa sobre el comportamiento de la respuesra (principio de bloqueo).
Kjemp$m, .!
En la figura 1.4 se muestran algunas de las variables que intervienen en e1 proceso de fabricacin de un envase de plstico. El problema general es encontrar 1as condiciones de operacin de los factores controlables, que dan por resultado valores ptimos de 1as caractersticas de calidad ah listadas. Tambin podra se r de inters investigar el efecto de factores no controlables, buscando lograr un proceso insensible (robusto) a su posible efecto. Supongamos que slo intereie 1 dureza de la pieza de plstico resultante. Algunas preguntas que se pueden resprlder con un
diseo experimental son: cules factores afectan la dureza de1 p1srr,-rl. cmo es que la afectan?, o bien, qu relacin hay entre los factores cnrr,t,ltbles y la drreza?; existen otras condiciones de operacin, distintas a 1as r;,s que mejoran la durezaf Estas preguntas se responden probando diferentes .-,:,n,L,inaciones en ios niveles de los factores controlables, seleccionadas de nln-:; :.decuada. Esto ltimo significa escoger el diseo experimental ms adecuad.. l problema, que en este caso parece ser un diseo factorial completo o fraccion:,- ,-aptulos
5,6y8).
Hapms ss eN dtsmffi*
d* *xBwrmentos
I
Matriz Ce dise*
Un aspecto fundamental del diseo de experimentos es decidir;u.i:. :,-i:bas o tratamientos se van arealizat y cuntas repeticiones de cada uno !- i.i-::;r-r. de manera que se obtenga la mxima informacin al mnimo costc r,sibte. El arreglo formado por los diferentes tratamientos que sern corridos, inclu,. endo las repeticiones, recibe el nombre de matriz de diseo o slo diseo. Para que un estudio experimental sea exitoso es necesario re:hzar. por etapas, diferentes actividades. En este sentido, la etapa ms impor-tante \ : ia que se le debe dedicar mayor tiempo esla planeacin (vase captulo 10). A c.rr:rnucin se describen de manera breve las etapas del diseo de experimentos con obiero de dar una visin global de lo que implica su correcta aplicacin. Vanos J{,rt-rcepros que se mencionan en estas etapas se definen con detalle en los siguientes rapirulos,
Planeacin
3,:l
-,:i
aCilt',:"
: ri llu:' . 'l--C
C= '' o:'-
--. =-:.'l
-
ifde ,
,,t
?'c
Planesei*n y
\-,rtbles
-:.
de --.-: _:.
de
planeacin se deben hacer investigaciones preliminares que conduzcan a entender y delimitar el problema u objeto de estudio. de tal forma que quede claro qu se va a estudiar, por qu es importante r. si es un probrema, cul es la magnitud del mismo.
Etapas en el dise=c
:= :'::-
-:-'::
tt
1as mediciones que se obtengan sobre esas variables sean cont-iables. E: 'ruas palabras. se debe garanlizar que los instrumentos y/o mtodos de miicin son capaces de repetir y reproducir una medicin, que tienen la pre"'rsin (error) y exactitud (calibracin) necesaria. Recordemos que los siste;nas de medicin son la forma en la que percibimos la realidad, por lo que si stos son deficientes, las decisiones que se tomen con base en ellos pueden
;ue
ser inadecuadas.
-:
Determinar cules factores deben estudiarse o investigarse, de acuerdo a la supuesta influencia que tienen sobre la respuesta. No se trata de que el experimentador tenga que saber a priori cules factores influyen, puesto que precisamente para eso es el experimento, pero s de que utilice toda la informacin disponible para incluir aquellos que se considera que tienen un
mayor efecto.
tal adecuado a los factores que se tienen y al objetivo del experimento. Este paso tambin implica determinar cuntas repeticiones se harn para cada tratamiento, tomando'en cuenta el tiempo, el costo y la
precisin deseada.
Planear y organizar el trabajo experimental. Con base en el diseo seleccionado, organizar y planear con detalle el trabajo experimental, por ejemplo, las personas que van a intervenir, la forma operativa en que se harn las cosas, etc. (vase captulo 10). Realizar el experimento. Seguir al pie de la letra el plan previsto en la etapa anterior, y en caso de algn imprevisto, determinar a qu persona se le reportara y lo que se hara.
\-lisis
:-: : ' -: etapa no se debe perder de vista que los resultados experimentales son obser- ',. ,i ntuestrales, no poblacionales. Por ello, se debe recurir a mtodos estads:; , :iferenciales para ver si las diferencias o efectos muestrales (experimentales) - -ruficientemente grandes para que garanticen diferencias poblacionales (o a 1 :. :ioceso). La tcnica estadstica central en el anlisis de los experimentos es el ;-.:i"r anlisis de varianzaANOVA (acrnimo en ingls).
-:erPretacln
de
lt d
r---. Jon el respaldo del anlisis estadstico formal, se debe analizar con detalle lo -i-: :.: pasado en el experimento, desde contrastar las conjeturas iniciales con 1os
ede
:u1
;'
.: ,-,:.ios del experimento, hasta observar los nuevos aprendizajes que sobre e 1 pr.r,.: , :3 lo_eraron, verificar supuestos y elegir el tratamiento _uanador. siernpr::..n
into
:rn : las
nao aen
l2
CAPiTUL
"tt1i^11::erreconocer que las sotucin de problemas, es necesario pfoceso de investtgac y o" por ello no garant\zaninvestigaciones exitosas' rnetodologas estadsticas por s solas es ir\portante considetar \os sigrentes punttls"
utilizar los mtodos estadsticos en El conocimiento no estadstico es vital. Para en primer lugar se requiere que general y los diseos de experimentos en particulat, tcnico y prctico sobre el el experimentador r"ngu un buen nivel de conocimiento que pueda vislumbrar con cierta facifenmeno o proceso q*ue estudia, de tal for:rna y seacapaz de plantear conjeturas lidad cules son los urp.oro* clave del fenmeno variables de respuesta y los posiprecisas, vislumbrar'eitipo de relaciones entre las mejor los factores y sus nibles factores a estudiar. Todo esto ayudar a seleccionar ese conocimiento permitir veles, as como el diseo que es mejor aplicar. Adems' los resultados y obtener conclusiosacaile un provecho real al anlisis estadstico de
nes que generen aprendizaje
y soluciones'
e impoancia prc' Reconocer la diferencia entre significancia estadstica tratamientos son ditica. En ocasiones, un experimentador puede concluir que dos aunque sean significativas' no ferentes estadsticamente, pero que tales diferencias, prctica sea importante' necesariamente representan una diferencia que en la
que a un experimento nico Apostarle ms a la experimentacin secuencial en una sola y definitivo. En ocasines, los experimentadores novatos pretenden
sobre un proceso o fenfase de experimentacin contestar todas sus interrogantes experimentos muy extensos que meno en particular. Sin embargo, esto puede llevar a generacin de resultados' Por ello consuman demasiados recufsos y que retarden la diferentes fases de experimentacin en es importante considerar como alternativas a una mayor precisin en los forma secuencial, en las cuales se alcance paulatinamente
conocimientos Y soluciones' con la experimentaEs importante no confundir la experimentacin secuencial frente a mover un cin a prueba y effof (vase seccin "Experimentacin factorial en cada fase sigue una factor a lavez" del captulo 5).La experimentacin secuencial cada fase se obtienen resultados y estrategia bien definia y pensada; por 1o tanto, en y conocimiento ms reficonclusiones importantes que permiten generar soluciones
nadoparaplanteardemejormanelalasiguientefasedeexperimentacin.
Frincipios bsieos
observables y repetibles' Por El diseo de experimentos trata de fenmenos que son observabilidad y repetibililo tanto, sin el pensamiento estadstico, los conceptos de cosa observada se aprecia con dad son inherentemente contradictorios. cualquier dos veces, incluso las mevariabilidad; nada ocune exactamente de la misma forma
t5
., ni -:
!r' 'r -*r
eun-
ite el
ie
1as
r ello
observacin sea repetible?, qu repeticin es realmente un :i:'-" -:: - 'r resuitado es el mismo o difiere, es confirmacin o contradiccrn : n., pueden ser contestadas de manera coherente sin el pensamientc, : : :1ernplo, alguien da una nueva receta de chocolate, dice que no falla. -: r: ,, no sale, mientras que el segundo y tercer intento s funcionan. La - :,:robada completamente? (Los chocolates tienen ms de 800 ingre-: -rles que pueden ser separados.) - : ,--;:.ir con lo anterior, se debe ser muy cuidadoso en la planeacin y el -. - . : rerimento. El punto de partida para una correcta planeacin es apli.
-J - -: *::
,; a-:..: -
)os en :e que
bre el
; :
:
:r,-,:s bsicos
del diseo de experimentos: aleatoizacin, repeticin y con que los datos obtenidos sean
es decir, la validez del anlisis de los
facieturas
:r
ffi
,i1 !
'
posi-
nirmitir
sus
clusio-
ftffihcin. Consiste en hacer las corridas experimentales en orden aleatorio . -. ^ : :, material tambin seleccionado aleatoriamente. Este principio aumen- . :',:.-.,jad de que el supuesto de independencia de los errores se cumpla, lo .., r -- ,-:-uisito parala validez de las pruebas de estadsticas que se realizan. .r' :- :: -rii manera de asegurar que las pequeas diferencias provocadas por
". r'* -- :
.
c:et* r
;r,:
{:-ul:
Ex!)-
: -: ':-_C
el c,UpJi\ir.
:- i--- -.,. rr'. 't)\ it;ii'r!\
j:
'i5,,rJ.
, 1,,c
in,.lq .r,
.,lt
,,. c
I Pfcson di.\'as, no
r ;J.]lpo 1, todos los factores no controlados, se repartan de manera homo'l;. :- . :,-,s 1os tratamientos. Por ejemplo, una evidencia de incumplimiento o
.-t ,-,_I.tll'j.
-:
:ste principio se manifiesta cuando el resultado obtenido en una prueba -,-,::nciado por la prueba inmediata anterior.
ffi
1!:.i,1
s nico rna sola o fenlsos que Por ello ecin en n en los :rimentarlover un una 'igue ultados Y
ms
nwrd[csrt Es coner ms de una vez un tratamiento o una combinacin de factores. I :*'- '.. .. -, .-onfundir este principio con medir varias veces e1 mismo resultado expe-
i: *-*
lrl,',
r.:. i'.
t'
!l!_
-.-,-, - lnr)\llPr';.r1F
! =::tr
.::-do ei mismo tratamiento, sino cuando corresponda de acuerdo con la alea. i repeticiones permiten distinguir mejor qu parle de 1a variabilidad total -,r *-, - . .; debe al eror aleatorio y cul a los factores. Cuando no se hacen repeti' : - .r:'" rrsflera de estimar la variabilidad natural o el enor aleatorio, y esto difi-
- :..-ruccin
refi-
bles. Por
repetibiliecia con
iso las me-
Mlrryceo. J,:,nsiste en nulificar o tomar en cuenta, en forma adecuada, todos los fac- i,3ir.,,r;,,:,::, : - -: :*dan afectar la respuesta observada. Al bloquear, se supone que el sub- l*;,'r'riif: . r - -'. :: Jatos que se obtengan dentro de cada bloque (nivel particular del factor ...'" " -:-- . lebe resultar ms homogneo que el conjunto total de datos. Por ejem- ,.rr . =. ,: ---.,erert comparar cuatro mquinas, es importante tomar en cuenta ai opel ,.,- - ,: '. :rrquinas. en especial si se cree que la habilidad y los conocimientos de1 r r -, : : *ien influir en el resultado. IJna posible estrategia de bloqueo del facr,:--:r-:. sera que un mismo operador rcalizata todas las pruebas del experir- :: - :. posible estrategia de bloqueo sera experimentar con cuatro operadores , -r,.: :.-.J-,*s). donde cada uno de ellos prueba en orden aleatorio las cuatro m,,. --' .,. ,'si- segundo caso, la comparacin de las mquinas quizs es ms real. .* :.-'j,-,r es un bloque porque se espera que las mediciones del mrsmo ope-
de varios operadores.
l4
CAPiTI",LS
Los principios bsicos se entendern mejor en la medida en que se estudien los ejemplos de los captulos siguientes. En particular, en la seccin "Poblaciones pareadas" del captulo 2, se presentan los experimentos ms simples donde la aplicacin
de estos principios es evidente.
C$mmftemsfinn
y $**ce*m de
ss dseffims *xp*trfiffiem*mHes
Existen muchos diseos experimentales para estudiar la gran diversidad de problemas o situaciones que ocurren en la prctica. Esta cantidad de diseos hace necesario saber cmo elegir el ms adecuado para una situacin dada y, por ende, es preciso conocer cmo es que se clasifican los diseos de acuerdo con su objetivo y
su alcance.
Los cinco aspectos que ms influyen en la seleccin de un diseo experimental, en el sentido de que cuando cambian por 1o general nos llevan a cambtar de diseo, son:
1. El objetivo del experimento. 2. El nmero de factores a estudiar. 3. El nmero de niveles que se prueban en cada factor.
4. Los efectos que interesa investigar (relacin factores-respuesta). 5. El costo dei experimento, tiempo y precisin deseada.
Estos cinco puntos no son independientes entre s, pero es importante sealarlos de manera separada, ya que al cambiar cualquiera de ellos generalmente cambia el diseo experimental a utilizar (vase captulo 10). Con base en algunos de estos cinco puntos es posible clasificar los diseos como lo hacemos a continuacin, El objetivo del experimento se utiliza como un criterio general de clasllicacin de los diseos experimentales, mientras que los otros cuatro puntos son tiles para subclasificarlos. En este sentido, de acuerdo con su objetivo y sin pretender ser exhaustivos, los diseos se pueden clasificar como:
para estudiar el efecto de varios factores sobre la(s ) respuesta(s). para determinar el punto ptimo de operacin del proceso. para la optimizacin de una mezcla.
En la figura 1.5 se muestra la clasificacin general de los diseos experimentales de acuerdo con su objetivo. Dentro de cada rama se pueden clasihcar de acuerdo al nmero de factores, al tipo de efectos que se pretende estudiar y segn las restricciones existentes. En la misma figura se listan los diseos particulares ms representativos de cada rama. Ntese que los diseos factoriales completos y fraccionados ocupan ms de un lugar en la figura 1.5; la razn es que estos diseos son eficaces en diversas situacio-
Preguntas y ejercicrcs
t5
l.
Diseo completamente al azar Diseo de bloques completos al azar Diseo de cuadros latino y grecolatino Diseos factoriales 2k Diseos factoriales 3k Diseos factoriales fraccionados Diseos para el modelo
2k
-p
p
de primer orden
{
I
I uiseno I
4. Diseos robustos
j
I J
nes prcticas. De hecho, varios de los otros diseos que se mencionan en esta figura son casos particulares o generalizaciones de los diseos factoriales. En los siguientes
1.
Explique las ventajas que tiene el diseo de experimentos sobre una estrategia de prueba y error. ZQu es un experimento y qu es disear un experimento? En el contexto de un diseo de experimentos, iqu es una variable de respuesta?, iqu
2.
3.
es un factor estudiado? y zqu relacin se esperara que haya entre la variable y los
factores?
tEn un experimento slo es posible estudiar los factores que actualmente se controlan en la operacin normal del proceso? iEs posible estudiar cmo influye un factor sobre la varable de respuesta, si el factor se mantiene fijo en todas las corridas o pruebas experimentales? Explique.
Se tiene un experimento en el que los factores a estudiar y sus niveles son los siguientes: temperatura (10, 20 y 30"C); tiempo (60 y 90 minutos). Elabore una lista de todos los posibles tratamientos de este diseo.
a1o L-
7. 8.
rfl-
un io-
r
t6
CAPTULO
10.
cPor qu se considera la planeacin del experimento como la etapa ms importante? Describa cinco actividades que se realizan en esta etapa. Describa de manera breve los tres principios bsicos del diseo de experimentos. Explique la diferencia entre significancia prctica y significancia estadstica. Proponga un
I t.
12.
Suponga que se quiere estudiar el desempeo de un automvil, y lo que se desea es encontrar los factores que ms influyen en su rendimiento. iCules podran ser las variables de respuesta?, icules los factores a estudiar?, Zcules los factores no controlables o de ruido?
16.
quiere comparar el desgaste de dos marcas de llantas A y B, para lo cual se eligen al azar I 0 conductores particulares de cierta ciudad. A cinco de ellos, seleccionado s al azar, se les instalan gratis las llantas marca A y a los cinco restantes la marca B, con el compromiso por escrito de permitir la verificacin del desgaste cada seis meses. o) ZCree que este experimento permita una comparacin justa del ciesgaste de las dos
Se
marcas de llantas?
b) c)
17.
Una compaa farmacutica realiz un experimento para comprobar los tiempos promedio (en das), que son necesarios para que una persona se recupere de los efectos y las complicaciones que siguen a un resfriado comn. En este experimento se compararon a personas que tomaron distintas dosis diarias de vitamina C. Para hacer el experimento se contact a un nmero determinado de personas, que en cuanto les daba el
resfriado empezaban a recibir algn tipo de dosis. Si la edad de las personas es una posible fuente de variabilidad, explique con detalle cmo aplicara la idea de bloqueo para controlar tal fuente de variabilidad.
t8. En el caso anterior, cqu podra pasar si no se controla la posible fuente de variacin
que es la edad? r9.
Un grupo de investigadores trabaja para industrializar la mermelada de tuna; para ello, realizan mermeladas considerando los siguientes factores: o) variedad de tuna: tres tipos, ) con cscara o sin cscara, c) completa o la pura pulpa. Por lo tanto, se tienen l2 posibles formas (tratamientos) de producir mermelada.
La pregunta central que se plantean es si influyen en el sabor los factores considerados, y quisieran encontrar cul es la mejor combinacin de mermelada (tratamien-
ffmffig*s
re
ffi$mm*m*s
msad{sgsm
** Kefuffim*a
: ffiKp*rmmse*m E
##s? asrkffi y
f"r, e
,
d*s ffimKmm*sltcs
l
Hiptesis para dos medias: comparacin de dos tratamientos Prueba para la igualdad de varianzas
3t.lgt3ffi3T#
,
...'
Poblacin y muestra, parmetros y Distribuciones de probabilidad e
estadsticos
intervalo Conceptos bsicos de prueba de hiptesis .rii: Planteamiento de una hiptesis estadsticu
,r,::. Estimacin puntuai y por
inferencia
:l::
:rr
de
equivalentes
ffihj mv*E d*
ffi ffi ffi ffi ffi
ffiptr*Kadxmj
Describir las pruebas para la media y la varianza, as como los conceptos bsicos de prueba de hiptesis" ldentificar las pruebas para la igualdad de varianzas. Distinguir las pruebas para comparar medias con muestras independientes y muestras pareadas.
Mapa conceptual
r
20
fiAPfTeJg"#
{o*eepteis e*ave
"
ffimb$me*xa
Kffi
e$*stre, pev*??etrss
'
ll
. Estadstico
y *$*ed$s*cms
Una poblacin o universo es una coleccin o totalidad de posibles indirr::,is. especmenes, objetos o medidas de inters sobre los que se hace un estudiu- as poblaciones pueden ser finitas o infinitas. Siesfinita y pequea se pueden rni;- todos los individuos para tener un conocimiento "exacto" de las caractersticas : -;rmetros) de esa poblacin. Por ejemplo, un parmetro que podra ser de int;::. es la proporcin p de productos defectuosos, o la media, 2, de alguna variable ::-:dida a los productos. Si la poblacin es infinita o grande es imposible e incosteab,; medir a todos los individuos, en este caso se tendr que sacar una muesra repre ,.-.:ativa de dicha poblacin, y con base en las caractersticas medidas en la mues';: esto-
. Estadstico de prueba
" Estimador puntual 'Crados de libertad ' Hiptesis estadstica " lnferencia estadstica 'lnterualo de confianza . Muestras pareadas
ffi
P*futn{ic}m t$ltn Es aquella en la que se pueden medir"todos ics individuos para iener un cor'ucin ientn exfo de sus cracletsticas.
dsticos) se podrn hacer afirmaciones acerca de los parmetros de la p.,:ircin (figura 2.1). Con frecuencia, las poblaciones de inters son los materiales, los pr:drctos
terminados, partes o componentes, o algunos de los procesos. En muchos ca-'.-'s estas poblaciones se pueden suponer infinitas o grandes. Por ejemplo, en emprs>s con produccin en masa no siempre es posible medir cadapieza de material qu: iiega o las propiedades de cada producto terminado. Incluso, si la produccin no es :iasiva, conviene imaginar al proceso como una poblacin infinita o muy grande. ibido a
que el flujo del proceso no se detiene, es decir, no existe el ltimo artculo prucido mientras la empresa siga operando. En estos casos los procesos (poblaciones I se estudian mediante muestras de artculos extradas en algn punto del proceso
ffi.
Flar*$Tetr$s
CarcLeristicE que, mediante su r;alor nr-lrnrico, describen a .l^ Clirir:{rrl;(1r - a,"ljul'C -, ^;.,-+- CF ^1,,.-.,^r.. O
r-itiidltoc.
re r:
c
?
:be.:i** rf*r*it*
.::cila
e
:-
s 3rrijs y cs impcsibie e
do, el muestreo sistemtico y por conglomerados; cada uno de ellos logra rnuestras representativas en funcin de los objetivos del estudio y de ciertas circunstancias y caractersticas particulares de la poblacin (vase Gutirrez Pulido, 200,5 r.
t r
f
cE_ ffi
ldiestra rcpresentativa
Ls una pafe <1e L:na pcblacin, .eiecc ion, l o,ler'..rdmen;e,
ffi
i
-:
-J
-----,
b:e<is en la infomcin
-I ll -' i Ua ei :, l,, !;
ltlcitl.l.-
---!
acerca de la poblacin o proceso con base en la informacin contenida en una muestra. Estas afirmaciones tienen por objetivo coadyuvar en la toma de decisiones. La inferencia estadstica por lo general se divide en estimctcin y prueba de hiptesis. \ se apoya en cantidades o datos estadsticos calculados a parlir de las observaciones en la muestra. Un estadstico se define como cualquier funcin de los datos muestrales que no contiene parmetros desconocidos. Un ejemplo de estadstico es la media muestral i con la cual se tratan de hacer afirmaciones sobre ia media.,u, que es un parmetro poblacional. Un aspecto clave en la interpretacin y utilizacin de cualquier estadstico es que se trata de una variable aleatoria, ya que su valor depende de los elementos que
li
L It
l!
Poblacin (toda la produccin del mes)
t:? o:?
PARAMETROS
(siempre desconocidos)
ESTADSTICOS
(conocidos)
lnferencia
Figura2.lRelacinentrepoblacinymuestra,parmetrosyestadsticos.
una muestra a otra. La forma son seleccionados en la muestra y, por lo tanto, vara de de probabilidad de cada de tonnar en cuenta este hecho es conocer la distribucin de probabilidad estadstico. Como se ver ms adelante, al conocer la distribucin del parmetro el valor es del estadstico se podrn hacer estimaciones acerca de cul hiptesis o conpoblacional, y tambin ser posible probar o verificar la validez de puede proveedor un jeturas que se tengan sobre la poblacin o proceso. Por ejemplo,
.trn:
Cesct,no-ldos.
afirmnqueelporcentajedesuproductoquenocumpleconespecificacioneses
se puede tomar como verdadera'
muestra, si esta afirmacin de 0.7Vo,por lo que interesara investigar, con base en una
de
ctn
la Probabilidad
poblacionales. zaf supuestos (prueba de hiptesis), o bien, hacer estimaciones de confianza Las distribuciones de probabilidad que ms se usan en intervalos ji-cuadrada yF' y pruebas de hiptesis son las distribucion es'. normal, T de student, En la figura 2.2 se representan las formas tpicas de estas cuatro distribuciones' parmetros, que son La distribucin nornral est completamente definida por sus figura 2'2 se muestra la la media, lt, y ladesviacin estndar' d' Por ejemplo' en la
22
CAPTUIO
tI
bertd ryp,ren las di*ihrcres : *s.shrtr
Grados de
Son panfur:ex
ya"/se
los
ryTEr aprtr&
trdcr
=r:-ncs
-te**:s i'.d-
distribucin normal conlr - 0 y o = 1 , que se simboliza con N(0, 1) y se conoce como la distribucin normal estndar. En la figura 2.2 tambin se observa que, tanto la distribucin normal estndar como la f de Student son simtricas y centradas en cero, mientras que las distribuciom ji-cradrada 1- F son sesgadas y slo toman valores positivos. Las cuatro distribucir'rrs snn rehimadas entre s ya que las distribuciones Z de Student, ii-cuadrada I f sc dFfiE cu rrnirm de la distribucin normal estindar. Los parmeffos que p oodo b disribrciffi r & Snrdenr ji-cuadrada y F, reciben el & gt4- W.que tiemr e|trc rs con los t:maos muestrales invo& brfte k cj..!o,' i s ri* ..Fstr de rm*ro 20- se de infers una esrri[nciin f & Studer m 19 gr.d6 & bertad para hacer inferencia sobre la media poblacimal; o rrq ji-cuadrada m 19 gradm de libertad para hacer inferencias sobre la varianza poblacional. La distribucin Zde Student tiende a la distribucin normal est.ndar cuando el tamao de muestra crece, y prcticamente es la misma distribucin pma n > 45. La diferencia bsica entre las dos distribuciones es que la T de Student es ms ancha (respecto del eje horizontal) en las colas (vase figura 2.2).Ladistribucin normal estndar es una curva nica, por ello existen tablas que proporcionan cualquier irea o probabilidad de inters bajo esta curva. No pasa lo mismo con las otras distribucio-
Normal estndar
o.40
de Student 5 g.l.
030
o.20 0.20 0.1o
o.l0
Ji-cuadrada, 10 g.l.
4 (s, t0)
IT
I COmO
;tndar
buciostribuadrada os que
ben el
; invo-
nes a las que hemos hecho referencia, ya que pata cada tamao muestral es una cun"a diferente. Por eso, las tablas de estas distribuciones slo reportan los valores que separan las reas de mayor uso en inferencia estadstica (ver apndice 2)' En la acrualidad es mejor utilizar un paquete estadstico para encontrar cualquier tea o percentil que se quiera de cada distribucin. Como se muestra ms adelante, las distribuciones normal y Zde Student sirven ji-cuadrada ser para hacer inferencias sobre las medias; mientras que la distribucin Je utilidad para hacer inferencias sobre varianzas y la distribucin F se emplear para comparar varianzas. Es por esto que la distribucin F es la de mayor relevancia que se observ en en diseo de experimentos, dado que el anlisis de la variabiiidad
rn experimento
Uso de f;xee$
>: puede utilizar la hoja de clculo de Excel (o algo equivalente) para calcular las :rotabilidades con la distribucin normal. Para ello se utiliza la siguiente funcin:
D
La
ancha
rormal
rea
de sv
-e
stndar, acum)
bucio-
en la celda x se da el valor de referenciapafa el clcuio de probabilidades PrX < x)), en mecla se da el valor de la media, t, dela distribucin normal con la ,que se quiere obtener probabilidades, y en clesv-estndar se declara el valor de la desviacin estndar, O, de la distribucin normal. Por ltimo, ocum es un valor igico que determina la forma de la funcin, si el argumento acum eIVERDADERO ise da un 1), la funci n DISTR.NORM devuelve la funcin de distribucin acumuladensidad de probatJa (P(X < x)); si es FALSO (se da un 0), devuelve la funcin de
::rde
Es*Emasfr&s* paxmtwm$
4
y p#tr m*srvm8*
Las distribuciones de probabilidad que tienen una variable que representa cierta caracterstica de una poblacin se definen completamente cuando se conocen sus parmetros, pero cuando stos no Se conocen, ser necesario estimarlos con base en los datos muestrales para hacer inferencias sobre la poblacin. Por ejemplo, los parmetros de una distribucin normal son la media, P, y la desviacin estndar, O, que en caso de desconocerse ser necesario estimarlos a partir de los datos en la muestra.
Hstir:'laei*n pu*"ltu:a}
6
valor numrico metro desconocido; por ejemplo, tres parmetros sobre los que con frecuencia desea hacer inferencia son:
IJn estimador pwntual de un parmetro desconocido es un estadstico que genera un simple, que se utll\za para hacer una estimacin del valor del parse
Esti'adq Puntual
:.:::
41
::
qu:
eStima un valOi
esle:i,co de un Par'metro
724
tiiF"f, tj
L*
f; { s
' L; :.:.1:" :-'jji:rl i =.t. ' La l'ane r'i-s::J l = 51. . La propr,rrcir i :::::i,:rsLls en Ia muestra, f = xln, donde x es el nmero de artculos deler;.:. :- *l:::l-lsstra de tamao t?. ::::::ii' de loi discos producidos por un j: ': = I l5 tscOS. r' Se obtiene qUe prOCeSO, durante Una Semana Se torna una i:i:s:: lamedia muestral esi= 1.179. Este ralcr:*:-: -::l:= -t'l-rJ ull& estimacin punPor ejemplo, para estimar ei *=l,::
fial
de
Colocar un gofro (sm6olo ^) sobre un parrnerrL-r .s ;lne manera general de denotar un estimador puntual del correspondiente parmerrc,. pue>to que los estimadores no son nicos. Por ejemplo, la estimacin de
media. ri. podna hacerse con el uso de la media muestral X, la medianaX, olamoda, dado que las res son diferentes medidas de la tendencia central de unos datos'
1a
cular la desviacin estndar o error estndar del estadstico, visto como una variable aleatoria. Por ejemplo, consideremos la desviacin estndar S y la media de un^ muestra de tamao n. Puesto que X es una variable aleatoria, sta tiene su propia desviacin o effor estndar, que se puede estimar mediante 6 x = S l^,17 . Una forma operativa de saber qu tan precisa es la estimacin consiste en calcular tn intervalo de confianza que indique un rango "donde puede estar e1 parmetro"
con cierto nivel de seguridad o confianza. Construir un inten-aio al 100(1 - a)Va de confianza para un parmetro desconocido 0, consiste en estimar dos nmeros (estadsticos) L y U, de manera que la probabilidad de que 0 se encuentre entre ellos
sea 1 -
a,
es decir,
P\L=0=US=l-u
donde
(2.r)
U forman el intervalo de confianza buscado [L, U].Laconecfa interpretacin de un intervalo de confianza es como sigue: si se obtuvieran 100 muestras inde-
Ly
siimeein puntual y por intervalo pendientes de la" misma poblacin o proceso, cada una de tamao n y para cada muestra se calcular el intervalo de confianza a95Va para el mismo parmetro, entonces se espera que 95 de los 100 intervalos contengan el verdadero valor de dicho parmetro. En la prctica se obtiene slo un intervalo y se dice que el intervalo [], L/] tiene una conftanza de 100(1 - a)Va; esto tiene una interpretacin constante, en el sentido de que el parmetro estar en el intervalo 100(1 - a)Vo de las veces que apliquemos el procedimiento.
25
ffi
lntervalc
ele eodianea Rangc donde se estima que est el valor de un parmetrct
La longitud del intervalo de confianza es una medida de la precisin de la estimacin. De aqu que es deseable que la longitud de los intervalos sea pequea y con alto nivel de confianza. El ancho de los intervalos es mayor a medida que sea mayor lavaianzade la poblacin y el nivel de confianza exigido. El ancho del intervalo es menor si se incrementa el tamao de la muestra.
iroblacional.
P(L<l'I=L)=l-&
X,una muestra aleatoria de tamao n de una poblacin, con una distribucin normal con mediaz y varianzad, ambas desconocidas. El procedimienSea X1, X2,
..
.,
lo
,a-
to general para deducir el intervalo consiste en partir de un estadstico que involucra al parmetro de inters y que tiene una distribucin conocida, Tal estadstico es
x-t,
el cual sigue una distribucin Z de Student con n - 1 grados de libertad. Por lo tanto, en la tabla de esta distribucin o en su grfica se pueden ubicar dos valores crticos
totzy
:r
tiler
n
rUa
/o72,
tales que:
:al-
ble
na
rpia
i-u
lcu-
[ro"
zlTo
efos
:llos
"(o
Eneste sentido,
-,,,,1,
< t <
x*,",
;|)
l-a
t2.2t
L=X-t",rl,
IJ
=X+t",.)t
t2.1)
retainde-
definen un intervalo al 100( 1 - a)Va para la media desconocida P . En la tabla de la distribucin Z de Student se observa que para una muestra mayol o igual a 30, el intervalo al 100(1 - a)Vo para la mediapl es aproximadamente XtZ. o sea, la media ms menos 2 veces su effor estndar.
7
26
CAPT[JtCI
Elemplo ?"I
En un proceso de inyeccin de plstico una caracterstica de calidad del producto (disco) es su grosor, el cual debe ser de 1.20 mm con una tolerancia de +0.10 mm. As, el grosor del disco debe estar dentro de la especificacin inferior, EI = 1.10, y la superior. ES = 1.30. para considerar que el proceso de inyeccin fue satisfactorio. Para evaluar esta caracterstica de calidad. durante una semana se hace un muestreo sistemtico en una lnea de produccin. 1' se obtienen 25 muestras de tamao 5 cada una. Por lo tanto, al final se tiene una muestra de il = 125 -v" se obtiene la media muestral, X = 7.779 mm y lavattanza, Sr = 0.00071. por lo que ia estimacin del error
estndar de la media es
Ji
*0'0266 =o.oo24
1
1.18
Cuando > -15. la distnbucin f de Student es prcticamente igual a la distribucin norrnal estndar. por lo tanio. de la tabla de la distribucin normal se obtiene que I,: 3i..:= i.96 paraG = 0.0,5. De aqu que el inten'alo al 100(1 -a)Vc de confianza para la mediap del grosor de los discos est dado por
tto,,ft=t.ror 1 e6(T#)=
t.trn r
0.00466
Se puede afirmar entonces que con una confianza de 95Va,la media z de grosor de los discos se encuentra en el intervalo [I.I74,1.184]. En el clculo anterior al valor de 0.00466 se le conoce como effor de estimacin, porque hasta en 0.00466 puede
onaT pt.
Tamao de la muestra, En ocasiones es necesario calcular el tamao de muestra r para lograr que la estimacin de una media poblacional lr tenga como error mximo a un nmero E. En este caso, como el error de estimacin est dado por E t(n/2. n \Sl\/ n , entonces despejando n obtenemos que
tt
t,2otz. u-lrS2
-
E'
Ccm.. ,- : r : - depende de r r' sta es la inc-enita, entonces para propsitos prcticos v con temarios d muestra ma\'ores que .'30. el I'alor de l,p.,,_,, puede tomarse como l. De esta manere,
tt =-
'E)
.1S_
$ es un estimador de la varianza. Por ejemplo, si en el caso del grosor medio de los discos se quisiera un effor mximo de 0.004 = E, entonces se requiere,
donde 4(0.00071) n=-4=1.77.5 (0.004)'
= l7B.
27
- l)S2 1r-t
(n
)
l)S'z
t
(2.3)
Xn,z.
Xt-qn,,.
donde Xto,r,,-, Y X?-otz,,-t son puntos crticos de la distribucin ji-cuadrada con n - 1 grados de libertad y se leen en la tabla de esta distribucin para el valor de a dado. Es decir, P(X> X|,r,,_r)=a12.
*$empm 2.?
En el proceso de fabricacin de discos para computadoras, una de las variables crticas es el rendimiento de formato. Se toma una muestra aleatoria de n = 10 discos de la produccin del turno de la maana. Se formatean y se reporta el rendimiento decada disco. Los datos obtenidos son: 96.II,91.06,93.38,88.52, 89.5i,92.63,
85.20,9I.41,89.79,92.62. Con base en estos datos interesa estimar puntualmente y por intervalo la media y la desviacin estndar para la poblacin de discos de dicho
turno.
X:-'=t
est dado por
)x, '
10
=91.03
S=
= 2.99
la
media
l* -,.,, rt,x
*,
",,
+f=
r.o, *
[n
r88.8e,
e3.ri]
donde el valor del punto crtico ta/z= t0.025 = 2.26 se lee en las tablas para la distribuci6nT de Student con 9 grados de libertad que se localiza en el apndice. Con una confianza de 95Va se espera que el rendimiento promedio de los discos producidos durante ese turno est entre 88.89 y 93.17. El correspondiente intervalo para 1a deso2 dado en la relacin
viacin estndar o se obtiene sacando la raiz cuadrada al intervalo paralavarianza (2.3).As, el intervalo parao est clado por
l-r)Y
llE;
(e)(2.er'z
19.02
,9),zeet'
l 2.70 |
'
s.461
28
CAPTEJLS
donde los valores crticos X'o,r, ,-, = X3.orr.g = 19.02 y X?_",r, ,_, = X\.n r,n = 270 se obtienen de la tabla de la distribucin ji-cuadrada, que est en el apndice, o tambin se pueden consultar usando un software. As, con una confianza de 957o se espera que la desviacin estndar del rendimiento de los discos producidos durante ese turno est entre 2.05 y 5.46. Cuando no se est satisfecho con la amplirud del rnten'a1o. entonces ser necesario incrementa 1a precisin de 1a e:tirnacin. esto se hace aumentando el tamao de nues-'::.
ten'alo de conhanzapara la proporcin poblacional p, apoyndose en la aproximacin de la distribucin binomial por la normal. En estas condiciones se puede afirmar que la proporcin muestralp sigue una distribucin normal con mediap y varianza
*?
Zo,,
P<
p<f*,o,,
_s x-to,r
(n'-i)S'
\ln
-,s X+to,, 1n
l),.
,,,
? + to,,
h{l n
t)
(X,
-i;,;rU*ln,_rs
Ft
Fz
tlt i-+Vq n2
nr-2
si
o Sl'"rt' ' I nt-1
-:1)5?+(n,-1)S1
nr*
o;
d:1,
sl
5t 't-alz.
n,
{i,- b)-
2."',
, b,Q- b,)
29
Eiemplo 2.5
Se quiere estimar la proporcin p de artculos defectuosos en un lote de 2 000 (poblacin). Para ello, se toma una muestra aleatoria de n = 100 artculos y se encuentra que de stos, x = 5, son defectuosos. Por lo tanto, un estimador puntual de p es fi = 5/100 = 0.050. Si se quiere estimarp por intervalo, entonces de acuerdo con 1o explicado antes, un intervalo al95Vo de confianza est dado por
0.050
1.96
0.0s(1- o.o5)
100
= 0.050
0.043
centuales entre 0.77a y 9.3Vo. En el clculo anterior, al valor de 0.043 se le conoce como error de estimacii'?, porque hasta en ese valor puede diferir fi de p.
Tamao de muestra. Si se quiere estimar el tamao de la muestra n, qlJe es necesario para estimarp con un error mximo de E,entonces dado que E = Zo,rrffi1* pln;
si despejamos de aqu a n obtenemos que
f es una estimacin del valor de p. Por ejemplo, si en el problema anterior se quisiera un effor mximo de E = 0.03, con una confi.anzade957o, entonces se requiere que n = (I.96)2 (0.05X1 - 0.05)/(0.03)2 = 203. En ocasiones, cuando no se sabe nada de p en la frmula anterior, se supone f = 0.J.
donde
incluyen las frmulas correspondientes para intervalos de confianza que involucran a dos parmetros, como son: diferencias de medias, diferencias de proporciones y cocientes de varianzas. Estos intervalos proveen informacin sobre la igualdad estadstica de los parmetros conespondientes a las dos poblaciones de inters. Note que los clculos involucran a los estimadores puntuales obtenidos con cada muestra. En
latabla, lanotacin z1-s12,t;2,X?-",r,n-ry Fr-otr,n2-r,nr-t)serefiereapuntoscrticos de la correspondiente distribucin. Estos valores se determinan fcilmente con el uso de un software estadstico o de las tablas dadas en el apndice.
' -
Los tres proveedores del material;r tienen el mismo nivel de calidad. El porcentaje de este ingrediente afecta el resultado de la mezcla.
s4'r
- LU
. '
El tiempo de espera d esi operacicn 3s l::;' .-.:-' :- -- redio. Si aumentamos la cantidad de reaclirtr r '-::---,' -- :-.:-=:-*.
se describen 1os conceptos
bsi;':.:-::--:::: hiptesis, es decir, los pasos fundamentales de cualquier procedtn:.;:-:- l: :r*::i de hiptesis, como son: planteamiento de la hiptesis, estadstico d :*;:'-, ::-i;it-' de rechazo.
A continuacin
s estadstica es una afirmacin sobre 1os \;"lL-:-! :: i,:'. parmetros de r" :..11*:in o proceso, que es Susceptible de probarse :iail i: 1a inlormacin -,:..-:-:-1 -n una muestra rep-resentativa que es obtenida,le 1: :,-:,:'-in. Por ejem,i1,-r'-s
,',:::"cin "este proceso produce menos de 8'r de ::i:-:,:'ios se puede p de artculos =.:::sticamente, en trminos de la proporcin c.;'1,--;ida
>
1-r
t,-lS
(2.4)
es menor a 0.081
H,,,:
p < 0.08
,
-
: ',-, j.-ri-r
--;:,:: re piantea como una igualdad, 1o cual facilita el fener una distribu. "1 -ri lrl -::,-:d de referencia especfica. En general, la estrategia a seguir para :i- --,-:"- :;sls e s suponer que la hiptesis nula es verdadera, y que en caso de ,-.1: .: r: - :or la evidencia que aportan los datos, se estar aceptando la hiptesis
: -
: :- -' . .r.. en el caso de las proporciones, la afirmacin que se desea probar se r.-: r.:r, : :-: ;ierta. slo en caso de rechazat la hiptesis nula. - ":
-r,
r-::r--,r,S ahora que la afirmacin a probar es "este proceso produce 8 '4o de rl:en'e que la afirmacin seala que su falsedad se da, tanto si se
ser:
(2"s)
H. it
'.
. :;: se desea concluir es la hiptesis nula. Ntese la diferencia entre .-,.-,ir as en las expresiones (.2.4) y (2.5). En (2.4) HA se conoce como ,'i.;:;i:,, -- "..' '-; -;. "'. de rn solo lcLdo (unilateral), ya que la nica manera de rechazar H es :::,.::.r- '. - ,r'le: de 1a proporcin muestralp significativamente ms pequeos que [] i-lS. -{.:r:-:::r,r. en tl.5)11, se llama lptesis alternativa de dos lados (bilaterct[1. -t'e que ," ',;i;nia en contra de 110 se obtiene con valores pequeos o grandes
::-
de la propor;r.in nustral p. As. la eleccin de 1a hiptesis alternativa en cuanto a si debe ser unilateral o bilateral depende de la afimacin que se quiera probar.
I
5l
Otro aspecto importante es la seleccin del valor del parmetro que especifica la hiptesis nula, esto es, por qu 0.08 en las hiptesis de las expresiones (.2.$ y (2.5)? Este valor se elige de manera que separe dos situaciones que ilevan a tomar diferentes acciones. Por ejemplo, en la hiptesis dada en (2.,1) se eligi 0.08. porque sta es la proporcin de defectuosos reportada el mes anterior. despus de implementff un programa de rnejora se quiere r,er si dio el resultado esperado. En caso de no rechazar 10 se concluira que el programa no funcion y que se deben tomar medidas adicionales para bajar la proporcin de defectuosos.
{.
.- ":;"1
j:1ll
.
," "Y:
_J{i''' '.
Estmdistie*
d* prueba
,\.'
-:
ta'
Probar una hiptesis consiste en investigar si 1o afirmado por la hiptesis nula es verdad o no. La estrategia de prueba parte del supuesto de que 116 es verdadera, y si ios resultados de la investigacin contradicen en forma suficiente dicho supuesto. entonces se rechaza I1o y se acepta la hiptesis alternativa. En caso de que los resultados de la investigacin no demuestren claramente la falsedad de Ho, sta no se rechaza. Es decir, la hiptesis nula es verdadera mientras no se demuestre lo
i.'
,.'ir
"l'r:
.i;,. '.'L]'
a
e
contrario. Unavez planteada la hiptesis, se toma una muestra aleatoria de la poblacin de estudio o se obtienen datos mediante un experimento planeado de acuerdo con la hiptesis. El estadstico de prueba es un nmero calculado a partir de los datos r la hiptesis nula, cuya magnitud permite discernir si se rechaza o no la hiptesis nula f16. Al conjunto de posibles valores del estadstico de prueba que lievan a rechazar Hs, se le llama regin o intervalo de rechctzo para la prueba, y a los posibles valores donde no se rechaza H se les llama regin o intervalo de aceptacin. Por ejemplo, para las hiptesis planteadas en (2.4) y (2.5), el estadstico de prueba est dado por
ffi;
ffistadistiee de prueb;* i\nrero clcr,ilcl* r partir de lrcrltl,,r 11,',.r .\,, :a,rr1, tiul p*rmite cji-ccerrril gi se i*-
.1,,,, 16, d I L. ^
ffi:
ffi*gi$nr de reelau* l,: el ccnjurtc rle polibier v;:ioi-,--- i I ----:r,--i;'r;;irc,.i.r i(': rr.'] .'qi, ,lP\ ir', I ':...i.,..J ,.ltl:l1.'
b
E
_
'o
Jonde
_ -
Q.O
sir rl.rla.
tr
I
I
I
I
kr
f es la proporcin de defectuosos que se encontr en Llna muestra de n artculos inspeccionados. Si /1e es verdad, el estadstico e sigue aproximadamente la dis:nbucin normal estndar; la aproximacin es mejor mientras ms grande es el valor le 2. En general, se requiere np > I0 para una buena aproximacin; en este caso, con 'tp > 120 unidades inspeccionadas sera suficiente. Por ejemplo, supongamos que se toma una muestra de n = 150 piezas y de ellas t = 2A son defectuosas, entonces el valor de la proporcin es i = .rln = 0. 1 3. Vamos a ver si esto implica una diferencia suficiente pua rechazar que p = 0.08. Por io pronto, el valor estadstico es z0 = 2.41 .
Criteri* de reehexo
El estadstico de prueba, construido bajo e1 supuesto de que Hu es r-erdad. es una
variable aleatoria con distribucin conocida. Si efectivamente 110 es verdad, el valor dei estadstico de prueba debera caer dentro del rango de valores ms probables de su distribucin asociada, el cual se conoce como regin de aceptacin. Si cae en una de las colas de sri distribucin asociada, fuera del rango de valores ms probables (en
fe
P h'
t2
{AFiT{JL*
la regin de rechaTo), es evidencia en contra de que este valor pertenece a dicha distribucin (vase figura 2.3).De aqu se deduce que debe estar mal el supuesto bajo el cual se construy, es decir, 110 debe ser falsa.
Pruebas de una y dos colas (unilaterales y bilaterales). La ubicacin de la regin o inten'alo de rechazo depende de si la hiptesis es bilateral o unilateraL Como se .u'lo en el caso de las proporciones, una hiptesis es bilateral cuando la hiptesis 'llemlti'i'a f1..r e S de1 tipo "no es igual" (.1);y es unilateral cuando la alternativa es dei :r:',,- "'ll'" ari i-'ie r> ) o "menor que" (<). Cuando es bilateral, como en la expresid,r 1.5 . -. ::_:::: i; rechazo est repartida de manera equitativa entre ambas colas de la ;r-.:::-:- - ::, :-iisico de prueba. Pero si 1a hiptesis es unilateral, como en 1a erpre st,t: l.:. . ,. :-, ::i:.-ti el Jontra de 1a hiptesrs nuia se ubica en un solo lado de 1a disi':;r -:- :t: - =;. -. :=_.: - : ;= r:.-hazo slo se concentra en una de las colas. En le e::;.-::- l - -.::----: :- :-J:-.7,r s Joncentra en e1 lado izquierdo de la disuib:;,:: :t- :r:-::i:: - '-: - :',: I 5 -r :: llsura 1.3 ). P-"::::.:i -: --:. :-:!: !- ttc -t ::,::.,:;"in se caicula el estadstico de prueba :, :; -.::--;:--: l: -. rc -,::-t:":- J;; 3n l" l:r,,in de echazO O aCeptaCin. POf :'=:.:-: . =- -'. :-:.:'::S:;:-'-:=."i=- :-'L -'. SltF:i:fl-.3:,].-l'Se feehaZaHg Si g <-o: !. ,-; :-:':iii:s -s:.r C:s :.lr .-. rerJi,nes ,'.,i I se rechaza 11n si :s ( -oz O Si .- ) i;.1. ; srn:prenenre. si :. ):,:. En la gura 1.3 esto equivale a Que is caiga en
ea: sombreadas. de acuerdo con la haptesis de que se trate. Si queremos probar 1a hiptesis bilateral con una confianza de 95Vc. entonces rc.:= 1.96; adems, como p =A.n Y io = 2.4I, entonc.s Z0 > i.96; por lo tanto, se rechaza Ho : p = 0.08. De alguna forma, esto ya se intua, puesto que la proporcin muestral haba sido i = 0.13.
de
i;r.-s
;r :"igo
Si en lugar de tener x = 20 defectos, se tuvieran x = 15, entonces = 0.10. A1 sustituir esto en (2.6) con n = 150, se obtiene Que Z = 0.90 que no es mayor que Zat2 = 1.96. De aqu que no se rechace Hs: p = 0.08. Es decir, en este caso f = 0.10 no es evidencia suficiente contra 10 : p = 0.08.
t t
, /'
H. :p
(
-
w.Ja
C.CE
' r P r L.uo
ci
r.:r,,'aio -f
de rechazo)/
-(1
,,
/\\
.,i i-a /\
i\
,.
Regin
o intervalo
\-u
Regin o intervalo
de rechazo
.l-de
,
-Zal2
\-***
rechazo
ZalL
I
de aceptacin
LJ
lntervalo de
' aceptacin
::
5t
El riesgo de una decisin equliv*eada: errores tipa i y tlpo *-'rar una hiptesis estadstica es una decisin probabilstica, por 1o que existe el r, i itr de cometer un error tipo I o \n error tipo II . El primero ocuffe cuando se re::.:ai H cuando sta es verdadera, y el error tipo II es cuando se acepta 11 y sta es
$$
>
ilHrr*r tiBo
(-. ;l
Es cuando se
rec::::
s". En toda prueba de hiptesis cada tipo de error tiene una probabilidad de ocu::" Con ct y B se denotan las probabilidades de los errores tipo I y II, respectivamen-
ffi=
f;rror ipo
*E
= P {error tipo I } = probabilidad de rechazar I1e siendo verdadera ,J = P{enor tipo II} = probabilidad de aceptar 110 siendo falsa
c,:
rY.
qu* es falsa.
A 1 - P se le llama p otencia de la prueba, y es la probabilidad de rechazar Hs ::.ndo es falsa. A a lambin se le conoce como la significancia dada de la prueba
ffi
Fotercia de !a prarebe ls ,r lir-'hl",,lrlc jt :" i z':r H,, iu[iC es ils.
; s la probabilidad de la regin o intervalo de rechazo; su valor se especifica por :=e del investigador desde que planea el estudio. Por lo general se utilizan los va.
:'rs
a = 0.05
\I,ntras ms pequeo es el valor de a se requiere ms evidencia en los datos para :::hazar 11s. Por ejemplo, si la accin a tomar despus de rechazar 10 implica una .---. ersin fuerte de recursos, se recomienda utilizar a = 0.01 para tener mayor con:::za de que la decisin ser la adecuada. Si la decisin no implica una inversin :-:fe. es suficiente trabajar con c( = 0.05, que es el valor ms utilizado para este :,::So. Esto es. un valor ms pequeo que a no necesariamente ser mejor, ya que si poco riesgo (a < 0.01) se .^t truncando la posibilidad de muchos cam."; "dmite :.,'s que seran positivos para la empresa. Utilizara = 0.05 significa que por cada - ,,,t r-eces independientes que se aplica el procedimiento y se rechaza 110, se espera ,- -- en un promedio de 95 veces, tal decisin sea la correcta. Por lo general, en las pruebas de hiptesis se especifica el valor de a y se dise:-: ia prueba de tal forma que el valor de B sea pequeo. E,sto es, la probabilidad del . * ' r ripo 1 se controla directamente, mientras que la probabilidad de error tipo II se : -:irola de manera indirecta con el tamao de la muestra, ya que a ms datos B ser :-3nor. En otras palabras, con una muest^a grande es mayor \a potencia de la prue--;.: es decir, se incrementa la probabilidad de rechazar 110 si sta es falsa. En la prctica suele ser ms delicado cometer el enor tipo I que el enor tipo II, ::brdo a que en la mayora de las hiptesis el rechazar 110 implica objetar algo que :- acepta de manera convencional. No rechazar 110 implica, en muchos casos, seguir :Lrmo hasta ahora. Por lo anterior, es comn que se controle slo ei error tipo I. mren:ras que el error tipo II se deja libre como si su magnitud no importara. Lo cierto es que el error tipo II tambin importa;, la magnitud de su probabilidad debe ser pequea (se recomienda B = 0.10). El problema es que ccntroiar a B
Es posible afirmar que, en general, es deseable que una prueba estadstica sea potente. Sin eme1
bargo, cuando
prctico.
r
54
ABYUg"
tiene varios problemas; por ejemplo, muchas veces se requieren grandes tamaos muestrales o se deben reaTizar muchas repeticiones en el experimento. Por ello, en este libro no enfatizamos el control del error tipo II, pero damos 1as recomendaciones dei nmero de repeticiones que deben obtenerse en cada experimento para tener un valor pequeo de B.
no se conoce.
lo.
Ho:
lr
= &o
(2.7)
H: pt
to
Para probar esta hiptesis se toma una muestra aleatoria de tamao n de los posibles valores de la variable X y se calcula el estadstico de prueba:
"
X-u^ ,U
slJn
(2.8)
l.'nde 5 es la desviacin estndar de los datos. Bajo el supuesto de que I1o es verda-
:::. sre estadstico se distribuye Zde Studentconn- 1 grados de libertad. Se re;i..: H si el valor absoluto del estadstico de prueba es mayor que el valor crtico ; -. :r::nbucin. es deci se rechaza 10 si I tol ) ton.Recordemos que /.,,, es el p:r.:: .:,:-:'-' ,Je la distribucin zde Student, tal que P(t > t,lz) = al2) o sea, las reas 'n::-- ., ;*:-.': ; la derecha del punto ta/zy & la izquierda de -to2 son iguales a a/2 -.:-.: ll.-.r" l.-ll. Estos valores crticos se obtienen de la tabla de la distribucin Z de S:;el: i;da en e1 apndice. Lnt brere justificacin del criterio de rechazo para la prueba anterior es la siguiente. p.-r reora estadstica se sabe que bajo el supuesto de que Ho : fl - lo es r erdadera- el estadstico de prueba r se distribuye z de Student con n I - grados de Litrertad \-. en consecuencia. hav una probabilidad de 100(l - a)Vc de que el valor
55
-t
Regin
ar2 o
Regin
rchazo -aceptacin
de
'olz
de
____,
Regin de rechazo
e r caiga entre -to2y top.De aqu que, si la muestra produce un valor de /6 fuera de gsole lmites, entonces tal valor de /6 es evidencia de que F/s es falsa. Por el contrario, ri re cae entre -to12y tanes evidencia a favor de la veracidad de 110 ya que no existe inguna contradiccin. Obsrvese que la regin de rechazo dada por la unin de in-
:rralos (-cr , -totz) lJ (-ton oo) est determinada por la probabilidad a del error tipo I (vase figura2.4). En aquellas situaciones en que se desea rechazar Ho : l"t 6.la hiptesis alternativa es unilateral:
Ho: Lt = [to
(2.e)
Ht: &
lto
En este caso se rechaza Ilo si lo > to. Por otra parte, si 1o que interesa es rechazar Ht: l =,ls slo cuando & < l0, entonces ahora, la hiptesis unilateral se plantea de
la forma:
Ho:
lt
= &o
(2.10)
to
H: t 1
y
se rechaza
H, si to < -to.
Eiemplo 2.4
Peso de costales. Un fabricante de dulces compra costales de azicar a cierto ingenio. Segn los vendedores, los costales tienen un peso medio de 50.1 kg, con una varianza de (oz = 0.5). El comprador sospecha que el peso medio es menor. Para confi.rmar su sospecha decide contrastar las hiptesis:
Ho: l"t
50.1
(2.11)
50.1
[56
{epiTUL
con un nivel de significancia de 5 -r r c: = fl.{-l-i L Paa eilo, selecciona de manera alea_ toria tres bultos de cada uno de 1os sis:ienis citco pedidos. Pesa los 15 bultos y obtiene quex = 49.4y s2 = 1.2. De .riu rn.n.o.. :1 estadstico de prueba calculado de acuerdo con la expresin (2.8). est dad 1,r.
- r. h=- s
.,T'-i
I A1
1.1
De las tablas de la distribucin rde Sruie:r Jl : - I = 1-l _erados de libertad, para a = 0.05, se lee el valor crtico /00.. _. = j.-6. C,tr:o :. = -).1j <-1.76 = -/.s5, 14, Se rcchaza la hiptesis 16 (figura 2.5). Es deci. s re;haza la atlnnacin del vendedor de que los bultos tienen un peso medio de 50.1. r'adernis l: e.,-idencia seala que dicho peso es menor que el declarado.
Ho: oz = 0.5 Ho: o2 > 0.5 y de esta manera comprobar si esa diferencia es estadsticamente significativa. Esta hiptesis es un caso particular de la siguiente:
Hs: o2 = of;
Ho:d>of;
donde ofr es un valor conocido (0.5 en el ejemplo). para probar esta hiptesis y bajo el supuesto de distribucin normal, se utiliza el siguiente estadstico de prueba
t7
fde
Student
g.l.
,"/
con 14
La:-t'to
I
ir
ll
-4
A
I
-2.4 7
Regin rechazo
de
la varianza
'aZA le1
rue
hi-
y se acepta ta hipOtesls unilateral 11o (vase figura 2.5). Es por el vendedor para el peso de los costales es falsa y, en la vartanzareportada decir, realidad, la variabilidad del peso de los costales es mayor. Tanto el estadstico / de la hiptesis sobre la media, como el estadstico 1fr de la hiptesis sobre la varianza, cayeron en las respectivas regiones de rechazo, lo cual se representa en la figura 2.5. Si la hiptesis alternativa parala vaianza es bilateral, entonces se rcchaza Ho ti Xl > XZ," o si yl < X? - on.
23.68 = Xz"se rechaza 10
:sta
balo
decisin en trminos de rechazar o no a 1s. Sin embargo, algunos de estos mtodos proporcionan informacin adicional sobre la decisin que se est tomando, por lo que en algunas situaciones puede resultar ventajoso usar un criteno \ no otro.
n
ji7;es
:alnos
Estadstics de Brueba frente a var crtico :Este es el criterio que utilizamos en el ejemplo previo y es el que tradicionalmente se
empleaba antes de las facilidades que ahora provee la computacin; por ello, es el que se explica en muchos libros de texto. Este mtodo consiste en rechazar Hs si el estadstico de prueba cae en la regin de rechazo que est delimitada por el valor crtico. Debe tenerse cuidado de comparar los valores adecuados, dependiendo de la hrptesis alternativa de que se trata. Cuando los clculos se hacen de forma manual, este criterio es el nico que comnmente se usa. No obstante, este mtodo tradicional es el que da menos informacin adicional acerca de la decisin tomada.
:on 14
:ada se
_13.6
>
38
{AP$TUL$
K
Sigr:lficancia predefinida
| '. ,'l rr95g9 m,ixrrnn
error
La signfficancia predefinida que se denota con (t, es el riesgo mximo que el experimentador est dispuesto a correr por rechazar rgs indebidamente (error tipo I). Mientras que la signfficancia observada o calculada, tambin conocida como p-value o valor-p, es ei rea bajo la distribucin de referencia ms all de1 valor del estadstico de prueba. La erpresin "ms all del estadstico de prueba" significa, por ejemplo en 1a prueba rbllateral. el area bajo 1a curva fuera del intervalo l-to, to], es decir: '.':l.-,r-r = PT j,:,:J.e
<_i-t -P(T>+/o)
anterior se desprende que fl, se rechaza si la sleiri.'anric ctbsert'ado es merlor que la significancia dada, o se, si valor-p < c. Este criterio es mejor que e1 anterior porque la sigaihcancia obsen,ada se puede ver como la probabilidad o evidencia a favor de Hr. por lo tanto. representa una medida de la contundencia con la que se rechaza o no ia hiptesis nula. por ejemplo, si la significancia observada o valor-p es igual a 0.0001, entonces s1o hay una probabilidad a favor de I1e de 0.0001, por lo que se rechazara la hiptesis nula con un riesgo tipo I de 0.0001, que es menor del que se est dispuesto a admitir, tpicamen-
Jttrjbucln f de Student con r?- 1 grados de irL'enad. Si il prueba e s ,f : ,1 e :eha r lzquierda r. 1a si-enificancia obser'nll:tera vada es el rea bajo Ia cun'a,je 1a di>inl'uin a la derecha {izquierda) de rs. De lo
a = 0.05. En otras palabras, un valor-p = 0.0001 nos seala que el valor observado del estadstico de prueba prcticamente no tena ninguna posibilidad de ocurrir si la hiptesis nula fuera verdadera, 1o que lleva a concluir de manera contundente que la hiptesis nula debe rechazarse. En la figura 2.6 se muestra, utilizando una hiptesis bilateral, que cuando ocute
ne el evento ltol ato,rnecesariamente sucede que valor-p > d,y viceversa. En el caso representado en la f,rgura citada no se rechaza I1o con cualquiera de los dos criterios. La comparacin de 0 frente a /"r, consiste en contrastar simples nmeros,
mientras que comparar las significancias a frente avaTor-p es contrastar.probabilidades. de aqu que esto ltimo sea ms informativo.
-t"/2 -to
Reein
to to/2 , Resin
de
rechazo Figura
Resin de
ace"ptacin
'
de
rechazo
ct.
,ii':
!rf+n!*:xfr"s
59
trrit*svm!*
d* e*mfi*mza
En este mtodo se rechaza 16 si el valor del parmetro declarado en la hiptesi: nula se encuentra fuera del intervalo de conf,ranzapara el mismo parmetro. Cuando la hiptesis planteada es de tipo bilateral, se utiliza directamente el intervalo al 100 \7 - c: t't de confianza. Si lahiptesis es unilateral, se requiere el intervalo a1 100 (1 -)-c;t'c para que el rea bajo la curva, fuera de cada extremo del intervalo, sea igual a a. Por ejemplo, en el caso de la hiptesis unilateral sobre la media del peso de costales dada por la expresin (2.11) se debe construir e1 inter-valo al 100(l - (2 x A.A5DVa = 907c
de confianza para aplicar este criterio con una significancia 9AVo de confianza para la media,r est dado por:
a = 0.05. El intervalo
al
la1
iS.
a-
dm'd*w
*wmmw$esewru
lJn problema frecuente que se presenta es comparar la media de dos procesos o dos tratamientos. Por ejemplo, comparar dos proveedores, dos materiales. dos mquinas
o dos mtodos de trabajo.
Supongamos que interesa comparar dos tlatamientos )' que stos son dos mquinas A y B, que realizan la misma operacin. Para ello se obtendr una muestra aleatoria de observaciones de cada mquina. Supongamos que los datos a observar en la mquina A son Yor, Yor., ..., Y, y los datos de la mquina B son YBy, Ys2, ..., Yu,,. Estos futuros datos se podrn escribir como en latabla2.2: Para que la comparacin sea justa, la materia prima que utilizan las mquinas se asigna de forma aleatoria a las mquinas, y las 2n pruebas o conidas se hacen en orden aleatorio. No es adecuado realizar primero todas las pruebas de la mquina A
40
eApTUL*
l't:
Iat
Yn
Yen
+
X,*"
y posteriormente la: de ia rnqnina B. prorque eso puede favorecer a una de las mquinas y afecta isesgar la compara.-in. La asigaacin aleatoria del material hace posible que a cada mquina le corresponda material con una calidad equivalente, y el orden aleatorio de la: prueba-s nulifica el efecto de las fuentes de variabilidad que acran durante el transcurso de las mismas (como las variables ambientales), al re-
partir su efecto equitativamente en ambas mquinas. Ahora, veamos cmo hacer estadsticamente este tipo de bomparaciones. Suposicin de varianzas desconocidas. Sean dos procesos o tratamientos con medias 4" y ltyy varianzas o1y ol, respectivamente. Interesa investigar si las medias de dichos procesos pueden considerarse estadsticamente iguales. Para ello se plantean las siguientes hiptesis:
Ho:&r=
&y
(2.t2)
Ha: ,t, # .t,
que se pueden reescribir como
Ho: #, - /tr,
(2.13)
H^:
p,-
py + 0
Para probar r1o se toman dos muestras aleatorias, como en el ejemplo de las mquinas antes descritas, de tamao n, la del proceso X,y de tamao nrladelproceso f; en general, es recomendable que n, = ky = n, pero tambin puede trabajarse con n, n, si no pudieran tomarse iguales. Si cada proceso sigue una distribucin normal y son independientes entre ellos, el estadstico de prueba adecuado para probar la hiptesis de igualdad de medias est dado por,
'0
t=
X_Y
fr,
(2.14)
{il
el cual sigue una distribucin 7de Studenfconn,* fly- 2 grados de libertad, donde Sf es un estimador de la varianza muestral comn, suponiendo que dichas varianzas
desconocidas sean iguales, y se calcula como
(n"
5,, =
-1,)Sl+(nj -l)S)':
nr*nr-2
talCe
con S] y S] hs varianzas muestrales de los datos de cada proceso' Se rechaza Ho ri I tol ) totr, donde to2eS elpwto al2 de la cola derecha de la distribucin Z de Student con nx * fty - 2 grados de libertad. Cuando la hiptesis alternativa es de la forma H. : lt, > ly, Se rechaza Ho : lt* = pl., si l ) t1, y si es de la < Sa rechaza si /s < -fo. En forma equivalente, se rechaza Ie si el forma He:
:.y
lue
Ejernpla ?"5
Compracin de dos centrfugadoas. La calidad de la pintura ltex depende, entre otras cosas, del tamao de la partcula. Para medir esta caracterstica se utilizan dos centrifugadoras, y se sospecha que stai reportan mediciones distintas para la misma pintura. Se decide hacer un estudio que permita comparaf las medias y las varianzas reportadas por los dos equipos; para lo cual, de un mismo lote de pintura se tomaron 13 lecturas con cada centrifugadora. Los resultados son los siguientes:
4',7'14
lees-
con
dias
an-
6011,
4:6P6'
4896 4561
4oO5: '-rr'4r8'r0
:
4987
5,i
&.
626
:..::.
.,..
:'
4 924
XiJ'
,,.12)
4,684.00;"'
"
'l
s?;
4 530
1,24'732.001
4295
4.2.|t
.in=
47.:44
, 3:7M
4'326
3797
,;:,'
4 401
4618 4339
112 020.00
4779
41AO
4:152
44A892;
Sl=
Para comparar las medias se plantea la hiptesis de igualdad de medias con la alternativa bilateral, puesto que no hay ninguna conjetura del experimentador acerca de cul centrifugadora puede reportar valores mayores. Luego, el planteamiento es: 2.13)
,
Lqui-
:so
f;
Itt, i
mal y la hi-
la cual se desea probar con un nivel de significancia de 57o (a = 0'05)" Suponiendo igualdad de v,rianzas pan el tamao de la partcula, el estadstico de prueba calculado con las frmulas (2.14) est dado por
to=
4684.00-4408.92
344.06JOrc)+Qt:r,
=2.04
t2.14)
De la tabla de distribucin Z de Student con 13 + 13 - 2 = 24 grados de libertad, se obtiene el punto crtico t0.ozs,z+1= 2.064' Como ltol = z'O+ < 2'064 = to2' rto sa rechazaHo, por lo que se concluye que las centrifugadoras A y B reportan en promedio el mismo tamao de partcula. Es decir, las centrifugadoras son estadsticamente
42
{APT!"}LS
iguales en cuanto a sus medias. Sin embargo, conviene observar que el rechazo es por un margen muy escaso, puesto que el estadstico de prueba y el punto crtico son muy similares. Al comparar la significancia predefinida a = 0.05 con el valor-p = 0.053 se concluye lo mismo (no se rechazallo), pero se aprecia que si tal significancia predefinida por el experimentador fueraa = 0.055, la decisin sobre la hiptesis sera rechazada. Esto es, basta con que el experimentador est dispuesto a correr 4.5% de riesgo tipo I adicional para concluir que las medias de las centrifugadoras no son i-euales. En general, no es recomendable cambiar a posteriori el valor cr para modificar 1a decrsin sobre una hiptesis. pero habra situaciones en las que se pueden a.imtlr pr:b'eblhdades de ese errtrr hasta de c,- = 0.1. dependiendo de lo que
::*":- t; ; :-'--:1ir: l- " i: .1-:.1.. Otrr aspecio ,-on:i.ier" es 1a slgrul-icancia prctica de 1a decisin sobre la Luptesis. 1o cual tiene que ver con la dii'erencia obsen'ada. que en este caso es
y representa un e stimador d 1a diferencia en las medias poblacionales del tamao de partcula que son reportadas por las centrifugadoras. En caso de que 275.08 represente una diferencia relevante. que puede impactar fuertemente 1a calidad de1 tamao de partcula, sera un elemento favorable al tratar de verificar si tal diferencia es real. Ya sea al anahzat la conveniencia de utilizar o = 0.055 o tomando ms datos. Si por el contrario, la diferencia observada se considerara despreciable o irrelevante desde el punto de vista prctico, entonces "conviene" aplicar estrictamente a = 0.05 y concluir que las medias de las centrifugadoras son iguales. E1 caso de las varianzas desconocidas pero iguales que acabamos de describir, es el ms utilizado en la prcticapara probar la igualdad de dos medias. En muchos estudios es razonable suponer que las varianzas desconocidas de los dos tratamientos a comparar son iguales. Pero en ocasiones las varianzas no son iguales, o no existen datos histricos sobre los dos tratamientos que permitan suponer algo pertinente sobre las varianzas. Por ejemplo, al comparar dos proveedores del mismo material puede no haber razones para suponer de antemano que las varianzas de cada uno de ellos sean i-suales o parecidas (estadsticamente). Si no se supone igualdad de varianzas. e1 estadstico de prueba para Hs 1 lt,= 4,. est dado por
sj
-f
(2.1s)
s:
trr'
h,
que sigue aproximadamente una distribucin T de Student, cuyos grados de libertad v (nu) se calculan mediante la relacin:
[f
.f)'
a
t2.16t
4t
:
S
f
S
Como antes, se rechazaHo ri I fol ) ton." o si el valor-p < a. Por ejemplo. si en el caso de las centrif'ugadoras no se pudiera suponer que las varianzas son iguales. e1 valor del estadstico dado por la expresin (2.15) resulta ser /0 - 2.04, y aplicando la frmuia (2.16) para calcular los grados de libertad, se obtiene eue v = 26. Con esto se determina que el valor-p = 0.052. Por lo tanto, con a = 0.05, no se rechaza la igualdad de las medias. sta es la misma decisin que se obtuvo al suponer varianzas iguales; observe que los valores de ls y el valor-p son prcticamente iguales que
antes.
la
Hg: O2,= Ol
1e
(2.w)
Ho:
o2"
e-
* oi
io
al.
or
)s-
ty
rir,
La comparacin de varianzas tiene inters en s misma, con independencia de las me<lias, puesto que stas son determinantes en cualquier proceso o tratamiento. En general se considera que a menor varianza, implica potencialmente mejor calidad. Por ejemplo, en el caso de las centrifugadoras interesa ver si alguna de ellas tiene mayor error (variabilidad) en sus mediciones. El planteamiento de la hiptesis se puede reescribir como: (f'
luTA-
no
Hn::;=1
o"
(2.18)
rti0a-
H^::;*l
o;
paru enfatizar que la prueba se basa en la distribucin del estadstico, E -l
o'
lda
de
1s)
"s;
,s2
(2.19
rtad
el cual, bajo el supuesto de que /6 es verdad, sigue una distribucin F con rz, - 1 grados de libertad en el numerador y nn - 1 grados de libertad en el denominador. A1 calcular el valor del estadstico de prueba se obtiene que Fo = f .il. Como la distribucin F no es simtrica, el valor-p est dado por el rea bajo 1a curva a la derecha
lacurvaalaizquierdade 1/1.11=0.9.2Medianteelpaquete estadstico Statgraphics se obtiene valor-p = 0.85. Por lo tanto, utilizando a = 0.05, la decisin es no rechazar Ho: ot, = oi., y se concluye que, estadsticamente,
de 1.11,msel reabajo .16)
2En general, los puntos porcentuales de cola izquierda y cola derecha de la distribucin F cum-
plenlaigualdad'.Ft
o.,,
t.n2
grados de libertad del numerador y de1 denominador. Si stos son iguales simplemente es el inverso.
44
CApYAitS
las centrifugadoras tienen la misma variabilidad, precisin o effor de medicin. El valor del valor-p tan grande con respecto al valor de a, seala que la decisin de no rechazar la igualdad de varianzas es contundente.
Comparacin de proporcones
Una situacin de frecuente inters es investigar la igualdad de las proporciones de dos poblaciones o tratarnientos. es decir. se requiere probar la siguiente hiptesis:
se
\ = 65 y xz = 7 5 personas que se recuperaron con el frmaco en los grupos correspondientes. Para ver si estas diferencias son significativas a favor del frmaco 2, se necesita probar la hiptesis de igualdad de proporciones. Para ello, bajo el supuesto de distribucin binomial, el estadstico de prueba zs est dado por:
bodonde
frt(t-;)
>:o/r. En caso de que
1a
. Se
rechaza
Hs
si
lz0 |
hiptesis alterativa
fuera unilateral, entonces z se compara con z.t. En el caso de los frmacos, como (65 + 15)l(100 + 100) = 0.70; entonces.
65 75 100
f=
100
= -I.543
\07(1-0?)[#.#)
Como I o I = t.5+3 no es mayor gtJe Zo.otz= L96, entonces no se rechaz a Hs, por 1o que no hay evidencia suficiente para afirmar que un frmaco es mejor que el
otro.
rilr
l'l:r:*str*s iSependielt*:)
45
EI
lno
;de
!.
Por
pos ada
justifica la suposicin de que no existe relacin directa entre los datos en el primer tratamiento con los datos en el segundo. Recordemos que orden completamente al azar significa que las unidades se asignan de manera aleatoria a los tratamientos, mientras que las pruebas o corridas experimentales se hacen en orden estrictamente aleatorio, lo cual se hace con la idea de evitar cualquier sesgo que pudiera favorecer a uno de los tratamientos. Sin embargo, en muchas situaciones experimentales no conviene o no es posible tomar muestras independientes, sino que la mejor estrategia es tomar muestras pareadas. Esto significa que los datos de ambos tratamientos se van obteniendo por pares, de forma que cada par son datos que tienen algo en comn; por ejemplo, que a la misma unidad experimental o espcimen de prueba se le apliquen los tratamientos a comparar. Un par de ejemplos son:
ffi
e *; ", a! a,
Es :,'r:n*pfi
gtarr*a:t*
c-=
:r
el que ls unida,
des
las
s::.
letc'
hacen
.^. de mner
: itenientos
=' :="
-:
piue:..
l-eniles :e
-.::ol-io,
ei -'i=-
w
ffluestras pareacas
Son aquelies .. :-.: ;s dalos de anrbos -. : - :-iJs 5e obtienen pof :a rranerS que slos iiene - . -... coTt:n ) nlr -,On - -. - - ,-. -.
--
* "
rse
pos aco
A los mismos pacientes se les aplican dos medicamentos (tratamientos) para el dolor en distintas ocasiones; los tratamientos a comparar son los dos medicamentos. A las mismas piezas se les hace una preba de dureza con distintos instrumentos; aqu se quieren comparar los instrumentos.
:r--:
:'
su-
lVa
En el primer caso, el apaleamiento consiste en que el grupo de pacientes que recibe el medicamento A es el mismo grupo que recibe el medicamento B, por 1o que las mediciones del efecto de los medicamentos sobre el mismo paciente estn relacionadas, y en este sentido no son independientes. Al ser el mismo grupo el que recibe ambos tratamientos se logra una comparacin ms justa y precisa, pero adems, al observar las diferencias entre los tratamientos en un mismo paciente se eliminan otras fuentes de variacin y se logra hacer una comparacin sin sesgos. En el caso de
las piezas, si una es grande se espera que ambos instrumentos tiendan a reportar una medicin alta, por lo que se espera que haya una fuerte correlacin entre las medi-
ciones reportadas con los dos instrumentos. Adems, al medir las piezas con los dos instrumentos, si hay diferencias en las mediciones sobre la misma pieza, entonces esas diferencias se deben principalmente al sistema de medicin.
Ejemplo 2.6
)or
e1
los
es.
1^ ,1d
Comparacin de dos bsculas. Se desea ver si dos bsculas estn sincronizadas. Para ello se toma una muestra aleatoria de 10 especmenes y cada uno se pesa en ambas bsculas, cuidando que el orden en que se utilizan sea elegido al azar. El trabajo lo reaTiza el mismo operador y los datos obtenidos se muestran enlatabla2.3. Es claro que tenemos el caso de observaciones pareadas, ya que el peso que registra una bscula para un espcimen no es independiente del que registra la otra bscula para el mismo espcimen, en el sentido de que si uno es muy pesado se espera que ambas bsculas lo detecten. La comparacin de las bsculas se puede evaluar probando ia siguiente hiptesis:
rel
se
: t, Ho: tt * ,Lt
Hs'. P1
eAPiTUtO
bsculas.
I
2
J
4
-)
6 7
8
11.23 | 14.36 i
11.27
i I | I
14.4t A.-l:
10.s2
23.41
-0.04 -0.05
4.02 4.02
-o.01
9.t'7
13.52
4.02
-o.05
0.01
6.41 I
9
10
6.46 12.4s
19.35
-0.05
0.03
dondepl es el peso promedio poblacional que mide la bscula I y ptres el peso promedio poblacional que mid'e la bscula 2. Entonces, estas hiptesis, en el caso pareado, se plantean de manera equivalente como:
Hs:
ur=g
(2.20)
H^: p
donde
pt, es la media de la poblacin de diferencias. De esta manera, el problema de comparar las medias de dos poblaciones se convierte en el problema de comparar la media de una poblacin con una constante. En este sentido, el estadstico de prueba para la hiptesis (2.20) es el caso particular del estadstico (2.8) para una media, cuando &o = 0 (vase seccin "Prueba para la media" de este captulo). Esto es, con la muestra de n diferen cias (d1, cl2, . . . , d,) se obtiene el estadstico dado por:
to=
donde
s,tJ
(2.21)
d = -0.02 es el promedio muestral de las diferencias, So = 0.02g7 es la desviacin estndar muestral de tales diferencias y /? es el tamao de la muestra. Bajo F1 el estadstico r- se distribul'e como una Z de Student con n 1 grados de libertacl, prrr lo que ll se rechaza si l " ) r,- : ,, _ .. o si yalor-p < c. Al hacer los clculos resulta que:
-{.01
0.0287 /
10
= -1.20
como el valor-p = 0.055 es mayor eu 6r = 0.05 no se rechaza Hs aun nivel de significancia de (x, = 0.05. Es decir, no hay suficiente evidencia en cona de la sincronizacin de las bsculas. Sin embargo, esta conclusin es bastante endeble dado que el varor-p es muy similar al valor a.De hecho, cone, 0.06 se concluira lo = contrario, y el experimentador debera considerar la posibilidad de asumir este riesgo de 67a y rechazar la sincronizacin de las bsculas.
eJg iiq."*
rn*iii;s i:
firliii:
.:cf lirrjii.:'l.e$}
47
Si en el ejemplo, en lugar de analizar las diferencias, que es la manera correcta de resolver el problema, se analizan por separado las mediciones de cada bscula, el efecto de las posibles diferencias entre los dos instrumentos se mezclara con la variabilidad que de por s tienen las piezas. Pero aun si se pesara un grupo diferente de 10 especmenes con cada bscula, entonces la propia variabilidad de las piezas dentro de cada grupo, ms las diferencias entre los dos grupos. probablemente ocultara el efecto de la diferencia de los instrumentos de medicin. As, las observaciones pareadas son necesarias para eliminar fuentes de variabilidad que podran no dejar hacer la comparacin de manera eficaz, esto quedar ms claro a continuacin.
D)
utilizarseen situaciones ms complejas donde variabilidad explcitas. Por ejemplo, se quieren cornparar dos mquinas por medio de los resultados que generan, pero el material que utilizan tiene una historia larga en la que sufri el efecto de varios factores como son: proveedores, lotes, turnos, das, subprocesos, etc.; entonces, al no ser posible hacer dos mediciones sobre la misma pieza como en el caso de las bsculas, se requiere una identificacin ms estricta de las t-uentes principales de variabilidad a fin de parear los datos con base en ellas.
esta manera, la prueba pareada puede es necesario comparar tratamientos ante la presencia de varias fuentes de
de
ia
ba
Eiemp$* ?"s
lmpurezas en cofres levantados y bajados. En una fbrica de autos se tiene la conjetura o hiptesis de que el nmero de impurezas en la pintura de los cofres de los autos es diferente, dependiendo de si el auto pas con el cofre cerrado o abierto por ios homos de secado. Se decide correr un experimento para comparar el nmero promedio de impurezas en cada situacin dei cofre (tratamientos). Se consider que no era adecuado ilizar muestras independientes, ya que se saba que los das de la :m?lril o los turnos podan tener influencia en el nmero de impurezas. Estos dos :actores se incluyen en el estudio como el criterio de apareamiento, como se muestra :n la tabla 2.4, en la cual tambin se aprecian los datos obtenidos. As, en cada com:inacin de da y tumo se asignaron caffos con el cofre levantado y cer:rado. Cada dato en las columnas levantado y bajado en la tabla 2.4 representa el :rorrredio de impurezas en 10 autos, de tal forma que en el experimento se utilizaron :n total 200 autos. La aleatoridad se llev a cabo por parejas de autos: antes de - entrada a los hornos se aleatoriz si el cofre del primero estara levantado rr t,etrjo: si le tocaba levantado, el cofre del segundo auto deba estar bajado. E1 planteaniento estadstico consiste en probar la hiptesis de que 1a n-redia de las drferencias -s cero:
H(j'. ptp
ia,
on
1)
ies-
ajo
tad,
:1
de
sin-
lado ia lo
esgo
=0
(2.22)
Ho: pt,
7
48
CAPTULO
:1
!!fPS
L!l!$S',',,,""', "''
:2:
MARTES MARTES
M T M
T
3.4
3- I
2:-],
0.7
.',0t5 rl11
es$f$e$ , pf$eb3
3,L
1",8
2'5 se r n la tabla
2t9
2.5 1.6
. oue inuolucran
. tistan los Prote
udu
4
5
1,9
ldncoms
,o'6
0,5 0.6
.0.9
1' f,
M
T
i.1
2.2 2.8
tuto t"
6
7
lffi.cors
JUEVES
tecna ,nteno de
1el valor-P'
Tt'
et
e
I
9,,,
JUE\'ES
VpRI!$S,,,,r,':,,,
-VIERNES'"',.'t',i
M T M
Tr
s( rabala conun
o,*
4;3
3;.,-4
',0.5 0.9
sible rechazar
10
,"ot Y tt '
Al aceptar Ho: LLo= 0 se estara admitiendo que el nmero de impurezas promedio en el cofre levantado y bajado son iguales (Ho: ltr = t ).El valor del estadstico de prueba es:
t
Uso de
si
se
" Sol'ln
=-=_-tr/fl
Los rrrtodt
0.74
utlhzi
0.24131J10
estadsticc Lncluven
y el nivel de significancia observado (valor-p) es 0.0000046, el cual es menor que a = 0.05, por lo tanto, se rechaza de manera contundente la hiptesis nula de que los
tratrmientos son iguales, es decir, e1 nmero de impurezas en los cofres depende de si ste se encuentra levantado o bajado cuando el auto pasa por los homos. Pero adems, como se observa en los datos, cuando el cofre est levantado hay menos impurezas: entonces, a partir de esto se decidi que los cofres de los autos se levantarn al entrar a los hornos de secado. Con esta medida se logr reducir en forma significati-
En Partic
Sesviacrt
Oile-t
i'ttet
tierneil
va el nmero de impurezas. Ntese que en la tabla 2.4La gran variabilidad que existe entre los datos de un da a otro, -v tambin entre turnos. Eso causa que, si en lugar de analizat las diferencias se analizan los datos de cada tratamiento (posicin del cofre) por separado, las diferencias debido a tratamientos se pueden, minimizar ante tanta variabilidad. En efecto. si la comparacin se hace siguiendo el criterio de muestras independientes, entonces de acuerdo a lo visto en la seccin "Hiptesis para dos medios" de este captulo, el estadstico de prueba es / = 1.39, que le corresponde un valor-p = 0. 18, por lo que al proceder de esa manera se concluira en forma equivocada que no hay diferencias entre tratamientos (los detalles de este anlisis se dejan ccmo ejercicio). Esto, aunado a las mejoras logradas, justifica que la forma como se hizo el apaeamiento fue necesaria y coffecta, ya que como se aprecia en el arreglo deIatabla2.4, se asegur que al aparear caffos pintados el mismo da y en el mismo turno, se logran resultados ms homogneos a los que se les aplican los tratamientos, por lo que las diferencias observadas dentro de un mismo da y turno, se deben en gran medida a los tratamientos.
l{9
criterio de rcchazo, este ltimo para cada una de las tres posibles alternativas. Si se trabaja con un software estadstico es ms directo y conveniente basarse en el criterio del valor-p, el cual, para cualquier hiptesis, debe ser menor qu,e a paruque sea posible rechazar In. En la tabla 2.6, note que aparecen tres maneras de probar la igualdad de medias Ho: la primera a) es para el caso de muestras independientes suponiendo varianzas iguales. La segunda b) es para muestras independientes sin suponer varianzas iguales y el caso e) es para muestras pareadas. >
S-
EE
OS
de
le)u'81
rri-
En
loS,
:ste
18,
hay
io).
tea-
2.4, Fan
r
las
laa
7
50
Captulo
a|H.n
',.',,::tH).
,;t,..:,,,H'1.
lL:1-=.&z
t{.i,,',,t,ltt
:lt;,2:::p2
-u-------F
xr- x,
Ful>r.,="-*,
to>
to <
to-
'"J;.;.
donde
q*..-z
':''.
Hi:
pr''1'P:"
-to. r4-z
Ft=$z
fIA H^
, _ xr-, ,o-m
t\<th
{t*t
li;,li;;y"',.,,
to',>.,'{_t:-;..r'.il
ldffde
to 1
-t o,,
u:::,::,,,;,:
s;.s;
\n2
lL:.*1,L.,:,.::,;;..;:,:.,;,,:f4;,l
a],Ha.
:.a
o!,,;,,::6;'tr:,'
'',H. i?,.;z
,'
.,.:'
;:ri
..:'
ior>"Fit n. t. n2-t
Fo
Hi
HA
7';;'
o?'< atr
Pt=Pz
F, < F,
.o,
t l, nr-7 t '
AHo
H"
HA
..,,t1,
Pt+Pz
!t)Pz.
Pt<Pz
li;t;,,;i r,r,
) : ^ X,+X. p\*nz
d
lrol, ,",,
:'tt
.,., :'
. Al>;,Qt:'::.i.lliii
t1,ljii.,i:r,.::::,,iti'l'it
I
'He
ZO'2-:,;
:::r::
111'''l
rl';'11
':'11'
',)::Hb
Fz
'o
-_ s,lJi
:'
,ru.>-.rr;:];:;.,,.,:::.r,,r,:
at:fii,::<.+:1.,.:,it:i..::.,:,:):.:::.:.,,':
HA
PtlFz
(Pane options). Ah mismo est la opcin Hypothesis tests.Enlas opciones de panel valor Qt que define la hiptesis nula, el nivel de signicanciaa y el tipo de hiptesis alternativa que se tiene.
se especifican: el
Las hiptesis sobre la desviacin estndar se prueban en la opcin Confidence interuals usando el criterio del intervalo de confianza: si el valor especificado en la hiptesis nula oo se encuena dentro del intervalo no se rechaz a H0: en caso contra-
rio
se rechaza.
El problema de comparar dos medias o dos varianzas con muestras independientes. esr en Compare -> T\ro samples -+ Ttro-sample comparison. En las opciones tabulares se escogen Comparison of nteans y Comparison of standard deviations.
t
Fregunias y eiereicios
Para comparar medias con muestras pareadas la secuencia de opciones a utilizar es Compare + Two samples -> Paired-sample comparison.En Minitab, la secuencia para estimacin y prueba de hiptesis es: Stctt + Basic Statistics, y ah se elige la opcin deseada para una, dos muestras (sample) o muestra pareada.
5l
hn kxcel
Para hacer clculos estadsticos en Excel se utilizan las funciones (f,) estadsticas r' la opcin Anlisis de datos dentro del men de Herramientas . Si no estuviera activada la opcin de Anlisis de datos, sta se activa usando la opcin Complemenlos que est dentro del mismo men de Herramientas. Para probar la hiptesis o encontrar
intervalos de confianza para un parmetro, se usa la secuencia: Herramientas '> Anlisis de datos -> Estadstica descriptiva. Ah se activa el cuadro u opcin Nlvel de confianza para la media. En todos los casos, despus de sealar el anlisis que
se desea hacer, se abrir una ventana en la que se especifica el rango de celdas donde se encuentran los datos
En caso de comparar las medias de dos poblaciones suponiendo varianzas desconocidas pero iguales, la secuenciaes'. Herramientas -+ Anlisis de datos -> Prueba t para dos muestras suponiendo varianzas iguales. Para probar la igualdad de dos medias usando muestras pareadas la secuencia es'. Herramientas -> Anlisis de datos + Prueba t para medias de dos muestras emparejadas. Al final, para probar la igualdad de las varianzas se utiliza la serie de comandos'. Herramientas -> Anlisis de datos - Prueba F para varianzas de
eJos
muestras.
iQu es probar una hiptesis? iQu es hacer una estimacin puntual y en qu consiste hacer una estimacin por intervalo para la media, por ejemplo?
ZPor qu no es suficiente la estimacin puntual y por qu se tiene que recurrir a la estimacin por intervalo?
A l.
_-i
5.
panel
6.
iaay
dence
7.
estimacin por intervalo, seale en forma especfica para estimar qu parmetro utiliza cada una de las siguientes distribuciones: f de Student, Normal y jiEn el contexto de
cuadrada.
en la ontraiepen-
B.
9.
10.
Seale y describa de manera breve los tres criterios equivalentes de rechazo de una hiptesis. Seale un ejemplo de datos o muestras pareadas.
:iones
rt?
s.
f
g2
' ':.''.)-' '- " ','t , :.., -, . ,
,
Ejercicios de estimacin
I
I.
En la elaboracin de envases de plstico es necesario garantizar que cierto tipo de botella en posicin vertical tenga una resistencia mnima de 50 kg de fuerza. Para garantizar esto, en el pasado se realizaba una prueba del tipo pasa-no-pasa, donde se aplicaba la fueza de 50 kg y se vea si la botella resista o no. En la actualidad se realiza una prueba exacta, en la que mediante un equipo se aplica fuerza a la botella hasta que sta cede, y el equipo registra la resistencia que alcanz la botella. o) iQu ventajas y desventajas tiene cada mtodo de prueba? b) Para evaluar la resistencia media de los envases se toma una muestra aleatoria de n :20 piezas. De los resultados se obtiene que X : 55.2 y S : 3. Estime con una confianza de 95o/o, Zcul es la resistencia promedio de los envases? c) Antes del estudio se supona que ,& : 52. Dada Ia evidencia de los datos, ital su-
puesto es correcto?
d)
12.
Con los datos anteriores, estime con una confianza de 950/0, icul es la desviacin estndar poblacional (del proceso)?
Para evaluar el contenido de nicotina en cierto tipo de cigarros elaborados por un proceso, se toma un muestra aleatoria de 40 cigarrillos y se obtiene que i : I 8.1 mg y 5 : 1.7.
o) )
Estime con una confianza de 95o/a, icul es la cantidad de nicotina promedio por
cigarro?
Antes del estudio se supona que lt: 17.5. Dada la evidencia de los datos, ise puede rechazar tal supuesto? Con los datos anteriores, estime con una confianza de95o/o, Zcul es la desviacin estndar poblacional (del proceso)?
c)
d) iQu
puede decir sobre la cantidad mnima y mxima de nicotina por cigarro? Es posible garantizar con suficiente confianza que los cigarros tienen menos de 20 mg de nicotina.
13.
En un problema similar al del ejercicio I l, es necesario garantizar que Ia resistencia mnima que tiene un envase de plstico en posicin vertical sea de 20 kg. Para evaluar esto se han obtenido los siguientes datos mediante pruebas destructivas:
28J 26.8 26.6 265 28.1 24.8 27.4 26.2 29.4 28.6 24.9 25.2 30.4 27.7 27.O 26.1 28j 26.9 28.O 27.6 25.6 29.5 27.6 27.3 26.2 27.7 27.2 25.9 26.5 28.3 26.5 29j 23.7 29J 26.8 29.5 28.4 26.3 28.1 28.7 27.O 25.5 26.9 27.2 27.6 25.5 283 27.4 2B.B 25.O 25.3
27.7 25.2 28.6 27.9 28.7
a) )
ipor
al
lOOo/0,
Haga un anlisis exploratorio de estos datos (obtenga un histograma y vea el comportamiento de los datos obtenidos).
c)
d)
Estime, con una confianza de 950/0, Zcul es la resistencia promedio de los envases?
e)
14.
Dada la evidencia de ios datos, Ztal supuesto es correcto? Con los datos anteriores estime, con una confianza de 950/0, icul es la desviacin estndar poblacional (del proceso)?
quep:25.
En fa elaboracin de una bebida se desea garantizar que el porcentaje de CO (gas) por envase est entre 2.5 y 3.O. Los siguientes datos son obtenidos del monitoreo
del proceso:
55
ia
a
2.65 2.56 2.68 2.51 2.56 2"62 2.63 2.57 2.60 2.53 2.69 2.53 2,67 2.66 2 6a 2.60 252 2.62 2.67 2.58 2.61 2.64 2.49 2.58 2.61 253 2.53 2.57 2.66 2.a'l 2.57 2.56 2.52 2.58 2.64 2.59 2.57 2.58 252 2.61 2.55 2.55 2.73 2.51 2.61 2.59 2.60 2.64 2.56 2.60 2.57 2.48 2.60 2.61 2.55 2.66 2.69 2.56 2.64 2.67
o) ) c) d)
debe ser igual a 2.75. Dada la evidencia, ise puede rechazar tal
supuesto? Con los datos anteriores estime, con una confianza de 950/0, icul es la desviacin estndar del proceso?
U-
e)
15.
'o-
tv
recibe directamente de los establos lecheros es de 3.00/0. Por medio de 40 muestreos y evaluaciones en cierta poca del ao se obtuvo que X: 3.2 y 5: 0.3.
o) b) c)
Ieon
Es
iCul es el error mximo de estimacin para la media? iPor qu? Estime, con una confianza de 950/0, icul es la desviacin estndar poblacional? puede decir sobre la cantidad mnima y mxima de grasa en la leche? iEs poZQu @ sible garantizar con suficiente confianza que la leche tiene ms de 5.00/o de grasa?
16.
m8
En la fabricacin de discos compactos una variable de inters es la densidad mnima (grosor) de la capa de metal, la cual no debe ser menor de 1.5 micras. 5e sabe por experiencia que la densidad mnima del metal casi siempre ocurre en los radios 24y 57,
rcia
aunque en el mtodo actual tambin se miden los radios 32, 40 y 48. Se hacen siete lecturas en cada radio dando un total de 35 lecturas, de las cuales slo se usa Ia mnima. A continuacin se presenta una muestra histrica de l8 densidades mnimas: 1.81, 1.97,1.93, 1.97, 1.85, 1.99, 1.95, 1.93, 1.85, '.l .87, 1.98, 1.93, 1.96,2.O2,2.O7,
1.92, 1.99, 1.93.
uar
:8.1
t9.7
o)
t5.3
b)
Ao/0,
c)
d)
17.
omenI su-
En una auditora se seleccionan de manera aleatoria 200 facturas de las compras reali-
l0
o) ) c)
lB.
Estime con una confianza de 950/o el porcentaje de facturas con anomalas en todas
las compras del ao. ZCul es el error de estimacin? tPor qu?
cin
tQu tamao de muestra se tiene que usar si se quiere estimar tal porcentaje con un error mximo de 2o/o?
En la produccin de una planta se est evaluando un tratamiento para hacer que ger-
I Por oreo
mine cierta semilla. De un total de 60 semillas se observ que 37 de ellas germinaron. o) Estime con una confianza de 900/0, la proporcin de germinacin que se lograr con tal tratamiento.
54
i-.FETiJ! ril
,:L
Con una confianza de 900/0, se puede garantizar que la mayora (ms de la mitad) de las semillas germinarn? los dos incisos anteriores pero ahora con 950/o de confianza.
c) Conteste
I
9.
Para er"aluar la efectividad de un frmaco contra cierta enfermedad se integra en forma aleatoria un gruPo de 'l00 personas. Se suministra el frmaco y transcurrido el tiempo de crleba se observa x:65 personas con un efecto favorable. c' Es'ttre crn una confianza de 900/0, la proporcin de efectividad que se lograr con :e ::'!r-:o. l-.iaga una interpretacin de los resultados.
ia !- ': :::: : i:l:lema Cel ejercicio l l, los datos anteriores al diseo de la prueba cc":'--: --:s:':- : siguienie: de n: r20 envases de plstico probados para ver si
tencia mlnira es:e:::::. ::aqa ..]na interpretacin de los resultados. iCul es el e-ro- ce =; -a::-l Calculeel tarnacde 'r-:;-=c-:s:recesitaparaqueel errordeestimacinmximo sea de 0.03.
) c)
21
Dos mquinas, cada una operada por Lrna ,ersona, son utilizadas para cortar tiras de hule, cuya longitud ideal debe ser de 20Cr min" De las inspecciones de una semana (25 pezas) se observa que la longitud media de las 25 piezas para una mquina es de 200.1 y para fa otra es de 201.2. ZEs significativa la diferencia entre los dos casos? Argu, mente.
22'
bombillas y se tiene que elegir entre las marcas comPraron I o0 focos de cada marca, y se encontr que las bombillas probadas de la marca A tuvieron un tiempo de vida medio de I 120 horas, con una desviacin estndar de 75 horas; mientras que las de Ia marca B tuvieron un tiempo de vida medio de I 064 horas, con una desviacin estndar de g2 horas. o) iEs significativa Ia diferencia entre los tiempos medios de vida?
A y B. Para ello, se
Use
0.05.
A:
23.
ZCon qu tamao de muestra se aceptara que las marcas son iguales, utilizando
O.Q5?
En un laboratorio bajo condiciones controladas, se evalu, para l0 hombresy lo mujeres, la temperatura que cada persona encontr ms confortable. Los resultados en
74 i tz | 77 : 76 i l-T ..,.-'.'-..'-i-''...--"'*....i.-*-.'.'''*.l"--.-,....,-,*,-.*---....--]..*--.:
-..-.-
75i77i78.79 --.-.-L---,-.--.1--,,--.-r.--- --
77
it
i'
l]- ia ,-14 t
._i_1__-l__-1_"
t9 lZslsol 1 ""
i
',
7s
o) zcules son en realidad los tratamientos que se comparan en este estudio? b) ZLas muestras son dependientes o independientes? Explique. c) ila temperatura promedio ms confortable es igual para hombres que para mujeres?
Pruebe la hiptesis adecuada.
r
Preguntas y ejercicios
55
d)
17.2
na
Po
2t.4
;0.9
19.8
20.4 20.6
z\.a
20.8
19:9
-.
ba
'si
)4.
16.8 18:4
16.7:
;is-
2t.1
20.3
17.6
ixi-
o)
ZLa
de (2s
de
b) c) d) e)
dsticas correspondientes a esta interrogante. D un intervalo de confianza para la diferencia de medias. ZCul temperatura provoca un encogimiento menor? Compare las varianzas en cada temperatura. Dibuje los diagramas de cajas simultneos e interprete.
gu-
i5.
Una compaa de transporte de carga desea escoger la mejor ruta para llevar la mercanca de un depsito a otro. La mayor preocupacin es el tiempo de viaje. En el estudio
grupo de 10 y se asignaron a la ruta A; los cinco restantes se asignaron a la ruta B. Los datos obtenidos fueron:
se seleccionaron al azar cinco choferes de un
rcaS
illas
una
de
o)
iExisten diferencias significativas entre las rutas? Plantee y pruebe las hiptesis estadsticas correspondientes.
En caso de rechazar Ia hiptesis del inciso o), dibuje los diagramas de cajas simultneos para determinar cuf ruta es mejor. Sugiera otra manera de obtener los datos (diseo alternativo), de manera que se pueda lograr una comparacin ms efectiva de las rutas.
)
rndo
c)
?6.
Se
mu-
tienen dos proveedores de una pieza metlica, cuyo dimetro ideal o valor objetivo
5en
l4
21
.53,
o) b)
nten-
Describa un procedimiento de aleatorizacin para la obtencin de estos datos. Pruebe la hiptesis de igualdad de los dimetros de los proveedores en cuanto a sus medias. Pruebe la hiptesis de igualdad de varianzas.
c)
56
CAP{-ru.*.|o:
eseemurs pre d carmo su 2O25 nnrn - 2.25 mm, Zcul proveedor fqdre rreiru p*ms e.r*rsasl et f-rt a*"fl pqeefu 5e rFFr{tra l*r[-l 2i. En Xow" S- Srnranapee, V" A f*rri 't {2m5} se pre.senta un estudio donde se mdan dos tiff de brr de poenerc, orp Ensin se refueza con fibra de vidrio (RP)- EG btrr-ds, en sffiin de hs ykFs de acero, son utilizadas para reforzar
corlcreto, por lo q-re su caracterizacin es
c r as
irportanb
Las bafi-ds se
sometieron
tensin hasta
regi*artinuacin:
su ruptura (en Mpa). Los datos para dos t{os de banas se muestran a con-
o) Formule la hiptesis para probar la igualdad de medias de los tratamientos. ) Anote la frmula del 'estadstico de prueba para demostrar la hiptesis. c) Pruebe la hiptesis a un nivel de significancia de 5olo. Para rechazar o no la hiptesis, apyese tanto en el criterio del valor-p como en el del valor crtico de tablas.
d) e)
Explique cmo se obtiene el valor-p del inciso anterior. Pruebe la hiptesis de igualdad de varianzas entre tratamientos.
f)
Se realiza un estudio para comparar dos tratamientos que se aplicarn a frijoles crudos,
con el objetivo de reducir el tiempo de coccin. Un tratamiento (Tl ) es a base de bicarbonato de sodio; el otro, T2, es a base de cloruro de sodio o sal comn. La variable de
o) Formule la hiptesis para probar la igualdad de medias de los tratamientos. ) Anote la frmula delestadstico de prueba para probar la hiptesis. c) Pruebe la hiptesis a un nivel de significancia de 5ol0. Para rechazar o no la hiptesis, apyese tanto en el criterio del valor-p como en el valor crtico de tablas.
d) Pruebe la hiptesis de igualdad de varanzas entre tratamientos. e) De acuerdo con el anlisis hecho hasta aqu, ihay algn tratamiento
mejor?
29. Se comparan dos mtodos para inocular o contagiar una cepa del hongo del maz conocido como huitlacoche. En una primera etapa del estudio, el experimentador quiere determinar cul de los mtodos genera mayor porcentaje de infeccin. El mtodo A consiste en cortar la punta de la mazorca para aplicar la cepa, y en el mtodo B se inyecta la cepa de forma transversal. De 4't mazorcas inoculadas con el mtodo An 20 se infectaron, es decir, generaron huitlacoche; en tanto, de 38 mazorcas inoculadas con el mtodo B se infectaron 27. o) ZHay evidencia estadstica suficiente para afirmar que el mtodo B genera una mayor infeccin de huitlacoche? Plantee y pruebe la hiptesis correspondiente.
30.
El mejor mtodo de inoculacin del problema anterior se aplic a dos variedades de maz en dos localidades. Una vez infectada la mazorca, interesa medir el porcentaje
-.:
57
inal de la superficie de
sta que fue cubierta por el hongo y el peso en gramos del r.itlacoche. Los resultados para la variedad 2demaiz, obtenidos en l5 mazorcas de lexcoco y en l5 mazorcas de Celaya son los siguientes:
le se
idrio
ofzaf
trol
L
Y
1
hasta
COf'l-
60
40
95 55
95
100
231.80 346.74
23.1.4t
2
J
70 40
35 100
4
5
t41.49 t49.69
40
20, 10
29t.28
86.03
30
100 100 100 25
15
8 9
10 55
15
57.05
145.83
r58.74
167.2s
ripterlas.
10
120.89
19.74
1l
12
13
35 25
22.08
134.O2
70
2A 2A
85
15
14
40.57
19.36
28.76
24.87
t5
30
o) iSe
que en Texcoco?
b)
c)
d)
5.
Utilice un diagrama de dispersin (grfica tipo X-Y) para ver si existe una relacin lineal entre el porcentaje de cobertura de la mazorca con los gramos de huitlacoche. lgnore la cobertura y pruebe la igualdad de la produccin promedio de huitlacoche en las dos localidades.
evidente que a mayor cobertura hay una mayor produccin de huitlacoche, ihabra forma de saber con estos datos si a igual cobertura corresponde una produccin de huitlacoche semejante en ambas localidades? Argumente su respuesta.
Es
a hiPtea5.
51.
lr?
I maz co-
ior quiere
mtodo A lo B se inlo A, 20 se das con el
Con respecto al problema del ejercicio 18, se desea comParar dos tratamientos Para hacer que germine cierta semilla. Los datos del tratamiento A son los del ejercicio 18, es decir, de 60 semillas puestas a germinar se observ que 37 de ellas germinaron. Mientras que para el tratamiento B, de 70 semillas se observ que 50 germinaron. o) ZHay una diferencia significativa entre los dos tratamientos? Pruebe la hiptesis correspondiente a 950/o de confianza. b) Estime, con una confianza de 95o/o,la proporcin de germinacin que se lograr con cada tratamiento.
fa una ma:nte.
32. Se desea comparar dos proveedores; para ello, se toma una muestra aleatoria de la produccin de cada uno de n : 150 piezas, y se les hace en orden aleatorio una prueba. En el caso del primer proveedor se obtuvieron xr : I I piezas que no pasaron la prueba,
iedades de
porcentaie
mientras que para el segundo fueron xz:22. o) iQu proveedor parece mejor? b) LHay una diferencia significativa entre los dos proveedores? Pruebe Ia hiptesis correspondiente a 950/o de confianza.
58
CAPTUIO
Elemen::s
:= -'=.=-:
Pruebas pareadas
33.
tarda 2 rniutos. 5e orcpcne un nuevo mtodo de prueba que consiste en medir solamente los racias 2-:. 5f donde casi es seguro que estar el valor mnimo buscado. Si el mtodo ruer resuka igual de efectivo que el mtodo actual se podr reducir en
600/o el
to donde se mide la densidad mnima de metal en l8 dlxos u-ndo tanto el mtodo actual como el mtodo nuevo. Los resultados estn oderaios horizontalmente por disco. As LB8 y 1.87 es el resultado para el primer disco ccr- anrbos mtodos.
1.83
I 1.91 1.9+ i.95 i.93 I 2.18 1.81 t.t_1 1.97 1.92 . 2.A) t.fn 1.95
2.01 2.0A
2.05
o) b)
Pruebe la igualdad de las medias usando Ia prueba pareada. Cul es el criterio de apareamiento? Encuentre un intervalo para la diferencia de medias usando la desviacin estndar de las diferencias. Inteprete. Haga el anlisis de los datos ignorando el apareamiento. Compare con los resultados del inciso o), ipor qu ignorar el apareamiento es incorrecto? Determine un intervalo de confianza para Ia diferencia de medias suponiendo muestras independientes. Compare con el inciso b). en este caso?
c)
d)
f)
34. En una prueba de dureza, una bola de acero se presiona contra el material al que se mide la dureza. El dimetro de Ia depresin en el material es la medida de su dureza. Se dispone de dos tipos de bolas de acero y se quiere estudiar su desempeo. para ello, se prueban ambas bolas con los mismos l0 especmenes elegidos de manera aleatoria y los resultados son:
o)
Analice paso a paso cmo se hizo el experimento y explique por qu es importante realizarlo de esa manera. Pruebe la hiptesis de que ambas bolas dan las mismas mediciones de dureza. Pruebe la igualdad de las bolas sin considerar que estn pareadas. Compare los resultados con los obtenidos en el inciso ). LEn qu situacin se esperara que los anlisis ) y c) den los mismos resultados?
) c) d)
35.
Se conduce un experimento Para determinar si el uso de un aditivo qumico y un fertilizante estndar aceleran el crecimiento de las plantas. En cada una de l0 localidades
se estudiaron dos plantas sembradas en condiciones similares. A una planta de cada localidad se le aplic el fertilizante puro y a Ia otra el fertilizante ms el aditivo. Despus de cuatro semanas el crecimiento en centmetros fue ef siguiente:
Preguntas y ejercicios
59
rde
que
3el
nrdo
Por
o) )
a :0.05.
c) Explique
)t
d)
Obtenga un intervalo al 950/o de confianza para Ia diferencia promediop. con detalle cmo se pueden asignar de manera aleatoria los tratamientos a las plantas en cada localidad utilizando una moneda. Suponga que en cada localidad una planta queda hacia el Este y la otra hacia el Oeste, realice una asignacin aleatoria de los tratamientos a las plantas lanzando
una moneda
l0
veces.
Retome los datos del ejemplo 2.6 (impurezas en cofres levantados y bajados): o) lgnore el apareamiento, y compare de manera independiente los dos tratamientos.
de
b)
ndar
Obtenga conclusiones. Explique si las conclusiones son diferentes con el anlisis en forma pareada y. de manera independiente. iCul es la conclusin correcta, hay o no diferencia entre los tratamientos?
c)
ultaes-
Se realiz un experimento para ver si dos tcnicos tienen alguna tendencia a obtener
diferentes resultados cuando determina la pureza de cierto producto. Cada muestra fue dividida en dos porciones y cada tcnico determin la pureza de una de las porciones.
Los resultados se muestran a continuacin:
t.
le se
feza.
ello,
ftoria
o) b) c) d) e)
tante
'4.
trabajo? ZQu recomendara para lograr mayor uniformidad en las determinaciones de los dos tcnicos?
l!
to'
Cos?
rfertiCades
cada spus