Anda di halaman 1dari 64

oB42t

Anlisis y diseo de experimentos


-,:
"'i'...+,-** a\'"
rl

'".-'\'t'qFrt'

-,

."'o^,,

*a]h;'\it"

t, i-toI
f\

cr,

'r
\

*"

Anlisis y diseo de experimentos


Segunda edicin

Humberto Gutirrez Pulido


Cenfro Universitaria de Ciencfcs Fxccfas e lngeniera U niversided de Guadaeiara

Romn de la Vara Salazar


Cenfro de fnvestigecin de Msferneifccs

Guaneiueta, Mxiea

Revisin tcnica:

Adolfo Cano Carrasco


Dep*rtarnento de lngeniera tndustri al ,nsttfo Tecnatgico de Sanara

Mucio Osorie Snchez


Depa rta rne nta de Ma
te m t i c a s

lnsfffo Tecnolgico de Sonara

VXICO

. BOGOT.

LISBOA. MADRID AUCKLAND. LONDRES. VILN . MONTREAL. NUEVA DELHI SAN FRANCISCO. SINGAPUR. SAN LUIS. SIDNEY. TORONTO _t / L-'

BUENOS AIRES

CARACAS . GUATEMALA NUEVA YORK. SAN JUAN . SANTIAGO

-'

l'-t

,--,*==#

Contenido
.lcer.ca de los autores
XI

:decimientos -eiacio.

xill
XV

cpinro

lntroduccin al diseo de experimentos.

2
4 6
10

Ei diseo de experimentos hoy. Definiciones bsicas en el diseo de experimentos . . Etapas en el diseo de experimentos . . Consideraciones prcticas sobre el uso de mtodos estadsticos Principios bsicos. Clasificacin y seleccin de los diseos experimentales. . . .

IZ I2

l4

CIPTULO

Elementos de inferencia estadstica: experimentos con uno y dos tratamientos . . . .


.

t8
20

Poblacin y muestra, parmetros y estadsticos. . . .

Distribuciones de probabilidad e inferencia. Estimacin puntual y por intervalo . .


Conceptos bsicos de prueba de hiptesis Planteamiento de una hiptesis estadstica Prueba parula media
Prueba para la varianza Tres criterios de rechazo o aceptacin equivalentes Hiptesis para dos medias: comparacin de dos tratamientos Prueba para la igualdad de varianzas

.I

23 29 30 34 36

5t
39 43

Poblaciones pareadas (comparacin de dos medias con muestras

dependientes)....
Resumen de frmulas para procedimientos de prueba de hiptesis. . . Uso de un software estadstico.

44

49 49

(PTULO

Experimentos con un solo factor (anlisis de varianza). . . . . Diseo completamente al azar y ANOVA Comparaciones o pruebas de rango mltiples Verificacin de los supuestos del modelo Eleccin del tamao de la muestra. . . . . uso de software computacional . . .

60

6l s;
89
91

CAPruLO

Diseos de

bloques

l oo

Diseo de bloques completos al Diseo en cuadro latino .

azar

l0Z
109

Csrnfo
Diseo en cuadro grecolatino. Uso de software
115

116

cAPTUto

Diseos

factoriales.

Conceptos bsicos en diseos

factoriales.

126 I28

Experimentacin factorial vs. mover un factor Diseos factoriales con dos factores

alavez

132

I34
143

Diseos factoriales con tres factores Transformaciones para estabilizar varianza Diseo factorial general Modelos de efectos aleatorios

I49
150 153

Cmohacerloconsoftware....
CAPTULO 6 Diseos factoriales 2k Diseofactorial 22... Experimento 22: ejemplo integrador Diseo factorial 23 . . . Experimento 23: ejemplo integrador Diseo factorial general 2k . . . Diseo factorial 2r no replicado. . . Experimento 25 no replicado: ejemplo integrador Cuando la significancia de los efectos es menos clara: un ejemplo. . ' Factoriales 2k con punto al centro Factoriales 2k en bloques . . . .
.

l5'l
r66
168

173
183 185

r92
19:

t9s 20

2lt 2l(
22(

Uso de software estadstico

CAPTUIO

Diseos factoriales 3k y factoriales mixtos, Diseos factoriales 3k. . . . Factoriales mixtos


Uso de software estadstico

23(
231
24',

25(

CAPTULO

qr

Diseos factoriales fraccionados 2k-p. Diseo factorial fraccionado zk-t . . El concepto de resolucin . . . . Construccin de fracciones 2k-1 Experiment o 2s-r : ejemplo integrador
Diseos factoriales fraccionados 2r-2 Diseo factorial fraccionado 2k-p Experimento 21a: ejemplo integrador Tpicos adicionales sobre factoriales fraccionados. Uso de

25t
26
26:

26:
26t 26.
27. 27t

software

27' 28.

fPiTULO

lntroduccin al diseo robusto (Taguchi)

29,
29,

F-- : =:,: Taguchi

= : ---:::t.. le robustez :-:c::r":: - ::::1. de rurdO y de Seal

29 29 30

Contenido
Diseo con arreglo interno y externo (diseo de parmetros) . . . . . . . Razn seaVruido. Uso de software
CAF*,Y{.Ef;"S

ffi

307 307

312

planeacin de un expermento Experimentacin: una estrategiapara probar conjeturas y generar

x*

318
320
3Zz 323
330

aprendizaje
El diseo de experimentos y el ciclo de Deming Etapas y actividades de la planeacin y anlisis de un experimento . . . Control de factores de bloque y de ruido Qu sigue despus del primer experimento Qu hacer cuando ningn efecto es significativo. . .
cAp$?.r,rE"ff

33I
334

E Anlisis de regresin
.

338
340 346
351 351 360 365

Regresin lineal simple . . . . Pruebas de hiptesis en la regresin linea] simple Calidad del ajuste en regresin lineal simple. . . .

Estimacin y prediccin por intervalo en regresin simple Regresin lineal mltiple. . . . Pruebas de hiptesis en regresin lineal mltiple . . Intervalos de confianza y prediccin en regresin mltiple. Uso de un software estadstico.
.

37r
-)t-)

CAF$?$JL&

?P

Optimizacin de procesos con metodologa de superfcie de respuesta

384
386

Introduccin a la metodologa de superficie de respuesta Tcnicas de optimizacin. Diseos de superficie de respuesta. . . .


Uso de software estadstico
CAPY'&$L#

393 413 420

*3

Optimizacin simultnea de varias respuestas.

432
434 436
441

Optimizacin simultnea Mtodo grfico. Mtodo de la funcin de deseabilidad Trabaio con un software estadstico.

446

CAPITl{-*

g4

Dseos anidados y diseos en parcelas divididas. .

452
,<
--<.<

Diseos anidados Modelo y anlisis estadstico del diseo anidado Diseos en parcelas divididas

\{odelo y anlisis estadstico de los diseos en parcelas divididas


Cmo hacer los clculos usando software C.APlTLJt& Diseo de experimentos con mezclas. . . . El problema del diseo de experimentos con mezclas ,{lgunos diseos de mezclas y sus modelos estadsticos . . .

-f

-,

+6,i
111

3E

480
482
486

Contenido Ajuste del modelo

y caracteizacltii:.l1:5.f":I
de una mezcla

*:::::-

i:#;;;t
APNDTCE

Uso de software estadstico

"t

r"- componentes

490 494 500

509

TAbIAS

APNDIGE '--

Etapas al planear Sistema Minitab

Uso de sistemas comp-utacionales paquete estadstico experimento en un

521
<a1
<.r,1

analizar un

Sistema StatgraPhics

526 528
529
'

SistemaJMP" """."^

;i;"

sPss ' de exPerimentos usando

533
537

BIBTIOGRATiA REFERENCIAS Y

fnolcr ANALico

#mptulo

htroduccin al diseo
de experimentos
$xxsmmr*
*? El diseo de exPerimentos hoY
r. Definiciones bsicas en el diseo de experimentos

tF :;:

Etapas en el diseo de experimentos estadsticos consideraciones prcticas sobre el uso de mtodos

i*

PrinciPios bsicos

....Clasificacinyseleccindelosdiseosexperimentales

ffimtiv*s
dm ffiffs-*sldmffijt
ffi I
juega el diseo de Conocer el papel fundmental que y en la experimentos en el meioramiento de Procesos
investlgacin'

ldentificar los principios bsicos y la terminologa adecuada en el diseo de experimentos'

IDescribirlasetapasmsimportantesenlainvestigacin
experimental.

ffiHmpa tronceptual

Diseo de experimentos

fl&pgYCJt$ I

',.{

i:

{r:!i.}l'i i

rj ts'*!"i

* **

*xpeli ment*s'

(*e*:*$'1r'$ eEag*
" Aleatorizacin

ffi&

Sises de *xpffie-&wxffiffi&ws
: :'-=:::: t*]ii;;-'
:

&xmy

- Bloqueo - Diseo de exPerimentos

Enelcampo.leiarndustnaesfrecuentehacerexperimentosopruebasconlaintencindereS,]1.,'-r,on,oo*uocomprobar,,nui.u(conjetura,hiptesis);poreJem. o condiciones de operacin


p1o. ha:e

,.Enor aleatorio
" Enor exPerimental

t; io' tnut"'i";;;;t

d u n r :r,

. ExPerimento . Factores controlables - Factores estudiados . Factores no controlabie:

'

:'

l-

T ::' ff:':'Hn fl l*ruttll'H"'"Jffi#';:':T"

. Matriz de diseo . Niveles


'' Planeacin

ProcesDr-

--::=----

-:<^ --a - :-:-- -'

,.

i-,aoie de respu:sia

l.Compararadosomsmaterialesconelfindeelegiralquemejorcumple

2.

con la los requerimientos' para verificar s i trabajan medicin de Comparar uu'io' i"tt'omentos

I
4.

;:X-*ti:"Jril:[:t'l- .
sobre una o

tienen impacto de un proceso que

"u'uttersticas de Encontrar las condiciones "nt'"tt;;i;;*lp"tu'o'u'


del Proceso'

*a'

1,,"1",) del producto final'

velocidad' humedad'

porejemplo)d;;;;"dozcanlosdefectosselogreunmejordesempeno
::scilaciones de variables :. l:::ru ;l:'JJllff[i: 3::fiff o procesos' de nuevos productos
ambientares

de

dos quiere mejorar'un procesoexisten r'a heEn general, cuando se observar o monitorear para ello: unu ", mejorarlo: se dice obtener ta inrormaJ,

7. Apoyar "t i'"o o rediseo 8. Ayudar u "onot"" caracter\zar

nuevos materiales'

manetas bstcas

,"."r*t^

rramientas estadsticai,l"r,"

pasiva'-La que sta es una estrategia

"o*"". oY

,.n"r.i,iiii"'

y hacer cambios estratlico'


tiles.

U"1t*"1-1a1

qo" permitan experimentar' es decir' manera consiste en dichas seales proceso para provocar

Al

O"t analizar los r-esultado,

"tp".ii"ito '"

seguir' que oUti""en las pautas a

,.3Je S se concretan en mejoras sustanciales del proceso. En este :-.--.:-, -:-: : r":-.r--l:ttr es mejor que sentarse a esperar a que el proceso nos indiqul:-: ' :.:-,r mejorarlo. El diseo de experimenlos (DDE) es un conjunto de tcnr;"s las seales tiles' sina -, ', :-:. =r e1 sentido de que no esperan que el pfoceso mande para su . -: ., i .j "manipula" paraque proporcione la informacin que se requiere

T
t,
..

:
,,ber diseo de experimentos y offas tcnicas estadsticas, en combinacin con al responsable del mismo como un obseruador per,--3nros del proceso, sitan , _ , proactivo que es capazde pfoponer mejoras y de observar algo interesante

l I
S.

-**Jadesdemejora)enelprocesoyenlosdatosdondeotrapersonanoVenada.

t-

!i;,0 d* *npcrirn*rlt*s* *n
_ ,

{m

i*vestg*c!*e"l

!-

lr iof
rS.

de
SC

_ _; : ha dicho hasta el momento tambin es vlido en el campo de la investiga. - : _.:ilca o aplicada, ya que a fin de cuentas, el objetivo es generar nuevas ideas - : :: s respuestas a las interrogantes del investigador sobre el objeto de estudio' - - bjetivo cle los mtoclos estadsticos'es lograr que el proceso de generar coI - -_:--,io y aprendizaje sea lo ms eficiente posible. En este proceso, que ha deii ":.:: ser secuencial, interactan dos polos (vase figura 1'1)' por un lado estn ,. : :_:. los modelos, las hiptesis, las conjeturas y los supuestos; por el otro, esy los datos. As, como se --* . ::lidad, los hechos, los fenmenos, |a evidencia lleva a trn proceso de deduccin
:

tes

: *i las consecuencias derivadas de ia hiptesis pueden ser comparadas con los ;,: . : ,l lando las consecuencias y los datos no coffesponden, entonces la discrepan-.

.:..:

en Box et at.

(1918I una hiptesis inicial

$ts{{::-e,* rls'dqc$ alst*c}f'}

[:

cndc

las consecuercias

\'er

lon
.

la hiptesis origi- : -, r-- llevar a tn proceso de induccin, en el cual se modifica - - ; ssta manera inicia un segundo ciclo de la interaccin de teora y datos, en el

derivada: cie ia hiPtesi: pueden ser compar;dar con los da{os.

rpie

: : ";- *-: r'a la obtencin


:.le

-* ,::

(|os :onsecuencias de la hiptesis modificada son comparadas con los datos ios que se obtengan en este nuevo ciclo); esto puede llevar a futuras modifide conocimiento.

Fsotes* dq
Es
<1e

inxj$a:q*dlr*

cunCc las consecuencis


la hiptesis original ' ios cia-

nla
acto dad,
peo

proceso interactivo de aprendizaje puede visualizarse como un ciclo de .: -- . ,trrntacin (figural.)),en el cual las discrepancias entre los datos y las conH2, y de la verifica": - _-:: -is de la hiptesis fy'1, llevan a una hiptesis modificada

lcs nc estn de acuerdo, Por lo


que se inicia este Pr[eso Pare cambiar tal niptesis.

- -:-:.a.ademsdeconocimiento,seproduceunamodificacindelamodificacin ' :,- -.lis H.) y as sucesivamente.


l"= " e hist*rle d* qf*eft* d* KpffiritYl*nts Fisher en la :' r, estadstico de experimentos, desde su introduccin por RonaldA. -.:i * -::: nitad del siglo xx en Inglaterra, se ha utilizado para conseguir un aprendizaje
-- :

{es.

:::r.. El trabaio de Fisher

a travs de su

libro The Design of Experiments (1935),

i.lCaS a hee dice

Teoria, modelos, hiptesis, supuestos

decir,
eales ir. que
Realidad, hechos, fenmenos, datos

Figura

l.l

Proceso interactivo de la experimentacin

CepT{.tS

de exp*rinrentr:s intrr:di-ccn a!'-lis*o

lnduccin

*--+

HiPtesis

modificada H,

Hiptesis

H'

Deduccin
----J>

-,-a=-)zzaaH,

o*:ni: . ' -:- .: -:"' :'tisacin agrcola'.t" con muestras :.-l -, ,, .: ::,-:,-:-,:-' exPerimentos de tot .:se dio "titados - | - t'-tt' = :-:> : Fi:her -:;--: :: : ':radica en que este investigador ' ' ::;:: -: :l' = *: aniisis : el :":: -::- " -: : -tr' : --''-_-.,=:=",ipr"pot.ion -'- t'"f t'i*tntos obstaculizaba disear -t " -:r --': :,-= mtodos para ,-..r, :: ,-t.;1:';::-;:--:_-_ factores. ;: .. :-r*-,:-; _-_' t .=- - -..ara in-rulranea de varios

mtodos (ahora

;'Sil:'::-! : -i-''-':-:: fUerOn enCabeZadOS i)ipiiIl,illi'-: . -= --:- ."O-.,',antOS - '" -:- ll'-:pc's:ali'];;s la indus,o, ,1esarr.',l1os :urante och o aos en t'::]'' tlaba quien "ttit'ir;'-' s'ue, cie de respuestas nor George E' P' eor' desanoll.ila mt,j..is,'. "i: 1, r'grurJlu iria qumica.n

jn1':;ffi ;{U**:fi iX:';'Ti:ilt, ;;;;,,."r::*?j;* frecuente' la exPerrm

tegia Para u n".'u*'enta de aplicacin se convirti apli1970' o. "n ei diseo Hasta la caa de "r"t"if"' "^p".r-"ni", V 'a ar"uJ"-i*"riigu"iOn tu, pero slo

"n cacinanivelptuntuopfocesosdemanufacturanoestabageneralizada,debidoala faltadefecufsoscomputacionales.yaquelosingenierosyespecialistasenmanufacy, a apli c ac i n i* ilf; "j,T:X :".l1"tTen,o japonesa' El ;;;;;1J;i:":jndustria debido Ishikawa' promovlo "l del diseo o' "'p"'il*os gures ?"rnt"9 : calidad' la movimiento por f:t el Jiseo de experimentos demostr su "n:19"1d: donde "t calidad, producel uso de la estadr;i;;.; para disear mejor los

ffi

*:::*;t?
para;;il

:l;i.lff fi, i
d.;;;;"

utilidad ranto

problemas
desmca

"t,r"O"r" tos y los procesos.;;;;;; tu,,'uin tuvieron;#;;" sobre diseo pJt la calidad 'ouu' ,"rprr"rr" *;;iJi"tt" "l mundo occidental. o*o

cuyos conceptos U" Genichi Taguchi' en el significativo en la academia prode y la mejora

como

en los ltimos veinte cesos,iasindustriasempezafonaentrenarasusingeniefosenlaaplicacindeldisejL * como materla "*ttoio;.rnctuso' o de experr-"rr"r. "ontir,,iu el diseo de experimentos t'un aos, 1as oniu""liluJ"' "t"o'porado de las ingenieras' en la mayora obligatoria u on"'i'*u

effi e Se$m*ess?es b*sea$

diseo de exPerrsqentms
EIdiseodeexperne,l/oseslaaplicacindelmtodocientficopafagenerarconocimientoacercadeunsistemaopfoceso'n",'.'"u'"depruebasplaneadasadecuadamente.Estametodoioglu,"t'aloconsolidandocomounconjuntodetcnicas

Definiciones bsicas en el diseo de

experl-:-::

:: .' - :r-,'ilS ' de ingeniea, que permiten entender mejor situaciones compiejas at -: --.- r causa-efecto.

ir:erimento
--

. t.:ritnento es Ltn cambio en las condiciones de operacin de un sistema o pro-: !.. que se hace con el ob.jetivo de medir el efecto del cambio sobre una o varias :: :-:dades del producto o resultado. Asimismo, el experimento permite aumentar . :::ocimiento acerca del sistema. Por ejemplo, en un proceso qumico se pueden

lr
Experimer::
fJ u ,a - n< a: - _:_: _

l1l3 O Di..l l=: , - -:

:: . ::i diferentes temperaturas y presiones, y medir el cambio observado en el rendi-: -:,r (.vield, ppm, defectivo) del proceso. Al analizar los efectos (datos) se obtiene
-. -:imiento acerca del proceso qumico, lo cual permite mejorar su desempeo.

ei a!:jetirio a=
a

'' -

lti'

:-__-,1-:^ d: ! ii-'i( ) -^_

propieclade: de
sr-rltcic.

:--:,

"

- nidad exp*rrfiental * .n,idad experimental es la pieza(s) o muestra(s)


:

ffim
que se iliza para generar un
[Jnldad experinrental
nruesire(s) que se ulrltza S:ara gene rr un vlor qr* sra repres*ntativo rlel re:ulteda de !a prlleba. Piezals)

:,r que sea representativo del resultado del experimento o prueba. En cada diseo

:rperimentos es importante definir de manera cuidadosa la unidad experimental, ; !3 sta puede ser una pieza o muestra de una sustancia o un conjunto de piezas :::,.Jucidas, dependiendo del proceso que se estudia. Por ejemplo, si se quiere inves,.:r alternativas para reducir el porcentaje de piezas defectuosas, en un proceso que ::-'duce muchas piezas en un lapso corto de tiempo, es claro que no sera muy con.."rle que la unidad experimental fuera una sola pieza, en la cual se vea si en una - - r,licin experimental estaba defectuosa o no. Aqu, la unidad experimental ser
t.a

:.

- ::ta cantidad de piezas que se producen en las mismas condiciones experimentales, .l irnal se analizarcuntas de ellas estn defectuosas y cuntas no.
,

ariabNes,

fadores y niveles

)n
E1

::

i
SU

to'lo proceso intervienen distintos tipos de variables o factores como los que se :-- i.slran en la figura I .3, donde tambin se aprecian algunas interrogantes al planear :, erperimento.

lc:OS

ffi
Variable de resp*esta
A lravs de esta{s) varirble(s)

e1

rosente

Variable(s) de respuesta. A travs de esta(s) variable(s) se conoce el efecto o los ::sultados de cada prueba experimental (vase figura 1.3), por 1o que pueden ser -.:actersticas de la calidad de un producto y/o variables que miden el desempeo de
Entrada
Factores
conlTotaDtes

!s cilre el efecio t: lr:: resu


iaias dc c;Ca pruel:; experrne nt1"

Salida

:ria

***'*_r>

Factores no

Proceso
-*_-*---ts

Caractersticas de calioaci o variables de


resPUesta
tteCLOs -f

controlables

\,du5d5

_----_--}}

*_--_-+b

iCules caractersticas de calidad se van a medir? iCules factores controlables deben incluirse en el experimento?
ZQu niveles debe utilizar cada factor?

lnocuacas

iCul diseo experimental es el adecuado?

Figura 1.5 Variables de un proceso y preguntas a responder al disear un experimento.

r
I
CAPTULO

lntroduccin al diseo de experimentos

un proceso. El objetivo de muchos estudios experimentales es encontrar ia forma de mejorar lar s I variable(s) de respuesta. Por lo general. estas \ ariables se denotan con la letra 1.
Fatores controlables
>On
Caf

Fares cottolables.
:

Son variables de proceso o caracterstica: de 1os materiales

.':: =: -::--:=ir=-^-^: :t^:a-:--j

Af.:--i -:-- l= l: -:.:-:


:-

i:

y n:

que se Pueten njar


dado.

er u. - . -

erp'enmentde> que se pueden fijar en un nivel dado. Algunos de stos son 1os que usul-filene :e ;ontrolan durante la operacin normal del proceso rr'ase frgura 1.3), :e snrgeri Frrque. para cada uno de ellos, existe la manera o el men--anismo para crrntiii" :r;ry;lo su nir el de operacin. Esto ltimo es lo que hace posible que se pueda erFer-:rri: can l1as. Por ejemplo, si en el proceso se usa agua a 60"C entonces detre -rs:;i ncnismo que permita fijar la temperarura del asua dentro de
un rango

Jr

trolan

:*--o'n"

r:tri\i fo "rgr:.Jin. r-elocidad, presin, etc. A los factc'res '-ontrolables tarnt'iu:e h -''tr. ',r;riihles de entrada, condiciones de proceso-variables de direactil-1f,-

=rFi";rrrr-

';5:mr*--.i1. -{lgunos f'actores o caractersticas que generelrnente se conriempn de residencia, cantidad de cierto reactir-o. tipo de

I*
Factores no controlables

-irr- -:a;r;F/Tq1-. ;.- mr-eso. las ,r de un proceso o simplemente"focori.

Fadrc

-den con'.rolar C.a..: : =,-:' :. ; , rrLg"LUUicl-=4" ^^ -, - - -:


aot rla:a'

Son variables que nc

Si I

1 n:*"trx

o de ruido. Son variables o caractestica-i de materiales rhl :e pueden controlar durante el experimento o la operacin normal ,:*- r-.-ceo. Por e_jemplo. algunos factores que suelen ser no controlables son las ""'e:-L"l* :rmtlirnrales (luz, humedad, temperatura, partculas. ruido. etc. l. el animo
{t".r

n crlroltes

fu

tl:

la calidad del material que se recibe del proleedor t interno o exes no controlable puede convertirse en controloble ctana e ,-renta con el mecanismo o la tecnologa para ello.
l':nr'

""pteraJores.

Ln factor que ahora

Fadures esdiados. Son las variables que se investigan en el experimento, resFwtrl de cmo influyen o afectan a la(s) variable(s) de respuesta. Los factores estudiair--'s pueden ser controlables o no controlables, a estos ltimos quiz fue posible y
de iters controlarlos durante el experimento. Para que un factor pueda ser estudiado es necesario que durante el experimento se haya probado en, al menos, dos niveles o condiciones.

En principio, cualquier factor, sea controlable o no, puede tener alguna influencia en la variable de respuesta que se refleja en su media o en su variabilidad. Para fines de un diseo de experimentos deben seleccionarse los factores que se considera. por conocimiento del objeto de estudio, que pueden tener efecto sobre la respues-

ta de inters. Obviamente, si se decide o interesa estudiar el efecto de un factor no controlable, parte de la problemtica a superar durante el diseo es ver la manera en que se controlar durante el experimento tal factor.

Niveles y tratamientos. Los diferentes valores que se asignan a cada factor estudiado en un diseo experimental se llaman niveles. Una combinacin de niveles de todos los factores estudiados se llama tratamiento o punto de dse.o. Por ejemplo, si en un erperimento se estudia la influencia de la velocidad y la temperatura, y se de.::i :robar cada una en dos niveles, entonces cada combinacin de niveles (veloci-.'.r" ::::Frrurar es un tratamiento. En este caso habra cuatro tratamientos, como : :L"f: r .. -b1r 1.1. Es necesario probar cada tratamiento y obtener el corres;mUinr''rie ", 1;{lf ;
-,

Definiciones bsicas en el disec de exDerinrenr,:,.

Tabla

l.l

Puntos de diseo o tratamientos.

l:
"

.,: : '::

"cuerdo

con estas definiciones, en el caso de experimentar con un solo fac-

nir.e1 es un tratamiento.

i-

e
:S

E*rw aleatorio y erfor experimental, Siempre que se realiza un estudio experit*,rr -'-. :arte de la variabilidad observada en la respuesta no se podr explicar por los
'i.r.-.
-

:-!

esrudiados. Esto es, siempre habr un remanente de variabilidad que se debe

t-

ES

ral
las

natural del proceso. Esta ..:-,idad constituye el llamado error aleatorio. Por ejemplo, ser parte de este :'- - ''-atorio el pequeo efecto que tienen los factores que no se estudiaron, siem:r: , ::ando se mantenga pequeo o despreciable, as como la variabilidad de las :':-;-rnes hechas bajo las mismas condiciones. Sin embargo, el emor aleatorio

-r ::i comunes o aleatorias, que generan la variabilidad

ffi
Frrsr atr*ntorio

[s

la vribiliCaei obsenaile

que nc :e pueCe expiicar por los fctores estL.:diadas; resrlta


.lpl r)or:,,

no 3\an-

--:.:r absorber todos los errores que el experimentador comete durante los expe* -:.:. -',:. y si stos son graves, ms que error aleatorio hablaremos de error experiii,ir - --, . De predominar ste,

to:.ei :r

, 'r cla,l,r:^ In. ,. .)t--^.-.. ^-, ejt.i L:os y' )- ar"li-

expenmenial.

la deteccin de cules de

1os factores estudiados tienen

r.i ---;:o real

sobre la respuesta ser

difcil, si no

es que imposible.

ffifr_
a$3
,.

res-

sturie y

,Juando se corre un diseo experimental es importante que la variabilidad obu* -; de la respuesta se deba principalmente a los factores estudiados y en menor n--i al eror aleatorio, y adems que este enor sea efectivamente aleatorio. Cuan- , :,J.\'or parte de la variabilidad observada se debe a factores no estudiados o a r.n -:rlr no aleatorio, no se podr distinguir cul es el verdadero efecto que tienen los

Error experirnenta
f, 'rr,,r:rl-:l,rr.n (I ,, \L"PUrCrr!Ur. ',.'r;, r' r,:,r,1,.1 art,Jr':

:ft.r'?> ll gvPt' rin*nfccr en la p!*neacin y ejecL:cin del experiment

:U': :ellci,

lr..'..

.dia-

r'euenPara sidepues-

Factores de diseo (fciles de controlar):


Tiempo de ciclo, presin del molde, velocidad de tornillo, temperatura, tiempo de curado, contenido de humedad

x1 x2...

ttt sf

xk

or no
:ra en ','.ieria

prima

Yt Y2
Proceso

Yk

Caractersticas de calidad:

+ + f
: estu:les de
Lplo, si se de-

encogimiento, dureza, color, costoltextura

), ),...)o
. Parmetros de calidad del proveedor . Qumica del plstico . Otras variables del proceso . Variables ambientales
Figura 1.4
Factores de ruido (difciles de controlar):

veloci. como
COITES.

Factores y variables en la fabricacin de un envase de plstico.

/
t0
eApiTUf,-

lntrndu*cin ni *iiseo *l* *xperim*ntr:s

factores estudiados, con 1o que el experimento no alcanzara su objetivo principal. De aqu la importancia de no dejar variar libremente a ningn factor que pueda influir de manera significativa sobre el comportamiento de la respuesra (principio de bloqueo).

Kjemp$m, .!
En la figura 1.4 se muestran algunas de las variables que intervienen en e1 proceso de fabricacin de un envase de plstico. El problema general es encontrar 1as condiciones de operacin de los factores controlables, que dan por resultado valores ptimos de 1as caractersticas de calidad ah listadas. Tambin podra se r de inters investigar el efecto de factores no controlables, buscando lograr un proceso insensible (robusto) a su posible efecto. Supongamos que slo intereie 1 dureza de la pieza de plstico resultante. Algunas preguntas que se pueden resprlder con un

diseo experimental son: cules factores afectan la dureza de1 p1srr,-rl. cmo es que la afectan?, o bien, qu relacin hay entre los factores cnrr,t,ltbles y la drreza?; existen otras condiciones de operacin, distintas a 1as r;,s que mejoran la durezaf Estas preguntas se responden probando diferentes .-,:,n,L,inaciones en ios niveles de los factores controlables, seleccionadas de nln-:; :.decuada. Esto ltimo significa escoger el diseo experimental ms adecuad.. l problema, que en este caso parece ser un diseo factorial completo o fraccion:,- ,-aptulos

5,6y8).

Hapms ss eN dtsmffi*

d* *xBwrmentos

I
Matriz Ce dise*

:, - . -'-. ':'.':ir,; pr ic: .-:-:-- : . : -,:.ernlcrriljo:,

Un aspecto fundamental del diseo de experimentos es decidir;u.i:. :,-i:bas o tratamientos se van arealizat y cuntas repeticiones de cada uno !- i.i-::;r-r. de manera que se obtenga la mxima informacin al mnimo costc r,sibte. El arreglo formado por los diferentes tratamientos que sern corridos, inclu,. endo las repeticiones, recibe el nombre de matriz de diseo o slo diseo. Para que un estudio experimental sea exitoso es necesario re:hzar. por etapas, diferentes actividades. En este sentido, la etapa ms impor-tante \ : ia que se le debe dedicar mayor tiempo esla planeacin (vase captulo 10). A c.rr:rnucin se describen de manera breve las etapas del diseo de experimentos con obiero de dar una visin global de lo que implica su correcta aplicacin. Vanos J{,rt-rcepros que se mencionan en estas etapas se definen con detalle en los siguientes rapirulos,

Planeacin

3,:l
-,:i

aCilt',:"

: ri llu:' . 'l--C

C= '' o:'-

--. =-:.'l
-

ifde ,
,,t

?'c

Planesei*n y

\-,rtbles

,rnrCj.,_-.. ,-'.:...,) expetimentai.

L .. : dr lc: tral-a:icn ----.i:


r)r1(

-:.

de --.-: _:.

remiuae[r't 1. Entender y delimitar el problema u obieto de estudio. En la etapa

de

planeacin se deben hacer investigaciones preliminares que conduzcan a entender y delimitar el problema u objeto de estudio. de tal forma que quede claro qu se va a estudiar, por qu es importante r. si es un probrema, cul es la magnitud del mismo.

2. Elegir la(s) variable(s) de respuesta que ser medida en cada punto


del diseo y verificar que se mide de manera confiable. La eleccin de esta(s) variable(es) es vital, ya que en ella se refleja el resultado de Ias pruebas. Por ello, se deben elegir aquellas que mejor reflejen el problema o que caractericen al objeto de estudio. Adems, se debe tener confianza en

Etapas en el dise=c

:= :'::-

-:-'::

tt

1as mediciones que se obtengan sobre esas variables sean cont-iables. E: 'ruas palabras. se debe garanlizar que los instrumentos y/o mtodos de miicin son capaces de repetir y reproducir una medicin, que tienen la pre"'rsin (error) y exactitud (calibracin) necesaria. Recordemos que los siste;nas de medicin son la forma en la que percibimos la realidad, por lo que si stos son deficientes, las decisiones que se tomen con base en ellos pueden

;ue

ser inadecuadas.

-:

Determinar cules factores deben estudiarse o investigarse, de acuerdo a la supuesta influencia que tienen sobre la respuesta. No se trata de que el experimentador tenga que saber a priori cules factores influyen, puesto que precisamente para eso es el experimento, pero s de que utilice toda la informacin disponible para incluir aquellos que se considera que tienen un
mayor efecto.

Seleccionar los niveles de cada factor, as como el diseo experimen-

tal adecuado a los factores que se tienen y al objetivo del experimento. Este paso tambin implica determinar cuntas repeticiones se harn para cada tratamiento, tomando'en cuenta el tiempo, el costo y la

precisin deseada.

Planear y organizar el trabajo experimental. Con base en el diseo seleccionado, organizar y planear con detalle el trabajo experimental, por ejemplo, las personas que van a intervenir, la forma operativa en que se harn las cosas, etc. (vase captulo 10). Realizar el experimento. Seguir al pie de la letra el plan previsto en la etapa anterior, y en caso de algn imprevisto, determinar a qu persona se le reportara y lo que se hara.

\-lisis
:-: : ' -: etapa no se debe perder de vista que los resultados experimentales son obser- ',. ,i ntuestrales, no poblacionales. Por ello, se debe recurir a mtodos estads:; , :iferenciales para ver si las diferencias o efectos muestrales (experimentales) - -ruficientemente grandes para que garanticen diferencias poblacionales (o a 1 :. :ioceso). La tcnica estadstica central en el anlisis de los experimentos es el ;-.:i"r anlisis de varianzaANOVA (acrnimo en ingls).

-:erPretacln
de
lt d

r---. Jon el respaldo del anlisis estadstico formal, se debe analizar con detalle lo -i-: :.: pasado en el experimento, desde contrastar las conjeturas iniciales con 1os

ede
:u1

;'

.: ,-,:.ios del experimento, hasta observar los nuevos aprendizajes que sobre e 1 pr.r,.: , :3 lo_eraron, verificar supuestos y elegir el tratamiento _uanador. siernpr::..n

- : de las pruebas estadsticas.

into
:rn : las

lntrol y e$nc$ilssnes finnles


se recomienda decidir qu medidas implemengeneralizar ::::1 el resultado del estudio y para garantizar que las mejoras se : ;:.-::gan. Adems. es preciso organizar una presentacin para difundir los logros.

:r-. :ncluir e1 estudio experimental


.r.:

nao aen

l2

CAPiTUL

li:tir:Jucin al ijisee t** experimentr'i:;

tmnsideracioles Ptrl&$A&&$ Pwbsm el uso de mr&t*dms estmdstems


Enadicinalodichoenlaseccinanteriot,esimportantetomalencuentaqueaunms eficiente el po' 1o.genl*t metodologas estadstica'
que el uso de

"tt1i^11::erreconocer que las sotucin de problemas, es necesario pfoceso de investtgac y o" por ello no garant\zaninvestigaciones exitosas' rnetodologas estadsticas por s solas es ir\portante considetar \os sigrentes punttls"
utilizar los mtodos estadsticos en El conocimiento no estadstico es vital. Para en primer lugar se requiere que general y los diseos de experimentos en particulat, tcnico y prctico sobre el el experimentador r"ngu un buen nivel de conocimiento que pueda vislumbrar con cierta facifenmeno o proceso q*ue estudia, de tal for:rna y seacapaz de plantear conjeturas lidad cules son los urp.oro* clave del fenmeno variables de respuesta y los posiprecisas, vislumbrar'eitipo de relaciones entre las mejor los factores y sus nibles factores a estudiar. Todo esto ayudar a seleccionar ese conocimiento permitir veles, as como el diseo que es mejor aplicar. Adems' los resultados y obtener conclusiosacaile un provecho real al anlisis estadstico de
nes que generen aprendizaje

y soluciones'

e impoancia prc' Reconocer la diferencia entre significancia estadstica tratamientos son ditica. En ocasiones, un experimentador puede concluir que dos aunque sean significativas' no ferentes estadsticamente, pero que tales diferencias, prctica sea importante' necesariamente representan una diferencia que en la
que a un experimento nico Apostarle ms a la experimentacin secuencial en una sola y definitivo. En ocasines, los experimentadores novatos pretenden

sobre un proceso o fenfase de experimentacin contestar todas sus interrogantes experimentos muy extensos que meno en particular. Sin embargo, esto puede llevar a generacin de resultados' Por ello consuman demasiados recufsos y que retarden la diferentes fases de experimentacin en es importante considerar como alternativas a una mayor precisin en los forma secuencial, en las cuales se alcance paulatinamente

conocimientos Y soluciones' con la experimentaEs importante no confundir la experimentacin secuencial frente a mover un cin a prueba y effof (vase seccin "Experimentacin factorial en cada fase sigue una factor a lavez" del captulo 5).La experimentacin secuencial cada fase se obtienen resultados y estrategia bien definia y pensada; por 1o tanto, en y conocimiento ms reficonclusiones importantes que permiten generar soluciones

nadoparaplanteardemejormanelalasiguientefasedeexperimentacin.

Frincipios bsieos
observables y repetibles' Por El diseo de experimentos trata de fenmenos que son observabilidad y repetibililo tanto, sin el pensamiento estadstico, los conceptos de cosa observada se aprecia con dad son inherentemente contradictorios. cualquier dos veces, incluso las mevariabilidad; nada ocune exactamente de la misma forma

t5

., ni -:
!r' 'r -*r

:-:rrrrl e\ento varan. Entonces,

eun-

ite el
ie
1as

r ello

observacin sea repetible?, qu repeticin es realmente un :i:'-" -:: - 'r resuitado es el mismo o difiere, es confirmacin o contradiccrn : n., pueden ser contestadas de manera coherente sin el pensamientc, : : :1ernplo, alguien da una nueva receta de chocolate, dice que no falla. -: r: ,, no sale, mientras que el segundo y tercer intento s funcionan. La - :,:robada completamente? (Los chocolates tienen ms de 800 ingre-: -rles que pueden ser separados.) - : ,--;:.ir con lo anterior, se debe ser muy cuidadoso en la planeacin y el -. - . : rerimento. El punto de partida para una correcta planeacin es apli.

-J - -: *::

qu se quiere deci cuandcr

,; a-:..: -

)os en :e que

bre el

; :
:

:r,-,:s bsicos

: : l:.les tienen que ver directamente

del diseo de experimentos: aleatoizacin, repeticin y con que los datos obtenidos sean
es decir, la validez del anlisis de los

facieturas

:r

, , ..::nder a las preguntas planteadas, '.: .n estos principios.

ffi
,i1 !

'

posi-

nirmitir
sus

clusio-

ftffihcin. Consiste en hacer las corridas experimentales en orden aleatorio . -. ^ : :, material tambin seleccionado aleatoriamente. Este principio aumen- . :',:.-.,jad de que el supuesto de independencia de los errores se cumpla, lo .., r -- ,-:-uisito parala validez de las pruebas de estadsticas que se realizan. .r' :- :: -rii manera de asegurar que las pequeas diferencias provocadas por
". r'* -- :
.

c:et* r

;r,:

{:-ul:

Cclsistr: en hcer rrl'ls


.n1 ,1/,i . r nr,icr rrt.'1.. lC arr i'l 'it,./.:.l

Ex!)-

: -: ':-_C

rir: {al ezi'r); esle princrpil :. . I ian r: r.: -:, .1.-

el c,UpJi\ir.
:- i--- -.,. rr'. 't)\ it;ii'r!\

j:

'i5,,rJ.

, 1,,c

in,.lq .r,

.,lt

,,. c

I Pfcson di.\'as, no

r ;J.]lpo 1, todos los factores no controlados, se repartan de manera homo'l;. :- . :,-,s 1os tratamientos. Por ejemplo, una evidencia de incumplimiento o

.-t ,-,_I.tll'j.

-:

:ste principio se manifiesta cuando el resultado obtenido en una prueba -,-,::nciado por la prueba inmediata anterior.

ffi
1!:.i,1

s nico rna sola o fenlsos que Por ello ecin en n en los :rimentarlover un una 'igue ultados Y
ms

nwrd[csrt Es coner ms de una vez un tratamiento o una combinacin de factores. I :*'- '.. .. -, .-onfundir este principio con medir varias veces e1 mismo resultado expe-

i: *-*
lrl,',

r.:. i'.

t'
!l!_

-.-,-, - lnr)\llPr';.r1F

! =::tr

es volver a realizar un tratamiento, pero no inmediatamente despus

;:.ll-.ic'.i:C o t.c.':l-'.f :,i,1

.::-do ei mismo tratamiento, sino cuando corresponda de acuerdo con la alea. i repeticiones permiten distinguir mejor qu parle de 1a variabilidad total -,r *-, - . .; debe al eror aleatorio y cul a los factores. Cuando no se hacen repeti' : - .r:'" rrsflera de estimar la variabilidad natural o el enor aleatorio, y esto difi-

- :..-ruccin

de estadsticas realistas en el anlisis de los datos.

refi-

bles. Por

repetibiliecia con
iso las me-

Mlrryceo. J,:,nsiste en nulificar o tomar en cuenta, en forma adecuada, todos los fac- i,3ir.,,r;,,:,::, : - -: :*dan afectar la respuesta observada. Al bloquear, se supone que el sub- l*;,'r'riif: . r - -'. :: Jatos que se obtengan dentro de cada bloque (nivel particular del factor ...'" " -:-- . lebe resultar ms homogneo que el conjunto total de datos. Por ejem- ,.rr . =. ,: ---.,erert comparar cuatro mquinas, es importante tomar en cuenta ai opel ,.,- - ,: '. :rrquinas. en especial si se cree que la habilidad y los conocimientos de1 r r -, : : *ien influir en el resultado. IJna posible estrategia de bloqueo del facr,:--:r-:. sera que un mismo operador rcalizata todas las pruebas del experir- :: - :. posible estrategia de bloqueo sera experimentar con cuatro operadores , -r,.: :.-.J-,*s). donde cada uno de ellos prueba en orden aleatorio las cuatro m,,. --' .,. ,'si- segundo caso, la comparacin de las mquinas quizs es ms real. .* :.-'j,-,r es un bloque porque se espera que las mediciones del mrsmo ope-

...- ".:: :-,"> parecidas entre s que las mediciones

de varios operadores.

l4

CAPiTI",LS

tntroduerin *l dise* ri* *x:erimentr-:s

Los principios bsicos se entendern mejor en la medida en que se estudien los ejemplos de los captulos siguientes. En particular, en la seccin "Poblaciones pareadas" del captulo 2, se presentan los experimentos ms simples donde la aplicacin
de estos principios es evidente.

C$mmftemsfinn

y $**ce*m de

ss dseffims *xp*trfiffiem*mHes
Existen muchos diseos experimentales para estudiar la gran diversidad de problemas o situaciones que ocurren en la prctica. Esta cantidad de diseos hace necesario saber cmo elegir el ms adecuado para una situacin dada y, por ende, es preciso conocer cmo es que se clasifican los diseos de acuerdo con su objetivo y
su alcance.

Los cinco aspectos que ms influyen en la seleccin de un diseo experimental, en el sentido de que cuando cambian por 1o general nos llevan a cambtar de diseo, son:

1. El objetivo del experimento. 2. El nmero de factores a estudiar. 3. El nmero de niveles que se prueban en cada factor.

4. Los efectos que interesa investigar (relacin factores-respuesta). 5. El costo dei experimento, tiempo y precisin deseada.
Estos cinco puntos no son independientes entre s, pero es importante sealarlos de manera separada, ya que al cambiar cualquiera de ellos generalmente cambia el diseo experimental a utilizar (vase captulo 10). Con base en algunos de estos cinco puntos es posible clasificar los diseos como lo hacemos a continuacin, El objetivo del experimento se utiliza como un criterio general de clasllicacin de los diseos experimentales, mientras que los otros cuatro puntos son tiles para subclasificarlos. En este sentido, de acuerdo con su objetivo y sin pretender ser exhaustivos, los diseos se pueden clasificar como:

1. Diseos para comparar dos o ms tratamientos.

2. Diseos 3. Diseos 4. Diseos 5. Diseos


lables.

para estudiar el efecto de varios factores sobre la(s ) respuesta(s). para determinar el punto ptimo de operacin del proceso. para la optimizacin de una mezcla.

para hacer el producto o proceso insensible a factores no contro-

En la figura 1.5 se muestra la clasificacin general de los diseos experimentales de acuerdo con su objetivo. Dentro de cada rama se pueden clasihcar de acuerdo al nmero de factores, al tipo de efectos que se pretende estudiar y segn las restricciones existentes. En la misma figura se listan los diseos particulares ms representativos de cada rama. Ntese que los diseos factoriales completos y fraccionados ocupan ms de un lugar en la figura 1.5; la razn es que estos diseos son eficaces en diversas situacio-

Preguntas y ejercicrcs

t5

l.

Diseos para comparar dos o ms tratamientos

Diseo completamente al azar Diseo de bloques completos al azar Diseo de cuadros latino y grecolatino Diseos factoriales 2k Diseos factoriales 3k Diseos factoriales fraccionados Diseos para el modelo

2. Diseos para estudiar el


efecto de varios factores sobre una o ms variables de respuesta

2k

-p
p

3. Diseos para la optimizacin


de procesos

de primer orden

{
I

Oisenos factoriales 2k y 2k Oiseno de Plakett-Burman

Diseo simplex de composicin central Diseo de Box-Behnken Oisenos factoriales 3k y 3k - p

Diseos para el modelo de segundo orden

I uiseno I

4. Diseos robustos

j
I J

Rrreglos orlogonales (diseos factoriales) Diseo con arreglos interno y ederno

l' liseno simplex-reticular


5. Diseos de mezclas

I Diseo con restricciones t^.


L Urseno axral

Diseo simplex con centroide

Figura 1,5 Clasificacin de los diseos experimentales.

nes prcticas. De hecho, varios de los otros diseos que se mencionan en esta figura son casos particulares o generalizaciones de los diseos factoriales. En los siguientes

captulos se vern con detalle prcticamente todos estos diseos.

1.

Explique las ventajas que tiene el diseo de experimentos sobre una estrategia de prueba y error. ZQu es un experimento y qu es disear un experimento? En el contexto de un diseo de experimentos, iqu es una variable de respuesta?, iqu

2.
3.

es un factor estudiado? y zqu relacin se esperara que haya entre la variable y los
factores?

tEn un experimento slo es posible estudiar los factores que actualmente se controlan en la operacin normal del proceso? iEs posible estudiar cmo influye un factor sobre la varable de respuesta, si el factor se mantiene fijo en todas las corridas o pruebas experimentales? Explique.
Se tiene un experimento en el que los factores a estudiar y sus niveles son los siguientes: temperatura (10, 20 y 30"C); tiempo (60 y 90 minutos). Elabore una lista de todos los posibles tratamientos de este diseo.

a1o L-

7. 8.

iQu es el error aleatorio y qu es el error experimental?


iPor qu es importante aleatorizar el orden en que se corren los diferentes tratamientos en un diseo de experimentos?
Seale las etapas en el diseo de un experimento, as como algunos aspectos clave de cada una de bllas.

rfl-

un io-

r
t6
CAPTULO

lntroduccin al diseo de experimentos

10.

cPor qu se considera la planeacin del experimento como la etapa ms importante? Describa cinco actividades que se realizan en esta etapa. Describa de manera breve los tres principios bsicos del diseo de experimentos. Explique la diferencia entre significancia prctica y significancia estadstica. Proponga un

I t.
12.

ejemplo donde se tenga Ia segunda pero no la primera.


13. Describa cinco aspectos que son relevantes al momento de seleccionar el diseo experimental. 14. Mencione dos problemas en su rea de trabajo que pudieran abordarse con el diseo de experimentos. Para cada problema enliste algunos factores de control y al menos una variable de respuesta.
15.

Suponga que se quiere estudiar el desempeo de un automvil, y lo que se desea es encontrar los factores que ms influyen en su rendimiento. iCules podran ser las variables de respuesta?, icules los factores a estudiar?, Zcules los factores no controlables o de ruido?

16.

quiere comparar el desgaste de dos marcas de llantas A y B, para lo cual se eligen al azar I 0 conductores particulares de cierta ciudad. A cinco de ellos, seleccionado s al azar, se les instalan gratis las llantas marca A y a los cinco restantes la marca B, con el compromiso por escrito de permitir la verificacin del desgaste cada seis meses. o) ZCree que este experimento permita una comparacin justa del ciesgaste de las dos
Se

marcas de llantas?

b) c)
17.

iQu consideraciones se debieron hacer para lograr una comparacin ms justa?


Proponga al menos un cambio al experimento que usted considera que mejorara la comparacin.

Una compaa farmacutica realiz un experimento para comprobar los tiempos promedio (en das), que son necesarios para que una persona se recupere de los efectos y las complicaciones que siguen a un resfriado comn. En este experimento se compararon a personas que tomaron distintas dosis diarias de vitamina C. Para hacer el experimento se contact a un nmero determinado de personas, que en cuanto les daba el

resfriado empezaban a recibir algn tipo de dosis. Si la edad de las personas es una posible fuente de variabilidad, explique con detalle cmo aplicara la idea de bloqueo para controlar tal fuente de variabilidad.

t8. En el caso anterior, cqu podra pasar si no se controla la posible fuente de variacin
que es la edad? r9.
Un grupo de investigadores trabaja para industrializar la mermelada de tuna; para ello, realizan mermeladas considerando los siguientes factores: o) variedad de tuna: tres tipos, ) con cscara o sin cscara, c) completa o la pura pulpa. Por lo tanto, se tienen l2 posibles formas (tratamientos) de producir mermelada.
La pregunta central que se plantean es si influyen en el sabor los factores considerados, y quisieran encontrar cul es la mejor combinacin de mermelada (tratamien-

to ganador). Para responder hicieron las 12 combinaciones y pusieron cada una en un


recipiente numerado. Enseguida se trasladaban a lugares concurridos donde acomodaban los recipientes ordenados del 1 al 12, y a personas del pblico les entregaban una hoja de registro y la invitaban a que en el orden dado probaran en pequeas porciones las mermeladas y anotaran qu tan buena les pareca la mermelada (en una calificacin entre 0 a I 0). Al final se tuvo la respuesta de 42o personas, donde cada una daba I 2 calificaciones (una para cada mermelada). iHay algo que desde su punto de vista invalide los resultados obtenidos? Utilice el sentido comn y argumente su respuesta.

ffmffig*s

re

ffi$mm*m*s
msad{sgsm

** Kefuffim*a

: ffiKp*rmmse*m E

##s? asrkffi y
f"r, e
,

d*s ffimKmm*sltcs
l
Hiptesis para dos medias: comparacin de dos tratamientos Prueba para la igualdad de varianzas

3t.lgt3ffi3T#
,
...'
Poblacin y muestra, parmetros y Distribuciones de probabilidad e

estadsticos

intervalo Conceptos bsicos de prueba de hiptesis .rii: Planteamiento de una hiptesis estadsticu
,r,::. Estimacin puntuai y por

inferencia

P"bh.b*r fr"adas (comparacin de dos medias con muestras dependientes)

:l::
:rr

Prueba_para la media Prueba para la varianza


Tres criterios de rechazo o aceptacin

ti Resumen de frmulas para procedimientos


prueba de hiptesis

de

equivalentes

Uso de un software estadstico

ffihj mv*E d*
ffi ffi ffi ffi ffi

ffiptr*Kadxmj

ldentificar los elementos de la inferencia estadstica y su importancia en los diseos experinnentales.


Explicar el papel de las distribuciones de probabilidad en

la inferencia estadstica, ascomo la estimacin puntual y por interualo.

Describir las pruebas para la media y la varianza, as como los conceptos bsicos de prueba de hiptesis" ldentificar las pruebas para la igualdad de varianzas. Distinguir las pruebas para comparar medias con muestras independientes y muestras pareadas.

Mapa conceptual

Elementos de inferencia estadstica

r
20
fiAPfTeJg"#

fil*n:*nt*s rI* inf*r*ne! estadstiia

{o*eepteis e*ave
"

ffimb$me*xa

Kffi

e$*stre, pev*??etrss

'

trror trpo Enor tipo

ll

. Estadstico

y *$*ed$s*cms
Una poblacin o universo es una coleccin o totalidad de posibles indirr::,is. especmenes, objetos o medidas de inters sobre los que se hace un estudiu- as poblaciones pueden ser finitas o infinitas. Siesfinita y pequea se pueden rni;- todos los individuos para tener un conocimiento "exacto" de las caractersticas : -;rmetros) de esa poblacin. Por ejemplo, un parmetro que podra ser de int;::. es la proporcin p de productos defectuosos, o la media, 2, de alguna variable ::-:dida a los productos. Si la poblacin es infinita o grande es imposible e incosteab,; medir a todos los individuos, en este caso se tendr que sacar una muesra repre ,.-.:ativa de dicha poblacin, y con base en las caractersticas medidas en la mues';: esto-

. Estadstico de prueba
" Estimador puntual 'Crados de libertad ' Hiptesis estadstica " lnferencia estadstica 'lnterualo de confianza . Muestras pareadas

'Orden completamente al azar


. Potencia de la prueba
" Regin de aceptacin , Regin de rechazo , Significancia obseruada " Significancia predefinida

ffi
P*futn{ic}m t$ltn Es aquella en la que se pueden medir"todos ics individuos para iener un cor'ucin ientn exfo de sus cracletsticas.

dsticos) se podrn hacer afirmaciones acerca de los parmetros de la p.,:ircin (figura 2.1). Con frecuencia, las poblaciones de inters son los materiales, los pr:drctos
terminados, partes o componentes, o algunos de los procesos. En muchos ca-'.-'s estas poblaciones se pueden suponer infinitas o grandes. Por ejemplo, en emprs>s con produccin en masa no siempre es posible medir cadapieza de material qu: iiega o las propiedades de cada producto terminado. Incluso, si la produccin no es :iasiva, conviene imaginar al proceso como una poblacin infinita o muy grande. ibido a
que el flujo del proceso no se detiene, es decir, no existe el ltimo artculo prucido mientras la empresa siga operando. En estos casos los procesos (poblaciones I se estudian mediante muestras de artculos extradas en algn punto del proceso

ffi.
Flar*$Tetr$s
CarcLeristicE que, mediante su r;alor nr-lrnrico, describen a .l^ Clirir:{rrl;(1r - a,"ljul'C -, ^;.,-+- CF ^1,,.-.,^r.. O

Un asunto importante ser lograr que las muestras sean representatilas. en el


sentido de que tengan los aspectos clave que se desean analizar en la poblacin. Una forma de lograr esa representatividad es disear de manera adecuada un rnuestreo aleatorio (azar), donde la seleccin no se haga con algn sesgo en una direccin que favorezca la inclusin de ciertos elementos en particular, sino que todos los etrementos de la poblacin tengan las mismas oportunidades de ser incluidos en 1a muestra. Existen varios mtodos de muestreo aleatorio, por ejemplo: el simple, el estratifica-

r-itiidltoc.

re r:
c
?

:be.:i** rf*r*it*

.::cila
e

L.n i.: (lL9 la pnbla

:-

s 3rrijs y cs impcsibie e

i-'t:,',:oble rrtedt, u Lodos io,


tndi,,,ra,.cs.

do, el muestreo sistemtico y por conglomerados; cada uno de ellos logra rnuestras representativas en funcin de los objetivos del estudio y de ciertas circunstancias y caractersticas particulares de la poblacin (vase Gutirrez Pulido, 200,5 r.

t r
f

cE_ ffi
ldiestra rcpresentativa
Ls una pafe <1e L:na pcblacin, .eiecc ion, l o,ler'..rdmen;e,

mfes'eneia estad stiea El objetivo de la inferencia estadstica es hacer afirmaciones vlidas


$

que cnslva los aspeclos clave de la poblacin"

ffi
i

;tfeie r.:i.; i:i,asis{qe

Son ls afirncisre: vlidas :cerca Ce la poblacin o proce-

-:
-J
-----,

b:e<is en la infomcin
-I ll -' i Ua ei :, l,, !;

ltlcitl.l.-

---!

acerca de la poblacin o proceso con base en la informacin contenida en una muestra. Estas afirmaciones tienen por objetivo coadyuvar en la toma de decisiones. La inferencia estadstica por lo general se divide en estimctcin y prueba de hiptesis. \ se apoya en cantidades o datos estadsticos calculados a parlir de las observaciones en la muestra. Un estadstico se define como cualquier funcin de los datos muestrales que no contiene parmetros desconocidos. Un ejemplo de estadstico es la media muestral i con la cual se tratan de hacer afirmaciones sobre ia media.,u, que es un parmetro poblacional. Un aspecto clave en la interpretacin y utilizacin de cualquier estadstico es que se trata de una variable aleatoria, ya que su valor depende de los elementos que

li

L It

l!
Poblacin (toda la produccin del mes)

t:? o:?

PARAMETROS

(siempre desconocidos)
ESTADSTICOS

(conocidos)

lnferencia

Figura2.lRelacinentrepoblacinymuestra,parmetrosyestadsticos.

una muestra a otra. La forma son seleccionados en la muestra y, por lo tanto, vara de de probabilidad de cada de tonnar en cuenta este hecho es conocer la distribucin de probabilidad estadstico. Como se ver ms adelante, al conocer la distribucin del parmetro el valor es del estadstico se podrn hacer estimaciones acerca de cul hiptesis o conpoblacional, y tambin ser posible probar o verificar la validez de puede proveedor un jeturas que se tengan sobre la poblacin o proceso. Por ejemplo,

Estnd{**eo Cualquier funcin de los datos muestrles que no ccntiene


pc:'n'

.trn:

Cesct,no-ldos.

afirmnqueelporcentajedesuproductoquenocumpleconespecificacioneses
se puede tomar como verdadera'

muestra, si esta afirmacin de 0.7Vo,por lo que interesara investigar, con base en una

Distr*huetoffies de Probabllidad e *mf*rem**e


X relaciona La distribucin de probabilidad o distribwcin de una variable aleatoria a cada asociada probabilidad el conjunto de valores posibles de X (rango de !, con la por medio de una funcin uno de estos valore, y io, representa a travs de una tabla o por el estaplanteada como una frmuia. Por ejemplo, sea la variabie aleatoria dada probabilidad podrestico media muestral, i, entonces al conocer su distribucin de probables' mos saber cules son los valores que puede tomar i y cules son ms X seaEn otras palabras, la distribucin de probabilidad de la media muestral De esta asumidos. la qu valores se espefa que tome , de acuerdo con los supuestos capricho, y forma, la distribucin de probabilidad hace que lo aleatorio no sea un con 1o que muestral, modela (describe, acota) los posibles valores de un estadstico realizacin especfica de un estadstico se pueden corroborar o rechaal observar una
E!$s*rbuem

de

prabablded ele X Relaciona el canjunto d* ';aloreE de X

ctn

la Probabilidad

socid can cada unc de e:tos veiores.

poblacionales. zaf supuestos (prueba de hiptesis), o bien, hacer estimaciones de confianza Las distribuciones de probabilidad que ms se usan en intervalos ji-cuadrada yF' y pruebas de hiptesis son las distribucion es'. normal, T de student, En la figura 2.2 se representan las formas tpicas de estas cuatro distribuciones' parmetros, que son La distribucin nornral est completamente definida por sus figura 2'2 se muestra la la media, lt, y ladesviacin estndar' d' Por ejemplo' en la

22

CAPTUIO

Efementos de inferencia estadstica

tI
bertd ryp,ren las di*ihrcres : *s.shrtr
Grados de
Son panfur:ex

ya"/se
los

ryTEr aprtr&

trdcr

=r:-ncs

-te**:s i'.d-

distribucin normal conlr - 0 y o = 1 , que se simboliza con N(0, 1) y se conoce como la distribucin normal estndar. En la figura 2.2 tambin se observa que, tanto la distribucin normal estndar como la f de Student son simtricas y centradas en cero, mientras que las distribuciom ji-cradrada 1- F son sesgadas y slo toman valores positivos. Las cuatro distribucir'rrs snn rehimadas entre s ya que las distribuciones Z de Student, ii-cuadrada I f sc dFfiE cu rrnirm de la distribucin normal estindar. Los parmeffos que p oodo b disribrciffi r & Snrdenr ji-cuadrada y F, reciben el & gt4- W.que tiemr e|trc rs con los t:maos muestrales invo& brfte k cj..!o,' i s ri* ..Fstr de rm*ro 20- se de infers una esrri[nciin f & Studer m 19 gr.d6 & bertad para hacer inferencia sobre la media poblacimal; o rrq ji-cuadrada m 19 gradm de libertad para hacer inferencias sobre la varianza poblacional. La distribucin Zde Student tiende a la distribucin normal est.ndar cuando el tamao de muestra crece, y prcticamente es la misma distribucin pma n > 45. La diferencia bsica entre las dos distribuciones es que la T de Student es ms ancha (respecto del eje horizontal) en las colas (vase figura 2.2).Ladistribucin normal estndar es una curva nica, por ello existen tablas que proporcionan cualquier irea o probabilidad de inters bajo esta curva. No pasa lo mismo con las otras distribucio-

Normal estndar
o.40

de Student 5 g.l.

030
o.20 0.20 0.1o

o.l0

Ji-cuadrada, 10 g.l.

4 (s, t0)

Figura 2.2 Muestra de

las distribuciones de probabilidad de mayor uso en inferencia.

Hstimacn puntualy por intervaio

IT

I COmO

;tndar

buciostribuadrada os que

ben el
; invo-

s una rbre la feren,ndo el


-15.

nes a las que hemos hecho referencia, ya que pata cada tamao muestral es una cun"a diferente. Por eso, las tablas de estas distribuciones slo reportan los valores que separan las reas de mayor uso en inferencia estadstica (ver apndice 2)' En la acrualidad es mejor utilizar un paquete estadstico para encontrar cualquier tea o percentil que se quiera de cada distribucin. Como se muestra ms adelante, las distribuciones normal y Zde Student sirven ji-cuadrada ser para hacer inferencias sobre las medias; mientras que la distribucin Je utilidad para hacer inferencias sobre varianzas y la distribucin F se emplear para comparar varianzas. Es por esto que la distribucin F es la de mayor relevancia que se observ en en diseo de experimentos, dado que el anlisis de la variabiiidad

rn experimento

se hace comparando varianzas'

Uso de f;xee$
>: puede utilizar la hoja de clculo de Excel (o algo equivalente) para calcular las :rotabilidades con la distribucin normal. Para ello se utiliza la siguiente funcin:
D

La

ancha

rormal

rea

I STR'N O RM(x, media,

de sv

-e

stndar, acum)

bucio-

en la celda x se da el valor de referenciapafa el clcuio de probabilidades PrX < x)), en mecla se da el valor de la media, t, dela distribucin normal con la ,que se quiere obtener probabilidades, y en clesv-estndar se declara el valor de la desviacin estndar, O, de la distribucin normal. Por ltimo, ocum es un valor igico que determina la forma de la funcin, si el argumento acum eIVERDADERO ise da un 1), la funci n DISTR.NORM devuelve la funcin de distribucin acumuladensidad de probatJa (P(X < x)); si es FALSO (se da un 0), devuelve la funcin de

::rde

bilidad, es decir, daf(x).

Es*Emasfr&s* paxmtwm$
4

y p#tr m*srvm8*
Las distribuciones de probabilidad que tienen una variable que representa cierta caracterstica de una poblacin se definen completamente cuando se conocen sus parmetros, pero cuando stos no Se conocen, ser necesario estimarlos con base en los datos muestrales para hacer inferencias sobre la poblacin. Por ejemplo, los parmetros de una distribucin normal son la media, P, y la desviacin estndar, O, que en caso de desconocerse ser necesario estimarlos a partir de los datos en la muestra.

Hay dos tipos de estimacin: puntual y por intervalo.

Hstir:'laei*n pu*"ltu:a}
6

valor numrico metro desconocido; por ejemplo, tres parmetros sobre los que con frecuencia desea hacer inferencia son:

IJn estimador pwntual de un parmetro desconocido es un estadstico que genera un simple, que se utll\za para hacer una estimacin del valor del parse

Esti'adq Puntual

:.:::

41

::

qu:

eStima un valOi

esle:i,co de un Par'metro

724
tiiF"f, tj

L*

f; { s

n'ent*ls cia i *f *:rer*ie est:d istir:c

Lamedia t del proceso (poblacin).

Lavananzaoz ola desviacin estndar o dei proceso. La proporcinp de artculos defectuosos.


Los estimadores puntuales (estadsticos) ms recomendados para estimar estos p.ri-r,:ri: :,1:"1. r-ipcctivamente
:

' L; :.:.1:" :-'jji:rl i =.t. ' La l'ane r'i-s::J l = 51. . La propr,rrcir i :::::i,:rsLls en Ia muestra, f = xln, donde x es el nmero de artculos deler;.:. :- *l:::l-lsstra de tamao t?. ::::::ii' de loi discos producidos por un j: ': = I l5 tscOS. r' Se obtiene qUe prOCeSO, durante Una Semana Se torna una i:i:s:: lamedia muestral esi= 1.179. Este ralcr:*:-: -::l:= -t'l-rJ ull& estimacin punPor ejemplo, para estimar ei *=l,::

fial

de

Colocar un gofro (sm6olo ^) sobre un parrnerrL-r .s ;lne manera general de denotar un estimador puntual del correspondiente parmerrc,. pue>to que los estimadores no son nicos. Por ejemplo, la estimacin de

t (la media del Proceso).

media. ri. podna hacerse con el uso de la media muestral X, la medianaX, olamoda, dado que las res son diferentes medidas de la tendencia central de unos datos'
1a

Estimacin por intervalo


La estimacin puntual de un parmetro se genera a travs de un estadstico. 1' como el valor de ste es aleatorio porque depende de los elementos que fueron seleccionados en la muestra, entonces la estimacin que se hace sobre el parmetro depender y variar de una muesa a offa. De esta forma, cuando se quiere tener mayor certidumbre sobre el verdadero valor del parmetro poblacional, ser necesario obtener la informacin sobre qu tan precisa es la estimacin puntual. As, la estimacin puntual dir poco sobre el parmetro cuando la variacin entre una estimacin v otra
es muy grande. Una forma de saber qu tan variable es el estimador, consiste en cal-

cular la desviacin estndar o error estndar del estadstico, visto como una variable aleatoria. Por ejemplo, consideremos la desviacin estndar S y la media de un^ muestra de tamao n. Puesto que X es una variable aleatoria, sta tiene su propia desviacin o effor estndar, que se puede estimar mediante 6 x = S l^,17 . Una forma operativa de saber qu tan precisa es la estimacin consiste en calcular tn intervalo de confianza que indique un rango "donde puede estar e1 parmetro"

con cierto nivel de seguridad o confianza. Construir un inten-aio al 100(1 - a)Va de confianza para un parmetro desconocido 0, consiste en estimar dos nmeros (estadsticos) L y U, de manera que la probabilidad de que 0 se encuentre entre ellos
sea 1 -

a,

es decir,

P\L=0=US=l-u
donde

(2.r)

U forman el intervalo de confianza buscado [L, U].Laconecfa interpretacin de un intervalo de confianza es como sigue: si se obtuvieran 100 muestras inde-

Ly

siimeein puntual y por intervalo pendientes de la" misma poblacin o proceso, cada una de tamao n y para cada muestra se calcular el intervalo de confianza a95Va para el mismo parmetro, entonces se espera que 95 de los 100 intervalos contengan el verdadero valor de dicho parmetro. En la prctica se obtiene slo un intervalo y se dice que el intervalo [], L/] tiene una conftanza de 100(1 - a)Va; esto tiene una interpretacin constante, en el sentido de que el parmetro estar en el intervalo 100(1 - a)Vo de las veces que apliquemos el procedimiento.

25

ffi
lntervalc
ele eodianea Rangc donde se estima que est el valor de un parmetrct

La longitud del intervalo de confianza es una medida de la precisin de la estimacin. De aqu que es deseable que la longitud de los intervalos sea pequea y con alto nivel de confianza. El ancho de los intervalos es mayor a medida que sea mayor lavaianzade la poblacin y el nivel de confianza exigido. El ancho del intervalo es menor si se incrementa el tamao de la muestra.

iroblacional.

lntervaln de ennfiafira para ufia rnedie


Por definici6n de intervalo de confianza se trata de encontrar dos nmeros L y U, tales que el parmetro p se encuentre entre ellos con una probabilidad de 1 - a. Esto es,
:1 IS

P(L<l'I=L)=l-&
X,una muestra aleatoria de tamao n de una poblacin, con una distribucin normal con mediaz y varianzad, ambas desconocidas. El procedimienSea X1, X2,
..

.,

lo
,a-

to general para deducir el intervalo consiste en partir de un estadstico que involucra al parmetro de inters y que tiene una distribucin conocida, Tal estadstico es

x-t,
el cual sigue una distribucin Z de Student con n - 1 grados de libertad. Por lo tanto, en la tabla de esta distribucin o en su grfica se pueden ubicar dos valores crticos
totzy

:r

tiler
n
rUa

/o72,

tales que:

:al-

ble
na

rpia

l= l-a ,(-,",, < ---= 1t.,^ "'' ) S lJn


De aqu, despejando hasta dejar slo en medio de las desigualdades al parmetro de inters, se llega a que

i-u

lcu-

[ro"
zlTo

efos

:llos

"(o
Eneste sentido,

-,,,,1,

< t <

x*,",

;|)

l-a

t2.2t

L=X-t",rl,

IJ

=X+t",.)t

sonlos nmerosbuscados que

t2.1)

retainde-

definen un intervalo al 100( 1 - a)Va para la media desconocida P . En la tabla de la distribucin Z de Student se observa que para una muestra mayol o igual a 30, el intervalo al 100(1 - a)Vo para la mediapl es aproximadamente XtZ. o sea, la media ms menos 2 veces su effor estndar.

7
26
CAPT[JtCI

Elementos de inferencia estadistica

Elemplo ?"I
En un proceso de inyeccin de plstico una caracterstica de calidad del producto (disco) es su grosor, el cual debe ser de 1.20 mm con una tolerancia de +0.10 mm. As, el grosor del disco debe estar dentro de la especificacin inferior, EI = 1.10, y la superior. ES = 1.30. para considerar que el proceso de inyeccin fue satisfactorio. Para evaluar esta caracterstica de calidad. durante una semana se hace un muestreo sistemtico en una lnea de produccin. 1' se obtienen 25 muestras de tamao 5 cada una. Por lo tanto, al final se tiene una muestra de il = 125 -v" se obtiene la media muestral, X = 7.779 mm y lavattanza, Sr = 0.00071. por lo que ia estimacin del error
estndar de la media es

Ji

*0'0266 =o.oo24
1

1.18

Cuando > -15. la distnbucin f de Student es prcticamente igual a la distribucin norrnal estndar. por lo tanio. de la tabla de la distribucin normal se obtiene que I,: 3i..:= i.96 paraG = 0.0,5. De aqu que el inten'alo al 100(1 -a)Vc de confianza para la mediap del grosor de los discos est dado por

tto,,ft=t.ror 1 e6(T#)=

t.trn r

0.00466

Se puede afirmar entonces que con una confianza de 95Va,la media z de grosor de los discos se encuentra en el intervalo [I.I74,1.184]. En el clculo anterior al valor de 0.00466 se le conoce como effor de estimacin, porque hasta en 0.00466 puede

diferir el estimador puntual X del parmetro poblaci

onaT pt.

Tamao de la muestra, En ocasiones es necesario calcular el tamao de muestra r para lograr que la estimacin de una media poblacional lr tenga como error mximo a un nmero E. En este caso, como el error de estimacin est dado por E t(n/2. n \Sl\/ n , entonces despejando n obtenemos que
tt

t,2otz. u-lrS2
-

E'

Ccm.. ,- : r : - depende de r r' sta es la inc-enita, entonces para propsitos prcticos v con temarios d muestra ma\'ores que .'30. el I'alor de l,p.,,_,, puede tomarse como l. De esta manere,

tt =-

'E)

.1S_

$ es un estimador de la varianza. Por ejemplo, si en el caso del grosor medio de los discos se quisiera un effor mximo de 0.004 = E, entonces se requiere,
donde 4(0.00071) n=-4=1.77.5 (0.004)'

= l7B.

Hstirnacin puntual y por inten'aLo

27

lntervalo pars ta vananam


De manera similar a como se obtiene el intervalo para la media, es posible deducir intervalos de confianza para cualquier parmetro. En particular, para construir un intervalo de confianza parula vaanza o2, la distribucin de referencia es una ji-cuadrada con n - 1 grados de libertad, ya que bajo el supuesto de que la variable de inters tiene una distribucin normal con media y varianza desconocidas, el estads-

tico(n -l)Szld sigueladistribucinji-cuadrada conn* l gradosdelibertad.Deesta


manera, con un poco de lgebra, se llega a que el intervalo de confianza para la varianza est dado por
(n

- l)S2 1r-t

(n
)

l)S'z
t

(2.3)

Xn,z.

Xt-qn,,.

donde Xto,r,,-, Y X?-otz,,-t son puntos crticos de la distribucin ji-cuadrada con n - 1 grados de libertad y se leen en la tabla de esta distribucin para el valor de a dado. Es decir, P(X> X|,r,,_r)=a12.

*$empm 2.?
En el proceso de fabricacin de discos para computadoras, una de las variables crticas es el rendimiento de formato. Se toma una muestra aleatoria de n = 10 discos de la produccin del turno de la maana. Se formatean y se reporta el rendimiento decada disco. Los datos obtenidos son: 96.II,91.06,93.38,88.52, 89.5i,92.63,

85.20,9I.41,89.79,92.62. Con base en estos datos interesa estimar puntualmente y por intervalo la media y la desviacin estndar para la poblacin de discos de dicho
turno.

Los estimadores puntuales para la media y la desviacin estndar resultan ser


sl0

X:-'=t
est dado por

)x, '
10

=91.03

S=

= 2.99

Suponiendo distribucin normal, el intervalo al 95Va de confianz a para

la

media

l* -,.,, rt,x

*,

",,

+f=

r.o, *
[n

2.26#,e 1.03 + r ru#f=

r88.8e,

e3.ri]

donde el valor del punto crtico ta/z= t0.025 = 2.26 se lee en las tablas para la distribuci6nT de Student con 9 grados de libertad que se localiza en el apndice. Con una confianza de 95Va se espera que el rendimiento promedio de los discos producidos durante ese turno est entre 88.89 y 93.17. El correspondiente intervalo para 1a deso2 dado en la relacin

viacin estndar o se obtiene sacando la raiz cuadrada al intervalo paralavarianza (2.3).As, el intervalo parao est clado por

l-r)Y

llE;

(e)(2.er'z
19.02

,9),zeet'

l 2.70 |

'

s.461

28

CAPTEJLS

fterrentas de inferencia estadstica

donde los valores crticos X'o,r, ,-, = X3.orr.g = 19.02 y X?_",r, ,_, = X\.n r,n = 270 se obtienen de la tabla de la distribucin ji-cuadrada, que est en el apndice, o tambin se pueden consultar usando un software. As, con una confianza de 957o se espera que la desviacin estndar del rendimiento de los discos producidos durante ese turno est entre 2.05 y 5.46. Cuando no se est satisfecho con la amplirud del rnten'a1o. entonces ser necesario incrementa 1a precisin de 1a e:tirnacin. esto se hace aumentando el tamao de nues-'::.

lnter"--alo para la prcporcin


Bj,- el supuesto de que el nmero de artculos defectuosos en una muestra sigue una ,listribucin binomial, y suponiendo que se inspecciona una cantidad grande de n artculos )' se encuentra una proporcin f de defectuosos, se puede construir un in-

ten'alo de conhanzapara la proporcin poblacional p, apoyndose en la aproximacin de la distribucin binomial por la normal. En estas condiciones se puede afirmar que la proporcin muestralp sigue una distribucin normal con mediap y varianza

*?

Con el uso de la misma argumentacin que en el intervalo para la media,

se deduce que el intervalo de confianza para la proporcin es de la forma

Zo,,

P<

p<f*,o,,

donde Zo2es un percentil de tabla de la distribucin normal estndar que est en el


apndice.

Tabla 2.1 Resumen de frmulas para intervalos de confianza.

_s x-to,r
(n'-i)S'

\ln

-,s X+to,, 1n

l),.

,,,
? + to,,

h{l n

t)

(X,

-i;,;rU*ln,_rs

Ft

Fz

tlt i-+Vq n2
nr-2
si
o Sl'"rt' ' I nt-1

-:1)5?+(n,-1)S1

nr*

o;
d:1,

sl

5t 't-alz.

n,

{i,- b)-

2."',

b$- b) + ?t2{1- t'2) (itr- b) + 2",, b,ft- i,t

, b,Q- b,)

Conceptos bsicos de prueba de hiptesis

29

Eiemplo 2.5
Se quiere estimar la proporcin p de artculos defectuosos en un lote de 2 000 (poblacin). Para ello, se toma una muestra aleatoria de n = 100 artculos y se encuentra que de stos, x = 5, son defectuosos. Por lo tanto, un estimador puntual de p es fi = 5/100 = 0.050. Si se quiere estimarp por intervalo, entonces de acuerdo con 1o explicado antes, un intervalo al95Vo de confianza est dado por

0.050

1.96

0.0s(1- o.o5)
100

= 0.050

0.043

de aqu que, con una confianza de 95Vo,

est entre 0.007 y 0.093, en trminos por-

centuales entre 0.77a y 9.3Vo. En el clculo anterior, al valor de 0.043 se le conoce como error de estimacii'?, porque hasta en ese valor puede diferir fi de p.

Tamao de muestra. Si se quiere estimar el tamao de la muestra n, qlJe es necesario para estimarp con un error mximo de E,entonces dado que E = Zo,rrffi1* pln;
si despejamos de aqu a n obtenemos que

z'"''itQ- il '^ rrpz

f es una estimacin del valor de p. Por ejemplo, si en el problema anterior se quisiera un effor mximo de E = 0.03, con una confi.anzade957o, entonces se requiere que n = (I.96)2 (0.05X1 - 0.05)/(0.03)2 = 203. En ocasiones, cuando no se sabe nada de p en la frmula anterior, se supone f = 0.J.
donde

Resurren de frmulas para inrterualos de csnfianza


En la tabla 2.1 se muestran las frmulas para calcular los intervalos de confianzams usuales. Adems de los intervalos para un parmetro ya presentados, en la tabla se

incluyen las frmulas correspondientes para intervalos de confianza que involucran a dos parmetros, como son: diferencias de medias, diferencias de proporciones y cocientes de varianzas. Estos intervalos proveen informacin sobre la igualdad estadstica de los parmetros conespondientes a las dos poblaciones de inters. Note que los clculos involucran a los estimadores puntuales obtenidos con cada muestra. En

latabla, lanotacin z1-s12,t;2,X?-",r,n-ry Fr-otr,n2-r,nr-t)serefiereapuntoscrticos de la correspondiente distribucin. Estos valores se determinan fcilmente con el uso de un software estadstico o de las tablas dadas en el apndice.

eonceptss bitscos de Brueba d* hpteslx


Un estudio experimental o una investigacin, por lo general tiene como ltimo objetivo, responder en forma segura ciertas preguntas y/o tomar decisiones. En este contexto, el experimentador tiene a priori ciertas creencias o hiptesis que desea comprobar. Por ejemplo:

' -

Los tres proveedores del material;r tienen el mismo nivel de calidad. El porcentaje de este ingrediente afecta el resultado de la mezcla.

s4'r

- LU

. '

El tiempo de espera d esi operacicn 3s l::;' .-.:-' :- -- redio. Si aumentamos la cantidad de reaclirtr r '-::---,' -- :-.:-=:-*.
se describen 1os conceptos

bsi;':.:-::--:::: hiptesis, es decir, los pasos fundamentales de cualquier procedtn:.;:-:- l: :r*::i de hiptesis, como son: planteamiento de la hiptesis, estadstico d :*;:'-, ::-i;it-' de rechazo.
A continuacin

FE*ffit*errx$*ssw dw wrem fuEptesis estadstiem


L
-n3

s estadstica es una afirmacin sobre 1os \;"lL-:-! :: i,:'. parmetros de r" :..11*:in o proceso, que es Susceptible de probarse :iail i: 1a inlormacin -,:..-:-:-1 -n una muestra rep-resentativa que es obtenida,le 1: :,-:,:'-in. Por ejem,i1,-r'-s

,',:::"cin "este proceso produce menos de 8'r de ::i:-:,:'ios se puede p de artculos =.:::sticamente, en trminos de la proporcin c.;'1,--;ida
>

J-;e genera el proceso, como se hace a continu:--.,j1-

H 1 p = 0.08 (la proporcin de defectuosor e'

1-r

t,-lS

(2.4)

Ht: p < 0.08 (la proporcin

es menor a 0.081

;irsin Ho: p = 0.08 se le conoce como hiptesis nulaY


rj i
r-

H,,,:

p < 0.08

,
-

: ',-, j.-ri-r

alternativa. EI nombre de hiptesis nula se deriva del hecho de

--;:,:: re piantea como una igualdad, 1o cual facilita el fener una distribu. "1 -ri lrl -::,-:d de referencia especfica. En general, la estrategia a seguir para :i- --,-:"- :;sls e s suponer que la hiptesis nula es verdadera, y que en caso de ,-.1: .: r: - :or la evidencia que aportan los datos, se estar aceptando la hiptesis

: -

: :- -' . .r.. en el caso de las proporciones, la afirmacin que se desea probar se r.-: r.:r, : :-: ;ierta. slo en caso de rechazat la hiptesis nula. - ":
-r,
r-::r--,r,S ahora que la afirmacin a probar es "este proceso produce 8 '4o de rl:en'e que la afirmacin seala que su falsedad se da, tanto si se

::rr-J,r. el planteamiento estadstico debe

ser:

: rr = 0.08 (la proporcin de defectuosos es 0.08)

(2"s)

H. it
'.

0.08 (la proporcin es diferente a 0.08)

. :;: se desea concluir es la hiptesis nula. Ntese la diferencia entre .-,.-,ir as en las expresiones (.2.4) y (2.5). En (2.4) HA se conoce como ,'i.;:;i:,, -- "..' '-; -;. "'. de rn solo lcLdo (unilateral), ya que la nica manera de rechazar H es :::,.::.r- '. - ,r'le: de 1a proporcin muestralp significativamente ms pequeos que [] i-lS. -{.:r:-:::r,r. en tl.5)11, se llama lptesis alternativa de dos lados (bilaterct[1. -t'e que ," ',;i;nia en contra de 110 se obtiene con valores pequeos o grandes

' ,-i ::'-:;.-.


--

::-

de la propor;r.in nustral p. As. la eleccin de 1a hiptesis alternativa en cuanto a si debe ser unilateral o bilateral depende de la afimacin que se quiera probar.
I

Fianteamientr: ei* un* llr**sis estadstica

5l

Otro aspecto importante es la seleccin del valor del parmetro que especifica la hiptesis nula, esto es, por qu 0.08 en las hiptesis de las expresiones (.2.$ y (2.5)? Este valor se elige de manera que separe dos situaciones que ilevan a tomar diferentes acciones. Por ejemplo, en la hiptesis dada en (2.,1) se eligi 0.08. porque sta es la proporcin de defectuosos reportada el mes anterior. despus de implementff un programa de rnejora se quiere r,er si dio el resultado esperado. En caso de no rechazar 10 se concluira que el programa no funcion y que se deben tomar medidas adicionales para bajar la proporcin de defectuosos.

{.

?f,' g n- -\s t'


g,,t;f
-?
:
_

.- ":;"1

j:1ll
.

," "Y:
_J{i''' '.

l. '- '' .:r..


:1

Estmdistie*

d* prueba
,\.'

-:

ta'

Probar una hiptesis consiste en investigar si 1o afirmado por la hiptesis nula es verdad o no. La estrategia de prueba parte del supuesto de que 116 es verdadera, y si ios resultados de la investigacin contradicen en forma suficiente dicho supuesto. entonces se rechaza I1o y se acepta la hiptesis alternativa. En caso de que los resultados de la investigacin no demuestren claramente la falsedad de Ho, sta no se rechaza. Es decir, la hiptesis nula es verdadera mientras no se demuestre lo

i.'
,.'ir

"l'r:

i. :t. ' ". ;

.i;,. '.'L]'

a
e

contrario. Unavez planteada la hiptesis, se toma una muestra aleatoria de la poblacin de estudio o se obtienen datos mediante un experimento planeado de acuerdo con la hiptesis. El estadstico de prueba es un nmero calculado a partir de los datos r la hiptesis nula, cuya magnitud permite discernir si se rechaza o no la hiptesis nula f16. Al conjunto de posibles valores del estadstico de prueba que lievan a rechazar Hs, se le llama regin o intervalo de rechctzo para la prueba, y a los posibles valores donde no se rechaza H se les llama regin o intervalo de aceptacin. Por ejemplo, para las hiptesis planteadas en (2.4) y (2.5), el estadstico de prueba est dado por

ffi;
ffistadistiee de prueb;* i\nrero clcr,ilcl* r partir de lrcrltl,,r 11,',.r .\,, :a,rr1, tiul p*rmite cji-ccerrril gi se i*-

.1,,,, 16, d I L. ^

-,. l, I ijl ' :l' I rl..l..' ic i,,."..,,.,,,.

ffi:
ffi*gi$nr de reelau* l,: el ccnjurtc rle polibier v;:ioi-,--- i I ----:r,--i;'r;;irc,.i.r i(': rr.'] .'qi, ,lP\ ir', I ':...i.,..J ,.ltl:l1.'

b
E

_
'o
Jonde

_ -

p-0.08 .uJg(l- o.ogy,

Q.O

sir rl.rla.

tr
I

I
I
I

kr

f es la proporcin de defectuosos que se encontr en Llna muestra de n artculos inspeccionados. Si /1e es verdad, el estadstico e sigue aproximadamente la dis:nbucin normal estndar; la aproximacin es mejor mientras ms grande es el valor le 2. En general, se requiere np > I0 para una buena aproximacin; en este caso, con 'tp > 120 unidades inspeccionadas sera suficiente. Por ejemplo, supongamos que se toma una muestra de n = 150 piezas y de ellas t = 2A son defectuosas, entonces el valor de la proporcin es i = .rln = 0. 1 3. Vamos a ver si esto implica una diferencia suficiente pua rechazar que p = 0.08. Por io pronto, el valor estadstico es z0 = 2.41 .
Criteri* de reehexo
El estadstico de prueba, construido bajo e1 supuesto de que Hu es r-erdad. es una
variable aleatoria con distribucin conocida. Si efectivamente 110 es verdad, el valor dei estadstico de prueba debera caer dentro del rango de valores ms probables de su distribucin asociada, el cual se conoce como regin de aceptacin. Si cae en una de las colas de sri distribucin asociada, fuera del rango de valores ms probables (en

fe

P h'

t2
{AFiT{JL*

[ler-rentns de inferenci* esiac{stic*

la regin de rechaTo), es evidencia en contra de que este valor pertenece a dicha distribucin (vase figura 2.3).De aqu se deduce que debe estar mal el supuesto bajo el cual se construy, es decir, 110 debe ser falsa.

Pruebas de una y dos colas (unilaterales y bilaterales). La ubicacin de la regin o inten'alo de rechazo depende de si la hiptesis es bilateral o unilateraL Como se .u'lo en el caso de las proporciones, una hiptesis es bilateral cuando la hiptesis 'llemlti'i'a f1..r e S de1 tipo "no es igual" (.1);y es unilateral cuando la alternativa es dei :r:',,- "'ll'" ari i-'ie r> ) o "menor que" (<). Cuando es bilateral, como en la expresid,r 1.5 . -. ::_:::: i; rechazo est repartida de manera equitativa entre ambas colas de la ;r-.:::-:- - ::, :-iisico de prueba. Pero si 1a hiptesis es unilateral, como en 1a erpre st,t: l.:. . ,. :-, ::i:.-ti el Jontra de 1a hiptesrs nuia se ubica en un solo lado de 1a disi':;r -:- :t: - =;. -. :=_.: - : ;= r:.-hazo slo se concentra en una de las colas. En le e::;.-::- l - -.::----: :- :-J:-.7,r s Joncentra en e1 lado izquierdo de la disuib:;,:: :t- :r:-::i:: - '-: - :',: I 5 -r :: llsura 1.3 ). P-"::::.:i -: --:. :-:!: !- ttc -t ::,::.,:;"in se caicula el estadstico de prueba :, :; -.::--;:--: l: -. rc -,::-t:":- J;; 3n l" l:r,,in de echazO O aCeptaCin. POf :'=:.:-: . =- -'. :-:.:'::S:;:-'-:=."i=- :-'L -'. SltF:i:fl-.3:,].-l'Se feehaZaHg Si g <-o: !. ,-; :-:':iii:s -s:.r C:s :.lr .-. rerJi,nes ,'.,i I se rechaza 11n si :s ( -oz O Si .- ) i;.1. ; srn:prenenre. si :. ):,:. En la gura 1.3 esto equivale a Que is caiga en
ea: sombreadas. de acuerdo con la haptesis de que se trate. Si queremos probar 1a hiptesis bilateral con una confianza de 95Vc. entonces rc.:= 1.96; adems, como p =A.n Y io = 2.4I, entonc.s Z0 > i.96; por lo tanto, se rechaza Ho : p = 0.08. De alguna forma, esto ya se intua, puesto que la proporcin muestral haba sido i = 0.13.
de
i;r.-s

;r :"igo

Si en lugar de tener x = 20 defectos, se tuvieran x = 15, entonces = 0.10. A1 sustituir esto en (2.6) con n = 150, se obtiene Que Z = 0.90 que no es mayor que Zat2 = 1.96. De aqu que no se rechace Hs: p = 0.08. Es decir, en este caso f = 0.10 no es evidencia suficiente contra 10 : p = 0.08.

t t

, /'

H. :p

(
-

w.Ja

C.CE

' r P r L.uo

ci

r.:r,,'aio -f

de rechazo)/
-(1

,,

/\\

.,i i-a /\

i\
,.

Regin

o intervalo

Regin -d ,,. '', o intervalo

\-u
Regin o intervalo

de rechazo

.l-de

,
-Zal2

\-***

rechazo

ZalL
I

de aceptacin

LJ

lntervalo de

' aceptacin

Figura 2.5 Hiptesis unilateraly bilateral, regiones de aceptacin y rechazo.

Planteamlentc de una hiptesrs estacis:

::

5t

El riesgo de una decisin equliv*eada: errores tipa i y tlpo *-'rar una hiptesis estadstica es una decisin probabilstica, por 1o que existe el r, i itr de cometer un error tipo I o \n error tipo II . El primero ocuffe cuando se re::.:ai H cuando sta es verdadera, y el error tipo II es cuando se acepta 11 y sta es
$$
>

ilHrr*r tiBo
(-. ;l

Es cuando se

rec::::

s". En toda prueba de hiptesis cada tipo de error tiene una probabilidad de ocu::" Con ct y B se denotan las probabilidades de los errores tipo I y II, respectivamen-

-J--)^-.^ ^- ",^ ia- -lr \/all idt l-l

ffi=
f;rror ipo
*E

= P {error tipo I } = probabilidad de rechazar I1e siendo verdadera ,J = P{enor tipo II} = probabilidad de aceptar 110 siendo falsa
c,:

cundo se dc.;)l und

rY.

qu* es falsa.

A 1 - P se le llama p otencia de la prueba, y es la probabilidad de rechazar Hs ::.ndo es falsa. A a lambin se le conoce como la significancia dada de la prueba

ffi
Fotercia de !a prarebe ls ,r lir-'hl",,lrlc jt :" i z':r H,, iu[iC es ils.

; s la probabilidad de la regin o intervalo de rechazo; su valor se especifica por :=e del investigador desde que planea el estudio. Por lo general se utilizan los va.

:'rs

a = 0.05

o 0.01, dependiendo dcl riesgo que se quiera admitir en la conclusin.

\I,ntras ms pequeo es el valor de a se requiere ms evidencia en los datos para :::hazar 11s. Por ejemplo, si la accin a tomar despus de rechazar 10 implica una .---. ersin fuerte de recursos, se recomienda utilizar a = 0.01 para tener mayor con:::za de que la decisin ser la adecuada. Si la decisin no implica una inversin :-:fe. es suficiente trabajar con c( = 0.05, que es el valor ms utilizado para este :,::So. Esto es. un valor ms pequeo que a no necesariamente ser mejor, ya que si poco riesgo (a < 0.01) se .^t truncando la posibilidad de muchos cam."; "dmite :.,'s que seran positivos para la empresa. Utilizara = 0.05 significa que por cada - ,,,t r-eces independientes que se aplica el procedimiento y se rechaza 110, se espera ,- -- en un promedio de 95 veces, tal decisin sea la correcta. Por lo general, en las pruebas de hiptesis se especifica el valor de a y se dise:-: ia prueba de tal forma que el valor de B sea pequeo. E,sto es, la probabilidad del . * ' r ripo 1 se controla directamente, mientras que la probabilidad de error tipo II se : -:irola de manera indirecta con el tamao de la muestra, ya que a ms datos B ser :-3nor. En otras palabras, con una muest^a grande es mayor \a potencia de la prue--;.: es decir, se incrementa la probabilidad de rechazar 110 si sta es falsa. En la prctica suele ser ms delicado cometer el enor tipo I que el enor tipo II, ::brdo a que en la mayora de las hiptesis el rechazar 110 implica objetar algo que :- acepta de manera convencional. No rechazar 110 implica, en muchos casos, seguir :Lrmo hasta ahora. Por lo anterior, es comn que se controle slo ei error tipo I. mren:ras que el error tipo II se deja libre como si su magnitud no importara. Lo cierto es que el error tipo II tambin importa;, la magnitud de su probabilidad debe ser pequea (se recomienda B = 0.10). El problema es que ccntroiar a B

Es posible afirmar que, en general, es deseable que una prueba estadstica sea potente. Sin eme1

bargo, cuando

tamao de la muestra se incrementa en exceso (a tamaos en cientos) se llega a tener


110

una potencia excesiva, que lleva al extremo de rechazar

cuando es verdadera desde el punto de vista

prctico.

r
54
ABYUg"

E!emeritos de inferencia estadstie*

tiene varios problemas; por ejemplo, muchas veces se requieren grandes tamaos muestrales o se deben reaTizar muchas repeticiones en el experimento. Por ello, en este libro no enfatizamos el control del error tipo II, pero damos 1as recomendaciones dei nmero de repeticiones que deben obtenerse en cada experimento para tener un valor pequeo de B.

Frueba para la media


C::::,--!:::l-1,:;-:,::,:-t:-i:ta:: :--:-::-.-;:-,::-:,-'i]]enOsUelenintefesar -,::-,--;: :-II-;i-:-. - J;:,--,-1,::- l---*- E--:.::";--":..,.fUdiaf lamedia,fZ,eS i; .-.-:l=:::rJ-:-':-; -' :i'-'=: ._i-'.:::..: - ::::.1: --ill'-..,Ulrlf 11,.. dOnde/g ;: -: rirr.:' ;,:'1,-';i,l-.- P,:; -'::-.:,. :-:j: :: j: -:,::s ::.i tsilsar si el rendimien.-. prcrrnedio,lel prxeso durnte -si; laiaer -. l.u.. rTl.tl trr rr reflof que el de la
semana anterior ro. Cualquiera de esas res presuntas se responde n planteando una hiptesis estadstica adecuada. Las hiptesis se pueden probar suponiendo la varianza poblacionai ol conocida o desconocida. Sin embargo, como en la mayoa de los problemas es irreal suponer de antemano que se conoce lavarianza, nos limitamos a describir el caso cuando o2

no se conoce.

Prreba para la media con varianza desccnocida


sea X una variable aleatoria con distribucin normal con media4 y varianzaoz, ambas desconocidas. Se quiere probar la hiptesis de que la media es igual a cierto valor

lo.

Es decir. la hiptesis a probar es

Ho:

lr

= &o

(2.7)

H: pt

to

Para probar esta hiptesis se toma una muestra aleatoria de tamao n de los posibles valores de la variable X y se calcula el estadstico de prueba:

"

X-u^ ,U
slJn

(2.8)

l.'nde 5 es la desviacin estndar de los datos. Bajo el supuesto de que I1o es verda-

:::. sre estadstico se distribuye Zde Studentconn- 1 grados de libertad. Se re;i..: H si el valor absoluto del estadstico de prueba es mayor que el valor crtico ; -. :r::nbucin. es deci se rechaza 10 si I tol ) ton.Recordemos que /.,,, es el p:r.:: .:,:-:'-' ,Je la distribucin zde Student, tal que P(t > t,lz) = al2) o sea, las reas 'n::-- ., ;*:-.': ; la derecha del punto ta/zy & la izquierda de -to2 son iguales a a/2 -.:-.: ll.-.r" l.-ll. Estos valores crticos se obtienen de la tabla de la distribucin Z de S:;el: i;da en e1 apndice. Lnt brere justificacin del criterio de rechazo para la prueba anterior es la siguiente. p.-r reora estadstica se sabe que bajo el supuesto de que Ho : fl - lo es r erdadera- el estadstico de prueba r se distribuye z de Student con n I - grados de Litrertad \-. en consecuencia. hav una probabilidad de 100(l - a)Vc de que el valor

Prueba para la media

55

-t
Regin

ar2 o
Regin

rchazo -aceptacin

de

'olz

de

____,

Regin de rechazo

gura 2.4 Regiones de rechazo y de aceptacin para hiptesis (2.7).

e r caiga entre -to2y top.De aqu que, si la muestra produce un valor de /6 fuera de gsole lmites, entonces tal valor de /6 es evidencia de que F/s es falsa. Por el contrario, ri re cae entre -to12y tanes evidencia a favor de la veracidad de 110 ya que no existe inguna contradiccin. Obsrvese que la regin de rechazo dada por la unin de in-

:rralos (-cr , -totz) lJ (-ton oo) est determinada por la probabilidad a del error tipo I (vase figura2.4). En aquellas situaciones en que se desea rechazar Ho : l"t 6.la hiptesis alternativa es unilateral:

zo slo ctando 't >

Ho: Lt = [to
(2.e)

Ht: &

lto

En este caso se rechaza Ilo si lo > to. Por otra parte, si 1o que interesa es rechazar Ht: l =,ls slo cuando & < l0, entonces ahora, la hiptesis unilateral se plantea de
la forma:

Ho:

lt

= &o
(2.10)
to

H: t 1
y
se rechaza

H, si to < -to.

Eiemplo 2.4
Peso de costales. Un fabricante de dulces compra costales de azicar a cierto ingenio. Segn los vendedores, los costales tienen un peso medio de 50.1 kg, con una varianza de (oz = 0.5). El comprador sospecha que el peso medio es menor. Para confi.rmar su sospecha decide contrastar las hiptesis:

Ho: l"t

50.1

(2.11)

Ht: & <

50.1

[56

{epiTUL

Elementos de inie renei esiae ist;re

con un nivel de significancia de 5 -r r c: = fl.{-l-i L Paa eilo, selecciona de manera alea_ toria tres bultos de cada uno de 1os sis:ienis citco pedidos. Pesa los 15 bultos y obtiene quex = 49.4y s2 = 1.2. De .riu rn.n.o.. :1 estadstico de prueba calculado de acuerdo con la expresin (2.8). est dad 1,r.

- r. h=- s

.,T'-i

I A1

1.1

De las tablas de la distribucin rde Sruie:r Jl : - I = 1-l _erados de libertad, para a = 0.05, se lee el valor crtico /00.. _. = j.-6. C,tr:o :. = -).1j <-1.76 = -/.s5, 14, Se rcchaza la hiptesis 16 (figura 2.5). Es deci. s re;haza la atlnnacin del vendedor de que los bultos tienen un peso medio de 50.1. r'adernis l: e.,-idencia seala que dicho peso es menor que el declarado.

Prueba para la rarianza


En el ejemplo 2.4 sobre el peso de cosiales, a simple vista se puede norar que la vananza ol = 0.5. declarada por el r,endedor. es bastanfe diferente que 1a vananza muestral I = l.2,lo cual lleva a sospechar que su ahrmacin sobe tra varianza del proceso es falsa. El hecho de que los dos nmeros sean distintos no srgnifica que sean estadsticamente diferentes, de aqu ia necesidad de contrastar o probar las hiptesis:

Ho: oz = 0.5 Ho: o2 > 0.5 y de esta manera comprobar si esa diferencia es estadsticamente significativa. Esta hiptesis es un caso particular de la siguiente:

Hs: o2 = of;

Ho:d>of;
donde ofr es un valor conocido (0.5 en el ejemplo). para probar esta hiptesis y bajo el supuesto de distribucin normal, se utiliza el siguiente estadstico de prueba

-.2 tn -lSS2 z;= oi


donde n es el tamao de la muestra. Si 110 es verdaderaT6 si-eue una distribucin jicuadrada eon n - 1 grados de libertad. por elro. se rechaza Ho si yl > y2*, d"ond,e yl es un punto crtico que se obtiene de la tabla de distribucin ji-cuadrada. Si aplicamos

lo anterior al caso de la varianza del peso de ios costales, obtenemos que

, (r - l)Sr 14x1.2 ,-= = oi =33'6 d


el cual, bajo el sllpuesto de normalidad, sigue una distribucin ji-cuadrada con 14 grados de libertad cuando Flo es verdadera. En la tabla de clistribucinji-cuadrada se lee que yl, con c(, = 0.05 y 14 grados de libertad es igual a23.6g. Como yf,= 33.6 >

Tres eriterios de rechazo o aceptaci equivalentes

t7

fde

Student
g.l.

,"/

con 14

La:-t'to

I
ir

ll
-4
A
I

-2.4 7

Regin rechazo

de

Figura 2.5 Resultados de las hiptesis para la media y para


del peso de costales con o : 0,05.

la varianza

'aZA le1
rue

hi-

y se acepta ta hipOtesls unilateral 11o (vase figura 2.5). Es por el vendedor para el peso de los costales es falsa y, en la vartanzareportada decir, realidad, la variabilidad del peso de los costales es mayor. Tanto el estadstico / de la hiptesis sobre la media, como el estadstico 1fr de la hiptesis sobre la varianza, cayeron en las respectivas regiones de rechazo, lo cual se representa en la figura 2.5. Si la hiptesis alternativa parala vaianza es bilateral, entonces se rcchaza Ho ti Xl > XZ," o si yl < X? - on.
23.68 = Xz"se rechaza 10

:sta

Tres eriteriCIs de reef!!u$ o &cep*acim equivailentes


Al menos en las hiptesis ms usuales, existen tres criterios equivalentes para decidir
cundo rechazar la hiptesis nula y, en consecuencia, aceptar la hiptests alternatir-a. La equivalencia es en el sentido de que los tres llevan invariablemente a la misma

balo

decisin en trminos de rechazar o no a 1s. Sin embargo, algunos de estos mtodos proporcionan informacin adicional sobre la decisin que se est tomando, por lo que en algunas situaciones puede resultar ventajoso usar un criteno \ no otro.
n

ji7;es

:alnos

Estadstics de Brueba frente a var crtico :Este es el criterio que utilizamos en el ejemplo previo y es el que tradicionalmente se
empleaba antes de las facilidades que ahora provee la computacin; por ello, es el que se explica en muchos libros de texto. Este mtodo consiste en rechazar Hs si el estadstico de prueba cae en la regin de rechazo que est delimitada por el valor crtico. Debe tenerse cuidado de comparar los valores adecuados, dependiendo de la hrptesis alternativa de que se trata. Cuando los clculos se hacen de forma manual, este criterio es el nico que comnmente se usa. No obstante, este mtodo tradicional es el que da menos informacin adicional acerca de la decisin tomada.

:on 14
:ada se
_13.6

>

38

{AP$TUL$

Flementas d* infereneia estadstica

K
Sigr:lficancia predefinida
| '. ,'l rr95g9 m,ixrrnn

$ignifieancia obseruada frente a significanca predefinida


q:ri ci e^a

perim*ntadtr estd di:puesto


arier con resp*ckl
ilp'-r
1,

error

La signfficancia predefinida que se denota con (t, es el riesgo mximo que el experimentador est dispuesto a correr por rechazar rgs indebidamente (error tipo I). Mientras que la signfficancia observada o calculada, tambin conocida como p-value o valor-p, es ei rea bajo la distribucin de referencia ms all de1 valor del estadstico de prueba. La erpresin "ms all del estadstico de prueba" significa, por ejemplo en 1a prueba rbllateral. el area bajo 1a curva fuera del intervalo l-to, to], es decir: '.':l.-,r-r = PT j,:,:J.e

<_i-t -P(T>+/o)

anterior se desprende que fl, se rechaza si la sleiri.'anric ctbsert'ado es merlor que la significancia dada, o se, si valor-p < c. Este criterio es mejor que e1 anterior porque la sigaihcancia obsen,ada se puede ver como la probabilidad o evidencia a favor de Hr. por lo tanto. representa una medida de la contundencia con la que se rechaza o no ia hiptesis nula. por ejemplo, si la significancia observada o valor-p es igual a 0.0001, entonces s1o hay una probabilidad a favor de I1e de 0.0001, por lo que se rechazara la hiptesis nula con un riesgo tipo I de 0.0001, que es menor del que se est dispuesto a admitir, tpicamen-

Jttrjbucln f de Student con r?- 1 grados de irL'enad. Si il prueba e s ,f : ,1 e :eha r lzquierda r. 1a si-enificancia obser'nll:tera vada es el rea bajo Ia cun'a,je 1a di>inl'uin a la derecha {izquierda) de rs. De lo

I:s :n'!;::;:- J j::r:it3 i:.

a = 0.05. En otras palabras, un valor-p = 0.0001 nos seala que el valor observado del estadstico de prueba prcticamente no tena ninguna posibilidad de ocurrir si la hiptesis nula fuera verdadera, 1o que lleva a concluir de manera contundente que la hiptesis nula debe rechazarse. En la figura 2.6 se muestra, utilizando una hiptesis bilateral, que cuando ocute

ne el evento ltol ato,rnecesariamente sucede que valor-p > d,y viceversa. En el caso representado en la f,rgura citada no se rechaza I1o con cualquiera de los dos criterios. La comparacin de 0 frente a /"r, consiste en contrastar simples nmeros,
mientras que comparar las significancias a frente avaTor-p es contrastar.probabilidades. de aqu que esto ltimo sea ms informativo.

-t"/2 -to
Reein

to to/2 , Resin

de

rechazo Figura

Resin de
ace"ptacin

2.6 l:^:-::::- ie signifrcancias , valor-p )

'

de

rechazo

ct.

i-{iprit*si; :nrn d*s medias: conrpaiaein J*

,ii':

!rf+n!*:xfr"s

59

trrit*svm!*

d* e*mfi*mza

En este mtodo se rechaza 16 si el valor del parmetro declarado en la hiptesi: nula se encuentra fuera del intervalo de conf,ranzapara el mismo parmetro. Cuando la hiptesis planteada es de tipo bilateral, se utiliza directamente el intervalo al 100 \7 - c: t't de confianza. Si lahiptesis es unilateral, se requiere el intervalo a1 100 (1 -)-c;t'c para que el rea bajo la curva, fuera de cada extremo del intervalo, sea igual a a. Por ejemplo, en el caso de la hiptesis unilateral sobre la media del peso de costales dada por la expresin (2.11) se debe construir e1 inter-valo al 100(l - (2 x A.A5DVa = 907c
de confianza para aplicar este criterio con una significancia 9AVo de confianza para la media,r est dado por:

a = 0.05. El intervalo

al

xlnu., - = 4e.40't.16(l'$) = 4e.4at0.4st =148.s. 4s.sl \3873) ..ln


As, con una confianzade90Ta pr esf entre 48.9 y 49.9. En tanto, el valor 50.1 declarado en la hiptesis nula no pertenece al intervalo, y adems el intervalo est ubicado a la izquierda del 50.1, por lo tanto, se rechaza la hiptesis f16 : = 50.1 y la evidencia seala que contienen menos azicar de la que se afirma. Ntese que para rechazar una hiptesis unilateral tambin es necesario verificar la ubicacin del intervalo en relacin con el valor declarado en la hiptesis nula; el intervalo debe ubicarse con respecto a este valor, como 1o indica la hiptesis alternativa. En el ejemplo, la hiptesis alternativa es .1 : pt < 50.1, por lo que para rechazar la hiptesis nula el intervalo debe ubicarse a la izquierda de 50.1, como
ocurre en este caso.
Este criterio es til cuando el software proporciona el intervalo de confianza para el parrnetro de inters, pero no provee la prueba de hiptesis correspondiente. Tamtrin puede ser que el experimentador quiera, adems de la conclusin de la hiptesis, el intervalo de confianza para el parmetro que 1e interesa; en ese aspecto,
este criterio tiene ventajas sobre los anteriores.

la1

iS.

a-

ffi&p$mw$w pmrm dmru mm#mru; ffiffitrffiWmrms$Srx

dm'd*w

*wmmw$esewru

lJn problema frecuente que se presenta es comparar la media de dos procesos o dos tratamientos. Por ejemplo, comparar dos proveedores, dos materiales. dos mquinas
o dos mtodos de trabajo.

Supongamos que interesa comparar dos tlatamientos )' que stos son dos mquinas A y B, que realizan la misma operacin. Para ello se obtendr una muestra aleatoria de observaciones de cada mquina. Supongamos que los datos a observar en la mquina A son Yor, Yor., ..., Y, y los datos de la mquina B son YBy, Ys2, ..., Yu,,. Estos futuros datos se podrn escribir como en latabla2.2: Para que la comparacin sea justa, la materia prima que utilizan las mquinas se asigna de forma aleatoria a las mquinas, y las 2n pruebas o conidas se hacen en orden aleatorio. No es adecuado realizar primero todas las pruebas de la mquina A

40

eApTUL*

Eierrentos de inferencia estadstica

Tabla 2.2 Comparacin de dos tratamientos.

l't:

Iat
Yn
Yen

+
X,*"

y posteriormente la: de ia rnqnina B. prorque eso puede favorecer a una de las mquinas y afecta isesgar la compara.-in. La asigaacin aleatoria del material hace posible que a cada mquina le corresponda material con una calidad equivalente, y el orden aleatorio de la: prueba-s nulifica el efecto de las fuentes de variabilidad que acran durante el transcurso de las mismas (como las variables ambientales), al re-

partir su efecto equitativamente en ambas mquinas. Ahora, veamos cmo hacer estadsticamente este tipo de bomparaciones. Suposicin de varianzas desconocidas. Sean dos procesos o tratamientos con medias 4" y ltyy varianzas o1y ol, respectivamente. Interesa investigar si las medias de dichos procesos pueden considerarse estadsticamente iguales. Para ello se plantean las siguientes hiptesis:

Ho:&r=

&y

(2.t2)
Ha: ,t, # .t,
que se pueden reescribir como

Ho: #, - /tr,

(2.13)

H^:

p,-

py + 0

Para probar r1o se toman dos muestras aleatorias, como en el ejemplo de las mquinas antes descritas, de tamao n, la del proceso X,y de tamao nrladelproceso f; en general, es recomendable que n, = ky = n, pero tambin puede trabajarse con n, n, si no pudieran tomarse iguales. Si cada proceso sigue una distribucin normal y son independientes entre ellos, el estadstico de prueba adecuado para probar la hiptesis de igualdad de medias est dado por,

'0

t=

lrT J,\r, I-+

X_Y
fr,

(2.14)

Hiptesis para dos medias:comparacin de dos tratamier,::s

{il

el cual sigue una distribucin 7de Studenfconn,* fly- 2 grados de libertad, donde Sf es un estimador de la varianza muestral comn, suponiendo que dichas varianzas
desconocidas sean iguales, y se calcula como

(n"
5,, =

-1,)Sl+(nj -l)S)':

nr*nr-2

talCe

con S] y S] hs varianzas muestrales de los datos de cada proceso' Se rechaza Ho ri I tol ) totr, donde to2eS elpwto al2 de la cola derecha de la distribucin Z de Student con nx * fty - 2 grados de libertad. Cuando la hiptesis alternativa es de la forma H. : lt, > ly, Se rechaza Ho : lt* = pl., si l ) t1, y si es de la < Sa rechaza si /s < -fo. En forma equivalente, se rechaza Ie si el forma He:

F* Fy, valor-p < & para la pareja de hiptesis de inters.

:.y
lue

Ejernpla ?"5
Compracin de dos centrfugadoas. La calidad de la pintura ltex depende, entre otras cosas, del tamao de la partcula. Para medir esta caracterstica se utilizan dos centrifugadoras, y se sospecha que stai reportan mediciones distintas para la misma pintura. Se decide hacer un estudio que permita comparaf las medias y las varianzas reportadas por los dos equipos; para lo cual, de un mismo lote de pintura se tomaron 13 lecturas con cada centrifugadora. Los resultados son los siguientes:
4',7'14

lees-

con
dias
an-

6011,

-:i r' r.'r rr

4:6P6'

4896 4561

4oO5: '-rr'4r8'r0
:

4987

5,i

q:962,r.r,, r',"'4 06|6

&.

626

:..::.

.,..

:'

4 924

XiJ'
,,.12)

4,684.00;"'

"

'l

s?;
4 530

1,24'732.001

4295

4.2.|t

.in=

47.:44

, 3:7M

4'326

3797
,;:,'

4 401

4618 4339
112 020.00

4779
41AO

4:152

44A892;

Sl=

Para comparar las medias se plantea la hiptesis de igualdad de medias con la alternativa bilateral, puesto que no hay ninguna conjetura del experimentador acerca de cul centrifugadora puede reportar valores mayores. Luego, el planteamiento es: 2.13)

,
Lqui-

Ho: &, = I'tv HA: I't,# HY

:so

f;

Itt, i
mal y la hi-

la cual se desea probar con un nivel de significancia de 57o (a = 0'05)" Suponiendo igualdad de v,rianzas pan el tamao de la partcula, el estadstico de prueba calculado con las frmulas (2.14) est dado por

to=

4684.00-4408.92

344.06JOrc)+Qt:r,

=2.04

t2.14)

De la tabla de distribucin Z de Student con 13 + 13 - 2 = 24 grados de libertad, se obtiene el punto crtico t0.ozs,z+1= 2.064' Como ltol = z'O+ < 2'064 = to2' rto sa rechazaHo, por lo que se concluye que las centrifugadoras A y B reportan en promedio el mismo tamao de partcula. Es decir, las centrifugadoras son estadsticamente

42

{APT!"}LS

ilien"r*nt*s de infer*ncir *stacistie*

iguales en cuanto a sus medias. Sin embargo, conviene observar que el rechazo es por un margen muy escaso, puesto que el estadstico de prueba y el punto crtico son muy similares. Al comparar la significancia predefinida a = 0.05 con el valor-p = 0.053 se concluye lo mismo (no se rechazallo), pero se aprecia que si tal significancia predefinida por el experimentador fueraa = 0.055, la decisin sobre la hiptesis sera rechazada. Esto es, basta con que el experimentador est dispuesto a correr 4.5% de riesgo tipo I adicional para concluir que las medias de las centrifugadoras no son i-euales. En general, no es recomendable cambiar a posteriori el valor cr para modificar 1a decrsin sobre una hiptesis. pero habra situaciones en las que se pueden a.imtlr pr:b'eblhdades de ese errtrr hasta de c,- = 0.1. dependiendo de lo que
::*":- t; ; :-'--:1ir: l- " i: .1-:.1.. Otrr aspecio ,-on:i.ier" es 1a slgrul-icancia prctica de 1a decisin sobre la Luptesis. 1o cual tiene que ver con la dii'erencia obsen'ada. que en este caso es

- | =4 684.00 - 4 408.92 = 27 5.A8

y representa un e stimador d 1a diferencia en las medias poblacionales del tamao de partcula que son reportadas por las centrifugadoras. En caso de que 275.08 represente una diferencia relevante. que puede impactar fuertemente 1a calidad de1 tamao de partcula, sera un elemento favorable al tratar de verificar si tal diferencia es real. Ya sea al anahzat la conveniencia de utilizar o = 0.055 o tomando ms datos. Si por el contrario, la diferencia observada se considerara despreciable o irrelevante desde el punto de vista prctico, entonces "conviene" aplicar estrictamente a = 0.05 y concluir que las medias de las centrifugadoras son iguales. E1 caso de las varianzas desconocidas pero iguales que acabamos de describir, es el ms utilizado en la prcticapara probar la igualdad de dos medias. En muchos estudios es razonable suponer que las varianzas desconocidas de los dos tratamientos a comparar son iguales. Pero en ocasiones las varianzas no son iguales, o no existen datos histricos sobre los dos tratamientos que permitan suponer algo pertinente sobre las varianzas. Por ejemplo, al comparar dos proveedores del mismo material puede no haber razones para suponer de antemano que las varianzas de cada uno de ellos sean i-suales o parecidas (estadsticamente). Si no se supone igualdad de varianzas. e1 estadstico de prueba para Hs 1 lt,= 4,. est dado por

sj
-f

(2.1s)

s:
trr'

h,

que sigue aproximadamente una distribucin T de Student, cuyos grados de libertad v (nu) se calculan mediante la relacin:

tSj/n, r {5'/n tr n -ll. n -1

[f

.f)'
a

t2.16t

Prueba para la iguaidad de varianras

4t

:
S

f
S

Como antes, se rechazaHo ri I fol ) ton." o si el valor-p < a. Por ejemplo. si en el caso de las centrif'ugadoras no se pudiera suponer que las varianzas son iguales. e1 valor del estadstico dado por la expresin (2.15) resulta ser /0 - 2.04, y aplicando la frmuia (2.16) para calcular los grados de libertad, se obtiene eue v = 26. Con esto se determina que el valor-p = 0.052. Por lo tanto, con a = 0.05, no se rechaza la igualdad de las medias. sta es la misma decisin que se obtuvo al suponer varianzas iguales; observe que los valores de ls y el valor-p son prcticamente iguales que
antes.

Frueha pera Ia *gualdad de variffimxas


En lugar de suponer, en la prueba de medias, que las varianzas son iguales o diferentes, se puede proceder a verificarlo de manera estadstica mediante las hiptesis:

la

Hg: O2,= Ol
1e

(2.w)
Ho:
o2"

e-

* oi

io
al.

or
)s-

ty
rir,

La comparacin de varianzas tiene inters en s misma, con independencia de las me<lias, puesto que stas son determinantes en cualquier proceso o tratamiento. En general se considera que a menor varianza, implica potencialmente mejor calidad. Por ejemplo, en el caso de las centrifugadoras interesa ver si alguna de ellas tiene mayor error (variabilidad) en sus mediciones. El planteamiento de la hiptesis se puede reescribir como: (f'

luTA-

no

Hn::;=1
o"
(2.18)

rti0a-

H^::;*l
o;
paru enfatizar que la prueba se basa en la distribucin del estadstico, E -l

o'

lda
de

1s)

"s;

,s2

(2.19

rtad

el cual, bajo el supuesto de que /6 es verdad, sigue una distribucin F con rz, - 1 grados de libertad en el numerador y nn - 1 grados de libertad en el denominador. A1 calcular el valor del estadstico de prueba se obtiene que Fo = f .il. Como la distribucin F no es simtrica, el valor-p est dado por el rea bajo 1a curva a la derecha

lacurvaalaizquierdade 1/1.11=0.9.2Medianteelpaquete estadstico Statgraphics se obtiene valor-p = 0.85. Por lo tanto, utilizando a = 0.05, la decisin es no rechazar Ho: ot, = oi., y se concluye que, estadsticamente,
de 1.11,msel reabajo .16)
2En general, los puntos porcentuales de cola izquierda y cola derecha de la distribucin F cum-

plenlaigualdad'.Ft

o.,,

t.n2

1=IlFo,,, t.n, r.Esdecir,unoeselinversodelotro,intercambianlos

grados de libertad del numerador y de1 denominador. Si stos son iguales simplemente es el inverso.

44

CApYAitS

E{ernentos de inferencia estadstiea

las centrifugadoras tienen la misma variabilidad, precisin o effor de medicin. El valor del valor-p tan grande con respecto al valor de a, seala que la decisin de no rechazar la igualdad de varianzas es contundente.

Comparacin de proporcones
Una situacin de frecuente inters es investigar la igualdad de las proporciones de dos poblaciones o tratarnientos. es decir. se requiere probar la siguiente hiptesis:

H:P, =P: Jn *p:


dondepl y pzson las proporciones de cada una de
poblaciones o tratamientos. Por ejemplo, para evaluar dos frmacos contra cierta enfermedad se integran dos grupos formados por dos muestras aleatorias de nr = 1. - 100 personas cada una. A cada
1as

grupo se le suministra un frmaco diferente. Transcurrido el tiempo de prueba


observan

se

\ = 65 y xz = 7 5 personas que se recuperaron con el frmaco en los grupos correspondientes. Para ver si estas diferencias son significativas a favor del frmaco 2, se necesita probar la hiptesis de igualdad de proporciones. Para ello, bajo el supuesto de distribucin binomial, el estadstico de prueba zs est dado por:

bodonde

frt(t-;)
>:o/r. En caso de que
1a

p {.-'| !-' ' = n1ln2

. Se

rechaza

Hs

si

lz0 |

hiptesis alterativa

fuera unilateral, entonces z se compara con z.t. En el caso de los frmacos, como (65 + 15)l(100 + 100) = 0.70; entonces.
65 75 100

f=

100

= -I.543

\07(1-0?)[#.#)
Como I o I = t.5+3 no es mayor gtJe Zo.otz= L96, entonces no se rechaz a Hs, por 1o que no hay evidencia suficiente para afirmar que un frmaco es mejor que el
otro.

PobXaeomes pareadas {cCImparacSm de dCIs medas c$m rmrestras dependientes)


En las secciones anteriores se prob la hiptesis de igualdad de las medias de dos poblaciones o tratamientos, suponiendo que las dos muestras son independientes. Esta suposicin se justifica por la manera en que se obtienen los datos; es decir, a la muestra a la que se le aplica el tratamiento 1 es independiente de la muestra para el tratamiento 2, y los datos se obtienen en orden completamente al azar. Con esto se

F*hlari***s pnr*ad;*t lri:lt'lp*ra*:i** d* *i*s m*clias


t.

rilr

l'l:r:*str*s iSependielt*:)

45

EI

lno

;de
!.

Por
pos ada

justifica la suposicin de que no existe relacin directa entre los datos en el primer tratamiento con los datos en el segundo. Recordemos que orden completamente al azar significa que las unidades se asignan de manera aleatoria a los tratamientos, mientras que las pruebas o corridas experimentales se hacen en orden estrictamente aleatorio, lo cual se hace con la idea de evitar cualquier sesgo que pudiera favorecer a uno de los tratamientos. Sin embargo, en muchas situaciones experimentales no conviene o no es posible tomar muestras independientes, sino que la mejor estrategia es tomar muestras pareadas. Esto significa que los datos de ambos tratamientos se van obteniendo por pares, de forma que cada par son datos que tienen algo en comn; por ejemplo, que a la misma unidad experimental o espcimen de prueba se le apliquen los tratamientos a comparar. Un par de ejemplos son:

ffi
e *; ", a! a,
Es :,'r:n*pfi

gtarr*a:t*

c-=

:r

el que ls unida,

des
las

s::.

letc'
hacen

.^. de mner

: itenientos
=' :="
-:

piue:..

l-eniles :e
-.::ol-io,

ei -'i=-

w
ffluestras pareacas
Son aquelies .. :-.: ;s dalos de anrbos -. : - :-iJs 5e obtienen pof :a rranerS que slos iiene - . -... coTt:n ) nlr -,On - -. - - ,-. -.

--

* "

rse
pos aco

A los mismos pacientes se les aplican dos medicamentos (tratamientos) para el dolor en distintas ocasiones; los tratamientos a comparar son los dos medicamentos. A las mismas piezas se les hace una preba de dureza con distintos instrumentos; aqu se quieren comparar los instrumentos.

:r--:

:'

su-

lVa

En el primer caso, el apaleamiento consiste en que el grupo de pacientes que recibe el medicamento A es el mismo grupo que recibe el medicamento B, por 1o que las mediciones del efecto de los medicamentos sobre el mismo paciente estn relacionadas, y en este sentido no son independientes. Al ser el mismo grupo el que recibe ambos tratamientos se logra una comparacin ms justa y precisa, pero adems, al observar las diferencias entre los tratamientos en un mismo paciente se eliminan otras fuentes de variacin y se logra hacer una comparacin sin sesgos. En el caso de
las piezas, si una es grande se espera que ambos instrumentos tiendan a reportar una medicin alta, por lo que se espera que haya una fuerte correlacin entre las medi-

ciones reportadas con los dos instrumentos. Adems, al medir las piezas con los dos instrumentos, si hay diferencias en las mediciones sobre la misma pieza, entonces esas diferencias se deben principalmente al sistema de medicin.

Ejemplo 2.6
)or
e1

los
es.
1^ ,1d

Comparacin de dos bsculas. Se desea ver si dos bsculas estn sincronizadas. Para ello se toma una muestra aleatoria de 10 especmenes y cada uno se pesa en ambas bsculas, cuidando que el orden en que se utilizan sea elegido al azar. El trabajo lo reaTiza el mismo operador y los datos obtenidos se muestran enlatabla2.3. Es claro que tenemos el caso de observaciones pareadas, ya que el peso que registra una bscula para un espcimen no es independiente del que registra la otra bscula para el mismo espcimen, en el sentido de que si uno es muy pesado se espera que ambas bsculas lo detecten. La comparacin de las bsculas se puede evaluar probando ia siguiente hiptesis:

rel
se

: t, Ho: tt * ,Lt
Hs'. P1

eAPiTUtO

Elernentcs de inferenca estadstica

Tabla 2,3 Mediciones reportadas por dos

bsculas.

I
2
J

4
-)

6 7
8

8.33 10.50 23.42 9,15

11.23 | 14.36 i

11.27

13.47 I Q.4A I 19.38 !

i I | I

14.4t A.-l:
10.s2
23.41

-0.04 -0.05

4.02 4.02
-o.01

9.t'7
13.52

4.02
-o.05
0.01

6.41 I

9
10

6.46 12.4s
19.35

-0.05
0.03

dondepl es el peso promedio poblacional que mide la bscula I y ptres el peso promedio poblacional que mid'e la bscula 2. Entonces, estas hiptesis, en el caso pareado, se plantean de manera equivalente como:

Hs:

ur=g
(2.20)

H^: p
donde

pt, es la media de la poblacin de diferencias. De esta manera, el problema de comparar las medias de dos poblaciones se convierte en el problema de comparar la media de una poblacin con una constante. En este sentido, el estadstico de prueba para la hiptesis (2.20) es el caso particular del estadstico (2.8) para una media, cuando &o = 0 (vase seccin "Prueba para la media" de este captulo). Esto es, con la muestra de n diferen cias (d1, cl2, . . . , d,) se obtiene el estadstico dado por:

to=
donde

s,tJ

(2.21)

d = -0.02 es el promedio muestral de las diferencias, So = 0.02g7 es la desviacin estndar muestral de tales diferencias y /? es el tamao de la muestra. Bajo F1 el estadstico r- se distribul'e como una Z de Student con n 1 grados de libertacl, prrr lo que ll se rechaza si l " ) r,- : ,, _ .. o si yalor-p < c. Al hacer los clculos resulta que:

-{.01
0.0287 /

10

= -1.20

como el valor-p = 0.055 es mayor eu 6r = 0.05 no se rechaza Hs aun nivel de significancia de (x, = 0.05. Es decir, no hay suficiente evidencia en cona de la sincronizacin de las bsculas. Sin embargo, esta conclusin es bastante endeble dado que el varor-p es muy similar al valor a.De hecho, cone, 0.06 se concluira lo = contrario, y el experimentador debera considerar la posibilidad de asumir este riesgo de 67a y rechazar la sincronizacin de las bsculas.

i:iili::i;:r:ir-rl*r r;;'*,*ii.:::; {;.*rrp..:ra*r}t

eJg iiq."*

rn*iii;s i:

firliii:

.:cf lirrjii.:'l.e$}

47

Si en el ejemplo, en lugar de analizar las diferencias, que es la manera correcta de resolver el problema, se analizan por separado las mediciones de cada bscula, el efecto de las posibles diferencias entre los dos instrumentos se mezclara con la variabilidad que de por s tienen las piezas. Pero aun si se pesara un grupo diferente de 10 especmenes con cada bscula, entonces la propia variabilidad de las piezas dentro de cada grupo, ms las diferencias entre los dos grupos. probablemente ocultara el efecto de la diferencia de los instrumentos de medicin. As, las observaciones pareadas son necesarias para eliminar fuentes de variabilidad que podran no dejar hacer la comparacin de manera eficaz, esto quedar ms claro a continuacin.

Fmbaci*ns p#reades: esffi m;.s general


La mayora de las aplicaciones de la prueba pareada buscan una estrategia en donde las diferencias observadas se deban a los tratamientos que se quiere comparar, y no al efecto de la heterogeneidad que de por s tienen los especmenes de prueba. De

D)

utilizarseen situaciones ms complejas donde variabilidad explcitas. Por ejemplo, se quieren cornparar dos mquinas por medio de los resultados que generan, pero el material que utilizan tiene una historia larga en la que sufri el efecto de varios factores como son: proveedores, lotes, turnos, das, subprocesos, etc.; entonces, al no ser posible hacer dos mediciones sobre la misma pieza como en el caso de las bsculas, se requiere una identificacin ms estricta de las t-uentes principales de variabilidad a fin de parear los datos con base en ellas.
esta manera, la prueba pareada puede es necesario comparar tratamientos ante la presencia de varias fuentes de

de

ia
ba

Eiemp$* ?"s
lmpurezas en cofres levantados y bajados. En una fbrica de autos se tiene la conjetura o hiptesis de que el nmero de impurezas en la pintura de los cofres de los autos es diferente, dependiendo de si el auto pas con el cofre cerrado o abierto por ios homos de secado. Se decide correr un experimento para comparar el nmero promedio de impurezas en cada situacin dei cofre (tratamientos). Se consider que no era adecuado ilizar muestras independientes, ya que se saba que los das de la :m?lril o los turnos podan tener influencia en el nmero de impurezas. Estos dos :actores se incluyen en el estudio como el criterio de apareamiento, como se muestra :n la tabla 2.4, en la cual tambin se aprecian los datos obtenidos. As, en cada com:inacin de da y tumo se asignaron caffos con el cofre levantado y cer:rado. Cada dato en las columnas levantado y bajado en la tabla 2.4 representa el :rorrredio de impurezas en 10 autos, de tal forma que en el experimento se utilizaron :n total 200 autos. La aleatoridad se llev a cabo por parejas de autos: antes de - entrada a los hornos se aleatoriz si el cofre del primero estara levantado rr t,etrjo: si le tocaba levantado, el cofre del segundo auto deba estar bajado. E1 planteaniento estadstico consiste en probar la hiptesis de que 1a n-redia de las drferencias -s cero:
H(j'. ptp

ia,
on

1)

ies-

ajo
tad,

:1

de

sin-

lado ia lo
esgo

=0
(2.22)

Ho: pt,

7
48
CAPTULO

Elementos de inferencia estadstica

Tabla 2.4 Nmero de impurezas en cofres de autos.

:1

!!fPS
L!l!$S',',,,""', "''

:2:

MARTES MARTES

M T M
T

3.4
3- I

2:-],

0.7
.',0t5 rl11

es$f$e$ , pf$eb3

3,L
1",8

2'5 se r n la tabla

2t9
2.5 1.6

. oue inuolucran
. tistan los Prote
udu

4
5

1,9

ldncoms

,o'6
0,5 0.6
.0.9
1' f,

M
T

i.1
2.2 2.8

tuto t"

6
7

lffi.cors
JUEVES

2.8 3.7 5.9


4,,8 4:,s

tecna ,nteno de
1el valor-P'

Tt'
et
e

I
9,,,

JUE\'ES
VpRI!$S,,,,r,':,,,
-VIERNES'"',.'t',i

M T M
Tr

s( rabala conun

o,*
4;3
3;.,-4

',0.5 0.9

sible rechazar

10

nla tabt Hn: ta lnmelt


'aq iguales'

,"ot Y tt '

Al aceptar Ho: LLo= 0 se estara admitiendo que el nmero de impurezas promedio en el cofre levantado y bajado son iguales (Ho: ltr = t ).El valor del estadstico de prueba es:
t

Uso de
si
se

" Sol'ln
=-=_-tr/fl

Los rrrtodt

0.74

utlhzi

0.24131J10

estadsticc Lncluven

y el nivel de significancia observado (valor-p) es 0.0000046, el cual es menor que a = 0.05, por lo tanto, se rechaza de manera contundente la hiptesis nula de que los
tratrmientos son iguales, es decir, e1 nmero de impurezas en los cofres depende de si ste se encuentra levantado o bajado cuando el auto pasa por los homos. Pero adems, como se observa en los datos, cuando el cofre est levantado hay menos impurezas: entonces, a partir de esto se decidi que los cofres de los autos se levantarn al entrar a los hornos de secado. Con esta medida se logr reducir en forma significati-

En Partic
Sesviacrt

Oile-t
i'ttet

tierneil

va el nmero de impurezas. Ntese que en la tabla 2.4La gran variabilidad que existe entre los datos de un da a otro, -v tambin entre turnos. Eso causa que, si en lugar de analizat las diferencias se analizan los datos de cada tratamiento (posicin del cofre) por separado, las diferencias debido a tratamientos se pueden, minimizar ante tanta variabilidad. En efecto. si la comparacin se hace siguiendo el criterio de muestras independientes, entonces de acuerdo a lo visto en la seccin "Hiptesis para dos medios" de este captulo, el estadstico de prueba es / = 1.39, que le corresponde un valor-p = 0. 18, por lo que al proceder de esa manera se concluira en forma equivocada que no hay diferencias entre tratamientos (los detalles de este anlisis se dejan ccmo ejercicio). Esto, aunado a las mejoras logradas, justifica que la forma como se hizo el apaeamiento fue necesaria y coffecta, ya que como se aprecia en el arreglo deIatabla2.4, se asegur que al aparear caffos pintados el mismo da y en el mismo turno, se logran resultados ms homogneos a los que se les aplican los tratamientos, por lo que las diferencias observadas dentro de un mismo da y turno, se deben en gran medida a los tratamientos.

Uso de un software estadstico

l{9

Resumen de frmulas para pracedlmientos de prueba de hiptesls


En la tabla 2.5 se resumen las frmulas de los procedimientos de pruebas de hiptesis que involucran un parmetro de una sola poblacin, mientras que en la tabla 2.6 se listan los procedimientos que involucran a dos parmetros de dos poblaciones. En cada caso se muestra el planteamiento de la hiptesis, el estadstico de prueba y el

criterio de rcchazo, este ltimo para cada una de las tres posibles alternativas. Si se trabaja con un software estadstico es ms directo y conveniente basarse en el criterio del valor-p, el cual, para cualquier hiptesis, debe ser menor qu,e a paruque sea posible rechazar In. En la tabla 2.6, note que aparecen tres maneras de probar la igualdad de medias Ho: la primera a) es para el caso de muestras independientes suponiendo varianzas iguales. La segunda b) es para muestras independientes sin suponer varianzas iguales y el caso e) es para muestras pareadas. >
S-

Uso de un safhrare e$adstico


l-os mtodos estadsticos tratados en el presente captulo son ms fciles de aplicar si se utiliza un software para hacer los clculos. Prcticamente en cualquier software estadstico se incluyen los mtodos aqu tratados. por ejemplo, en Statgraphics se incluyen en los mens de Describe y Compare que aparecen en la pantalla principal. En particular, para hacer una estimacin puntual y por intervalo, para la media y la desviacin estndar, la secuencia a elegir es la siguiente: Describe + Numeric data -+ One-variable analysi,s; entonces, se declara la variable a analizar,la cual fue prer-iamente capturada en una columna de la hoja de datos y despus se pide Confidence intervals en las opciones tabulares y se especifica el nivel de confianza deseado

EE
OS

de

le)u'81

rri-

Tabla 2.5 Procedimientos de prueba de hiptesis para un parmetro.


un tnlas

En
loS,

:ste

18,
hay

io).
tea-

2.4, Fan
r

las

laa

7
50
Captulo

Elementos de inferencia estadstica

Tabla 2.6 Procedimientos de prueba de hiptesis para dos parrh-rs

a|H.n
',.',,::tH).
,;t,..:,,,H'1.

lL:1-=.&z

t{.i,,',,t,ltt
:lt;,2:::p2

-u-------F

xr- x,

Ful>r.,="-*,
to>
to <
to-

'"J;.;.
donde

q*..-z

':''.

Hi:

pr''1'P:"

-to. r4-z

"o_ F,-l)s',*("r{)sl \+n'-2


!
b) Hc
HA

Ft=$z

fIA H^

Ft* Fz l\> Itt

, _ xr-, ,o-m

t\<th

{t*t

li;,li;;y"',.,,
to',>.,'{_t:-;..r'.il

ldffde

to 1

-t o,,

u:::,::,,,;,:

s;.s;
\n2
lL:.*1,L.,:,.::,;;..;:,:.,;,,:f4;,l

a],Ha.
:.a

o!,,;,,::6;'tr:,'

'',H. i?,.;z

,'

.,.:'

;:ri

..:'

ior>"Fit n. t. n2-t

Fo

< Fr-o,r, o ,, nrt:'',;'

Hi
HA

7';;'
o?'< atr
Pt=Pz

Fo> Fo.nl t.n2-l

F, < F,

.o,

t l, nr-7 t '

AHo
H"
HA

..,,t1,

Pt+Pz

!t)Pz.
Pt<Pz

li;t;,,;i r,r,
) : ^ X,+X. p\*nz
d

lrol, ,",,
:'tt
.,., :'

. Al>;,Qt:'::.i.lliii

t1,ljii.,i:r,.::::,,iti'l'it
I

'He

ZO'2-:,;

:::r::

111'''l

rl';'11

':'11'

= :.H P1* P, HA pr') ltz


l4-.t

',)::Hb

Fz

'o

-_ s,lJi

:'::.,' It f:> i ur r"' ;t;:' "::'" .:

:'

,ru.>-.rr;:];:;.,,.,:::.r,,r,:
at:fii,::<.+:1.,.:,it:i..::.,:,:):.:::.:.,,':

HA

PtlFz

(Pane options). Ah mismo est la opcin Hypothesis tests.Enlas opciones de panel valor Qt que define la hiptesis nula, el nivel de signicanciaa y el tipo de hiptesis alternativa que se tiene.
se especifican: el

Las hiptesis sobre la desviacin estndar se prueban en la opcin Confidence interuals usando el criterio del intervalo de confianza: si el valor especificado en la hiptesis nula oo se encuena dentro del intervalo no se rechaz a H0: en caso contra-

rio

se rechaza.

El problema de comparar dos medias o dos varianzas con muestras independientes. esr en Compare -> T\ro samples -+ Ttro-sample comparison. En las opciones tabulares se escogen Comparison of nteans y Comparison of standard deviations.

t
Fregunias y eiereicios
Para comparar medias con muestras pareadas la secuencia de opciones a utilizar es Compare + Two samples -> Paired-sample comparison.En Minitab, la secuencia para estimacin y prueba de hiptesis es: Stctt + Basic Statistics, y ah se elige la opcin deseada para una, dos muestras (sample) o muestra pareada.

5l

hn kxcel

Para hacer clculos estadsticos en Excel se utilizan las funciones (f,) estadsticas r' la opcin Anlisis de datos dentro del men de Herramientas . Si no estuviera activada la opcin de Anlisis de datos, sta se activa usando la opcin Complemenlos que est dentro del mismo men de Herramientas. Para probar la hiptesis o encontrar

intervalos de confianza para un parmetro, se usa la secuencia: Herramientas '> Anlisis de datos -> Estadstica descriptiva. Ah se activa el cuadro u opcin Nlvel de confianza para la media. En todos los casos, despus de sealar el anlisis que
se desea hacer, se abrir una ventana en la que se especifica el rango de celdas donde se encuentran los datos

y las estadsticas deseadas.

En caso de comparar las medias de dos poblaciones suponiendo varianzas desconocidas pero iguales, la secuenciaes'. Herramientas -+ Anlisis de datos -> Prueba t para dos muestras suponiendo varianzas iguales. Para probar la igualdad de dos medias usando muestras pareadas la secuencia es'. Herramientas -> Anlisis de datos + Prueba t para medias de dos muestras emparejadas. Al final, para probar la igualdad de las varianzas se utiliza la serie de comandos'. Herramientas -> Anlisis de datos - Prueba F para varianzas de
eJos

muestras.

t. En un estudio estadstico, cqu es una poblacin y Para qu se toma una muestra?


2. 3.

iQu es probar una hiptesis? iQu es hacer una estimacin puntual y en qu consiste hacer una estimacin por intervalo para la media, por ejemplo?
ZPor qu no es suficiente la estimacin puntual y por qu se tiene que recurrir a la estimacin por intervalo?

A l.

_-i
5.

Explique el papel que desempean las distribuciones de probabilidad en la inferencia


estadstica.

panel

6.

iaay
dence
7.

estimacin por intervalo, seale en forma especfica para estimar qu parmetro utiliza cada una de las siguientes distribuciones: f de Student, Normal y jiEn el contexto de

cuadrada.

en la ontraiepen-

Explique qu es un estadstico de prueba y seale su relacin con los intervalos de


aceptacin y rechazo.

B.

Qu son los errores tipo I y ll en pruebas de hiptesis?

9.
10.

Seale y describa de manera breve los tres criterios equivalentes de rechazo de una hiptesis. Seale un ejemplo de datos o muestras pareadas.

:iones
rt?

s.

f
g2
' ':.''.)-' '- " ','t , :.., -, . ,
,

Ejercicios de estimacin
I

I.

En la elaboracin de envases de plstico es necesario garantizar que cierto tipo de botella en posicin vertical tenga una resistencia mnima de 50 kg de fuerza. Para garantizar esto, en el pasado se realizaba una prueba del tipo pasa-no-pasa, donde se aplicaba la fueza de 50 kg y se vea si la botella resista o no. En la actualidad se realiza una prueba exacta, en la que mediante un equipo se aplica fuerza a la botella hasta que sta cede, y el equipo registra la resistencia que alcanz la botella. o) iQu ventajas y desventajas tiene cada mtodo de prueba? b) Para evaluar la resistencia media de los envases se toma una muestra aleatoria de n :20 piezas. De los resultados se obtiene que X : 55.2 y S : 3. Estime con una confianza de 95o/o, Zcul es la resistencia promedio de los envases? c) Antes del estudio se supona que ,& : 52. Dada Ia evidencia de los datos, ital su-

puesto es correcto?

d)
12.

Con los datos anteriores, estime con una confianza de 950/0, icul es la desviacin estndar poblacional (del proceso)?

Para evaluar el contenido de nicotina en cierto tipo de cigarros elaborados por un proceso, se toma un muestra aleatoria de 40 cigarrillos y se obtiene que i : I 8.1 mg y 5 : 1.7.

o) )

Estime con una confianza de 95o/a, icul es la cantidad de nicotina promedio por
cigarro?

Antes del estudio se supona que lt: 17.5. Dada la evidencia de los datos, ise puede rechazar tal supuesto? Con los datos anteriores, estime con una confianza de95o/o, Zcul es la desviacin estndar poblacional (del proceso)?

c)

d) iQu

puede decir sobre la cantidad mnima y mxima de nicotina por cigarro? Es posible garantizar con suficiente confianza que los cigarros tienen menos de 20 mg de nicotina.

13.

En un problema similar al del ejercicio I l, es necesario garantizar que Ia resistencia mnima que tiene un envase de plstico en posicin vertical sea de 20 kg. Para evaluar esto se han obtenido los siguientes datos mediante pruebas destructivas:

28J 26.8 26.6 265 28.1 24.8 27.4 26.2 29.4 28.6 24.9 25.2 30.4 27.7 27.O 26.1 28j 26.9 28.O 27.6 25.6 29.5 27.6 27.3 26.2 27.7 27.2 25.9 26.5 28.3 26.5 29j 23.7 29J 26.8 29.5 28.4 26.3 28.1 28.7 27.O 25.5 26.9 27.2 27.6 25.5 283 27.4 2B.B 25.O 25.3
27.7 25.2 28.6 27.9 28.7

a) )

ipor

Esta variable, forzosamente tiene que evaluarse mediante muestreo y no qu?

al

lOOo/0,

Haga un anlisis exploratorio de estos datos (obtenga un histograma y vea el comportamiento de los datos obtenidos).

c)
d)

Estime, con una confianza de 950/0, Zcul es la resistencia promedio de los envases?

Antes del estudio se supona

e)
14.

Dada la evidencia de ios datos, Ztal supuesto es correcto? Con los datos anteriores estime, con una confianza de 950/0, icul es la desviacin estndar poblacional (del proceso)?

quep:25.

En fa elaboracin de una bebida se desea garantizar que el porcentaje de CO (gas) por envase est entre 2.5 y 3.O. Los siguientes datos son obtenidos del monitoreo

del proceso:

55

ia
a

2.61 2.62 252 2.61 2.57 2.55 2.71 2.64

2.65 2.56 2.68 2.51 2.56 2"62 2.63 2.57 2.60 2.53 2.69 2.53 2,67 2.66 2 6a 2.60 252 2.62 2.67 2.58 2.61 2.64 2.49 2.58 2.61 253 2.53 2.57 2.66 2.a'l 2.57 2.56 2.52 2.58 2.64 2.59 2.57 2.58 252 2.61 2.55 2.55 2.73 2.51 2.61 2.59 2.60 2.64 2.56 2.60 2.57 2.48 2.60 2.61 2.55 2.66 2.69 2.56 2.64 2.67

o) ) c) d)

Haga un anlisis exploratorio de estos datos (obtenga un histograma y vea el com-

portamiento de los datos obtenidos).


Estime, con una confianza de 950/0, icul es el CO promedio por envase?
Se supone que

debe ser igual a 2.75. Dada la evidencia, ise puede rechazar tal

supuesto? Con los datos anteriores estime, con una confianza de 950/0, icul es la desviacin estndar del proceso?
U-

e)
15.

El anlisis de los datos muestrales establece que el mnimo es 2.48 y el mximo es

2.73, Lpor qu el intervalo obtenido en el inciso o) tiene una menor amplitud?


)n

Una caracterstica importante en la calidad de la leche de vaca es la concentracin de


grasa. En una industria en particular se fij como estndar mnimo que el producto que

'o-

tv

recibe directamente de los establos lecheros es de 3.00/0. Por medio de 40 muestreos y evaluaciones en cierta poca del ao se obtuvo que X: 3.2 y 5: 0.3.

o) b) c)

Estime con una confianza de 9oo/o el contenido promedio poblacional de grasa.

Ieon
Es

iCul es el error mximo de estimacin para la media? iPor qu? Estime, con una confianza de 950/0, icul es la desviacin estndar poblacional? puede decir sobre la cantidad mnima y mxima de grasa en la leche? iEs poZQu @ sible garantizar con suficiente confianza que la leche tiene ms de 5.00/o de grasa?

16.

m8

En la fabricacin de discos compactos una variable de inters es la densidad mnima (grosor) de la capa de metal, la cual no debe ser menor de 1.5 micras. 5e sabe por experiencia que la densidad mnima del metal casi siempre ocurre en los radios 24y 57,

rcia

aunque en el mtodo actual tambin se miden los radios 32, 40 y 48. Se hacen siete lecturas en cada radio dando un total de 35 lecturas, de las cuales slo se usa Ia mnima. A continuacin se presenta una muestra histrica de l8 densidades mnimas: 1.81, 1.97,1.93, 1.97, 1.85, 1.99, 1.95, 1.93, 1.85, '.l .87, 1.98, 1.93, 1.96,2.O2,2.O7,
1.92, 1.99, 1.93.

uar

:8.1

t9.7

o)

Argumente estadsticamente si las densidades mnimas individuales cumplen con la


especificacin de 1.5 micras. Encuentre un intervalo de confianza de99o/o para la media de Ia densidad mnima. D un intervalo de confianza de 990/o para la desviacin estndar.

t5.3

b)
Ao/0,

c)
d)
17.

Dibuje el diagrama de cajas para estos datos. lnterprete lo que observa.

omenI su-

En una auditora se seleccionan de manera aleatoria 200 facturas de las compras reali-

zadas durante el ao, y se encuentra que

l0

de ellas tienen algn tipo de anomala.

o) ) c)
lB.

Estime con una confianza de 950/o el porcentaje de facturas con anomalas en todas
las compras del ao. ZCul es el error de estimacin? tPor qu?

cin

tQu tamao de muestra se tiene que usar si se quiere estimar tal porcentaje con un error mximo de 2o/o?

En la produccin de una planta se est evaluando un tratamiento para hacer que ger-

I Por oreo

mine cierta semilla. De un total de 60 semillas se observ que 37 de ellas germinaron. o) Estime con una confianza de 900/0, la proporcin de germinacin que se lograr con tal tratamiento.

54

i-.FETiJ! ril

i-:l*rr*:l.i:t ii,: i;-:'+i::'t.l;r ::5i::.:,:

,:L

Con una confianza de 900/0, se puede garantizar que la mayora (ms de la mitad) de las semillas germinarn? los dos incisos anteriores pero ahora con 950/o de confianza.

c) Conteste
I

9.

Para er"aluar la efectividad de un frmaco contra cierta enfermedad se integra en forma aleatoria un gruPo de 'l00 personas. Se suministra el frmaco y transcurrido el tiempo de crleba se observa x:65 personas con un efecto favorable. c' Es'ttre crn una confianza de 900/0, la proporcin de efectividad que se lograr con :e ::'!r-:o. l-.iaga una interpretacin de los resultados.

ia !- ': :::: : i:l:lema Cel ejercicio l l, los datos anteriores al diseo de la prueba cc":'--: --:s:':- : siguienie: de n: r20 envases de plstico probados para ver si
tencia mlnira es:e:::::. ::aqa ..]na interpretacin de los resultados. iCul es el e-ro- ce =; -a::-l Calculeel tarnacde 'r-:;-=c-:s:recesitaparaqueel errordeestimacinmximo sea de 0.03.

tenlr : r=s.;=-:: r- :,::a de 50 kg de fuerza,x: l0 envases no pasaron la prueba. o) E-in-r::c---a::-i:aie95::, laproporcindeenvasesquenotienenlaresis-

) c)
21

Dos mquinas, cada una operada por Lrna ,ersona, son utilizadas para cortar tiras de hule, cuya longitud ideal debe ser de 20Cr min" De las inspecciones de una semana (25 pezas) se observa que la longitud media de las 25 piezas para una mquina es de 200.1 y para fa otra es de 201.2. ZEs significativa la diferencia entre los dos casos? Argu, mente.

Prueba de hiptesis (comparacin de tratamientos)

22'

bombillas y se tiene que elegir entre las marcas comPraron I o0 focos de cada marca, y se encontr que las bombillas probadas de la marca A tuvieron un tiempo de vida medio de I 120 horas, con una desviacin estndar de 75 horas; mientras que las de Ia marca B tuvieron un tiempo de vida medio de I 064 horas, con una desviacin estndar de g2 horas. o) iEs significativa Ia diferencia entre los tiempos medios de vida?
A y B. Para ello, se

Se desea comPrar una gran cantidad de

Use

0.05.

A:
23.

ZCon qu tamao de muestra se aceptara que las marcas son iguales, utilizando
O.Q5?

En un laboratorio bajo condiciones controladas, se evalu, para l0 hombresy lo mujeres, la temperatura que cada persona encontr ms confortable. Los resultados en

grados Fahrenheit fueron los siguientes:

74 i tz | 77 : 76 i l-T ..,.-'.'-..'-i-''...--"'*....i.-*-.'.'''*.l"--.-,....,-,*,-.*---....--]..*--.:
-..-.-

75i77i78.79 --.-.-L---,-.--.1--,,--.-r.--- --

I--i,.- " l---*-'-*i--73:78

77

it

i'

l]- ia ,-14 t
._i_1__-l__-1_"

t9 lZslsol 1 ""

i
',

7s

o) zcules son en realidad los tratamientos que se comparan en este estudio? b) ZLas muestras son dependientes o independientes? Explique. c) ila temperatura promedio ms confortable es igual para hombres que para mujeres?
Pruebe la hiptesis adecuada.

24. Se prueban l0 Partes diferentes

en cada nivel de temperatura y se mide el encogimien-

to sufrido en unidades de porcentaje multiplicado por 10. Los resultados son:

r
Preguntas y ejercicios

55

d)

17.2
na
Po

2t.4
;0.9
19.8

17.5 18,6 15.9


16,4
r'7

20.4 20.6

z\.a
20.8
19:9

-.

ba

'si
)4.

16.8 18:4
16.7:

;is-

2t.1
20.3

17.6

ixi-

o)

ZLa

temperatura tiene algn efecto en el encogimiento? Plantee las hiptesis esta-

de (2s
de

b) c) d) e)

dsticas correspondientes a esta interrogante. D un intervalo de confianza para la diferencia de medias. ZCul temperatura provoca un encogimiento menor? Compare las varianzas en cada temperatura. Dibuje los diagramas de cajas simultneos e interprete.

gu-

i5.

Una compaa de transporte de carga desea escoger la mejor ruta para llevar la mercanca de un depsito a otro. La mayor preocupacin es el tiempo de viaje. En el estudio

grupo de 10 y se asignaron a la ruta A; los cinco restantes se asignaron a la ruta B. Los datos obtenidos fueron:
se seleccionaron al azar cinco choferes de un

rcaS

illas
una

de

o)

iExisten diferencias significativas entre las rutas? Plantee y pruebe las hiptesis estadsticas correspondientes.
En caso de rechazar Ia hiptesis del inciso o), dibuje los diagramas de cajas simultneos para determinar cuf ruta es mejor. Sugiera otra manera de obtener los datos (diseo alternativo), de manera que se pueda lograr una comparacin ms efectiva de las rutas.

)
rndo

c)
?6.
Se

mu-

tienen dos proveedores de una pieza metlica, cuyo dimetro ideal o valor objetivo

5en

es igual a 20.25 cm. Se toman dos muestras de

l4

piezas a cada proveedor y los datos

obtenidos se muestran a continuacin:

21.38, 20.13, 19i12, 19.85, 20.54, 18.00, 22.24,21.94,

22.0, r8. 10, 19.25 2I.57, 22.22 ; 2L49, 2l


;9

1, 21.52, 22.06, 2I.5

r, 2r.29, 22.7 l, 22.65,

21

.53,

22.22,2l .92, 20.82


eres?

o) b)

nten-

Describa un procedimiento de aleatorizacin para la obtencin de estos datos. Pruebe la hiptesis de igualdad de los dimetros de los proveedores en cuanto a sus medias. Pruebe la hiptesis de igualdad de varianzas.

c)

56

CAP{-ru.*.|o:

eseemurs pre d carmo su 2O25 nnrn - 2.25 mm, Zcul proveedor fqdre rreiru p*ms e.r*rsasl et f-rt a*"fl pqeefu 5e rFFr{tra l*r[-l 2i. En Xow" S- Srnranapee, V" A f*rri 't {2m5} se pre.senta un estudio donde se mdan dos tiff de brr de poenerc, orp Ensin se refueza con fibra de vidrio (RP)- EG btrr-ds, en sffiin de hs ykFs de acero, son utilizadas para reforzar
corlcreto, por lo q-re su caracterizacin es

c r as

irportanb

para fines de diseo, control y

optimizaim para los ingenieros estrudrraler

Las bafi-ds se

sometieron

tensin hasta

regi*artinuacin:

su ruptura (en Mpa). Los datos para dos t{os de banas se muestran a con-

o) Formule la hiptesis para probar la igualdad de medias de los tratamientos. ) Anote la frmula del 'estadstico de prueba para demostrar la hiptesis. c) Pruebe la hiptesis a un nivel de significancia de 5olo. Para rechazar o no la hiptesis, apyese tanto en el criterio del valor-p como en el del valor crtico de tablas.

d) e)

Explique cmo se obtiene el valor-p del inciso anterior. Pruebe la hiptesis de igualdad de varianzas entre tratamientos.

f)

iExiste algn tratamiento mejor?

Se realiza un estudio para comparar dos tratamientos que se aplicarn a frijoles crudos,

con el objetivo de reducir el tiempo de coccin. Un tratamiento (Tl ) es a base de bicarbonato de sodio; el otro, T2, es a base de cloruro de sodio o sal comn. La variable de

respuesta es el tiempo de coccin en minutos. Se hacen siete rplicas. Los datos


se muestran en la siguiente tabla:

o) Formule la hiptesis para probar la igualdad de medias de los tratamientos. ) Anote la frmula delestadstico de prueba para probar la hiptesis. c) Pruebe la hiptesis a un nivel de significancia de 5ol0. Para rechazar o no la hiptesis, apyese tanto en el criterio del valor-p como en el valor crtico de tablas.

d) Pruebe la hiptesis de igualdad de varanzas entre tratamientos. e) De acuerdo con el anlisis hecho hasta aqu, ihay algn tratamiento

mejor?

29. Se comparan dos mtodos para inocular o contagiar una cepa del hongo del maz conocido como huitlacoche. En una primera etapa del estudio, el experimentador quiere determinar cul de los mtodos genera mayor porcentaje de infeccin. El mtodo A consiste en cortar la punta de la mazorca para aplicar la cepa, y en el mtodo B se inyecta la cepa de forma transversal. De 4't mazorcas inoculadas con el mtodo An 20 se infectaron, es decir, generaron huitlacoche; en tanto, de 38 mazorcas inoculadas con el mtodo B se infectaron 27. o) ZHay evidencia estadstica suficiente para afirmar que el mtodo B genera una mayor infeccin de huitlacoche? Plantee y pruebe la hiptesis correspondiente.
30.

El mejor mtodo de inoculacin del problema anterior se aplic a dos variedades de maz en dos localidades. Una vez infectada la mazorca, interesa medir el porcentaje

iier;',:ii.!. '' -;i-' :


:dor

-.:

57

inal de la superficie de

sta que fue cubierta por el hongo y el peso en gramos del r.itlacoche. Los resultados para la variedad 2demaiz, obtenidos en l5 mazorcas de lexcoco y en l5 mazorcas de Celaya son los siguientes:

le se

idrio
ofzaf

trol
L

Y
1

hasta
COf'l-

60
40
95 55

95
100

122.6 182:74 203.45

231.80 346.74
23.1.4t

2
J

70 40
35 100

4
5

84.03 128.46 31.85


12.81

t41.49 t49.69

40
20, 10

29t.28
86.03

30
100 100 100 25
15

8 9

10 55
15

57.05
145.83

r58.74
167.2s

ripterlas.

10

49.49 103.66 95.05


125.02

120.89
19.74

1l
12
13

35 25

22.08
134.O2

70
2A 2A

85
15

14

40.57
19.36

28.76
24.87

crudos, e bicarrable de s datos

t5

30

o) iSe

puede afirmar que el porcentaje de cobertura del hongo es mayor en Celaya

que en Texcoco?

b)

c)
d)
5.

Utilice un diagrama de dispersin (grfica tipo X-Y) para ver si existe una relacin lineal entre el porcentaje de cobertura de la mazorca con los gramos de huitlacoche. lgnore la cobertura y pruebe la igualdad de la produccin promedio de huitlacoche en las dos localidades.

evidente que a mayor cobertura hay una mayor produccin de huitlacoche, ihabra forma de saber con estos datos si a igual cobertura corresponde una produccin de huitlacoche semejante en ambas localidades? Argumente su respuesta.
Es

a hiPtea5.

51.

lr?

I maz co-

ior quiere
mtodo A lo B se inlo A, 20 se das con el

Con respecto al problema del ejercicio 18, se desea comParar dos tratamientos Para hacer que germine cierta semilla. Los datos del tratamiento A son los del ejercicio 18, es decir, de 60 semillas puestas a germinar se observ que 37 de ellas germinaron. Mientras que para el tratamiento B, de 70 semillas se observ que 50 germinaron. o) ZHay una diferencia significativa entre los dos tratamientos? Pruebe la hiptesis correspondiente a 950/o de confianza. b) Estime, con una confianza de 95o/o,la proporcin de germinacin que se lograr con cada tratamiento.

fa una ma:nte.

32. Se desea comparar dos proveedores; para ello, se toma una muestra aleatoria de la produccin de cada uno de n : 150 piezas, y se les hace en orden aleatorio una prueba. En el caso del primer proveedor se obtuvieron xr : I I piezas que no pasaron la prueba,

iedades de
porcentaie

mientras que para el segundo fueron xz:22. o) iQu proveedor parece mejor? b) LHay una diferencia significativa entre los dos proveedores? Pruebe Ia hiptesis correspondiente a 950/o de confianza.

58

CAPTUIO

Elemen::s

:= -'=.=-:

Pruebas pareadas

33.

tarda 2 rniutos. 5e orcpcne un nuevo mtodo de prueba que consiste en medir solamente los racias 2-:. 5f donde casi es seguro que estar el valor mnimo buscado. Si el mtodo ruer resuka igual de efectivo que el mtodo actual se podr reducir en
600/o el

La prueba actual de un solo disco se

tiempo de prueba,5e plantea un experimen-

to donde se mide la densidad mnima de metal en l8 dlxos u-ndo tanto el mtodo actual como el mtodo nuevo. Los resultados estn oderaios horizontalmente por disco. As LB8 y 1.87 es el resultado para el primer disco ccr- anrbos mtodos.

1.83

I 1.91 1.9+ i.95 i.93 I 2.18 1.81 t.t_1 1.97 1.92 . 2.A) t.fn 1.95

2.01 2.0A

2.05

o) b)

Pruebe la igualdad de las medias usando Ia prueba pareada. Cul es el criterio de apareamiento? Encuentre un intervalo para la diferencia de medias usando la desviacin estndar de las diferencias. Inteprete. Haga el anlisis de los datos ignorando el apareamiento. Compare con los resultados del inciso o), ipor qu ignorar el apareamiento es incorrecto? Determine un intervalo de confianza para Ia diferencia de medias suponiendo muestras independientes. Compare con el inciso b). en este caso?

c)
d)

f)

e) iQu se gana con el apareamiento de los datos

iRecomendara usted la adopcin del mtodo nuevo? Argumente su respuesta.

34. En una prueba de dureza, una bola de acero se presiona contra el material al que se mide la dureza. El dimetro de Ia depresin en el material es la medida de su dureza. Se dispone de dos tipos de bolas de acero y se quiere estudiar su desempeo. para ello, se prueban ambas bolas con los mismos l0 especmenes elegidos de manera aleatoria y los resultados son:

o)

Analice paso a paso cmo se hizo el experimento y explique por qu es importante realizarlo de esa manera. Pruebe la hiptesis de que ambas bolas dan las mismas mediciones de dureza. Pruebe la igualdad de las bolas sin considerar que estn pareadas. Compare los resultados con los obtenidos en el inciso ). LEn qu situacin se esperara que los anlisis ) y c) den los mismos resultados?

) c) d)
35.

Se conduce un experimento Para determinar si el uso de un aditivo qumico y un fertilizante estndar aceleran el crecimiento de las plantas. En cada una de l0 localidades

se estudiaron dos plantas sembradas en condiciones similares. A una planta de cada localidad se le aplic el fertilizante puro y a Ia otra el fertilizante ms el aditivo. Despus de cuatro semanas el crecimiento en centmetros fue ef siguiente:

Preguntas y ejercicios

59

rde
que

Sin aditivo Con aditivo

3el
nrdo
Por

o) )

ZLos datos obtenidos apoyan la afirmacin de que

el aditivo qumico acelera el

crecimiento de las plantas? Plantee las hiptesis apropiadas y prubelas usando

a :0.05.

c) Explique
)t

d)

Obtenga un intervalo al 950/o de confianza para Ia diferencia promediop. con detalle cmo se pueden asignar de manera aleatoria los tratamientos a las plantas en cada localidad utilizando una moneda. Suponga que en cada localidad una planta queda hacia el Este y la otra hacia el Oeste, realice una asignacin aleatoria de los tratamientos a las plantas lanzando

una moneda

l0

veces.

Retome los datos del ejemplo 2.6 (impurezas en cofres levantados y bajados): o) lgnore el apareamiento, y compare de manera independiente los dos tratamientos.

de

b)
ndar

Obtenga conclusiones. Explique si las conclusiones son diferentes con el anlisis en forma pareada y. de manera independiente. iCul es la conclusin correcta, hay o no diferencia entre los tratamientos?

c)
ultaes-

Se realiz un experimento para ver si dos tcnicos tienen alguna tendencia a obtener

diferentes resultados cuando determina la pureza de cierto producto. Cada muestra fue dividida en dos porciones y cada tcnico determin la pureza de una de las porciones.
Los resultados se muestran a continuacin:

t.

le se
feza.

ello,
ftoria

o) b) c) d) e)
tante
'4.

Estos datos deben analizarse en forma pareada, explique por qu.

Formule la hiptesis correcta al problema. Pruebe la hiptesis y obtenga conclusiones.


Si los tcnicos son diferentes, ihay alguna evidencia sobre cul de ellos hace mal el

trabajo? ZQu recomendara para lograr mayor uniformidad en las determinaciones de los dos tcnicos?

l!

to'

Cos?

rfertiCades

cada spus

Anda mungkin juga menyukai