Anda di halaman 1dari 26
2. ANALISIS DE RELACIONES JOHN W. TUKEY Joka W. Tukey empezs como quimic,siguié como matematico y fnalenen- te se conven extadltic debido a lo que dl mismo denomind “a expe fiencia de fos problemas reales y de los datos reales” qué adquiié durante In Guerra Mandal En 1937, ohn W. Tukey (1915) fue ala Princeton Uni- versity a estudiar quimica pero se doctor en matemiticas en 1939, Durante ta guerra taba en temas de precistn de fro. Después dela guerra, simul- taned su nbor en Princeton University con su trabajo en los Laboratovios Bell quis el grupo de investigncién industrial mis importante del mundo. Tukey dedicé ls mayor parte de su atencinal estudio estadisico de pro- temas especialmente difces de resolver, como son: la seguridad de los nestésices, el comportamiento sexual de los cares hurnanos, I comproba- cién del cumplimiento de a prohibicin de las pruebesnuclenes yl dter- tminacién de a calidad del aire vin contaminacia ambiental Baséndose en “la experiencia de los problemas reales y de los dates ra- Jes John Tukey desarollé el ands explortorio de datos, Invens algunas de as herramleniasestaistica que hemos visto en el capa T como, por cemplo, los diagramas de tallos y los diagramas de cap. Tukey cambi el -snfaque del andlsis de datos, efendiendo un andisis de dates mucho ow exible, mis explortoro,cuyo objetivo no consiste simplemente en dar ‘pest a preguntas coneeias. El primar propdsite es contetar al pregunea! ‘Qt dicen los datos?” Este capitulo, igual que el capitulo 1, sigue el cant ‘no que mars Tukey, y para ello presentamos mis ideas y herramientas pare examina datos seman wing sn &ems8> Hue gH BeuERY wENeS TI PueBUS MON TOME Fa a a uno ame esue) uON 8a oR SEBERIOD SNS! So» I oIPPENE Tew NOS ES TET ca soup sper se] OURIDP! ME 5 “at sss ptm fo gy SH} a u eae eo aieetaal BERETS Es BY aete Susceoe iter e emer e tir ow ie av ae ev tz ee RE ap RETA HAT EDT POL a eee YS INS SERN 22 SM hte: ‘aM aa oP sopeieg 01 9p WOPHERPS 92406 SOIC TSH, 16 /(¢>) suey ap aH Bail aia aonb ssn 0 uoDeRI MIP ap ezaesme ef seHoqdhs anuawydins S319m%D? « sep qundard am avenue” oqep ‘soyqeutia seezearp suns woes e seuTmex@ open weesodun spur ded um up an seouoBawe sqgetien se opides 21s ua soyep so] rezpreiro w wwpnde & senso “ord upyea opauaun v seouoBve Se Sarqeuea seszzarp aigos Forep souweuay opuenD loGmeqina wig “SeAREIRMERD sojqelseA Sej uD OpeNTeD soway SOU TOY REPEL guruoo ajqazton eum det souaus [8 0 sunmo Sa}geIEA Se SEPO} UOS? « [apn 98 op? {saguuaD Se BVURLTEIDEND UOS OIE? « {sovep 504 WaqUDSap sompraypur nO? + om “sds p ua syezegquny a 26 orb se] oo ‘aseuunid seunaxd se aropuyoreerd Tezodiza anb savbn “sojqeliea ses o SOP AUD UPDEAL m somTNEND OPEN canauaind ribo uifae ey oo 99pm wpe we sganud ee uewosaid as enb souanye ap aet faouod fp Woo "eau ap soy woo SEARLES 9p SOPEAISRE so] “LYS BAAN ML Ue “Sopeuopept urs omg soureunotd souenpod ezury “uuptpuodepsr eso} 2p caigetten seca ap snSe OpeUTAEND 20WDY wk “sSIE ap So U2 Opesaude sas vorajond corp soue(es sl 2p orpewosd f A vege sod sarmygp ua opesic UoRD onpo uo ago p-ngorad ey © ewsatd a5 anb sowunje ap afeuesiod (v5 ®4 turd ta sexnguarey ap & eBoy 2p oxpououd :UOs sa}Uesa:sjqauea OUD ser suiunigeg ap seq va oped epe> ap uypergod et axoRLOD eu EDEN] {ISM any aan0s 9M K ONAN) HDD HON td “OVS EY nas “OE 2 “oe AND uy B ap (NLA) MHC (WIN) KIN TPB (OSE HED OS ee (ON) muta pion reg opeisg pea aoouayad esuooupifax pn © pur ep sas sopeisg 90, fun! ekuinfa>esouns ey sonpKatpuy #0] sopeyexed aq “fuiva en ap sa0[ee 50 euaRuo> ewUMIOD EpeD SOP £0] WOE EoHEDSIP SONIA “purser nin 3a 2p sopeeg sostarps0| va uppeDNpe aiqos soxep vere ZEAE] oqdhofa fog sonpiapu ap onal OMEN Un 2 seperoja seygetea SRST AB Sruobept sw ua souaranuaa sou requ we qrade> ays wg "up evedwoo soe} frm soynwiad samo 8 onunl sun sopezo(e> seunesBony s0j 0 sore ap seusesSe for sfe> ap seucsderp 607 soomphmopryss sepepisionun seen 2p sauEIpAS fo ants "pepisanqun ee ossoe ap eqarud Sun "GFR, MOUSSSY 21H) AVS aonid ap sopra fo ereduco sezanb soesepod ‘oyduaia sng sown sod whale eplasjasaygemea ecru on 9p souomnqistp se iexedinoa soumaronb "0986 {y ageten tun ap sPux¥ FUR} UEDeY stORTPENS sfeqeR soy ap eoseD FT ugponponut Tz ‘atsye vavoruw vousINed / 06 92 / ESRADISTICA APLICADA BASICA alguna de las variables explica o incluso causa los cambios observados en. otras? Es deci, calgunas de las variables son warizbles respuesta mientas que ‘otras son onrinblesexplicatoas? . ‘VARIABLE RESPUESTA Y VARIABLE EXPLICATIVA Una variable respuesta mide el resultado de un estudio, Una variable explic cativa intents explicar los resultados obervados, Es mas féil identifier ls variables explicativas y las variables respuesta cuar- lo poclemos dar valores a una variable y observar como éstos afectan a ota EIEMPLO 2.1 Elalcohol produce muchos efectos en el cuerpo humana, Uno de ellos es fa bajada de {a temperatura corporal. Para estudiar este efecto, unos investigedonss surministraron distintas dosis de alcohol «unos ratones,y al cabo de 15 minus miieron el cambio sle temperatura de su cuerpo. La canvidad de aleohol es la variable explcativa y el ‘cambio de temperatura corporsl es la variable respuesta. Bl (Cuando no das valotes a ninguna variable sino que simplemente observas los valores que toman, éstas pueden ser 9 n9 variables explicativas y variables respues+ ta, El. que to sean depende de como pienses utilizar los datos eyémpeo 22 Alberto quiere saber qué relacidn existe entre Ia mediana de lag notas de Mtemati- «as y la mediana de las notas de Lengus obtenidas por los estudianies de los 51 Estar dos de EEUU (inciuyenco el Distrito de Columbia) en la prueba SAT. Iniciaimente, Alberto no cree que una variable depenca de ls valores que tome la otra. Tiene dos variables relacionadas y ninguna de ellas ea una variable explicativa Julia, con fos mismes datos, se plantea la siguiente pregunt: :puedo predecit la rola de Matemiticas de un Estado si conozco su nota de Lengua? En este caso, jal trata la nota de Lengua como una variable expicativa y la de Matersticas como una variable respuesta nel ejemplo 2.1, el alcohol realmente causa un cambio en la temperatura corpo= Anise relaciones (62) 93 ral, No existe ninguna relaci6n causa-efecto entre las notas de Materticas y las de Lengua de ejemplo 22. De todas formas, como existe una estrechs relacin entre las notas de Matemiticas y de Lengua, podemos utilizar la nota de Lengua para prede cit la nota de Matematicas. En la seccin 2.4 aprenderemos a hacer dicha prediecién. La prediceidn requlere que identifiguemos una variable explicativa y una variable respuesta. Otras ténicas estadisticas ignoran esta distincion. Recuenda que lamar a luna variable explicativa y a otra variable respuesta no significa neceseriamente que los carmbios en una de elias cause cambios en la ota ‘A menudo encontrards que a las variables explicativas se ls lama zaiablesinde- pondientesy alas variables respuesta oaviables depeutiontes. La idea es que el valor de 'a variable respuesta depende del valor de la variable explicativa, Como en estaisti- ca las palabras “independiente” y “dependiente” tionen otros signifcados que no ‘estén relacionados con lo que acabamos de ver, no utlizaremos extaterminologia. Las tenieasestadistices utilizadas para estudiar larelacin entre variables son més complejas que los métodos ulizados en el capitulc 1 para el esnidio de una sola variable. Afortunadamente,elandlisis ce diversas variables se basa en los miodosaplicidos a una sinica variable Loe prineipios que guian examen de datos tambign son los mists: 1. Empiaza con un gr 2, Identitia el aspecto general y las desviaciones. 5. Aiade deseripciones numércas de las caracteristicas concrotas de los datos, 44. A veces, el aspecta general puede describirse de forma muy breve. EJERCICIOS 21. Se puede predecir a altura de un nifio de 16 afos @ partir dels aleura que tenia 8 los 6? Una manera de saberlo consistiria en medir la altura de un grupo sufciente- mente numeroso de nifios de 6 af, esperar hasta que cumplieran los 16 aios y centonces volver a medir sus alturas. En este caso, geil as Ia variable explicativa 1y cual es la variable respuesta? :Estas variables son categdricas o cuancitativas? 22. Se sospecha que existe una diferencia importante entre sexos en cuanto 8 a pre ferencia de voto de os ciudadanos de EEUU, teniendo las mujeres mayor predile= ‘iin que los hombres por los candidates del Partido Demdecrata. Una centifica seloc- ciona una muestra de votantes de tamatio grande, mujeres y hombres, inscritos en el censo electoral, Pregunta a cada uno de ellos si ha votedo a los demécratas a los republicanos en las dtimas eleciones al Congreso de BEUU, En est estudio, cual cs la variable explicativa y cuil es la variable respuesta? Estas variables, json cal goricas o cuantitativas? quod y “seueur soxpnun weveur © wasaiy Sexogour SeuDUE Se ‘OVE BED "YPHOL aP soo ey ap 08: o © uoaia an soqpop x sapues8 spews Sokn Wos SHEE S07 "FZ sorpusfa “genoqe se, ap ofa uo epayuavcucas 1] apand sjqeuea sop se ap weary -opsandens sqqeyzen & senneasdxa soyqeuea ane rnuysip sowasenb 04 5 owoo exandsar ayqeten ov & x oman aezqoqus sowIOs | vanaREAe alge fe anb eprorooy (ex ap aa) sesnge se ap aa ja 2 axtuos ereupsaidas ‘eameanea ajqenea ottoa zesapisuco apand 2s sogetzen sop se ap Wun IS cnptagput spe ézed sajqetten sop se wewzox anb sez07ea 50] 3p apuadap wo «sod wino eureddep fap ajund un owo> aoarede onpintpur epeD ‘So. 59] VI Sepewpuo Se op ae 2 us #20 9p Saxo|2a sof SuSE Se] ap aa YP WO wD carve ajgetea tun ap ssioyea $07] Sonpystpur sows so eed Seppo 8 “einen sejgeuea sop au woxejaro| essen upysradsip 9p euresBeIp UN, NoIswaasia ga YWYYOVIC sa 210 1ozr 7p) cwund owas arssede eiseLy ap opesy se F1g ap exporop of © Kg jap Busou (PLE onmnd fo owed aparede eUIEGeIY aD OP eye fa “teepeuapao se ap ofa) $9 a9 ua gL fa &(s¥sIDge 3e| AP A) #561 2P LO (2 ag fp wosng“F15 ap ary SeonFUOLEW ap seiOW Se ap EuRIpAUE eX UAUIND Te 9IUAE “aad a5 sown 60] 9p sug [2 BUIEGATY ap OeISS [> WD ‘ojdutalo soy ‘opeIeg UT ees adar onund eps “ugrszadsip op ewesiep [9 s9 rz sun eT “sesDqe 9] ap as 19 UD eaneaycsa agenen ep enasaid as anb souuinye ap aexua2v0d pe sourarenass anb on [you oys0 0d 63 ‘wourexa [e uasaud as anb souunye ap steyuaos0¥ je wIqU> opens seuou se ap euetpaut &] e4fen oUmpD 494 sowDIIND wisondsar a[qeHEs 8| $9 ,STAEUL crept ap Seow se 2p euerpaul EL, aqqeuen ey ennendxa ageuie ese ,euasoid 98 ‘nb souuanys ap afeuaorod ja, afqeties ef ‘o1uey 30g ",SOpeyAsss sq 9p PUEDE EL, [apuania e yzepnde sou ,equaseud ag anb souumje op aeruaatod ja, anb souaat 12 wjqer ep sorep Soy Sout _aremtiy ‘opeieg outst [ap stonpuereyy ap Seu Se op EuEIpout e] 4 “opasy CPE ts segentd eyo # equnsaed a anb souumye ap slewuanuod fe ssiva wore | eur {x9 # souuya ‘opeasg ¥ opeisy ap ovpnut hea seqonud suse © eyuasoid asonb eIpous ‘zuvypeua ap souumye ap sfeyuaaied 9 anb eA ‘owanumpssord wang um s9 Ou LOD enjena ap euesss 53 "9[e00] ouI0> Safes OTLEY ‘SOAEIND FeIAISHS Sof LOHIEAT fund yg seqorud se uo sepmunngo sejou Soy ap seoypaus Sel MERTEN a6 AN Ba Wa ecowwalz 96 / (2) oDHEL IP SY {rz mAe tap seg wauTE oxo € eased os onb souun ap afeuasiod fe ugeuts wo IVS sqonad evo sea They ap stusipau seu sm 3p wopsiodp ap euesSerp (ST em rurard as anb sowurnye 2p aeyua20g Cr ugisiadsip 2p eutesBeyp ap ojdusala un ibe 94 -uosiadsp ap mneuSeip un s3 sea -geqqueno soigewes sop aqua uppeps e] usuoyps8 sensou 9p exoueur slSus & upysradstp op semerierg vz {seaneaguens 0 sexupdow sejqettta uos? ceisondsox ajqetea eso [gra 4 antago ajqetes e 50 yn-? uanmeyan ye sezqeat ap syndsep euantazedns ap op -oyad fo reqoicwoo waed soqzaned ses9 9p opismuos osu un oTAT a8 SE oouaaianuy set se, somanuezen $9j ap oun epe> © vo.2RoWOs 2s anb eure ap 129 “go ap seuizyun svuiea v 3270 fe uoEDaas ag “swUDAA sequTe pxEduzo9 anb OnIRAL ‘onmauauads oydure un sed opersideud any ojwenummen ap oyqui 13 epereye euoz oy ua exdeseiompes ap upeade e ap opmides‘soyumpunanD soangpur, some So 4 our p ajuaureanm sede ajans a8 4p 9 Lop oxped fop exajduto> uppedima uo entsuco eurew op sau ja anequion ered gogde2s nb owanutewen sauna |e, vossva Vavoruy YOUSWES / 25 96 / EStADISTICA APLICADA BASCA, censas Tiemcine expedidas Manat expedidas— Manats Ato (000) enuertos Ato Goto) auertes 7 “7 3 1964 = en ws 60 a i885 5 B ey 81 1556 au = 80 8 1857 os 2 ost i 1s ra 3 1952 312 158, mM 30 953 326 1390, 79 z ‘uscign, se presenta una tabla que contiene, para cada aff el niimero de liceneias para lanchas motoras (expresado en miles de licencias) expedidas en Florida y el -iimero de manatis muertos en los afos 1977 a 1990, (@) Queremos analiza la elacion entre el nimero de licencias expedias anualmen= teen Flora y ol niimero de manatis muertos cada ao. {Cul es a variable explicativa? (©) Dibuja un diagrama de dispersidn con estos dates (india en los ejes fos nom- bres cle fas variables, noo hagas como ze y). {Qué nos dice el diagrama de disper. sidn Sobre la relacin entre estas dos variables? 22.1 Interpretacién de los diagramas de dispersién Pra interpretar un diagrama de dispersién, identifica primero su aspecto general. El aspecto general debe revelar la dinceig, In forma y la fuercn dela relacign entre las dos variables. EJEMPLO 24 Los grupos La forma de a retacion dela Figura 2.1 nos sorprenceen seguida: hay dos grupos dstintes de Estados, En un grupo, mésdel 40% de los aluumsos se presenta la prueba y las media ‘mas de los resultados estates son bajas. En el otro grupo, menos del 30% dele alumnos se resonté al examen y, adem, obtuvo notes masallas ;Queé puede explcar los grupos? En EE UU existen dos pruebas principales de acceso ala universidad, la prueba SAT (Scho- laste Assessment Test) y la prusba ACT (America College Testing). En cada Estado pred ‘mina una de las dos pruebas. El grupo que aparece ala izquierda enol diagrama de dis- Persin ela figura 2.1 esté constitide por Estados donde predomina la prueba ACT. El grupo de la derechs est formado por Estados en ls que predomnina a prusta SAT. En los stados ACT, los alumnos que se presentana la prueba SAT Iohacen porque quieren acce- ie Analisi de rlaioes(€2) / 97 der a universidades més selectivas que exigen una nota elevada en la prucba SAT. Este ‘grupo selecto de estudiantes suse obtener unas notasen la prueba SAT superior a ls que obtcnen los estudiantes de los Estados donde predomina dicha prack, La divccign de la relacidn que ve muestra en I figura 21 tambign es clara. Inelu- so dentra de cada grupo, los Estados donde el porcentaje de alumnos que se presen ‘aa la prucha SAT es elevado tienden a tener notas medianas mds bajas. Las varia~ bles “el porcentaje de alumnos que se presenta ala prucba SAT” y “la mediana de las ota de Matematicas” est asoczdles negaicumente, ASOCIACION POSITIVA ¥ ASOCIACION NEGATIVA Dos variables estan asociadas positivamente cuando valores superiores al promedio de una de elas ienden a acompafiar valores superiores al prome- dio de ls otra, y cuando valores inferiores al promedio también tienden a ‘curr canjuntemente. Dos variables estin asocladas negativamente cuat clo valores superiores al promedio de una variable acompartan.a valores infe- lores al promedio de le otra y viceversa La relacién de I figura 2.1 tiene una direccién clara, la asociacién negativa. La {forma est4 dominada por los grupos y podria tener uns forma curvilines. Decimos “podeia tener” ya que, aparte de los grupos, ls fuerza de la relacidn es débil. Hay una amplia dispersiin de resultados entre Estados con aproximadamente el misto por cenlaje de estudiantes que se presenta al examen. Veamos 2 continuacida un ejemplo de una relacén fuerte con una forma més clara EJEMPLO 25 La farilla Sénchez esta a punto de instalar paneles solares en su casa para reducir el _gastoen calefacién. Para conocer mejor el ahorro que puede significar le instalacion ddedlichos paneles, los Sénchez han ido registranco su consumo de gas en fos iltimos ‘meses. El consumo de gas es mis elevado euando hace frio, por lo que debe existir tuna relaeién cara entre el consumo de gas y la temperatura exterior. {La tabla 22 mussiza loa datos de 16 meses. La variable respuesta yes el prome- lio de los consumos de gas de cada dia dufante el mes, an metros cdbicos (me). La variable explicativa 2 es ol promedio de los gradosdia de calofaccién de cada dia durante el mes (los grados-fa de calefaccin son la medida habitual de la demanda * Dates poporinads por Rabert Dal, Purdue University. “oponie pp oppoue i ap ed euoreropo oss opp sot eomgp as uyuag og Sora sopeppoqen eid sorep 21 zee eds ‘at Bs 2 BEey ngouodsua Joana *,2 uetus wn wosidns40> fry SAREE, HET Ns Sees fege SEE Cece eee 39 oe eect ost ore 0 au on ose ow cot oe oe 5 a oct oe o ws =o ono ra xz ot ost % 06 oot ao Te 001s) wre ‘er 01/ 8H wae) ounso5 PEpOTA ansue5 PEON _sousowoyp aot -0d wuyose8 ap sony ua atu enqao op oumsueo (9 & stey sod soxiouo(py ua opypaul ey 85 PEPDOIA FT HOSE flog [ap couriag ojapouw [eseivaxpodsasi09 sowep so} uewwasad es iby cep ya ne exuoumne anb epipac e aipao un ap eunosel ap ousua> 9 wea OMIT 9 cous epeo sezorou seypuy] sel ‘spiouepawrorde weeeut neue sojugna? OUUNL Ue seDuRDH ap OtetuMKT (2 sejaBuEO EIRPHAP PPHOL |S “rege 9 ap so1ec “sso Sos 9 ep sod uoo>ea(e 9p ep-URS eT HOP EP Jad sed op oxpounent ourasu0> ap uosubdsip ap ewesbo ce rz eA syp od ep-sop2s8 ap orpostou © sf @ & oO ° o 4 a g {3 429 op opp ounsuco ap orpowsorg 65 / (>) sap INI ove 2 spipadso sepem op ostnt o oplaSouNd ove Epe> soHOrta speeHU 9p Siow p upsatd veo spapaid epand 98? “ape BL 9p erry = 94-3590 ©) fea 538 pF AP HS eT aAEDEAG (4) _uowayedon o nants sepepose uns? Sgezes SET PRET #1 =p UoRDAN Ht akOSeC (2) ‘oye ape secjou ey>UM| Se UeeUT ab seuru ap azuna jp & epuots we ayouenue sepensiforseojour sepuet ed sepuact ap ovaumu jap uo(siads|p ap euresBep un aiselnqyp 97 opeucle fe Ug ST sopmeata se orp eum avon ‘4 ab & eau 58 04 anb uppers an sp ojdureo un ep 9 operat (g vanefau oa -njsod uopetzece eum owt siquosop sousepod anb exe uorDauNp Eun UBUER sou a1 sey sepoy ou ‘spux sg eauy] od 2p uos satoKe[ex se sepot ou ‘oisondns Jog q Baar saat me cod oe ROR wang Eh “cen Fr a obey a Neo Oe oy SE ee auqwandas ore ‘omuy re = omiv Soe a op ounsuos 9p s rp-sopees ap soxpauord 507 Ta HHL, 1m pepipunjosd spur wo> soursnn> -stp owword anb ewsay um so sayany sojeauty souopepat ap mused e uoporpaid eT se 9p oumsuos j@ prsyse@ ayes wos sapadd sowpod sow un ep seungerad} oy souraoolo> fg “eta: eypip ap a2od ueyrede 9s sonnd soi anbzod ayary uoetes fun "emus eaas wun ap oft of weRYS 35 sound Sol ‘nap Sy 7UoMy 99 wORDE|BL 1 ap eutioy &7 -opmumsueo seS smut ‘oqumy sod oy spur uCoEpUT Myp-s0peAE SPY ‘sony expisod uopepose wun enssnur 77 emf e| ap uprsiadsp ap eure od (upper ap ep-sopes8 eZ1 wapuOd -sauioo‘ojdwala od "3.1 9p pour emmezaduna eu) D,¢1 2p oleqap sod pis weKD vipaur emyesadures ef anb ope? epes sod exp-opeiS un ejmumnae 2g onde 20 votsve vavoruy Yousovss / 96 100 / Esranisnica APLICADA BASICA (@) Dibuja un diagrama de dispersion. (:Cuil es la variable explicativa? (b) Describe la forma de la relacin. zPor qué no es lineal? Explica lo que indica Ja forma de la relacin. (©) ¢Por qué no tiene sentido decir que las variables estan asociadas positiva 0 negativamente? (4) La telacién, ces razonablemente fuerte 0, por lo contrario, es ms bien debi? Justfiea tu respuesta 2.2.2 Inclusién de variables eategéricas en los diagramnas de dispersion Despus de identificar el aspecto general de un diagrams de dispersin, identfie posibles desviaciones como, por ejemplo, las observaciones aipias, OBSERVACIONES ATIPICAS Una abservacién atipica, en cualquier grafico de datos, es una observacién | que se distingue del aspecto general del grafic, l [Ningiin diagrama de dispersion de las figuras 2.1 y 22 tiene observaciones ati- picas claramente diferenciadas, La figura 2.1 muestra un grupo de cuatro puntos en la parte baja. a ls derecha, que correspondien a resultados de Matemnticas anormal- mante bajos. Vamos a investiga, EyEMPLO 26 Uno de los cuatro puntos que corresponden a notas anormalmente bajs es ef Distrito de Columbia, que es més una ciudad que wn Estado, Los offs tes puntos son Georgia, Carolina del Norte y Carolina del Sur Todos estos Estados estinsituae ddos en el sur de EEUU. Es posible que las medianas de las notas de los Estados Gel Sur sean inferiores a las medianas del esto de ls Estados, incluso después de tener fen cuenta el efecto del porceniaje de alumnos que se ha presentacio a la prueba? a figura 23 investiga esta posibilidad. Com este fin, se han sefalado ls Estados del Sur con un simbolo diferente al del resto de las Estados. Los cuatro Estados que hemos ‘nombrado anteriormente y quizs también el Estado de Virginia Occidental tenen notas ‘metianas bejas. Los restantes Estas del Sur estin mezclcos con les dems. Los datos ro permite mantener nuesire hipétesis de que les alums de los Estados del Sur obtienen peores notas de Matemsticas que los alums del resto de los Estados. ot eli Andlsis de relaciones (2) / 101 ls prueba SAT Be Ss & & > wo 2 3 4 5 6 Om Porcenaje de slumos que se presents ala prusba SAT Figura 23, La nota madiana de Matematicss en la proche SAT y l por ‘eta de limos qe se presenta a a presen crda Estado, Lee esx {Sos del Suree an suialaco cone simialo a, Al clasificar los Estados en Estados del Sur y resto ce los Estados, hemos intto= ducido una tercera variable en el diagrama de dispersion. Una variable categérica que slo tiene dos valores. Los dos valores se muestran con dos simbolos distintos Cuanela quieras ear wa variable categdrica a wn digransa de dspesicn, wile colores 0 Silos distncos para representar los puntos.” eqEMPLO27 Al poco tiempo de recopilar los datos que aparecen en la tabla 22 y en la figura 22, Ja familta Sanchez decidisinstalar pelos solares en su casa. Pera determinar ol aho- ‘70 de gas que podis representar la instalacin de estos paneles, las Sinchez regis: traron durante 23 meses més su consumo de gas. Para ver este efecto, aiade los mue~ 2 WS. Cleveland y R Mel “The many fase of satel’ onal of eden Sta cal Asst 72, 1994, pg. 7-22. cco uepys a8 aygezea eum ap saogea 807 sonptaput op cdl our tn SepEDIRE ‘neaneynuero seigenien sop 2siu9 uppupe M]easonul upredep ap ume uN wasandsas ajqzuea @ajgpice of» Ceapenéss 219 5p ee copien sowareue(y of = ajqeyrea wf #7 3iqeuea zpunes eun ap sorqure> {wos omnpur anb 0 ueaqdxa 2 aqgenea vam ap soxqurea So an souears open NeWAsmE {soro{nun 9p oda ja & seuqutoy ap odnua jp vaniunsyp 25 nb ug? esaialnan sep fe ten} $2? ‘sarqurby So] 2p osBeu asad je & ConOgeI ant pp ana ugweras esau sv] ezed opezan Te onURsTp ojogsté Uo J0f09 UT OP uezyqyn saiquaoy sof 2p s022p soy uoysiadstp ep ewesBerp p us apeue “wOUY ©) uopeyes ef ap ezsany v9 [PA ZUR! | ap PUES ‘159 jpn? coanoBau o eanysod so? “sqerren sop seisa anu UolBenose 7 (a) eaten aqensen ef eu05 yng? saranus sel ap sovep sor uod or9s worsiedsip ap euwuSeqp un elna (2) a oF oH 6 wo 6 sa a woo ce OW a H t te OW ot n 8 ce OW st KO ¢ vO HL w . oi oss e wO¢ a ote ON z iia arte a # L Byoqesa omg AS —~ ORS OayDAERUT og oS Bain (Bain PeCeamGeseegeeLeL HLH gcggRaREE OSS eee ‘oojpqeou eat pun emuenyt ‘juetiodut oun auan fexoduoo aufeur osed jp anb usa saxopeS saan so] Sone so] ap oanafiown sofea [a seseidxa e1ed epenygn peprun musi ef 'SHOL Fz WO SOPH “nsuoo seoges Wo esaid 96 opifequauz rary [3 “=>agTEP ap o4prusa un wa waved “ed anb sevoszad 61 ap osodas ua eorgqerout fant a & (ese 12 opmueiw09 ns Oped “uootep rear osod) oxSeus osad jp ‘oxss fa argos sorep ueuorrodord 2s yaw oHuoIIE ty ug eoppioyp 9p sorprasa Sof ua oyuDAD UD Zeus) # aqueLOdusy 20} Un $9 efBioUe ‘uunsuo9 odiono ns ane oun (@ ‘roap s9‘euosied eum 2p oDyoE RE! ANY IE LT, sompwsla 0 / (2) Bue BPS ; i souopeasoaqo ap ovonad orsunru un oveur v spquzsasda: opuena Sep -adar sauopensasqo se] xed soiupstp sojoquys seoqpn anb sourepuaunaras af o>e, oy ou -oisiedsip ap seuresderp corsa sazey exed opeayine eureaSoad fe opuadnipu sou oad ‘papureaaewoyne waDey of SOoRSTpES eEsexZoxd sounS|y UoIDeALasyO tun ap spur uearaidar anb soqund soy sees exed sojoqums soup seaHAN S2p -ang cowsnd owns jp uednoo oynt & ong sowid gy uaoazede o(gs Zz eB eL UO ‘oxquies ua “sasour 9t ap sorep auaRuoo Zz Blam ET Tz BgE wL ap Ox ap X onml ap s9seur 50017 {QE #[ wa eng ap A aseanee_ ap SopeseE SO| 2p SBI0[EA SO EY cupisradeip ap ewo1Somp [pp ond ours p uednoo “sazoyea SOUSHA SO] aOUNES oxo usa sonpinipur sounSie apuens) ropauapio un woo olnayp fp se8uy opuERD surejgord [ap evuana sap aj oll anb 195 pang “upisiadstp ap eureserp un zeinarp {e antowoquanoeey eyoeaud 28 anb wuraigoid un uauae sojduras sop soasenny sugjs sojud woo soso So uopuodsauo sooug sohund soy sr -aqos sued ua saous ov wapodeanio ssiou sone SOT =P “fury ered ejpsopest soe uote ao se ap owesuco (x 7e eM sousip sp-s0pe1D a a oO 2 sw seieos soured so] sejmsur op spndsop souous ayuaumes -xpp 59 508 ap ournsuo> [a sopy seu saseu So uo ‘orqurea ug “soiep 2p sodru sop so, uo epuDrapp eins Any OU Sou osod Sasew So| wy “opensas jo 9 ¥Z ery FT tuoisiadsyp ap ewreaSerp [e ua Samu 995 ap wYP-sopesd so] opuadnppUL SOWRP SOA vasya vavoriay Yousawisd / ZO 104 / Bsranisnica aPticada sic celeje de las abisasy los valores de la ofa en el elas ordenadas. Cade observacién ‘viene representada en el diagrama por un punto. ‘Situna de las dos varlables se puede considerar una variable explicativa, sus valo- res se sitian siempre en al eje de las abcisas del diagram de dispersidn, Cuando analices un diegrams de dispersisn, identifica su aspecto general des- cribiendo la direceidn, la forma y la fuerza de a relacin,y luego identifica las obser- vvaciones atfpicas y otras desviaciones. Sila relacidn entre las dos variables tiene una dizeccién clara, decimos que exis- te una asocineién positiva (si valores altas de las dos variables tienden a ocurrir simulténcamente) o una asociacidn negativa (si valores altos de una variable tienden | coincidir con valores bajos de la ota) [as relaciones lineales, cuando os puntos del dlagrama de dispersion se sition aproximadamente lo largo de une recta, son wna forma importante de relacién entre ddos variables. Las relaciones curviliness y las agrupaciones son ots formas en las que tambign tienes que diate La fuerza de la relacién entre variables viene determinada por la proximidad de las puntos del diagrama a alguna forma simple como, por ejemplo, una recta ‘Puedes mostrarel efecto de una variable eategériearepresentando los valoces de la variable con puntos de diferentes colores 0 formas en el diagrama de dispersidn, EJERCICIOS DE LA SECCION 22 8, La figura 2.5 es un dlagrama de dispersién que muestra las alturas de 33 parejas. {a altura de las mujeres se ha situaelo enol je de las ordenadas y la de los hombres ‘an el de las abcisas (@) ,Cual es la altura de Ia mujer mas baja? ;Casntas mujeres tenen esta altura? Cases son as alturas de las parejas de estas mujeres? (b) :Cusl es la altura del hombre mis alto? {Cusintos hombres tienen esta misma altura? {Cues son las alturas de las parejas de estos hombres? (6) 2Alguna de estas dos variabies se comporta como variable explicativa de los valores dela otra? © porel contrario, :pademos situar a cualquiera de ella en el je de las abcisas? (€) Explica con palabras lo que signifcaria que hubiera una asociacién posit vva entre las dos variables del diagrama. El diagrams de dispersién muestra una asociacion positiva d&bil. 2Por qué decimos que la asociacién entre estas variables es debil? * Los dates son una muestra aletots de tamato 55 de ot LOT? que apes ene rca KPasrzon yA. Loa, "On ha aa finrtane in mon, Bonar novembre de 1 pig 8 Andlisis de relacioes (2) 1105 mujer (en em) a 12s EV BEM OA HM? BO Alnura del hombre fen cm) tne as alturas de 33 areas Figors 25, Diagram de ds 9. Las slchichas ean un contenido alto en calories, tienen un contenido alto en sal? La figura 2.6 es un diagrama de dispersién de las ealorias y del contenido en sat {expresado en miligramos de odio) de 17 marcas distintas de salchichas hechas con came de ternera (@) Di de manera aproximada cudles son los valores mndximo y minimo det con- tenido de calorias de las distntas observaciones. ;Cusles som los contends en sel de estas dos observaciones? (b) El diagrama de dispersin, zmuestra alguna asociacin positive 0 negativa clara? Explica con palabras el significado de esta asociacin (o) Has idenificado alguna observacién atipica? Prescindiendo de las posibes cbservaciones atipicas, gexste une relacin lineal entre estas variables? Si ignoras Ins observacionesatipicas, eres que existe una asocaciOn fuerte entre ambas variables? 210, Una empresa del sector de la alimentacién reali una encuesta en la que pidis ‘3368 personas que intantaran sdivinar el nero de calorias de diversos productos * Datos det Consome pot, ja d 985 pags 66 scesge Bed oat ‘ra eos so pada pa BEE espero yd sons wo Huo pupa Pw 382 jo EL, BPRS 3 A KEN DM Soode way overex seated soyroporanbsepuppnsseuna op med vein spe sry eS 84 pst =H pono bag nee NSE ASE, “PPO VW ee Tor a8 aoa got £6 v6 ono ror ¥6 a rt ooo0e rot r6 1s cu on00F 96 6h se Tot aoe (paiva sad sopeou | ermoaedanady ‘stp ‘igus 9p pepisusc Ns ssayuaynissoj Uos Sopouargo soquoRENpUR! $7 OLAS PEPTENAS ap sopted ua eiquis ap sopepisuap seiusip w yeu ap send sesgus wo seo? grb onauracxa un aney as ‘edo exqUiDts ap pEpIstAp e|J2uTUIOH=P e1E “OPA wip fa gos enodse ojuonuspuss [2 anb of 30d “ons ep sewst sor ende e dod Vernodutoo sequeyd se ‘osuap Knit equiais 2F 15 Oleg gros oxcounpus 2 & OPED vennade ood eieiss ofses [p ‘sensed s220d WEIqUIME 3s 15 zonaTusIpUDL OWE! |e Geunngo soynou8e un anb exed 3eu pp wiquasts ap PeRISUDP eL6 a48P (FFD? y vpuap soundje “owed ns ua oysnU Tauotp savaurpadse #0159 IO) SERSHADUAED pus op sops9} sta uanown a5 0195 TEdas un ow0> eo> &sauoEp em EINE an vind crepe um out seumnyd euay an epmndumia aedso eun so siusdouy 1 THT _senidye Souopeasasqo fey? sqeauy onsourepeersoide 2 sojgesta sop 501 anv apes 7? jeaieSay camsbd upioepase sun aystxa? sajqezea sop se| anu woPetDs e| 2a1299C (4) opespero gaps auraZeqp ny, so sop sof wo eens cust x serum an Sus “sao ua wap 95 sotgesen segue OUD) Agee] BP SOIEP SO} WO UpEIedEP SP er “ot (o>) soem SPY “ast ap ano op oc Spon ys estore ve opazede an oune> Snape ogy, FP SEND MENA -eaeyp un elngp ‘ugpemprsueo ey sxasaid opvetua}, supmssenaus soj ap sersondsa: sey seaqdta © epnde ono un ap seoje> us pas oppueiun je amb SoueSs) (e) mH ot uiab ap pwd op woEIOA Hy 2 oat ‘urypauragwune sp eed Eup, @ an ‘owespauroveune ap exezucur fu) aL % paves eae esa or Be Gaps 9p 3 72 oe oa couegg d ap epeuegas ei 6 at Bn op ued 9p epavea eu ee oe ran ao sa¥0lnDeu 2p 13 zr et BE ser ap anne o> suede 9p 3 TFL et Bet isn po ap ASCE Siar moe) SERENE SSHOIPD sassy _-seoe> wo sopesazdxa soqure ‘spe Se10,B4 so] ouwo> Js Soxpausd ow sopessicxo Tesanous of ap sopeinsar sor wanssa 2s efgE aJMSIs o| UY seuRUICD sOHTONETE smpypyes ap ses 212 [ps ap opruniuo op seo sap woxeesip ap eureing 97 eng ssu0(2 ne o6t OB OL OBC ost OF vEL act OL ant es vateya vavoruy yausaviss / 501 108 / Esrabisnca aPLAcAoa asia (@) {Cuil es Ia variable explicativa, el rendimiento 0 la densidad de siembra? (b) Dibuja un diagrama de dispersién con los datos det rendimientoy de la den- sidad de slembra, (© Describe el aspecto general de la relacién. {Es una relacin lineal? ZExiste una asociacién positiva, negativa o ninguna de Ins dos? (@) Calcula tos rendimientos medios de cada una de las densidaces de siembra Sina estas medias en el diagrama de dispersisn. Une las medias con segmentos para ‘aciltar Ia interpretacién del diagrama. :Qué densidad de siembra recomendarias a tun agricultor que quisiera sembrar maiz en un campo de una fertilided similar a la dtexperimento? —” 2.25, La tabla 21 muestra datos sobre la educacidn en EE UU. Estamos interesados en analizar ia relacin existente entre el gasto en educacién en cada Estado (expresado ‘en délares por alurnno) y el selasio mediano de los profesorer en los dstintos Eata- clos (expresado en miles de dlares). (@) Explica por qué, en principio, eabe esperar una asociacién positive entre ambas variables, (b) Dibuja um diagrama de dispersién en el que Is variable explicative see el gasto en educacidn de cada Estado (en délares por alumno) (c) Describe la relacin existente entre las dos variables, ¢Existe una asociactén Positiva? La relacin es aproximadamente lineal? (4) Identitica en el diagrams un Estado en el que la mediana de! salario de los ‘rofesores es extraordinariamente alta en relacin al gasto en ecucacin en ese Esta 40 (dicho Estado se puede considerar una observacién atipicah, ua sepesaicko sequie ‘sens soy ap wid uppsetasap o& oppaut ey wos “sz ‘onme 20g seuossed u ap sosed 50) & seaae sey sowousy an & sowrsSoyp] ua osed ja» sonourco ve eam et 50 = an ‘ojdutalo sod ‘ugdng SSROSEAISGO WY OPUETAEBUESS CFSE 9p ANID] P| “sees wed eopema[e> wun o soonsTpeso sews? oud oq seziin suatauoa ‘eopoped ef ua ‘orad upperaznca ese ab zapuaua e spade Son pentyl offe = uowepue ef 9p emus HT, FoMpLAFDU Sot sopEH ese sounig ays wuuns, eosput rg “emosruCeur ens eSa8 ean I alcuots OWT) ae soffa.r ana suppeatios ey fap seus so ened (9 ap saunyenso| ered %5 & x wos sojgeuea sop se] ap seid sauopanssp sey & spouse] 3a “Aa eos onprgpur opundes jp ezed “Ha ‘suas onprupul sound pp eed sonoyon 507 sonpyagpuy » exed #9. sagetea sei ap sovep soutauay anb updng "eae co eaoqRS 96 Up|ufa1s0> e7 SearenReND SeygeReA sop anua (eau, uODeTse eI ap UODAKTP ¥| X e2IONY ef apitk WOLDe|aIO> NO_VIRRIOD 4 ugpeianieg Lee soureysaoau anb epspaut e| $9 wppoeyauios e] coups ps owawaTE no anb woupuine epipaus ean sezapan X sovep ap sisqpue jp va earense exon anos sounysaK ‘ofa 404 e259 FT OpUEIgUIED meta] © mayeSa Tey sy "9LARY ‘Syu 59 sojqetsen sop se] axa upppepose et znb ap uoisoudut ¥| ep sowapyy aired & “va operas wotsiodsrp ap eure: erp (sof So] 3p elense e ap eOUALANp ENUM e|UO> ‘soyep souisqus soy aneure2ex wenasoidas (7 wang of 2p uptsiadsip ap seumesBeIp sop $07 247 woRDeaL UN ap ezzory | JeURUIA.OP [EYP #9 “eA ofan @’sozoUNT voteya vavoray vousiavieg / OLE 112.7 ESTADISTCA APLICADA BASICA La correlacién no hece ninguna distinciin entre variables explicativas y variables respuesta, Da lo mismo amar za la variable altura que a la variable peso y vicever sa La correlacién exige que las das variables sean cuantitativas para que tenga sen- tido hacer los culos de la fSrmula de r. No puedes calcular le correlacién entre los ingresos de un grupo de personas y Ia ciudad en fa que viven, ya que la ciudad es una variable categoria BJERCICIOS 2.16. Vamos a calcula Ia correlacién r, paso & pase, en algunos casos senills para famillarizarnos con la férmula. Para cada conjunto de datos: + Dibujs el diagrama de dispersién. Describe brovemente la asocscin entre + Halla a media y la desviaciontipiea tanio de. como ce y(uiza la clculadore) ‘+ Holla los valores estandarizados de > ey, luego utiliza la formula dela come w ¢ 4 ay ’ - 4 » : + ° a4 2 “4 0 4 © 7 4 -2 2 2.7. Bl ejercicio 2.1 da las longitudes de los fémures y de los himeras de cinco fési- las de Archaeopterys (@) Hilla fa correlacién r paso a paso. Es decir, calcula la media y a desviacion tipica de las dos variables, A continwacién, halla los cineo valores estanderizados de cada variable y utiliza la @rmula de r. (b) Ahor calcula r entrando los detos en la caleuladora, Comprueba que obtie= nes el mismo resultado que en (a). 23.2 Caractorstieas de Ia conrelacién La formula de la correlacién ayuda a ver que res positive cuando existe na asocia- in positive entre las variables. Por ejemplo, el peso y la altura estin asociados posi- tivamente, La gente que tlene una altura superior al promedtio tiende también a tener lun peso superior al promedio. Para esta gente los valores estandariaados de altura y eso son positives. La gente que tiene una altura inferior al promedio tambin tien= va St 2 GE Arliss de relaciones (@2) / 113, de a tner un ps inferior al promedio, Los dos valores estandariados son nega- tivo. Enambos ass los productos de la férmla der son en su mayor parte post vos portant, también fo es Den misma manera, podemos ver gue r nop va cand la aecacdn entre zy es negative. Un estudio més detallad del fé- mula proporciona més propiedades de r. He aqui lo que necesitas saber para poder | Una rpoiive india una asocicinpostva entre ls variables. Una r nega va indica un socacon neg 2. La oman» sempre te valores entre 1 y 1 Valores der ceeanas 20 acan una rlacia neal may cb, La fuerza de I celacén neal asmenta a me dla que rac ale de Dyse acerea¢ 1091 Los valores der cercance #108 ing ore-l can que los puntos se halla cercans a una recta. Los valores extremes sélo se dan cuando existe una relacién lineal perfecta y los puntos del diagrama de | dlspersin estin exaetarnente sobre uns recta. $3, Como rtiliza ls valores estanclarizados de as observaciones, no varia cuan~ do cambiatnos las unidadas de medida de x, de yo de ambas. Si en vez de medi a altura en centimetnos lo hubiéramgs hecho en pulgadas, o si en lugar de medir el) peso en kilogramas lo hubiéramos hecho en Ubras, el valor de r seria e! mismo. La| correlecion no tiene unidad de medida. Es s6lo un ndmero entre y 1 4, La comtelacin slo mide la fuerza de una relacin tinea ent dos variables. La correlaci no describe les rlaciones curvilines ene variables aunque sean muy fuertes 5, Al igual que ecurre con la media y Ia desviacinHpica, la corelacidnse ve fuer- tementeafectada por unas pacas observaciones atpicas. Cuando detectes la presencia de observaciones atpicas en el diagrama de dispersion, utiliza r con precaucin. Los diagramas de dispersion de la figura 28 ilustran eémo los valotes der cer- anos a 1 02-1 corresponden a relaciones mis fuerles que los valores de rcercanos 20, Para que al significado bisico der quede claro, las desviacionestipcas de ambes variables en estos diagramas son iguales, ytambitn son Igual las escalas verticales y horizontales. Noes fécil, en general, estimar el valor de va partir de a observacién ‘de un dingrema de dispersién, Recwerda que un cambio de escala puede engafar be vista, pero no modifica le correlacén. Los datos reales que hemos exarsinado también lustran cémo la corelacién mice la fuerza y a direccion de las relacones linesles La figura 22 muestra una relackin lineal positiva muy fuerte entre le grados-ay el consumo de gas. La cormacién es r= 09953, Comprushalo com la alculadorauilizando los datos dela table 22. La Figur ta 21 muestra una asociacion negativa clara, pero mis débil, entre el porcentaje de afurnnos que se presenta a Ja pruebe SAT y las notas medianas de Matemitcas en ests prueba en los distintos Estados de EE UU. En este caso, la correlacién as r= ~ 08581. ‘Recuerda que la corelacién no esa descrpcin completa de tos datos de dos variables, ss ve o% YS 86 un, 001/308" Toc SSF HUDPNPROPA songy ourneuos pp ces04 sod sOset om oun09 ye HeyHBaH Aur 69 YOST Jeadmunceiprapuaonne un ap Ouse «gonauiaus> 1ST _jodva oprpow souesngnu se 15 SOHNE Tugnuadatp 9p wues3ep [8 40> PP yp an sod exes “21H SHEN OL or upgpesz09 wats £17 PAP ay ows [BP 2489} OU 9P SOFA SOP 2P ‘pray ef &P ITZ ccopepa sera woo wosiadsp op wseserp ws ane ap pepo se} sesodea 591 29 SOPEPD #2? ‘upperauio et smear soe zwetony an sqwou o> we cysandsas ma eogisne iL ® ‘pe eureoud pasa 2p epeat® 0108 oop zuopertien oj ab 2015? “HRRT2P HD A sexpupees qe ap opssanse> (2P A SeUOIED org got sod rep peproogan vj 3p soe sevens sO We “ep anb ugdag as2tane ofan Koxdioed b peppers ef evsurne arb EPP Y TE een epee wun st) 2¢ 3 018 P DS seped up wozaypnuz 36 sepeueSuOt Se (4) ou02 139 JOE Se uopsaderp ap euresierp un e(naid (©) jeg edoone ‘opp [9 TEE yp sepuaunins) {sopsseu ans pmo? ‘SEL go 25 aad sous Se] (SOET | sno pga 01 ap epuate oved tana awoUreTP = TemyaBau ayrouneze saL~ = wag 69 SOHEP 3p seoseut {1° stap woreda ap euaderp unsorc tn TSE -esondisar na sygisn{ gt © tsKOHE FS ovyap epeate oss eanssod ayaurese #08 stxgad 9Rs0 1-2? Oa uie 0-4 rusvoud 9 SEIOP SDAP 1 9PP HELD “ued gg ap seine S21 Exo epefaty orod eat rj anb sas? seh ep uomiadsyp ap euaserp un so eZ ema €1 SEZ sopmualt sss es uppeedann «a eed apURUBHLS PE SNE vans oe © sour 3a pee ab soUBUR OHO € PPL re eqnund Zopupuise 35 [0 1 omg "wEuERIONUD st arp ind sopenaund sfou 9] upsi= 0s ZOPuRA EL seissewsgns sor ‘SeREHSTP UOS 2904 buy woDmaHOD ef aarp swung “ee asauaunzad woDesue> €] ZepuPund %S ‘anb so nga 0 s0por © gut / (9) suo ae LY aes epunwsql 25 ooo FPus0, SHPO CPA S pf pune eee ee «7 ZOPERUIOL cool sod sopenqund 20} sary &zopuruy szantsor ap savor FL paul ou 9p 02 9 aie SO OPE 8 OIE US TS yaaus soqund ¢ UO? panb oleg spur snund zopupwsogy 35 9 en ‘nb uennsonus serpaur suomemgund sty “up asoqut ap sayz sod sop vos auoureydug wenIpectuod 9 08 SOYPAY S18 He Zapuyusaa ig pp #1 99 cleagp sod sorund ¢ ws sepupun "5 ppsuapentnd slop Sem 98 8 “9 s9 sofea as anb souion £ Souremaye> son! sop 80] ap souopenuumd se] urprenouo)? SesrueH emo sfuleargns ap Osos ssumvoded wr emu “A xappapusay sosoyos sot ‘soen| sop xod Sepep sav0p Tenjund se sowaua,opoag 259 9p peplagngo #|aigos sien Rus® CURSE SIPS, ‘ore op ea an ojaso oun ez anb soant ap ods un 10d sxpep saueperaund se ap speed e euruxyap 36 s2[acosajaud seuNEEans so 9P CHS WoHHPUOD eT grouwalt soups ap no supose 99 2 PHO nb vel ss sind stone #2 oe seperog sauoypued (uoReaLOD ef eyesore Tiel sepenoape sy os seppau ses ‘seid SauODeSep Se] A seypoul Se TAN WIP wep e| ap eTraigg wf anb v oprgap)4 a rap sly ouDeAsep sey & spout SLED nb sour unease e[ uo oun [EDU so sejgeTes Sy NUD UPPABEm opUETS OSA tee cesousagad sya upie 4p sooqes s0,'851 cap ean spat ums son so} ove) Tel] OBEBOFE BHM Zp HE Aer apraruaipefeuios ap pwepyse: Pp owND ap UPDENSTT FT AAS 6504 oso=4 ons ase woseAsze5 @) ‘wppefeH0 (P) < : coe E oni weed) ween) wope09 (0) i Eagan dee vyossve vavoru YOUSIONISE / YL 1 / Bstanisnca aPuicaDa BAS Dibuja un diagrama de dispersida del consumo en reacicn a la velocidad, Mues- tra que la correlacin es r= 0. Explica por qué r e2 0, a peser de que existe una fuer~ te relacion entro|a velocidad y el consumo. RESUMEN Lacorrelacién r mide Ia fuerza y Ia direccin de la asociacin linea entre dos variac bles cuantitativas 2 © y, Aunque puedes calcular r para cualquier diagratna de dis- persin,rs6l0 mide la relacin lineal {a correlacidn indica la direccién de una relacign lineal con su signo: > 0 para asoctaciones positvas y r < para asociaciones negativas Le conrelacin siempre cumple que ~1 << 1. Valores de r cereans a 108 1 indican una fuerte asociacién. Cuando los puntos de un diagrams de dispersin se sian exactamente a lo lango de una recta r= +1 La comrlacién jgnora la distincién entre variables explicativas y variables res: Pussia. El valor de r no se ve afectado por cambios en las unidades dle medica de cada una de las varinbes. De todas formas, r se puede ver muy afectada por las observaciones atipicas SJERCICIOS DE LA SECCION 2:3 5. Hl ejrlco 27 proporciona datos sobre el nivel melablico el peso magro de 12 mujeres y 7 hombres, (a) Dibuja un diagrama de dispersién si no lo hicste en el ejerico 27, Uslza colores o simboosdistintos par las mujeres y par los hombres Cres que la core. lacon sets sproximadamente igual par los hombres las mujeres bastante di tinta para los dos grupos? {Por qué? (b) Caleua + para et grupo de las mujeres y también para et grupo de ls hom bres (utiliza la calculadora). 7 (©) Caleul ek peso magro medio de las mujeres y de ls hombres EI hecho de «que, en promedio, os hombres sean mis pesados que las mujeres, jinfuye en las ‘corelaciones? Sie asi, por qué? (@) El peso magro se midié en kilograms. :Cual seria fa eorelcin slo hubie ‘amos medido en libras? (2.2 bras equivalen a1 kilogramo) 2.24, El ejercicio 2.10 proporciona datos sobre el contenido real en calorias dediezali- ‘menios, yo promedio de las estimaciones hechas por un grupo grande d grande de personas, (@) Dibuja un diagrama de dispersion sino lo hiciste en el eercicio 210. Luego, Ati de relciones(€2) [117 calcula la comrelacion r (utiliza la caleuladora). Explica, basindote on el diagrama de isparsin, por qué r es razonable. () Las esimaciones son todas mayores que os valores reales. Este hecho, zinflu- ‘ye de alguna manera en Ia corzeladon? ¢Cémo cambiaria + si todos los valores esti~ rmaclos fuesen 100 calorias mas altos? {@ Las estimaciones son demasiado altas para los espaguetis y los pasteles. Sefia- Ia estos puntos en el diagrama de dispersién, Caleula r para los ocho alimentos res- tantes. Explica por qué rcambia en el sentido en que lo hace. 2.25, Un cambio en las unidades de medida puede alterar dristicamente el aspecto dle un diagrama de dispersién. Considera los siguientes datos: ere ten ae -06 -05 05 05 -06 (@) Dibup un diagrama de dispersion con los datos anteriores en et que a escala de las ordenadis y la de Ins abcsos vayan de~ 6a 6, (&) Caleula, a partir de 2 e p los valores de las nuevas variables: 2*= 2/10 ¢ uy" = 10y, Dibuja y* en relacion a 2* en el mismo diagrama de dispersin utilizando otros simbolus, Hl aspecto de los dos diagramas es muy diferente (6) Usiiza Ia caleuladora para hallar la correlaci6n entre x e y. Luego, halla la correlacin entre 2" 2. ;Cudl es a relacién entre las dos correlaciones? Explica por qué este resultado no-s sorprendente, 2.26, Un periiico universtario entrevista a un psicélogo sobre las evaluaciones que hacen los estudiantes de sus profesores. El psicslogo afirma: “la evidencia demues- tra que la correlacion entre Ia capacidad investigadora de los profesoresy la evalua~ cién dacente que hacen los estudiantes es préxima a cero El talar del periédico dice: “el profesor Cruz dijo que los buenos investigadores tienden a ser malos profe- sores y viceversa". Fxplica por qué el titular del periédice’ no refi e sentido de las palabras del profesor Cruz. Escribe en un lenguaje sencillo (no utiles la palabra *correlacién”) lo que queria decir el profesor Cruz. 2.27, Los datos del eercicio .22 se presentaron para mostrar un ejemplo de una rela- cidn curvilines fuerte para la cual, sin embargo, r= 0. El ejercicio 26 proporciona datos sobre el consumo del Ford Escort en relacién a la velocidad. Dibuja un dia grama de dispersién sino fo hicisteen el ejercicio 26. Calcula la correlacién y expli- cm por qué est corea de 0a pesar de la fuerte relacién entre la velocidad y el con- soup apsope aL 2° onpowond un woo sous un uo so 9p owns jo spapesd ee usaf ara grea ap sree ues Sond apse 21 HEE 2 Ey poe ap oun fe snopeud ta up 2D C25) ee en aS ey 2 9p 8 ap ous (5p OTe 6 MAT souerp p-50pe1D) a a s ° pos sp ests ow ees apna 8 nb wo sou wor ous nb UEP 2 und gem omy roacomay eusoundsapased SE a partun umn" op ede aps wed Ms UE > i od ero so OPE oP 9 eed TOUS! “Su adn sopo 2a oyinseer eed cd Woe! UNS 2 nun apap so 9 ss tans oP eps 28 aL a ey op weve EHDN 7 UTAE HSPN SL von on ond tops oun nuns = 53 HAE 2 nn gamma eae ss @ wes eH SHINAI opespens-ourussa upisen2a4 9p spoU TFT 01 = opuera se ap curse jp uPHOmPEHS HL ye oo ap soajqgo sonaut £7] anvaurepeusoeosde up 0 soyea av5g “S32 259 9p UIP ED = e apuodsasies anb se ap oustuo> “uansuco zayauvg so} anb sousapaid ‘01 val ey a ouzo>,epiamba of wpe & aque woe, $948 Ses ye zetoy exed “ex en rust wo ‘ejp-sopesd ot ap ompawrond Toge sey ap af (# Ua OL 20jea fe e2TTE0 ett / (@2) spare 2p SI tum woo sow un ap seyp so] ap 508 ap cumsun> fa sepeud exed eps 99 ZOzTRN weg "uggtadatp ap euresenp [0 21gosUoqsasBa1 ap ea ef ope(natp Sou 6 EMS eT UE noroopand _ sou 90 souroseaygn se8 ony? (0.8 aP #9 eUEIP mpaKH eae -2cway ep exp sod exp-sopes3 ot ap orpamord um susan sows un fs, “sel ap oumsuca fe upopad ened upsejar pip seen asain ZOADURG ee) F] ZOAPUES SOK 9P ees ua sour an aquemp so ap Ouefpousuo> fap ofpautld fe 4 s9ut 9p Se 50 Sp oun uppoere ap eyp-sopes8 vs epppas) soUDiNe exeracese 9p ofPot Ped p an fo uppeesa:onj wan ojgpo anb ensanuswpssadsyp ap ewsesBeP stomata cjsondsos oyqeutes wun & eaneoyies ajqeues eum soure oy ant a upesina wf UQDWTPUIED e| ap FDUBIOGTP V “sap UPHUILAALP ojes un e auotpuodseiz0> 9p sore fe sapard ered vowsoiBos ap eat feun sourezya ‘opnuous yo earteagds@ ajgetes eun equnes anb eprpedt fe ejsondsas ajgaus eum oiquse> oUuge agus wo.sasSax ap w>az en NOISaUOIY 3a VIEL sere.suoo Anus souopenys ua ops anbune sayqen sop anus uppeyar er esa anb esa eum zeyfe exed @ponpu un s pape ca tionesSa ey sojund ap ag e{ 9p spaes © ea: wun opwdnayP ORES ese sta tion’ sou “eo door vue exisanua wolsiedsrp ap eusesseyp un 1g seanerRuer seyguusea sop ano feu UPPED: &| ap upBIDK eA eazy e| PPR UAPETDHOD & eonpapens-oumnuur uo(sasS9y “somone ge = 4 2p any zie pp oluarupuat fe A eiquats ap pepisuap ef ane epeey LODEIBHO FL, ©) " eauosoyoud soo s0d soypay se & santeypnise so} od seypet #330 -ayoad soap souo oenjeaa se] aNu2 (61 =) ee UpETaLIOD uN SOUTH, (A) _sosaiuysns & stzope{oqesy So] 2p oxag [9 a1} EP UOIDEOHIOD 8M SYST, (©) -ugpoatzoout ef 9 @pUD os epe> us edi vows un auatuos souoBeMIyT ayuoReSIs Se ap eM EBED " vossye vevarey YousOvISH / 91 120 / ESTADISTICA APLICADA BASICA Sey opuensiesy ce onb epipau! v ezoanp uo wued sesajacito sa} ap uoeauoy op opwaunaed (“LET jeina euor esa ue ean ap ene yap Hd [pp oxqure> fap omedsox anuorpuod ef coypur arb syuowosuip soya :uoysuTal ap eau of ap saad w| s2 eM? >) ‘ost = sues) ye A? Z(t = eURUIAS) oiprise jap ozuatusoa ye fd 9 e19 [pno? “upsides ep ena W|uOD opsande aC (a) ‘uoppenase eis ap openyTuss |p eYoURS ex -auvur eun ap ways yeaneou 0 eapssod so uoppeose €7? ae wIs9 WngiQ (8) Sop so] &uaig eqersne as ne ‘oppipens-ounsu wos -addo1 2p was ef anb uoseoipuy > oduon jap osed ya & ej anu feat uoDe|aL BUN uozea.esqo saiopeSseaut 87 eyfe Zop!e eun we>tpur clea Hd 9p ssxOyEA “Hd | a ‘uerpauu eulatay9p 28 Zap!9e &7 A133 “OPELO|OD ap yeu BUOZ eUM vO ean | BP ~zopbe e‘Searynoasuoo seueUsos pe] ayuRINp uoreURIENap Ssz0peBLSeAUI SOUT VEZ ‘opuopar ‘2p sesous S01 ¥ oprgap soup 0818395 uapand sopaynse: sop 9LZ o¢husle jap uOD ~enoa e{ seuange (@) Ue £ (8) u9 anb eqanudwo> “worpupena-cxmupunpsox8o8 ap yD 1 2p weromeg ‘oxpenaas {ap sauopenda sey opueaq ‘Soxoyea soso ap amued ¥ UOIS aida op esses ef ap v us8t0 [p uD epevapo wy A ¢ aivarpuad weep] woDe|asI00 ns (eae op eaida worsens o& eypour e seiey exed eopeqnore 9] ez (a) “onpapens-ourun upisauSau 9p ear ey ap uopense of sertey ened exopeyno(9 ef 9p wowsasas ap upDUTY 2| wane) ect /(¢2) suownpe ap sspuy ! ‘eropeynoye> eum wo Zz Ia ef 2p sorep soy ey ange + oheoe = ‘outoa 27 ree: et ap sap sor exed = eyp-sopusd soj » upDEIaE 3 4 503 ap oumnsue> jap uoisasins ap woo e| 9p upHEND w| up OFe OLdtuDa I “aCT sopiousia s-sopund sop soy sod red onb eyat e exes 4 r eapaadsaa ns aig0s f peo wns Sorep so| ap = ap saoea ‘0| 10d opeututmiop ojesumus fap sousaN9 soy us waNUATDuD 26 anb =p seI0qeA SOP ap f se4ey exed vosenda ef ezpan ‘ueistadsip ap eureadenp fp uD ves vy avev4s Cae yon vf op opvsuy, SHOETI = 96st's ~ Hee = (oD|99sR6'D + 5t8O'E = Di od x admgsns ‘up-soper3 p] # se8 ap ownsuo> fo s1papaid eieg "vomenda ef up ojaouCD soyen sod # sanynsns 049s wey “upeaapasd of eyes UgISAKBOU 9p epaH Bap UDIIeND? eT ‘uy 2904 ou opuERD osnpuT ausqUBUE 9s Out snsuoa aya. ene ja ejua[eo ued J seurpoo exed se aiso weemn “ep-sopea g uo> sole 508 ap. gpe0'e = Bap oxpswosd un upsezsan zaypu¥s Sot anb souDapALg <3 souaus ap 50 pau sous} eamyeradura: e| opuenD aLT0g = = ‘ojdwrls oN Sanu ug “9 ® Sousa sB19[e9 ewos + opuenD aaKs|PEIse OpEDYRS ava ofPS "UTS -aidos op maz ef snp ptod u98e0 J9 ua epeuzpu0 wap sopea fe souseyserau amb ‘opteno fap Jo[ea [a $8 up|sou8ar ap w>as of 2p w2BO J2 ns upouops0 By suny atuo po ypowapg ‘oueyp sei) ap ut 966b6'0 2p unsu0> fap oxuourne un aorpaid feuoI21pe eAp-opesE PED “OID ‘sword ua ‘onb anip ‘ojduisla visa ap g6sba'o = @ aworpuad #7 “pepmun eun wo -trgume 2 opens viqure> anb ua peprue> e ‘oiquieD ap ese; esa atusipuad x soiep so syoudroyur exed aqueyiodsy 59 uossauSax ap e901 eum op zpuypuod € syuaypiag vosya vavoruv vousowss / ZZ 124 # Bmapismica arucana Asc (©) Una prueba sobre un nuevo pavimenco después de 7 dias muestra que su sdureza es de 230 kg por em, Uiliza la ecuacidn de la rocta de rogresin para prede- cir la dureza de este pavimento después de 28 dias, Dibuja también en tm grific las Hineas de puntos “arriba y ala izquierda” desce x =230 (como en la figura 29), 2.4.2 Caracteristicas de la represién minimo-cuadrética La regresidn minimo-cuaditica tone en cuenta las distancias de los puntos ala recta s6lo en Ia direccién de y. Por tanto, en una regresin las variables = ey uegan pape les distints, k i) os 10 1s 20 Distancta, millones de parses Figura 21. diagram de dispersin delos dates de Hubble sbrela ds ‘apc la Terra de galaxias fa velocidad con Ta quests ealean de nosotros Las dos eta representadas son at doe tase represin n= ‘mo-cunrtcar inde Ia velocidad en reac ala distancia ipa cane us) y In de a distance en relacia a a velocdad (linea contin). EFEMPLO 2.11 La figura 211 es un diagrama de dispersién de fos dates que sirvieron de hase para descubrir que el Universo se ests expandiendo. Son las distancas a la Tiera de 24 Anis de relacions (e2 J 125 galaxies y las velocidades alas que éstass2alefan ce nosotros, proporcionedas por el astrénomo Edwin Hubble en 1929. Existe una relacién lineal posiiva, "= 07842, de ‘manera que las galaxias que se hallan més ljs se alejon mas rapidamente. De hecho, los astrénomos creen que la relacion es perfectamente lineal y que la dispersin se debea erores de medicin {Las dos rectas cel dibujo son rectas de regrestén minimo-cuadritica, La recta de trazado continuo es la regresién de Ia velocidad en relacién ala distancia, La recta de trazado discontinuo es la regresin de la dlistarcia en relacén a la velocidad. La regres dela velocidad en relacin a a distancia y la regres de fa distancia a relacin le velocidad can rectsdstnts. Al determinar la recta de regresién, debes saber cudl es Ia variable explicativa. Bt ‘A pesar de que lacorzelacién rignora la distineién entre variables explicaives y variables respueste, existe una esirecha conexién entre la corrlacin y a regrsién. la pendiente cela rocta de regrosién minimo-cuadratics es Esta ecuacién indica que, a lo largo de la recta de regresiGn, a ut cambio de ia iesoincintipien de le corresponde um enmbio le > desviciones pions de». Cuando las variables estin perfectamente correlacionadas (r = 1.0 r = ~1), el cambio en la res- ‘puesta predicha jes igual al cambio de z fexpresoda en desviaciones tipias), En ios restantescas05, como! << I, el cambio dejj es menar que el cambio de z. A medi- dda que lacorroacién es menos fuerte, Is prediccién j se tnueve menos en respuesta Jos cambios de z. Existe otra conexi6n entre la correlacidn y la regresién que ss incluso ms impor- ‘ante, De hecho, el valor numérico de r como medida de la intersidad dela relacién lineal se intespreta mejor pensando en tgrminos de regresién. He aqui el hecho que necesitams ‘ SEN LAREGRESION Bl euadrado de la correlaciGn, r,s la fraccin de la variaién de los valores de y que se explica por la regresion miinimo-cuadratica de y sobre = 1B Hable, “A eletion between distance an racial velocity among ext-gli ebula”, Prange National Aen of Sens, 3, 192, page. 16-17, “ne 2694 51 “aoa po Kaapeoy OK MON SHEN TO sSopieg pus eotepnsrnla gop eS esing maainy@ MU CE) LAT g 9 SHUT ON, “Ae away poe ope jo uossdaes (onamTeNg, Sy TNL OR HD UAEN Is -uossiadstp ap eweuSeip f ua eas eypp ezeH, ;pEPHO|eA ef € upDeaL UoD opLMDs od sosed ap oxouupu jap sonPIpero-ouuR upisosSax ap NEL eT ETEH ©) “uppoeyaezo ef wey A sosyp sonse ua ajuR|sH LODE e| aqLDSEC (@) sovep so] 2p wofsadsip ap euseserp un elsaip ‘oye ee jpeppojaa e op snied e opimndies sod sosed ap araum jp sDapasd sox2Id (©) see FE 9eE see gE TE OE opuntfes sod soseyy 9S OD LTS SES SSF AMD PePOTEA, _copunas sod sonaur ua esaude 9s pepinojaa eT “sopepDojen SenIRTD 2 a? ‘ap seugpatiog ap odns3 um op opunes rod sosed ap oypeutosd a mabe a} PEPDO!A bl ejwauine anb epipaw ¢ openas sod sosed spur uep souang soi0ps1409 87 “EEE ‘oypipod sores p anb (ofeg seus oyanen o) ee spur yet opis saqey epou eH 2p uy waurexa jap fea BU e[ amb seueUNBLe exed ac ejMa]ED OWING RUE Hes MOUS ns op wou of apapaid exed woueyy sososoud (ap opoypur jp anb 2a.> ou exAl @) ‘eq ap yeu uaurexe (ap e10u of >opaud ered woyseseu ap emer 2| zn (@) gunz (a ue epeuapro of s2 jen? zosino 50 ap sojopred souawiyx9 Sof u> epe|mutne WOU ef # UOHEFaL UOD (ety UDWEND [OP ‘jou vf 2p eonpspena-otsrusia upsesa2a: ap z81 ef ap snuorpuad ef $9 gD? (®) sojesed seuouryno 50[ uo sp sod sepojmunce sou sy ap sazed & ‘tp(ap reug wawves fp eno et zpepaic apoap rossjoud (99 9p exe sapuoxed UBL -pxa $0 uo wpenusnoe wyou ns nb ages cred eR ap ful UBLIENS gfrEANS a 5 8D sy soseyord [y'g ap ead uopeIasap wun & 7 ap erpour run WOU [BUY UTX Bp Seow 507 "0e ap Sid wopetasap wun ogc 9p eIpaU! wun wawEN seemed souDETETO sojap sepemnusnoe stow se7 919 =. 59 EIN s0say0Nd jap eMWOUODS 9p Os4N fap FEU, ‘uaurexe jap sejou Se 4 sp[etored seuDUIB Sof 9p SHOU se BUND UORRFALID &] TET sopiouafa sopepardo.d seipnur auan anb sa soyep soun w upisouSox 9p wnat eum zesnle exed ‘unuzop sp je 52 sopespena sousrujur So] ap oporpu [e [en e| sod YozEE ENO) =O%"P soun ¢ raz eun ap ajsnle ap sopoyaur sono ered see ues oN "oRppED-OUNTUTE ‘uolsaifar pap sajebedse sopepardoxd wos uppereize> ef uod sakloRaUOD Susy 221 / (e3) stems BNE 1+ anus ours ompaus © peas 0 ap woes wun ‘8 ap eT9 of UE “eOU] UPPDHIaL wf sod wages 96 EOE sen 2 2p peyur of uourepeunoude 9p 6360 = ot SOUND 2) = 40.29 = 1g "ygeuea exo ef cao yoauy uppea e| sod woydxa as aIQEUIA eUN AP UPPELEA B po) “ap 69 '] = x1 oseo aise ug “epaL eum ap OBey of e sopeaunye uauIE;eyad ueqrey os sonund $0] and eunidis (¢ = 4 0 [ ~ = 4) epayzad uoReTaLI0 eun -~UpD -2pose @] ap ezsany e| ap esjaud spur eapy eun s9uay exed opespero ye eyeaya "wpe 1109 ean sen} opuen3 "ysondsar of opuergdxa uorsauSar x 53 an evong o| 3p ep pout owo> 1 2p s0jea (2 ep “uotsarfas eum ap sopeynsar Soy soyuasaidl opuEND sm souotsudar segue smaucimyyy v apn 6 uppaszo9 sun cps as oad ‘uoeeifat ap seoat | 3p opexpuro [a "eR Be UOHLIR HO Soiep so} 2p uppetiea x] sprur eno eT uoyseifar ap eves e{ ap O84] of wananus as = ‘ab epipaw ef ap zsusigo soureiadsa enb uopewea esa se ap eu soued sop ua ‘ezuetiva ns outa epessucho 2p sopess9sqo sauo[ea soap eo} wPDULA B| PNP staisod sq sowarey oj ou anbune ‘aquoueatexqp8ye wesaidxa apand 9s vapt visg ‘opuens ({7 winy e| ap soiund onens soy es oly auanueut as -F opueno tap ajgeraprsuo> uoexiea sun eyaepoy ays%9 “SauLIY SOpC} aC“ = TOP ten anb sodem pres op s0jes 9 Z = = opuero anb ‘opdual sod ‘reuaype seupo ‘pepDojea e| us epeasasqo uppeH ol ap sued mun eda eOUERED Be UpHE|AE Na Rouy eouopuadp ry ‘sostadeyp syu: oysnur upsa {1° sue8y of 9p soyend sot ‘ope, ‘en0 104 “e221 vf ap ofe oj» sonund Sot ep uotsredstp eyua sasede anb ap yenprsas uuppeues eyanbad sun aya 0195 “se ap oumsuon [2 oftsuos opuensenre £ opuag san eat (F @p-sopes8 u> oprpouy) sou emyeradury oy anb ap oxpoy > 10d © ~idx9 95 ap uopese e] ap ated sodeur ef anb eaisonus worsiodsip op eurEABeIP 1 Te PE ap wea an saxojen uewoy 2p saroyea soy se8 ap ournsuO> (ap sorep soy “hap sopeaiseqe Faio[ea so] uo uopeues eypmu Sey] “gz emBy of ZOA PMO ery “ofsUOD ‘eg onseare ‘equi = anb epipaur # ant ap owpoy j@ 10d onde asf ap uosexrea 2] ap ayred “our uppeyar eum ays epuens zyuseniis ef s0 uorsaufas | ap eopr ey voisve vavonay vousivasg / 521 128 / EstApIeICA APLICADA BASICA (2) :Explica la velocidad Ia mayor parte de ls variacién observada en el mimero dle pasos por segundo que da un corredor? Calcula r y utiliza su valor para angu- smentar Is raspuesta, {) Si quisioras predect a velocidad en funcin del stimero de pasos por segui- do, gutilizaras la misma recta? Jusifica tu respuesta. ¢Tomaria * el mismo valor? 2.4, Un estudio sobre la asistencia 2 clase de ios alumnos de primer curso en una universidad pablica mostré que, en general los alumnos que asistian mis a clase ccbtenian mejores notas. La asistencia a clase explicaba el 16% de la variacion obser- vvada en Iss notas de los estudiantes. ;Cual es el valor numérico de la coreelacién entre la asistencia clase y las notas obtenicas? 2.43 Residuos Una recta de rogresién es una manera sencilla de desenbir tna relacién lineal centre una variable explicativa y una variable respuesta, Las desviaciones respec- toa la celacién lineal también son importantes. Cuando se dibuja una recta de regresidn, se ven las desviaciones cbservando la dispersién de los puntos resp toa dicha recta. Las distancias verticales de los puntos a la recta de regresicn :minimo-cuadrética son lo mas pequedas posible, en el sentido de que tienen ta ‘menor suma de cuadrados posible. A estas distancias les damos un nombre espe- ial, resins. RESIDUOS Un tesa a liferencia entre un valor observido de invariable respues- | Byetrierpeetn pare deren at residuo = yobservada ~y predicha =~ EJEMPLO 213, a igri eec a 12 5 i 6 0 09 é 2 7 2 re 7 83 8 a 7 a a 10 8 v a ° 5 104 2 uw % 0 2 % 2 0 10 0 z 13 * ts datos ls cbtuvo argialmente L. M. Linde de UCLA, per fueron publlados por prt ror ver por Mickey, O.|. Dunn y V lak, "Note onthe as of steps egresin in dec tng ot”, Comptes a Biola Revarc, 11967, pig 105-71, Los dats ham seo wis or vais aulors. Los hall en N. Re Draper ¥ JA. Jon, “vive cbersatins and otis epson”, Tenors, 23, SI, pis, 2125, soyep soqse exed uppdupsop pun fun so ou wer 27 -oapensny ofdusela un so (FEZ ean e7 TeaKy, s200u oes e| an eafpUr Sonpsas So} ap UOHMGINEAP eT 9p warm ewNzO; LUT « -sonpisai ap eures3eqp un o sowep so; ap uptsiadstp ap eweaiep un opuezy, ) sumac ap ssyeuy 3881 saloyen Soj ap UPPEWEA ef IPR Seu euLO} ap Jaa ayuusad seuredeIp op ods ia -sennge a] ua eaneorydse ajqerea nS sepeuspso se ua sonpsat soy equasanl. 295 jen (po oiezadsyp ap eurusZerp un sa sonpises op vaso un, Tz ema w 3p [P owas sap 0 sorep so] ap upisiedsip ap eweiferp [@ ua upjsodiar ap ea 2] & sojund so] ap sapoqisa squoperssop ee] opuemun sa2ey sepend O7 “Sorep 50 ‘smsnle as upienuat ap ea ve seqouduoo ered opepirs woo sonprsst so] suTUIXS onpnopas 99 sou “sonpasas 2p vusuSerd ogse-t oxip"tt~ osec-oc cope's- 0058's osse"r oFzSTY Bieter opog-st= soeL"e> Tero rt su99-9 Tepe tree betre teee-oe aTEO"s S0EL'e OnOgTET- Tere"é- TEOre :0203I -ayso euresZoud un woo sopauaigo 119525 eqanud ¥| 2p sowep soap sonpysar 17 $0 nib ‘af -2an of soapisay So S0p0} wep #4 sooustpese seuresSosd soy -t eped exed bu: sypaud eyandsa1 of seer] anb sauag ossuridl anb 25 “osouone} aiseseg s9 ex0pet -e> eum woo sofenprsar sauopes so eqo4] “Wun ped exed penpysatsopea um UE ectatge map soreg gee erauad map pepe map sed st js99 wopratund sonpant eed sopepers cui Use 52 Tonneau op sr sua [9 pep oF ODM! w 95 exon ap sbucpeuund x ap worannp 9p eeSeig Tre EMBL, (sosau) exqeed wrouned «1 9p pe « or 0 a o ° TD eqand on vousya vavarey YoUstavss / O€1 132 / EstabIsnca APLCADA BASICA, 4 a é Figura 214. Aspecto ideal en la represenacén de los ross mins cusdraticos. lg a indies un Buen acted la eta de regen. 3] 7 i Geet taeniaen eee eg te 12 2140. Las datos del grifico (6) muestom una forma comes para los resis, por fe que la racia se asta ma. ee : ee 34 id of ad a4 Figura 2190 La variable espuasia yen el grifico (ene mie deper- se pars los valores mais grandes de a variable explictive Por foto, [a prelcein serd menos procs cuanto mayer seas | Andis cde laciones (e2) 1133 Un crecimiento o decrecimiento de la dispersién de los residuos a medida que ‘aumentan ls x. La figura 214) es un ejemplo. En este ejemplo, la prediccién de y serd menos procisa para valores de x mayores, Los puntos individuales con residuos grancles, como el dl nifo 19 de las fgu- ras 112 y 213. Estos puntos son obseroeiones atpicas ya que no enesjan en el aspect lineal dela nube de puntos. Los puntos individuales que son extremes en el ee de ls abesas, como el nifo 18 de las figuras 2.22 y 2.13, Estos puntos pueden no tener grandes residuos, pero pueden ser muy importantes. 24.4 Observaciones influyentes Los nifos 819 cel ejemplo Geel son ambos poco frecuentes, poo lason de maneca distin, EI nit 19 et ojos def recta de regen, mienzas que ei 18s halla cerca des recta pero may deapzado en a deci de ej de ns abs 1 no 9 ura asec ap, con sna nti an alta que deberomes comprobarsi no s main de un ero de ranscpion de los datos. De hecho a puntuncin es correc 2 ito 18 fue el que empezd» babar mis tarde, Debio as posi extrem dl ied sss en gra infnencie ayscdn dea recta de esi. La ig ‘2 215 afade una segunda recs de regresidn, calcula tas exclu al no 18. Poe ses ver que sin esa observacon la posicién dela recta se ha modicado La reg sion minimo-cadrétice hace que la suma de los cuadmados de las distancia vertices de los puntos ala rca sen fo mis peat posible Por este motive, un punto ques encuentre sisladoen un extremo dol ej de as sn tas puntos cea deal despaza la recta hacia st. estos puntos los lamas infants. ‘OBSERVACIONES ATIPICAS Y OBSERVACIONES INFLUYENTES EN UNA REGRESION Una observacién atipica es una observacién que no eneaja en el aspecto kgeneral dela nube de puntos de un disgrama de dispersin. Una cbserva- ‘én atipica puede serlo en la diteccién det eje ce las abcisas, en Ia direccién del je de las ordenadas o en ambas direcciones Una observacion es influyente sal eliminara se produce un cambio notable en la posicin dela recta de regresion. Los puntos que son abservaciones atipicas ela dirsciin del ej de las abisas suelen ser observaciones influyentes, soi ¥ sowwarpuodsaiio> soyund soy apoyog “oyear sazojen soy ap med o sexo} Sey ap uopeurgse e[ spapaud exed opensope uojsiedsip ap wurexSerp un lnc (©) ‘uo}efait09 e uo seakdne ssuapenasqo sop ap eouany x woyds= FZ ZONBIAS cosiad ap odru osaiouimia un sod sapoums sopmueiuoo so; ap oqpotwosd o & soyuoU “ae zarp 2p seio(e> to yeas opRaoywo> fp aigos sojep wuoprodnad oy'z ODIs HET ‘eva voisiodsp ap eurerSerp (ap uoseifias ap pat v ap 082 of & sot und soy ap uojpnquastp 8 & equ so eat e159 ap OBE] of e SonpIsas s0| 9p UOIING “aystp of anb eqansduzoy ‘sepevapso Sel 2p ala [op Q 40124 [ap esa wv (eIUOON, boas eun ezexy x ap sofofea sof v UOPDEar UB sonpysa ap emexder um eLagIC {eopuopat ap ssious so e139 ‘uo opuoquay 9 & eunDsa> Anu og 59 sanpisa So] ap euins e] anb eqatudiso> (>) ‘ysond _sory eoyisn{ gr op sused ef spepaid ered wowsaiSorap eat of serra? (@) cumeaSexp ns uo uptsatBou ap woos ey ee & souoweasasgo sey woo uoisiadsip ap eureep ur Anaya (e) we TL HOS ET AIT wo- RT «OL wos souoppea95qo se] anb wapio OUEST fe UD ‘SOnprsad 507 soppi00~ gsott=4 1 upysaufan ap eas &T somprsat 50] UPIG use & wanpapeno-ourrues uprsaxda19p e}30 e| oprusigo sow onns;pese euretBoud {un ap epae e| w9 e104 sod sonausoypy ua pepsofa Uy souBUiNIY gg Zod eUTOSeS ‘3p sony wo opipaus iy 28 syuesngzes ap ournsuoo jg S9pepDOTPr SEIUNSTP e TOL “oyne un ap feusfosed ap owineuo> 9 21995 sawp euojaodoud 9 opPHale (3 “SST somata sr uopeniasqo sos eun ap owe epuadp ou ssnpue fp anb exweu ap S49 espa seguy vopezadiun uesey anb count 9p sxeUOEIPE soe pIs=HAW "UPERESGO typ avoquer ig eoerud oj un upoeraund iowxsod ns &smgey © eras ouRE UN fnb ef © pepo e] amua uopepst sj ap eauapisa e| sued wei uo apssedesp ‘S] ous qeaknpra ig ssngue op opensn uo eadngut an snpaad ezaqep asx anb ons, ty a gL OUR Jp O|LESIP 9 POP ageC OPEBTSNAL UM HD IEP IND? ogtt 2989 ‘81 OUR Te B72 SOUT t OF soxped soy eed spzoust ap eas onb ezed aon ]uSuBTU=.gRS sa pea HI ETI 112) swore sp HCY uezayduia sou so| anb ef» pepo e| 9p sued e woidxa apand as 19500 eqanud e| 1tp opeaiseqo [B)0] eoDeHeA e| ap SUP UN TDAP sy THD = = UauEN saleMEsEO soreP sof “yos05 eganud ef ap sovep Sof 3340s ojdusala fp ug “eoupspena-ouuT UoisosSax syangos { uppeyesis ej axqoe etuantyur ued wun weuay seuTANX@ sawoReasesco Se] src oTanala soyep soum 2p uo.peyaedsnya ef exauwur wex8 up reoyypoU UP and sayuadngt seuomeasesqo Se7 s3}uaAnyur sound 80] oye sod sesesed ‘son Sof uo sely ay ojgs 1g -ppasod ns epey erat ef ap ues anb vé “soyonbad sone ‘ised sou uafans sequen sorund S07 wotcn® upppensesqo e| ap ofeqap sod ear be vausgar anb cares ap sesojea uco soy soup Key anbiod woysai8a1 9p ‘2019 2p worstsod ¥] us epuenyuy souaus auad, Sepeuapl0 so) ap al fap UPI vy uo esidye upsessasgo un £2 6f OUR E luaKnUI KoDEAseeRO FUR UBLaLTEA {Xsestqe se ap aa fp uomrDAP ef ua eda? UHeAAasqa WU 59 gL OUR I agogsad a oqund aso wap 9 opuena ab es "ayAny uNDEO fon 6 gL OU [3 'St OU [ OpUDANNG OpEITED et 2s OMURAOETE ‘ren ap ©] Sop 20 Sopot 9p sued @ opHND|D wi oF OMUEUD> ore Sheba 2] eigeed wnurad a 3p pepo e| wo UoPeya: Ua ieD s=OD enund st ap soupspemsoutape wpsatlas ap e8s $0q STE ESL (sora) exqered eau 2 0p Peps Ca or oe « a 0 voisva avon USVST / 1 135 / ESTADISTICA APLICADA BASIC ‘espaguctis y a los pasteles en tw diagrama, Estos dos puntos quedan fuera de la rela. ign lineal de los ocho puntos restantes, (b) Utilize la calcaladora para hallar Ia recta de regresin de la calorias estima das con relacién a las caloras reales. Hazlo dos veces, primero con todos los puntos yy luego dejando fuera los espaguetisy los pastales. (@) Dibuja las dos rectas de regresin en tu diagrama (una de trazo continuo y la tea con trazo discontinuo). Los espaguetis y los pasteles, tomados conjuntamente, 60m observaciones influyentes? Justifica tm respuesta, 2.37, La discusion del ejemplo 2.13 muestra que el niRo 18de la tabla 23. una obser- vacion influyente. Ahora vamos examinar el efecto del niRo 19, que también es una observacién atipica en la figura (@) Hilla la recta de regresién minimo-cuadratica de Ia puntuacin en la prucba CGecell respecto a Is edad a la cual un nifio empieza a hablar, dejando fuera al nifo 13, El ejemplo 2.15 da la recta de regresion con todos los nines. Dibuja ambas rectas en al misma grafico (no es necesario que lo hagas sobre un diagrams de dispersién tan, 46lo diibuja Ins rectas). :Calificarias al silo 19 como muy influyente? zPor qué? (8) Le exclusién del nifo 19, qué efecto tiene sobre a valor = de esta regresiGn? [Explica por qué cambia ral excluir al nifo 19. RESUMEN Una recta de regresidn es une recta que describe come cambia une variable respues- ta yal cambiar una variable explicativa La recta de regresién minimo-cuadsitia esl recta dela ecuacién =a + hr que ‘minimiza la sua de cuadrados de Is distancias verticalas de los valores observedes de ya la recta de regresin Puedes utilizar una recta de regresién para predecir el valor de ya partir de cual- auier valor de 2, sustituyendo esta z en la ecuscion de la recta La pendiente b de una recia de regresin j= a + br nos indica la proporcién en la que ia variable respuesta predicha f cambia a fo largo de la recta de regresicn, al ‘cambiar [a variable explicativa z. Coneretamente, b es al cambio de { al aumentar 2 en una unided. La ordenada en el origen a de una recta de regrasién 9 =0 + be os la respuesta predicha cuando la variable explicetivs es = =0, Esta predicci6n no ene significa do estadistice a no ser que = pueda tomar valores cereanoe 80 La concelacién y Ia regresién estin intimamente relacionadas. Cuando las varia: bles x ey se miden en unidades estandarizadas, la corrlacén res la pendiente dela recta de regresion minimo-cuadritice. Hl cuadrado de la comelacién res Ia froccién

Anda mungkin juga menyukai