Anda di halaman 1dari 10
‘Sir Francs Gatton (1822-1911) Medien inglés. En 1869 pudice ol Siro Heredtay Gens ya raves Edel estudio de los problemas de laherencia lege al concepio de carelacion, siendo e! primero en ‘signer @ un conjunto de var: ‘ables un nmero que permiia Una medida del grado de rel: ‘acion exisonte entre elas. Variable estadistica bidimensional \ CConsidera los siguientes ejemplos: 1. Notas en flosofa historia de los estudiantes de décimo grado, \ 2, Pulso y temperatura de los enfermos de un hospital 3, Pesos y tallas de ls jugadores de un equipo de beloncesto 4, Gastos de publicidad ¢ ingresos obtenidos por una empresa a lo largo de varios, ates. 65. Ingresos y gastos, en millones de pesos, de las familas de una pequetia poblax | cn, 6, Tanto por ciento de alcohol en sangre y tiempo de reaccion en segundos de 20 | conductores, 7. Eslatura y niimero de calzado de los estudiantes de un curso. 8, Expresion oal y desirza manual de los estudiantes de primero de primaria, 9, Horas de estuso y calficacion en geogratia de os estudiantes de un curso, 10, Actitud agresiva y nimero de hermanos de quince rifles que ariston a la consulla de un psicologo infant “Tadios os ejemplos se refieren a dos caracteristicas cuanttaivas de una misma pobla~ con, En vez de estuciar cada variable por separado, interesa hacer un estudio Conjunto, analizando la relaci6n existene entre ambas variables, Una variable estadisticabidimensional (X,Y) es el resuitado del estudio de dos carac- tersticas cuanttavas X y ¥ en los indviduos de una poblacin, La variables estasiticas bidimensionales se representan por el par (X.Y), donde Xs una variable unicimensional que toma los VBlOeS x, % Xy.. %q ¥ ¥ es otra variable | Luniimensional que toma los VAlOr®S Y, Jo Yr» Ye La varie estacstica bidimensional (X,Y) toma los valores: (3). (te 9) (es (x, ¥), © tambien: (x, y), (1-1 = ‘Al estudiar una variable bicimensional es necesaro estudiar también las variables unig ‘mensionales que la forman, caracterizindolas por su media y desviacin tpica. Este proceso se lama estudio de las dstibuciones marginalas asociadas @ la variable Be ‘dimensional Tablas estadisticas bidimensionales simples Los datos de estas variables estadisicas so ordonan an distintos tipos de tablas. ‘Tabla simple Ejemplo. Los datos que se recogieron a realizar una prueba a diez estudiantes para ver (a relacién que hay entre expresion oral (X) y destreza manual (Y) se ordenaron en fa siguiente tabla, : wamemly) | 5/6|7/8 7, 41/5/36 En este caso, la ecuencia absoluta de cada par es 1 “Tabla simple con recuencias Ejemplo. Las calfcaciones de 39 estudiantes en flosofla y matemsticas fveron las siguientes. ‘Ahora, algunes de los pares, de [a variable eparecen repetidos Tabla de doble entrada Enlas colummas se colocan los datos de a variable Xy en ls fas, los de ¥. En ol inerior se coloca la frecuencia absoiuia de cada pat. La recuerc fs la frecuencia absoluta et par (x,y). La frecuancia f 0s la recuoncia de valor x dela variable X,y la trecuencia fs la frecuencia del valor, de ¥. Pr construccién, toda tabla de doble entrada se puede transtormar en una simple con frecuencias. Hasta ahora, todos los ejemplos quo se vieron do tablas estadisticas bidimensionales hhan sido con variables ciscretas. A la hora de trabalar con variables estadisticas bi- ‘dimensionales en las que alguna o las dos variables sean contnuas, se toman como walores x y y las marcas de clase Ejemplo. La siguiente tabla representa el numero de conciertas por quince grupos ¥ylas ventas de discos de esios, expresadas en miles, Calcul el numero medio de (0D vendids. {19, 30) (30,40) ot 1 140, 80) oa pee 5 Se transforma la tabla de doble entrada on una simple, en la que cada intrvalo 0 clase ‘Queda representado por su marca de clase 3 FA 15 2» 15 8 [15 © 16 sf 6 oa ss | mw | us Media do x ¥= BEF = 1d 1 numero madio de CD vendidos es de 9600 Los ingress anules doa ncutn ‘Sscogtteasuperan los 30000 rilonss de ares srl muna alagrama de ropresentacién oraica mas ctl a deserir el comporamiento onjunto de do variables. ———_ i roa SL ES Dai posiies rogaridedes que haya en fs datos observados, (XJ) i Yo a Mes) O17) es representa esas parejas on unos ees cartesianos. El conjunlo de punics fee obtene se denomina dlagrama de dspersin 0 nube de puntos. Ejemplo, rime de its de are que 6s nocesao bombear cada mina @ un Cuze para eve pusda parmanecer a dfareies proundidadess9 recoge en fa squint abla 7) *|#|»lalo “42 85 | 127 | 169. 245 | 424 1 Fepresenta la correspondiente nue de puntos. obs que a ayer prokusee, mayer fect ude are pr ro Que hay a | nhieu | ewe oT Profi in) Ejemplo. Se pregunté a 25 ointes a la sald de un restaurante por ls siguientes ppoctos: X = ‘ndmero de personas que vnieron a comer juntas’ Y = “cliicacion le pondiian a restaurante” an una escala de O a 5. Los datos recogices figuran en siguiente tabla de dobie entrada, Representa el dlagrama de dispersion correspondiente. Convene observar, por ejemplo, que &. parela (2, 3) le correspond una t 4, Por elo, en la proximidad del punto (2. 2 sivan cuatro puntos. @Recuenon Seem A N wa s, se lama tabi vatanza conjunta de las varabes X Bib. Da = ne 3M za puede ser postive, nega o nla Js covaianza indica cémo se spartan a la vez las dos coordenadas de un specto do la media. Si el resutado es positvo, quere decir que los productos ‘esto 65, ls valores de xy de y,se aljan en el mismo sentido de sus ‘meas, Y al conraio si el resultado es negativ, En caso de que el val 4a 4775 = 131 coms: y= 1 - 06-775 = 875 ro ‘Se lama comelacién a la “relacién o dependencia’ que existe entre las dos variables ‘que intervienen en una distribucion bidimensionl 1. La corralacién es neal 0 cunilinea segtin la nube de puntos se condense en toro a una linea recta 0 a una curva, 2. La correlacion es positva 0 drecta cuando a medida que rece una variable, la ora tambien crece. La comelacion es negativa o Inversa cuando al crecer una variable, a ora decrece, La corelacin es nula cuando ro existe ninguna relacién entre ambas variables; en este caso, los puntos del dlagrama estén esparcidos al azar, sin tender a formar ringuna line, y se dice que las variables estén incorreladas. 3, La corelacén es de too funconal si existe una funcién que satistace todos los valores dela distribucon, En caso contrario, sea tanto mas fuerte o més dé, dependiendo de la mayor 0 menor tendencia de los valores de la distibucion a aijustarse a una funcién dada. En la tabla se representan los distintos tipos de correlacion y y y| y 1 El dagrama de dispersion 0 nube e puntos coresponcienie a una arable estadstica biémensional (x, yb se obtiene al repcesentar fen unos es caresianos los pa- res de datos cbservads (x, J) Is hy Woe Oy ¥) te 1 fest \1 ot x od ¥|Op4 ¥ qt x Lineal positva —_Lingal negetva | Curviinea negativa | Curvlines postive uncon funcional funcional funciona ot x Ot % |] a Curvtinea negatva Lineal postive déoll | Uneal nogativa débi bi eb ‘nubs de puntos se condensa en torno @ una recta, existe una corelacion lineal las varables. Para muchos fendmenas es de gran intorée cuantiicar de forma mas ¥y precisa esta correlacion. ‘cooficonte de correlaciin de Pearson es un pardmetro de la variable bicimensional Y) que sire para mecir el grado de relacion lineal ene las dos variables unidimen. ‘Que la iegren. Se representa por ry es el cocione ene la coverianza y el de las desviacones tipicas de Xy Y. ‘Signo del coefcientsr viene dado pore signo de la covaianza, ya que las desviaciones| peas son siempre postvas. As! pues, el signo de la covarianza decide el comportamiento. fa corelacon Kan Pearson (1887-1938) Nao en Loncies. Fue abooado, paltic, Ierato y profesor de matemsticas aplcadas, 'A Pearson se deben aportacio- Lcosfciente de comelacén lineal es un nimero real comprendido entre —1 y 1 Ueto eo iiang Breer ses ata cmos sncporty otro ino pas on [Seman enennntmn | “dependencia entre dos variables, ar ot ¥ 4. Todos los valores | Las vibes XY stn en | Las arabes Xy Yson ala | Las varablesX Yesin en |r = —1. Todos ios vale | a varabie (1 1) se en | ependenci aleatoria dec |tfamente Independents, | depenendaaleatara ime ee varabe(,¥) $6 «0 [Seenvan sobre una rect. ta, tanto més ene cur |= 0. las varabies XY $2, tart més fuete ciao |cienan sobre una rect Ie vrbes XY exin en | més ‘se aprxima r@ 1, yon nconeadss. ‘nie ee aroma a—1, | Las variables XY extn en [penn non! nels eb varios 8 Inés GON cuamo més 50 epencncs undo en onc trea #0 I ‘oum a , ‘nvr ‘Un cosfciente de corelacon neal préximo a cer indica quo entre las variables no existe {acim rel, pro puede eco po de ebendeci con ona! ‘Se toma el cuadrado de los lerores para evar que se com- Penaen los erores negativos y postivos. Esto tipo de auste se lama tabi Ge minimos uae radios, con valores primos a los pares ‘considera. Las estimaciones mas fables serén las de valores pros a par ‘Las preaiccones deben nacerse $e Si entre dos variables exist una fuerte correlacion (Fes préxima a 1), el diagrama de ‘spersion se condensa en tno a una recta y tiene sentido determinar aquelia que mejor '3e aproxima a la rube de puntos y utlizarta para predecir valores desconocidos La reota que mejor se aproxima a unos datos se lama recta de regresin, La variable dependent 2s aquela que se quiere estimar,y la variable que se utliza para allo se ‘denemina variable indopenciente Ecuacién de la recta de regresién de Y sobre X 5% se cansdora X caro variable independiente, y Y como variable dependente do X fa vot ond una ecuactn ea fora y= m+n Extonces, a cada valor x, de Xle coresponden dos valores 6 ¥: +E valor observaco, *€ valor dado por a relcdn Ines, f= m+n, que es el vl esperad. caraeresita'k or eheatey ecg a) La condcisn para clear my m 88 aus la sua dee ores al cuarado Sea minima: Sap = Sty - (rm + mie Se demuestra que esta suma es minima si: mate Tae e Vea ‘S| se considera Y coma variable independiente y X como variable denenciente, 88 ‘obtene de forma andloga la recta de rogrsion de X sobre ¥. Propiedades de la recta de regresién + Las rectas de regresion se cortan en el punto (F, 9) lmmado centro de gravedad © ‘do masa “+ La pendionte de la recta de regresion tiene el mismo signo que el coefciente de correacion. “+E éngulo que forman las dos rectas do rogresién varle segin sea la corelacién que haya entre las variables: = Si [rf es pebximo a 1, las rectas précticamente colnciden. = Sires pxbximo a coro, os decir, la corelacion es cas nul, e! éngulo que las rectas os casi un angulo recto Primero se representa la nube de puntos. Los datos se agrupan en tomo a una recta: por lo tanto, tiene sentido calcula la recta de regresién. Fara halla las roctas de regresion hay que calcula os parametros do la variable (X.Y). 20703 20300 20708 79971 = OBIE tos 50-3 5, VEE 61 3 S25 _ ops = 4309 5, = VIBE ~ 656 so = TORE ap. ge = 378 a) Recta de regresién de ¥ sobre X(azul Y= 921 = 1,022(x ~ 195) = y = 1.022% ~ 107.19 ) Se susttuye x = 200 en la ecuacién obtenida: y = 1,022 + 200 ~ 107,19 = 97,21 Es deci, si un jugador mide 2m, pesaré 97,21 kg, 6) Recta de regresion de X sobre Yiverde) x 195 = O871y ~ 92,1) x= O87y + 11463 4) Se sustiuye y = 95 en la ecuacién oblonida: x = 087 95 + 11463 = 197,28 Es deci, si un jugador pesa 95 kg, meciré 197,28 em, $$ © Sasias ave ot We Tukey (1915-2000) Estadistico norteamericano. En 1977 desarolo la recta mecia- naxmediana 0 recta de Tukey. (que esté basada en la idea de {que la mediana es un paréme- tro mucho menos sensible a los valores alsiados, En algunos casos, la recta de regrasién se ajusta muy mal a la nube de puntos, a pesar de que a simple vista los puntos parecen incicar una correlacion lineal En estos casos se alustan fos datos a un modelo lineal mediante la recta de Tukey Ejemplo. Ajusta un modelo lineal a la distibucion bidimensional dada por la siguiente tabla 1]2)3]sl[e[7]alo[ole2] ula o[u[alels(w[wls Twlu lol? La variable Y toma dos valores, 1 y 2, que estan muy + ‘lejados de! resto. En la figura se represents la recta, de regresion de ¥ sobre X'y se aprecia su mal ajuste de la nube de puntos. La recta de Tukey se calcula del siguiente modo: 1. Se ordenan los datos en orden creciente de las abscisas. 2, Se divide ol conjunto ordenado de los datos en tres grupos: G, = ((1, 9) (2, 11) 8, 19) 6, 19)) G, = (6, 18) (7. 14) (@, 16) @, 1) G, = {(10, 16) (12, 14) (14, 19) (21, 2) 3. Para coda grupo G, se halla el punto P(x, y), donde x y y son, respectvamerte, las mmedianas de las abscisas y de las ordenadas del grupo G, es decir. Abscisas de G, (1.2.3.5) => % = 25 raise ahs ws Zw [hese Abscisas de G. (6.7.8.9) => %= 75) _ Ordenadas de G,(1. 14, 15, 16) y= 145) = (78 148) ‘Abscisas de G, (10, 12, 14,21) > = 19] Ordenadas de 6, (2, 14,16, 19) y, = 15 J > P(19. 15) 4, La recta de Tukey pasa por el baricentro del triangulo de vertices P,P, P, y tiene la pendiente de la recta que pasa por P, y P, Barcentro: x, = 28*75* 18 - 767 y= BAM = El baricentro tiene coordenadas G(7,67; 13,82) 15-12 La pendiente de la recta que pasa por P, y Pes: m La eouacion de la recta de Tukey es: y~ 13,83 = 0286(x- 7.67) = y= 0,286x + 11,64 Observa que e| nimero de datas en este caso es. n= 12, miltiplo de 3. y, por !o tanto, cada grupo esta formado por cuatro datos. Si el ndmero de datos n no es rmuitipo de 3, puede ocurrir que: ‘+ Sea miaitiplo de 3 mas 1; en este caso, el grupo G, se dela con un dato més. * Sea miltiplo de 3 mas 2; en este caso se deja el grupo G, con un dato menos. En el caso de que dos datos tengan la misma abscisa, se dejan en el mismo grupo. 3=25 1 Ejemplo, A partir do las datos de la tabla de! margen se quiere estimar cuanto tiempo ‘se necesita para descomponer un nimero de 20 cifras en sus factores primos. En algunas ocesiones se te- ie Un conjunto de datos que re ee puaden ajustar con una Fecta, pero entre os quo si ‘existe una dependoncia fun- Clonal. Esta dependencia ‘wansformarse en lineal ‘Se dibuja et iagrama de dispersion de la variable (X, Y) y se comprueba si existe una relacion curvilinea En la nue de puntos de fa figura de la izqulerda parece observarse que fenve las variables Xy Y os exponencial Se sustituye Y por InYy se dibula 0! diagrama de dispersion corresp fiabio (X. 2), donde Z = In (figura do la derecha). La nube de pugtos se ‘una recta y puede calcularse la recta de regresion de Z sobr ‘min, aproximadamente, sitvaciones que se puedan ajustar a elacion potencial Y = CX", donde C y m Iny= Inc + minx

Anda mungkin juga menyukai