Anda di halaman 1dari 12

36

U.T.N. - F.R.R.-Ao 2005


ESTADISTICA DESCRIPTIVA
RELACIONES ENTRE VARIABLES
Unidad 5 - TEORIA DEL AJUSTAMIENTO
Profesor Titular: E Mario J. Garber
1 - DEPENDENCIA FUNCIONAL Y DEPENDENCIA ESTADISTICA:
Cuando dos variables cualesquiera Xi e Yi estn relacionadas por una expresin
matemtica de cualquier tipo (por ejemplo, Yi a bX i o Yi aebx ) se dice que entre ellas
existe una dependencia funcional. Este tipo de dependencia es tal que a determinados valores
de la variable Xi le corresponden determinados y definidos valores de la variable Yi.
En cambio se dice que entre dos variables Xi e Yi existe una dependencia estadstica
cuando se presupone que entre ambas hay algn tipo de relacin y a determinados valores de la
variable Xi le corresponden indeterminados e indefinidos valores de la variable Yi. Ejemplos de
dependencia estadstica son los siguientes:
la variable Xi es el ingreso y la variable Yi es el ahorro, en cuyo caso, si bien
se sabe por el imperio de las leyes econmicas hay una relacin directa entre
el ingreso y el ahorro, dos personas con iguales ingresos no ahorrarn lo
mismo.
la variable Xi es el precio de un bien y la variable Yi es la demanda: entre
ambas variables slo existe una dependencia estadstica.
Por consiguiente, la dependencia estadstica entre dos variables presupone la existencia
de una relacin entre ellas. Inicialmente, esa relacin se descubre fundamentalmente por
medio de mecanismos empricos, en especial, la observacin de los fenmenos que ligan a
ambas variables.
Cuando entre dos variables no existe dependencia estadstica se dice que ellas son
estadsticamente independientes. Por ejemplo, no parece que exista dependencia estadstica
alguna entre el precio del algodn en bruto y la produccin de uva para el consumo, por lo que
estas dos variables seran estadsticamente independientes.
2 - CONCEPTO DE AJUSTAMIENTO - APLICACIONES:
Supongamos la existencia de dos variables Xi e Yi, y se sabe o simplemente se supone
que entre ellas existe algn tipo de relacin que insine una dependencia estadstica . Por
ejemplo, se puede pensar en los siguientes casos: el empleo y la produccin; el precio de un
bien y su oferta; el nivel de las tasas de inters y el de los depsitos.
Para cada una de las variables bajo anlisis se obtiene n valores empricos, es decir, n
datos provenientes de la realidad, que se ordenan en una tabla que tiene el siguiente formato:
Xi
Yi
X1
Y1
X2
Y2

Xn
Yn
La tabla anterior contiene, entonces, n pares de datos empricos de la forma (Xi;Yi).
Con ese conjunto de valores se construye un grfico (ver grfico N 1) denominado diagrama de
dispersin, que muestra la disposicin de n puntos en el plano.
-------------------------Probabilidades y Estadstica Ao 2005

37

GRAFICO N 1: DIAGRAMA DE DISPERSION

La Teora del Ajustamiento trata sobre los procedimientos destinados a ajustar


linealmente los puntos del diagrama de dispersin, lo cual significa encontrar la ecuacin de
la funcin de primer grado (lnea recta) que mejor explique la dependencia estadstica
existente, es decir, que mejor explique el comportamiento de los n puntos del diagrama.
Este procedimiento difiere del mtodo de la interpolacin que consiste en hallar la
funcin de grado (n-1) que pase exactamente por todos esos puntos, lo que resulta una tarea
tanto laboriosa como excesiva por varias razones, a saber:
como puede apreciarse, los puntos sealados en el diagrama de dispersin son
el reflejo de los datos empricos registrados, y normalmente ese conjunto de
datos proviene de una muestra. Ahora bien, muestras diferentes con toda
seguridad pueden dar lugar a resultados diferentes, lo cual conlleva a que, en
ese caso, los puntos de un diagrama de dispersin no coincidirn con los de
otro diagrama y, por eso mismo, resultar necesario recalcular todo el proceso
de interpolacin, repitiendo una tarea sumamente laboriosa.
asimismo, el trabajo que se propicia con el ajustamiento, tal como se indica
ms arriba, es explicar el comportamiento de los puntos del diagrama, lo
que significa encontrar una funcin que muestre la tendencia general que sigue
el fenmeno bajo estudio. Con la interpolacin, en cambio, tal como se seal,
se estara encontrando una funcin que pase por todos los puntos, un
objetivo completamente alejado de las intenciones de la Teora del
Ajustamiento.
Por otro lado, adems de describir linealmente la relacin existente entre dos variables,
otro de los objetivos del ajustamiento es la estimacin o el pronstico, es decir que una vez
hallada la expresin de la funcin matemtica de primer grado, ella puede ser utilizada para
estimar valores de la variable dependiente Yi para valores seleccionados de la variable
independiente Xi.
3 - DIAGRAMA DE DISPERSION - SU IMPORTANCIA:
La construccin del diagrama de dispersin es imprescindible y debe ser la primera
accin que realice el investigador cuando tiene los datos empricos en su poder. Una vez
construido, es sumamente conveniente observar la disposicin de los puntos contenidos en
l, lo que permite decidir si un ajuste lineal es procedente o si corresponde un ajuste de otro tipo,
aunque debe aclararse que cualquiera sea la disposicin de los puntos todo diagrama de
-------------------------Probabilidades y Estadstica Ao 2005

38

dispersin admite un ajustamiento de tipo lineal. Si bien una disposicin de puntos no lineal no
estara bien representada por una funcin de primer grado, esa funcin, se reitera, puede
calcularse perfectamente sin inconvenientes. En todo caso, la decisin de que un ajuste sea lineal
o no depende del investigador del problema, por lo que se insiste en que lo imprescindible es
construir, en primer lugar, el diagrama de dispersin.
Algunos casos de disposicin no lineal se muestran en los grficos siguientes:

Observando ambos diagramas queda perfectamente claro que los puntos no siguen una
disposicin lineal y que, por eso mismo, un ajuste de ese tipo no sera apropiado. Con
posterioridad se ver que existen algunas soluciones para aquellos casos de ajustamiento en los
cuales los diagramas de dispersin presentan una disposicin no lineal.
4 - METODOS DE AJUSTAMIENTO LINEAL:
Los mtodos de ajustamiento lineal se pueden clasificar en mtodos subjetivos y
mtodos objetivos. Los mtodos subjetivos pueden concluir en diferentes soluciones para un
mismo problema segn quien sea el investigador, mientras que los objetivos permiten encontrar
la misma solucin, independientemente del investigador que la desarrolle.
a) Mtodo subjetivo: Ajustamiento a mano alzada: este mtodo consiste en analizar la
disposicin de los puntos del diagrama de dispersin para, posteriormente, trazar aquella recta
que, a juicio del dibujante, cumpla con los requisitos del ajustamiento lineal. Si bien el mtodo es
sumamente simple, su carcter de subjetivo le quita rigurosidad por las posibles diferencias entre
las rectas trazadas por diferentes investigadores. Adems, una dificultad adicional del mtodo
subjetivo es que no permite obtener la expresin matemtica de la funcin lineal que se dibuja.
b) Mtodo objetivo: Mtodo de los mnimos cuadrados: este procedimiento es creacin
del matemtico alemn Gauss quien sugiri un criterio objetivo para determinar cul es la mejor
recta de ajustamiento. Segn l, es aquella que minimiza la sumatoria de los cuadrados de los
desvos existentes entre los puntos empricos del diagrama de dispersin y la propia recta
de ajustamiento. Es decir que este procedimiento consiste en encontrar una funcin lineal del
tipo Yi a1 b1 X i que cumpla las condiciones sugeridas por Gauss.

-------------------------Probabilidades y Estadstica Ao 2005

39

Segn el criterio de Gauss, un desvo di es la diferencia entre un punto emprico de


ordenada Yi y un punto terico de ordenada Yi , es decir que di Yi Yi . Grficamente, si
ampliamos un sector del diagrama de dispersin y tomamos en l a un punto emprico particular
de coordenadas (Xj;Yj) observaremos que el desvo d j Yj Yj (Ver grfico N 2):
GRAFICO N 2: DESVIO EN EL PUNTO YJ

Si bien el grfico precedente es parcial porque presenta la situacin referida a un solo


punto siendo que en un diagrama de dispersin hay n puntos, sirve para explicar de una manera
sencilla cmo se debe entender el desvo, y permite verificar con claridad que cualquier desvo di
puede ser positivo (si el punto emprico est por encima de la recta, como en este caso),
negativo (si el punto emprico est por debajo de la recta) o nulo ( si el punto emprico coincide
con la recta).
Considerando ahora todos los posibles desvos en el diagrama de dispersin, si los
elevamos al cuadrado y los sumamos, obtendremos la siguiente expresin, a la que llamaremos

di2 Yi Yi Yi a1 b1 X i

Como ya se indic, Gauss postula que la mejor recta es aqulla que minimiza esos
desvos al cuadrado. Si bien en el plano existen infinitas rectas, cada una con un par de
parmetros a1 y b1, de todas ellas slo una cumple con la condicin impuesta por Gauss. Se
trata de encontrarla, y eso equivale a encontrar sus parmetros a1 y b1. De acuerdo con los
procedimientos del Anlisis Matemtico, eso se consigue minimizando la funcin , es decir
haciendo
2

Yi a1 b1 X i min.
2

Para eso, en primer lugar, debe calcularse la primera derivada de con respecto al
parmetro a1, e igualrsela a cero.
Yi a1 b1 X i

2 Yi a1 b1 X i 1 2 Yi a1 b1 X i 0
a1
a1
Como el factor (-2) es distinto de cero, entonces debe ser Yi a1 b1 X i 0 .
2

Aplicando sumatoria a todo el parntesis, quedar


trminos se obtiene

Yi na1 b1 X i 0 , y por

Yi na1 b1 X i

expresin sta denominada Primera ecuacin normal de Gauss.

-------------------------Probabilidades y Estadstica Ao 2005

pasaje de

40

Con idntico criterio se deriva respecto del parmetro b1:


Yi a1 b1 X i

2 Yi a1 b1 X i X i 2 Yi X i a1 X i b1 X i2 0
b1
b1
2

Como (-2) es distinto de cero, debe ser

Yi X i a1 X i b1 X i2

0 .A partir de esta

2
igualdad, se verifica que Yi X i a1 X i b1 X i 0 , por lo que finalmente, mediante un
pasaje de trminos, se obtiene la siguiente expresin

Yi X i a1 X i b1 X i2

que se denomina Segunda ecuacin normal de Gauss.


Ambas ecuaciones normales conforman un sistema de dos ecuaciones lineales con dos
incgnitas (a1 y b1), cuya resolucin puede efectuarse por medio de alguno de los cuatro mtodos
existentes para este tipo de sistemas. Aplicando el Mtodo de los Determinantes, las incgnitas
se calculan del siguiente modo
Yi X i
Yi X i X i2 Yi X i2 X i Yi X i
a1
2
n
n X i2 X i
Xi
X i X i2

b1

n
Xi
n
Xi

Yi
Yi X i
Xi
X i2

n Yi X i X i Yi
n X i2

X i

Se puede ver fcilmente que ambos parmetros son calculados a partir de expresiones
basadas exclusivamente en los datos empricos.
Lo que quedara por analizar es si el punto crtico obtenido corresponde a un mximo o a
un mnimo, para lo cual se debera obtener la segunda derivada y verificar su signo. Sin
embargo, en este caso eso no es necesario porque aqu ocurre algo similar a lo visto en la tercera
propiedad de la media aritmtica. En su recorrido a travs del diagrama de dispersin, la
recta de ajustamiento se comporta como una medida de posicin aunque de carcter
dinmico (no de carcter esttico, como sera el caso de una media aritmtica) ya que cumple
con esa propiedad (equivalente a la segunda propiedad de la media aritmtica) de que
Yi Yi 0 , cuya verificacin es sencilla: aplicando sumatoria tenemos
Gauss.

Yi a1 b1 X i Yi na1 b1 X i 0

por la primera ecuacin normal de

Si la recta de ajustamiento se comporta como una medida de posicin y cumple con todas
sus propiedades, el criterio de los mnimos cuadrados de Gauss nos remite a la tercera propiedad
de la media aritmtica, en la cual el nico punto crtico obtenido en el proceso del anlisis
debe ser mnimo, ya que el mximo no tiene lmite. Efectivamente: si una recta particular
minimiza la suma de los desvos al cuadrado, alejarla de los puntos empricos (tanto en un
sentido como en el otro) produce un aumento en el valor de los desvos y, por consiguiente, de su
suma al cuadrado, por lo que el mximo no tiene lmite y la nica cota obtenida mediante
este procedimiento resulta un mnimo.
-------------------------Probabilidades y Estadstica Ao 2005

41

La interpretacin estadstica de ambos parmetros es la siguiente:


el parmetro a indica cual es la cantidad promedio de la variable Yi
para un valor igual a cero de la variable Xi, y
el parmetro b indica cul es la variacin promedio de la variable Yi que
corresponde a una unidad de variacin para la variable Xi.
El trabajo de clculo de los parmetros se organiza construyendo la tabla siguiente:
Xi
Yi
Xi 2
Xi Yi
X1
Y1
X12
X i Yi
2
X2
Y2
X2
X2 Y2

Xn
Yn
Xn2
Xn Yn

Xi

Yi

X i2

X i Yi

con la cual se obtienen todos los trminos involucrados en el clculo de los parmetros.
Ejemplo: Sean dos variables Xi e Yi para las cuales se dispone de los siguientes datos
empricos:
Xi
1
2
3
4
5
15

Yi
3
5
1
2
4
15

Xi2
1
4
9
16
25
55

Xi Yi
3
10
3
8
20
44

El diagrama de dispersin que se construye


ms abajo, permite verificar que la disposicin
de los puntos no resulta ser muy lineal. Sin embargo podr ver que no existe ningn impedimento terico para calcular una funcin de ajustamiento lineal. En el grfico N 3 tambin se ha
trazado la lnea de ajustamiento hallada.

GRAFICO N 3: DIAGRAMA Y LINEA DE AJUSTE

Los clculos para obtener los parmetros se efectan aplicando las frmulas, lo cual da
a1

15 55 44 15 825 660 165 3,3


2
275 225 50
5 55 15

-------------------------Probabilidades y Estadstica Ao 2005

42

b1

5 44 15 15
5 55 15

220 225 5

0,10
50
50

Por consiguiente, la ecuacin de la recta hallada es Yi 3,3 0,10 X i .


Mtodo abreviado: Este mtodo parte del supuesto siguiente: si en las ecuaciones
normales de Gauss se consiguiera que X i 0 , las frmulas para calcular los parmetros
podran reducirse significativamente. Para que se anule la sumatoria de la variable Xi, se la
transforma convenientemente, haciendo xi X i X , con lo cual la xi X i X 0 por la
segunda propiedad de la media aritmtica. De esa manera, si se efectuara el desarrollo terico
para encontrar las frmulas de los parmetros con las variables xi e Yi en lugar de con las
variables Xi e Yi, las ecuaciones normales que se obtendran tendran la siguiente forma:
Y na1 b1 xi na1 .
Yi X i a1 xi b1 xi2 b1 xi2 , debido precisamente a que xi 0 .
Se observar que en las expresiones precedentes aparece la variable xi en lugar de Xi, y
que los parmetros se indican con una simbologa modificada, a1 y b1 . Esto se realiza por
precaucin, ya que la transformacin de la variable Xi en xi podra eventualmente conducir a una
modificacin en el valor original de los parmetros y de esa manera se prev esa alternativa.
De ambas ecuaciones normales as construidas y mediante un simple pasaje de trminos,
se obtienen las expresiones para calcular los nuevos parmetros mediante el mtodo abreviado:
Yi
a1 Y
n

b1

xiYi

xi2

La simple comparacin entre stas y las frmulas obtenidas originalmente, permite


comprobar que el mtodo abreviado, efectivamente, reduce notoriamente su tamao y
complejidad.
Utilizando los nuevos parmetros la recta de ajustamiento puede ser escrita del siguiente
modo: Yi a1 b1xi . Sin embargo, si bien el mtodo abreviado intenta calcular los parmetros
mediante frmulas ms breves, al concluir el clculo no se obtienen a1 y b1 , los verdaderos
parmetros. Para llegar a esos valores se parte de considerar que existen dos expresiones
posibles para la recta de ajustamiento, es decir, por un lado, Yi a1 b1 X i y por el otro,
Yi a1 b1xi . Como adems, se sabe que xi X i X , en la segunda de esas expresiones se
reemplaza xi, quedando
Yi a1 b1 X i X a1 b1 X i b1 X a1 b1 X b1 X i . Pero recordando que

Yi a1 b1 X i , se comparan ambas expresiones, y claramente se concluye


que
b1 b1 y que
a1 a1 b1 X Y b1 X

con lo cual se obtienen los verdaderos parmetros

a1 y b1 a partir de los calculados a1 y b1 .

Interpretacin grfica del mtodo abreviado:

-------------------------Probabilidades y Estadstica Ao 2005

43

La base del mtodo abreviado consiste en transformar la variable Xi en una variable


centrada xi. Ahora bien, desde el punto de vista grfico, como construir una variable centrada
significa restar X a todos los valores de la variable Xi, esa construccin implica correr todos los
puntos empricos X unidades hacia la izquierda o, lo que es lo mismo, correr el eje de las
ordenadas X hacia la derecha.
Obsrvese el grfico siguiente para interpretar lo sealado precedentemente. As, podr
verse que en l se han representado los n puntos empricos y la recta de ajustamiento, y que se
han indicado dos ejes de abscisas que deben utilizarse alternativamente segn se trabaje con la
variable Xi o con la xi, con lo que claramente se descubre la correspondencia entre los valores de
ambas variables, de modo que el valor X en el eje Xi corresponde al valor cero en el eje xi.
Tambin puede observarse que el eje Yi se presenta tanto en su posicin original como en una
nueva posicin, corrido hacia la derecha, y que en este caso su trazado coincide con X . Como
correr los ejes hacia uno u otro lado no modifica la pendiente de la recta, fcilmente se
comprende que b1 es igual a b1 (ambos valores son la tangente del ngulo mientras que lo
que s se modifica con el corrimiento del eje Yi es la ordenada al origen de la recta de
ajustamiento, por lo que a1 es diferente a a1 (se indican las dos).
GRAFICO N 4: METODO ABREVIADO

En otro orden de cosas, si ampliamos un sector del grfico y lo presentamos en forma


independiente, podemos sacar una conclusin trigonomtrica de la frmula que permite calcular
a1.
GRAFICO N 5: ANALISIS DE a1

-------------------------Probabilidades y Estadstica Ao 2005

44

sen.

Recordemos que tg. b1


cos.

a1 a1
X

a1 a1 b1 X Y b1 X

5 - CASO INVERSO (CON YI COMO VARIABLE INDEPENDIENTE):


El caso inverso consiste en imaginar una alternativa que resulta slo posible desde el
punto de vista terico: que en un problema de ajustamiento la variable independiente sea Yi
en lugar de Xi. Se reitera que esta posibilidad slo puede presentarse tericamente porque en la
vida real la solucin de cualquier problema de ajustamiento se encara definiendo siempre
anticipadamente cul es la variable independiente y a ella normalmente se la simboliza con
Xi. Sin embargo, una vez definida esta circunstancia, puede pensarse que el conjunto particular
de datos con el que se est trabajando puede originar otro problema de ajustamiento, que
llamaremos caso inverso, en el que la variable independiente sea la simbolizada
tradicionalmente con Yi. Grficamente esto da lugar a la aparicin de una segunda recta de
ajustamiento simbolizada como X a2 b2Yi la cual, en realidad, no es una segunda recta
tericamente hablando, sino la misma recta Yi observada desde un ngulo completamente
diferente. Por esa circunstancia puede resultar apropiado denominar recta reflejo a la recta de
ajustamiento X a2 b2Yi .
En general, ocurre que a1 a2 , que b1 b2 y que el trazado de Yi no coincide con el de
X i .
Pensando en la recta de ajustamiento inversa X i , sus ecuaciones normales son
X i na2 b2 Yi

Yi X i a2 Yi b2 Yi2

en las cuales se observa una similitud con las ecuaciones normales para la ecuacin Yi , pero
con la variable Yi en lugar de Xi, y viceversa.
Finalmente, las frmulas de los parmetros a2 y b2 del caso inverso, calculadas
mediante el mtodo abreviado, son
Xi
a2 X
n

b2

yi X i

yi2

GRAFICO N 6: RECTAS DE AJUSTE X e Y ESTIMADAS

-------------------------Probabilidades y Estadstica Ao 2005

45

6 - PUNTO DE CRUCE DE LAS RECTAS DE AJUSTAMIENTO:


El grfico precedente, en el que se observan las rectas de ajustamiento Yi y X i , permite
la formulacin de la pregunta de en qu punto se cruzan ellas. Para contestarla, se parte de la
primera ecuacin normal de Gauss aplicada en ambos casos, es decir
Yi na1 b1 X i y X i na2 b2 Yi y se dividen ambas por n,
resultando

Yi na1 b1 X i
n

X i na2 b2 Yi , expresiones stas que pueden


n

X a2 b2 Y
tambin escribirse como Y a1 b1 X y
con lo cual se demuestra que el punto de coordenadas X ; Y satisface las dos ecuaciones
correspondientes a las rectas de ajustamiento, por lo que ambas rectas pasan por ese punto y
por consiguiente, se cruzan en l (ver grfico N 6 precedente).

CUADRO SINOPTICO SOBRE AJUSTAMIENTO


Colaboracin de la Profesora Mara de los Arcos Martnez
-------------------------Probabilidades y Estadstica Ao 2005

46

A ju s t a m ie n t o L in e a l
D a t o s E m p r ic o s
D ia g r a m a d e
D is p e r s i n
A ju s t a m ie n t o
L in e a l

A ju s t a m ie n t o
N o L in e a l

M to d o s

M to d o

S u b je t iv o s

O b je t iv o s

M a n o A lz a d a

S e m ip r o m e d io s

O b je t iv o
M n im o s
C u a d ra d o s

P a r a b lic o

M n im o s
C u a d ra d o s
E x p o n e n c ia l

P o t e n c ia l

L o g a r t m ic o

PREGUNTAS TEORICAS SOBRE TEORIA DEL AJUSTAMIENTO


1) Cul de las siguientes es la condicin bsica que debe cumplirse en el criterio de los
mnimos cuadrados propuesto por Gauss?

a) Yi Y 0
b) Yi Yi

minimo

c) Yi Y minimo
2) En un problema de ajustamiento lineal se obtienen los siguientes datos:
a1 3

X 5

Y 6

Cmo es la pendiente de la recta de ajustamiento?


a) positiva
b) negativa
c) nula

BIBLIOGRAFIA CONSULTADA:
Berenson Levine
Estadstica bsica en Administracin
Editorial Prentice Hall - 6 Edicin
Kazmier L. Daz Matta A.
Estadstica Aplicada a Administracin y Economa
Editorial McGraw Hill - 2 Edicin
Levin Rubin
Estadstica para Administradores
Editorial Prentice Hall - 6 Edicin
-------------------------Probabilidades y Estadstica Ao 2005

47

Montiel - Ros - Barn


Elementos Bsicos de Estadstica Econmica y Empresarial
Editorial Prentice Hall - Ao 1996
Mendenhall Reinmuth
Estadstica para Administracin y Economa
Grupo Editorial Iberoamrica Ao 1993
Johnston
Mtodos de Econometra
Editorial Vinces-Vives - 3 Edicin - Ao 1975
Gujarati
Econometra
Editorial McGraw Hill - 2 Edicin - Ao 1993
Spiegel M.
Teora y Problemas de Estadstica -

Editorial Shaum

-------------------------Probabilidades y Estadstica Ao 2005

Anda mungkin juga menyukai