Anda di halaman 1dari 7

MTODOS CUANTITATIVOS APLICADOS A LOS NEGOCIOS

INTERNACINALES. APUNTES Y EJERCICIO DE REGRESIN LINEAL POR


EL MTODO DE LOS MNIMOS CUADRADOS.
1. Si tenemos los siguientes datos obtenidos de una muestra previa de la
poblacin cancunense, en la cual se desea determinar la relacin lineal
del dimetro de la cabeza de 15 personas de ambos sexos, con rango
de edades entre 16 y 41 aos. Obtener una regresin con la siguiente
metodologa de los mnimos cuadradosi. Los resultados servirn para
obtener un estimado de la cantidad de personas a muestrear para
obtener datos que sirvan para la obtencin la distribucin de tallas de
sombrero en Cancn.

n observacin

EDAD (AOS)

ESTATURA (M)

DMETRO
CABEZA (CM)

20

155

51

16

172

55

22

165

53

23

153

51

22

168

54

20

154

55

20

158

54

22

164

56

41

168

56

10

22

173

58

11

22

160

55

12

20

170

57

13

24

183

59

14

20

167

55

15

20

180

55

Grfica 1. Dispersin de los datos.

2. Empricamente puedo hacer un ajuste de una recta, que muestre la


tendencia de los puntos graficados. Esta recta tendr la propiedad de pasar
por en medio de la dispersin de puntos. La ecuacin Es la siguiente
Yi bo bi X i

La idea fundamental del anlisis de regresin es obtener aquellos valores que


sean buenos estimadores de los parmetros b o y bi y que tambin minimicen
los errores de Yi para cada una de las observaciones.

Donde:
b1

SSxy
SSx

bo Y b1 X
n

Promedio de x

x
i 1

n
n

Promedio de y
Y i 1
n
3. Este modelo implica preguntarnos Existe
una relacin entre las dos
variables? Y Que tan fuerte es esta relacin?
Para contestar estas dos preguntas se recurri al Coeficiente de Correlacin (r)
y el Coeficiente de Determinacin (r 2) El valor de r siempre tendr valores
2

dentro del rango -1 y 1, donde el valor negativo implica una relacin lineal
negativa y viceversa. Es decir mientras ms cercano al uno absoluto se
encuentre el coeficiente de correlacin, el modelo que representa a la relacin
probabilstica tendr una mejor correspondencia con los datos generados en la
realidad1. Para determinar los valores crticos de r, se tendr un nivel de
significacin =0.10
En base a la tabla IX2 encontramos los valores crticos de r
r > valor absoluto 0.412
r

SS xy
SS xx SS yy

SS xy2

SS x SS y

Donde:
SS xy

xy n x y
1

1
x2
n

SS y y 2

1
y 2
n

SS x

Yi= El valor estimado de la variable dependiente en la iesima observacin.


bo y i son parmetros obtenidos por el mtodo de mnimos cuadrados.
Xi= Es el valor de la variable independiente en la iesima observacin.
=Es el error aleatorio.
n= nmero de datos.
x= observacin de la variable independiente.
y= observacin de la variable dependiente.
X = Promedio de las observaciones de x.

Y =Promedio de las observaciones de y.


SSx = Suma de cuadrados de x
SSy = Suma de cuadrados de y

Tabla 1. De las operaciones efectuadas

Op cit. (Rubio, 2003)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
totales

Estatura=
xi
medicin
real
155
172
165
153
168
154
158
164
168
173
160
170
183
167
180
2490

SSx

1134

SSy

68.9333333

SSxy

201

n de
observacin

Dimetro = yi
medicin real

xi2

yi2

xi*yi

DIMETRO
estimado

err

51
55
53
51
54
55
54
56
56
58
55
57
59
55
55
824

24025
29584
27225
23409
28224
23716
24964
26896
28224
29929
25600
28900
33489
27889
32400
414474

2601
3025
2809
2601
2916
3025
2916
3136
3136
3364
3025
3249
3481
3025
3025
45334

7905
9460
8745
7803
9072
8470
8532
9184
9408
10034
8800
9690
10797
9185
9900
136985

53.0
56.0
54.8
52.6
55.3
52.8
53.5
54.6
55.3
56.2
53.9
55.6
57.9
55.1
57.4

-2.
-1.
-1.
-1.
-1.
2.
0.
1.
0.
1.
1.
1.
1.
-0.
-2.

bo= Y-b1*X

25.51

b1= SSxy/SSx

0.177

25.51

0.18

promedio y 54.9333333

25.51

0.18

promedio x

25.51

0.18

166

En base a las frmulas de r y r 2, tenemos los coeficientes de correlacin y de


determinacin.
r

0.71891061

r2

0.51683246

Donde si r= 0 no existe relacin entre variables.


r > valor absoluto 0.412
0.72>0.412
Nos indica que existe relacin entre variables.

Grfica 2. Representacin grfica de los valores reales y los estimados. Se puede


observar el error en cada estimacin.

El intervalo de confianza es un rango en cualquiera de los lados de la media de


una muestra. Para obtenerlo se requiere tener los siguientes datos:
1. Alfa () es el nivel de significacin utilizado para calcular el nivel de
confianza. El nivel de confianza es igual a 100(1 - alfa)%, es decir, un
alfa de 0,05 indica un nivel de confianza de 95%.
2. Desviacin estndar (s) es la desviacin estndar de una muestra para
el rango de datos y se presupone que es conocida.
s

1 n
( xi X )2
n 1 i 1

3. Tamao de la muestra (n).


Si suponemos que el argumento alfa es igual a 0,05, se tendr que calcular
el rea debajo de la curva normal estndar que es igual a (1 - alfa) o 95%.
Este valor es 1,96. Por lo tanto, el intervalo de confianza en C es:

Y 1.96

EJERCICIO 1.

1. Siga la secuencia de resolucin del ejercicio y obtenga los valores presentados


en la tabla 1, grafico 1 y 2, programando y graficando en Excel, emulando lo
presentado en este escrito.
2. Obtenga la desviacin estndar y el tamao de la muestra.

Referencias bibliogrficas.

Rubio Arias, Hector. Estadstica Experimental. Instituto Nacional de Investigaciones Forestales, Agropecuarias y
Pecuarias (INIFAP) Mxico 2003.
2 Murray, Spiegel. Estadstica, 2da. Ed. Mc. Graw Hill. Mxico 1991

Anda mungkin juga menyukai