Anda di halaman 1dari 9

Ph.D. EDWIN M.

PINO VARGAS

ESCUELA DE INGENIERIA GEOLOGICA-GEOTECNIA, UNJBG TACNA

Regresin Mltiple
En este caso analizaremos un conjunto de datos, que relaciona la el caudal descargado con intensidad
de precipitacin y el rea de varias cuencas del Per, donde Q(m3/s), A(Km2) e I(mm/hr) .

Para efectuar el proceso de clculo de los coeficientes de regresin mltiple debemos tener en cuenta
que el modelo lineal mltiple, tiene la siguiente forma:
= 1 1 + 2 2 + 3 3 + +
Donde;
y

: es la variable dependiente

1 , 2 , . .

: son las variables independientes

La notacin matricial es:


1,1 1,2 1, 1
1
2 2,1 2,2 2,
3,1 3,3 3, 2
3 = () ()
3 =






,1 ,

( )1 = ( )1 ( )=, Donde puede ser estimado por: = ( )1 ( )

TELEFONOS: 952298638, 241595, #701907 E-MAIL: epino68@hotmail.com

: son los parmetros desconocidos.

Pgina

1 , 2 , . .

Ph.D. EDWIN M. PINO VARGAS

ESCUELA DE INGENIERIA GEOLOGICA-GEOTECNIA, UNJBG TACNA

2
1

( ) = 1 2

1 3

( ) = 2

2 1
2
2

2 3

3 1

3 2

2
3

Finalmente podemos concluir que el modelo resultante de regresin mltiple ser:


TELEFONOS: 952298638, 241595, #701907 E-MAIL: epino68@hotmail.com

Pgina

Por tanto tenemos:

Ph.D. EDWIN M. PINO VARGAS

ESCUELA DE INGENIERIA GEOLOGICA-GEOTECNIA, UNJBG TACNA

= 1 1 + 2 2 + 3 3 + +
= 4,136 + 12,901 0,522
Asimismo podemos establecer un cdigo computacional MATLAB de la siguiente forma:
load data1.txt
X1 = [ones(size(data1,1),1) data1(:,1:2)];
y = data1(:,3);
betahat = regress(y,X1)

El archive data1.txt, contiene la siguiente informacin:

Al correr el programa especificado obtendremos:


betahat =

-0.5247

TELEFONOS: 952298638, 241595, #701907 E-MAIL: epino68@hotmail.com

Pgina

12.9022

4.1344

Ph.D. EDWIN M. PINO VARGAS

ESCUELA DE INGENIERIA GEOLOGICA-GEOTECNIA, UNJBG TACNA

TELEFONOS: 952298638, 241595, #701907 E-MAIL: epino68@hotmail.com

Pgina

Si notamos la opcin utilizada corresponde a un modelo polinomio pero de grado 1, lo que hace que
estemos frente a una regresin mltiple lineal. Notemos que los resultados reportados son similares a
los obtenidos anteriormente, con lo que la ecuacin quedara de la siguiente manera:

Si usamos la caja de herramientas de MATLAB podemos tambin determinar este modelo lineal
mltiple u otros modelos no lineales. Activamos la opcin Surface Fitting Tool.

Ph.D. EDWIN M. PINO VARGAS

ESCUELA DE INGENIERIA GEOLOGICA-GEOTECNIA, UNJBG TACNA

= 4,134 + 12,9 0,5247 , con un r2=0,9795

Regresin No Lineal

Tambin podemos ensayar modelos de regresin no lineal, por ejemplo polinmicos de grados
mayores a la unidad, MATLAB nos da la opcin de efectuar regresiones en x e y para respuestas en z, en
grados de 2 a 5, con lo que podemos obtener las combinaciones que sean factibles segn los datos
existentes, a continuacin se muestra la primera opcin ensayada grado 2 en x (A) y grado 1 en (I).

Los resultados de las 16 combinaciones son el modelo Poly11 (representa grado 1 en (A) y grado 1 en
(I):

Linear model Poly11:


f(x,y) = p00 + p10*x + p01*y
Coefficients (with 95% confidence bounds):
p00 =

4.134 (-2.314, 10.58)

p10 =

12.9 (11.6, 14.2)

p01 =

-0.5247 (-2.222, 1.173)

R-square: 0.9795

TELEFONOS: 952298638, 241595, #701907 E-MAIL: epino68@hotmail.com

Pgina

SSE: 273

Goodness of fit:

Ph.D. EDWIN M. PINO VARGAS

ESCUELA DE INGENIERIA GEOLOGICA-GEOTECNIA, UNJBG TACNA

Adjusted R-square: 0.9758


RMSE: 4.982

Poly12 (representa grado 1 en (A) y grado 2 en (I):

Linear model Poly12:


f(x,y) = p00 + p10*x + p01*y + p11*x*y + p02*y^2
Coefficients (with 95% confidence bounds):
p00 =

10.45 (-25.33, 46.23)

p10 =

13.44 (-11.42, 38.3)

p01 =

-3.721 (-22.1, 14.66)

p11 =

-0.3848 (-13.31, 12.54)

p02 =

0.2837 (-1.25, 1.817)

Goodness of fit:
SSE: 266.3
R-square: 0.98
Adjusted R-square: 0.9712
RMSE: 5.439

Poly12 (representa grado 1 en (A) y grado 3 en (I):

Linear model Poly13:


f(x,y) = p00 + p10*x + p01*y + p11*x*y + p02*y^2 + p12*x*y^2 + p03*y^3
Coefficients (with 95% confidence bounds):
p00 =

-135.2 (-578.5, 308.1)

p10 =

62.23 (-326.5, 450.9)

p01 =

137.1 (-287.6, 561.9)

p11 =

-42.26 (-389.6, 305.1)

p02 =

-39.01 (-155.8, 77.78)

p12 =

8.581 (-66.87, 84.04)

p03 =

2.718 (-4.991, 10.43)

Goodness of fit:

Adjusted R-square: 0.9677


RMSE: 5.757
TELEFONOS: 952298638, 241595, #701907 E-MAIL: epino68@hotmail.com

Pgina

R-square: 0.9826

SSE: 232

Ph.D. EDWIN M. PINO VARGAS

ESCUELA DE INGENIERIA GEOLOGICA-GEOTECNIA, UNJBG TACNA

1. Estudio de un caso de 10 variables


1.1. Planteamiento del Caso
Los datos para la ilustracin de este ejemplo fueron tomados de la mina de uranio Schwartzwalder en
el Estado de Colorado.
Se trata de treinta muestras que fueron tomadas en dos niveles de la mina. Un nivel llamado
Minnesota, el otro llamado Upper level, cada muestra fue analizada por 10 elementos:
radiactividad, uranio, cobre, bixido de manganeso, oxido de vanadio, nquel, cobalto, molibdeno, zinc
y plomo.

Pgina

En el cuadro adjunto se muestran los datos originales de los resultados de anlisis de las muestras.

TELEFONOS: 952298638, 241595, #701907 E-MAIL: epino68@hotmail.com

Ph.D. EDWIN M. PINO VARGAS

ESCUELA DE INGENIERIA GEOLOGICA-GEOTECNIA, UNJBG TACNA

TABLA DE DATOS ORIGINALES


MUESTRA
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

Radioactividad
0.4600
0.4400
6.1800
0.0150
4.4000
0.2300
0.4100
0.5800
0.0520
0.0760
0.7000
1.8000
0.0340
0.6300
0.0120
1.3000
3.7000
0.4100
3.3000
0.2600
0.4600
1.5000
0.1100
2.3000
3.0000
0.7500
0.2300
3.0000
1.3000
5.7000

U
0.6300
0.5800
0.2600
0.0170
5.5700
0.3300
0.5800
0.6600
0.0670
0.0840
0.7900
1.9500
0.0330
0.7200
0.0090
1.5900
4.5900
0.5000
3.6100
0.2800
0.5800
1.1500
0.1100
2.7900
3.7000
1.1000
0.2900
2.4900
1.3700
6.3600

CU
0.0300
0.1500
0.1400
0.1000
0.1500
0.0200
0.0900
0.0800
0.0300
0.0300
0.8700
0.1400
0.1100
0.1900
0.0300
0.2300
0.0900
0.0900
1.0700
0.2200
0.9500
0.6200
0.4600
1.1600
0.8900
0.3200
0.1000
0.1600
0.4300
0.8500

MNO2
0.1300
0.2300
0.1600
1.9100
0.5300
1.4200
0.5200
0.5900
4.7700
0.7500
0.0800
0.0600
0.0300
0.0700
0.1100
0.0800
0.4500
2.0100
0.1800
0.0900
0.1100
0.0400
0.0200
0.0200
0.4800
0.1600
0.0900
0.4600
0.3100
0.0800

V2O5
0.0240
0.0490
0.0500
0.0130
0.0770
0.0580
0.0750
0.0300
0.0280
0.0460
0.0350
0.0320
0.0170
0.0180
0.0200
0.0410
0.0630
0.0330
0.0720
0.0320
0.0460
0.0420
0.0300
0.0340
0.0750
0.0480
0.0320
0.0570
0.0560
0.0710

Ni
0.0070
0.0100
0.0080
0.0070
0.0060
0.0020
0.0110
0.0080
0.0090
0.0080
0.0220
0.0110
0.0070
0.0160
0.0090
0.0390
0.0220
0.0090
0.0350
0.0090
0.0180
0.0180
0.0140
0.0160
0.0530
0.0170
0.0090
0.0160
0.0190
0.0410

CO
0.0030
0.0050
0.0030
0.0030
0.0180
0.0050
0.0050
0.0050
0.0030
0.0030
0.0170
0.0080
0.0030
0.0120
0.0030
0.0210
0.0070
0.0030
0.0400
0.0030
0.0180
0.0160
0.0060
0.0160
0.0500
0.0120
0.0030
0.0130
0.0050
0.0180

MO
0.0400
0.2200
0.0380
0.0180
0.6000
0.0600
0.1800
0.0720
0.0620
0.0600
0.5600
0.4300
0.0400
0.1400
0.0050
0.3100
0.4200
0.0580
0.2200
0.0540
0.2100
0.1500
0.0700
0.2200
0.8400
0.1700
0.0920
0.1400
0.1700
0.9500

ZN
0.0130
0.0140
0.0120
0.0200
0.0860
0.0270
0.0300
0.0230
0.0190
0.0220
0.1900
0.0560
0.0620
0.1600
0.1100
0.0680
0.0200
0.0460
0.1100
0.0440
0.0920
0.0820
0.0760
0.0890
0.1000
0.0450
0.0410
0.1600
0.1600
0.0840

PB
0.0180
0.5000
0.2100
0.0900
0.6900
0.2700
0.2400
0.1000
0.1100
0.1400
1.0700
0.3500
0.1300
0.5200
0.0800
0.6100
0.4100
0.1600
0.5300
0.0800
0.3200
0.4500
0.1200
0.6100
0.6100
0.1200
0.0700
0.2800
0.8400
1.6300

1.2. Anlisis y Solucin del Caso

Pgina

En primer lugar podemos establecer la matriz de correlacin, usando la hoja de clculo Excel tenemos:

TELEFONOS: 952298638, 241595, #701907 E-MAIL: epino68@hotmail.com

Ph.D. EDWIN M. PINO VARGAS

ESCUELA DE INGENIERIA GEOLOGICA-GEOTECNIA, UNJBG TACNA

MATRIZ DE CORRELACION (datos originales)

Rad.

Rad.

CU

MNO2

V2O5

Ni

CO

MO

ZN

PB

1.0000

0.9889

0.4409

-0.2099

0.6707

0.5986

0.5841

0.7888

0.2966

0.6973

0.9889

1.0000

0.4261

-0.2012

0.6812

0.5900

0.5841

0.8133

0.2399

0.6883

CU

0.4409

0.4261

1.0000

-0.3166

0.3067

0.6531

0.7249

0.5003

0.5133

0.5924

MNO2

-0.2099

-0.2012

-0.3166

1.0000

-0.1375

-0.2385

-0.2201

-0.2118

-0.3251

-0.2496

V2O5

0.6707

0.6812

0.3067

-0.1375

1.0000

0.4726

0.5326

0.5881

0.0887

0.4771

Ni

0.5986

0.5900

0.6531

-0.2385

0.4726

1.0000

0.8412

0.7161

0.3989

0.6303

CO

0.5841

0.5841

0.7249

-0.2201

0.5326

0.8412

1.0000

0.6444

0.4391

0.4779

MO

0.7888

0.8133

0.5003

-0.2118

0.5881

0.7161

0.6444

1.0000

0.3156

0.8107

ZN

0.2966

0.2399

0.5133

-0.3251

0.0887

0.3989

0.4391

0.3156

1.0000

0.5283

PB

0.6973

0.6883

0.5924

-0.2496

0.4771

0.6303

0.4779

0.8107

0.5283

1.0000

Pgina

El segundo paso ser normalizar los datos originales y obtener una nueva matriz de correlacin.

TELEFONOS: 952298638, 241595, #701907 E-MAIL: epino68@hotmail.com