Anda di halaman 1dari 18

Primera fase: Reduccin de los costes de compra de vehculos usados

En esta fase se pide estudiar, en funcin de las distintas delegaciones de PRESTON, los datos
para poder saber los criterios de seleccin de las mismas y para los proveedores de compra.
As pues, los datos que se nos facilitan nos permiten realizar los procedimientos siguientes:

1.1. Barcelona:
1: Lobocar.
2: Coches Leiny
Hacemos un dot plot de los datos y un box plot.

Grfica de caja de Lobocar; CotxesLeiny


3800

Lobocar

CotxesLeiny

3600

3400

3200

3000

2800

2600

A simple vista parece que Lobocar tiende a ser algo ms caro, y vemos que tampoco se detecta
ningn punto que llame la atencin excesivamente.
Hacemos hiptesis de igualdad de varianzas H0: 1=2 H1: 12

P valor es superior al 0,05 por lo que no puedo rechazar Ho y asumo igualdad de varianzas.
Ahora la prueba de hiptesis es que H0: 1=2 H1: 12. Asumiendo igualdad de varianzas.

Con este p-valor rechazamos H0, por lo que s que hay diferencias significativas entre
proveedores. Ahora debemos realizar la prueba unilateral para ver que proveedor es ms
barato.
El siguiente paso consiste en realizar la prueba de que H0: 1=2 H1: 1<2.

Con este p-valor no rechazamos H0 por lo que no podemos decir que el proveedor 1 sea ms
barato que el proveedor 2.
Habiendo realizado ya la hiptesis de igualdad vs desigualdad. Y viendo que existe desigualdad,
y que el primero no es ms barato que el segundo podemos concluir que el segundo
proveedor es ms barato. Para verificar este supuesto realizaremos el test de hiptesis de H0:
1=2 H1: 1>2.

Este p-valor s que nos permite rechazar H0 y concluir que el proveedor 1 es ms caro que el 2.
Por lo que prescindiremos para la regin de Barcelona del proveedor Lobocar. Podemos hacer
esta afirmacin con una seguridad del 99,5%.

1.2. Gerona
1: Vehicles Oller.
2: Run Fun.
Hacemos un dot plot de los datos

Grfica de caja de VehiclesOller; RunFun


VehiclesOller

RunFun

3200

3000

2800

2600

2400

A simple vista parece que Vehicles Oller tiende a ser algo ms caro, y vemos que tampoco se
detecta ningn punto que llame la atencin excesivamente.
Hacemos hiptesis de igualdad de varianzas H0: 1=2 H1: 12.

P valor es superior al 0,05 por lo que no puedo rechazar Ho y asumo igualdad de varianzas.
Ahora la prueba de hiptesis es que H0: 1=2 H1: 12. Asumiendo igualdad de varianzas.

Con este p-valor rechazamos H0, por lo que s que hay diferencias significativas entre
proveedores. Ahora debemos realizar la prueba unilateral para ver que proveedor es ms
barato.
El siguiente paso consiste en realizar la prueba de que H0: 1=2 H1: 1>2.

Este p-valor permite rechazar H0 y concluir que el proveedor 1 es ms caro que el 2.


Por lo que prescindiremos para la regin de Gerona del proveedor Vehcles Oller. Podemos
hacer esta afirmacin con una seguridad del orden del 100%.

1.3. Lleida
El primer paso, para que sirva de ayuda al tratamiento de datos, se realizan DotPlot y Boxplot:

Se puede observar tanto en el DotPlot como en el Boxplot que en ambos casos aparecen
puntos lo bastante alejados como para que puedan quitarse del anlisis. En el caso de Hugo
Torres, la fila dos de los datos contiene un valor excesivamente alto y en el de Mario Casanova,
excesivamente bajo.
Para ver esta diferencia, se realizar a continuacin el test de hiptesis de igualdad de
varianzas H0: 1=2 H1: 12 para el caso con los 22 valores y con los 20 (menospreciando
estos dos ms alejados).

Prueba con todos los valores:


Mtodo
Prueba F (normal)
Prueba de Levene (cualquiera continua)

GL1
11
1

GL2
11
22

Estadstica
de prueba
1,17
0,15

Valor P
0,802
0,701

GL1
10
1

GL2
10
20

Estadstica
de prueba
2,07
0,68

Valor P
0,265
0,421

Prueba sin los dos valores ms alejados:


Mtodo
Prueba F (normal)
Prueba de Levene (cualquiera continua)

En ambos casos, p-valor es superior al 0,05 por lo que no puedo rechazar H0 y se asume
igualdad de varianzas. An con eso, se prefiere trabajar con estos dos valores, porque los
intervalos de confianza para la relacin de varianzas son ms estrechos y el p-valor es mayor
en el primero de los casos mostrados.
Con 22 datos
Distribucin
de
de los datos
Normal
4,056)
Continuo
28,973)

Con 20 datos

IC para
relacin de

IC para
relacin

Desv.Est.
(0,580; 2,014)

varianza
(0,336;

(0,364; 5,383)

(0,132;

Distribucin
de
de los datos
Normal
7,711)
Continuo
21,507)

IC para
relacin de

IC para
relacin

Desv.Est.
(0,747; 2,777)

varianza
(0,558;

(0,351; 4,638)

(0,123;

El siguiente paso es realizar la prueba de hiptesis de que H0: 1=2 H1: 12, y asumiendo
igualdad de varianzas dados los resultados anteriores.

Con este p-valor no se puede rechazar H0, por lo que no hay diferencias significativas entre
proveedores. Esta es la confirmacin de lo que se observ en el Boxplot. Analizando la muestra
sin los valores ms alejados de la tendencia central, este p-valor aumenta significativamente,
de modo que se obtiene:
Prueba T de diferencia = 0 (vs. no =): Valor T = 0,38

Valor P = 0,708

GL = 20

Es preferible tratar con todos los datos, pues no nos vemos con bastante autoridad como para
considerar si uno o varios datos son errneos o no. Con estos p-valor, entonces, no es
necesario realizar ninguna prueba unilateral; y ambos tienen un precio igual.

1.4. Tarragona
Tambin en este caso se grafican los datos en BoxPlot y DotPlot:

En el cual no se observan valores significativamente distantes a la media. Entonces realizamos


el test para las varianzas del mismo modo que antes:
Mtodo
Prueba F (normal)
Prueba de Levene (cualquiera continua)

GL1
11
1

GL2
11
22

Estadstica
de prueba
1,44
0,12

Valor P
0,557
0,733

Y como p-valor es mayor a 0,05; no se puede rechazar la hiptesis de que las varianzas fueran
iguales.
Haciendo la prueba t de dos muestras (anlisis de las medias) asumiendo varianzas iguales se
obtiene:

Lo cual significa que no se puede rechazar la hiptesis de que las medias no sean iguales; es
decir, que los precios sean los mismos.

1.5. Resumen de los resultados


En esta fase hemos visto que existen proveedores significativamente ms caros para las
regiones de Barcelona y Gerona, siendo Lobocar y Vehcles Oller los ms caros
respectivamente; por lo consiguiente dejaremos de trabajar con dichos proveedores.
Para las regiones de Lrida y Tarragona no hay evidencias significativas para poder saber si un
proveedor es ms caro que el otro.

Segunda fase: Reduccin del coste de procesamiento


Esta fase se consiste en reducir el coste de procesamiento de distintos equipamientos. Los
equipamientos que los mecnicos de la empresa modifican son los siguientes:
1. Faros: Pueden ser de tres tipos: Xenn, Bi-Xenn y de Leds.
2. Tapicera: Puede ser: clsica de alta calidad, cuero o fantasa.
3. Pintura: En todos los casos se elige una pintura metalizada i no se incluye serigrafa,
que hara que los coches se vendieran ms caros pero con ms dificultad. Tenemos
disponibles tres tipos de pintura metalizada: pintura nitro-celulsica, pintura Two-pack
o pintura en base agua.
4. Llantas: todas las llantas que se colocan son de 18, pero hay tres estilos, Premium en
negro, Premium en gris y deportivas.

2.1. Faros.
Ya que el departamento de produccin nos dice que hay gran disparidad de precio segn la
gama del vehculo realizaremos un estudio ANOVA bloqueado (two ways). Realizando este
estudio vemos que los grficos de residuos son los siguientes.

Grficas de residuos para Preu


Grfica de probabilidad normal

vs. ajustes
200

90

100
Residuo

Porcentaje

99

50
10
1

0
-100
-200

-200

-100

0
Residuo

100

200

1400

Histograma
200
100

Residuo

Frecuencia

2000

vs. orden

4
2
0

1600
1800
Valor ajustado

0
-100
-200

-200

-100

0
Residuo

100

200

10
15
20
25
30
Orden de observacin

35

Vemos tanto en el papel probabilstico normal y en al histograma que los datos cumplen la
hiptesis de normalidad. Vemos tambin en residuo vs orden que se mantiene ms o menos
constante el valor. Y por ltimo en el grfico residuo vs ajuste vemos que ms o menos es una
nube de puntos, aunque en el rango de 1400 a 1600 se concentren ms los puntos.
Estos hechos hacen que se pueda tener en cuenta los resultados dados por ANOVA.
Esta tabla ANOVA nos da los siguientes resultados:

Nos confirma que hay diferencias muy significativas entre gamas, esto se puede ver ya que el
pvalue vale 0 y en la grfica inferior dnde se puede ver grficamente estas diferencias.
En cuanto el tema que nos compite vemos que s que hay diferencias, ya que el p valor es
inferior al 5%, pero vemos en el grfico que los intervalos se solapan, por lo que no somos
capaces de decir con la seguridad del 95% de qu tipo de faros es mejor y cual peor. Para eso
necesitaramos ms datos. Aunque si hay que decantarse por alguno nos decantaramos por
los faros Xenon, aunque la certeza de esta afirmacin ser inferior al 95%.

2.2. Llantas.
Ya que el departamento de produccin nos dice que hay gran disparidad de precio segn la
gama del vehculo realizaremos un estudio ANOVA bloqueado (two ways). Realizando este
estudio vemos que los grficos de residuos son los siguientes.

Grficas de residuos para Preu


Grfica de probabilidad normal

vs. ajustes
200

90
Residuo

Porcentaje

99

50
10
1
-300

100
0
-100
-200

-150

0
Residuo

150

300

1000

1200
1400
Valor ajustado

Histograma

1600

vs. orden

Residuo

Frecuencia

200
6
4
2
0

100
0
-100
-200

-200

-100

0
100
Residuo

200

10
15
20
25
Orden de observacin

30

35

Vemos tanto en el papel probabilstico normal y en al histograma que los datos cumplen la
hiptesis de normalidad, aunque no tan bien como en los faros. Vemos tambin en residuo vs
orden que se mantiene ms o menos constante el valor. Y por ltimo en el grfico residuo vs
ajuste vemos que es una nube de puntos.
Estos hechos hacen que se pueda tener en cuenta los resultados dados por ANOVA. Esta tabla
ANOVA nos da los siguientes resultados:

Nos confirma que hay diferencias muy significativas entre gamas, esto se puede ver ya que el
pvalue vale 0 y en la grfica inferior dnde se puede ver grficamente estas diferencias.
En cuanto el tema que nos compite vemos que s que hay diferencias, ya que el p valor es
inferior al 5%, y en este caso el valor es bastante ms bajo, por lo que nos da ms seguridad.
En el grfico podemos observar que las llantas ms caras son las Esports, y que estos intervalos
no se solapan con las negras, y por poco tampoco con las grises. por lo que descartaremos las
Esports.

2.3. Pintura.
El anlisis a realizar es el ANOVA de dos factores. En este, se obtiene un papel probabilstico
normal y un histograma bastante cercano a lo deseable. Adems, el anlisis de los residuos no
muestra ninguna forma concreta; ms bien es una nube de puntos. En los residuos en funcin
del orden aparece una pequea depresin en los puntos 4 hasta 9, pero tampoco la
consideraremos significativa por ahora.

Grficas de residuos para Preu


Grfica de probabilidad normal

vs. ajustes
400

90
Residuo

Porcentaje

99

50

0
-200

10
1

200

-500

-250

0
Residuo

250

-400
1000

500

1100
1200
Valor ajustado

Histograma

vs. orden
400

6
Residuo

Frecuencia

4
2
0

1300

200
0
-200

-300 -200 -100

0
100
Residuo

200

300

400

-400

10
15
20
25
Orden de observacin

30

35

En este caso no se observan diferencias significativas entre las diferentes opciones de pintura
ni las distintas gamas. Esto se observa en los p-valores as como en los pequeos grficos que
ofrece Minitab. Por lo que no podemos descartar ninguna opcin para ahorrar costes.

2.4. Volants.
Volvemos a hacer el ANOVA (dos factores) con Preu como variable de respuesta y Opcio y
Gama como factores. Los resultados que se obtienen el los grficos son:

Grficas de residuos para Preu


vs. ajustes
300

90

150
Residuo

Porcentaje

Grfica de probabilidad normal


99

50

0
-150

10
1
-300

-150

0
Residuo

150

-300

300

800

8
6

150

0
-150

2
0

1100

vs. orden
300

Residuo

Frecuencia

Histograma

900
1000
Valor ajustado

-200

-100

0
Residuo

100

200

-300

10
15
20
25
30
Orden de observacin

35

En este caso la discusin es la misma que en el caso anterior. El papel probabilstico normal y el
histograma muestran que los datos pueden ser explicados mediante una ley normal. Las
grficas e los residuos muestran una nube de puntos respecto al valor ajustado y ninguna
tendencia concreta respecto al orden de observacin.
De los resultados que se pueden extraer mediante este anlisis, con la opcin Mostrar
medias de Minitab, se resume que:

En este caso s se observa una diferencia significativa para la opcin de 4 radios. Esta es la que
causa que el p-valor de la variable descriptiva Opcio sea del 0,002. Por lo que la opcin
descartada para ahorrar costes ser la de 4 radios.

2.5. Conclusin Fase 2.


No se puede descartar ninguna opcin para Pinturas ni Faros con una certeza del 95%. En
cambio s que se puede descartar las llantas Esport y los volantes de 4 radios.

Tercera fase: Reduccin del coste comercial


En esta fase se pide reducir el coste comercial un 15% encontrando el modelo que utilizaba el
anterior encargado Joan Vila. De los datos recopilados, se dispone de 10 posibles variables que
se van a utilizar para modelizar el sistema que usaba el anterior encargado.
Usando Minitab, se hace el diagrama multivariante (Matrix plot) para observar alguna posible
relacin entre los datos, y para tener una idea de cmo se comportan los datos entre s. Por
ello, algunos de los datos son transformados a sus logaritmos y/o potencias, para adecuarlos
mejor a la variable respuesta (comisin). Posteriormente, se realiza la regresin de los datos
utilizando la opcin Best Subsets (Mejores Subgrupos) y se observan los distintos resultados.
Regresin de los mejores subconjuntos: Comissio vs. Antiguitat; MargeBrut; ...
la respuesta es Comissio
R
e
l
D a
e c
s i

Vars
1
1
2
2
3
3
4
4
5
5
6
6
7
7
8
8
9

R-cuad.
46,1
33,5
70,6
64,9
71,6
70,7
72,3
71,7
72,4
72,4
72,5
72,5
72,6
72,6
72,6
72,6
72,6

R-cuad.
(ajustado)
44,7
31,7
69,0
63,0
69,3
68,3
69,2
68,4
68,3
68,3
67,6
67,6
66,6
66,6
65,6
65,5
64,4

Cp de
Mallows
23,1
36,9
-1,8
4,5
-0,9
0,1
0,3
1,0
2,3
2,3
4,1
4,1
6,0
6,1
8,0
8,0
10,0

S
104,45
116,02
78,132
85,450
77,863
79,115
77,994
78,881
79,056
79,060
79,990
79,993
81,133
81,204
82,417
82,422
83,778

A
n
t
i
g
u
i
t
a
t

M
a
r
g
e
B
r
u
t

D
e
s
c
o
m
p
t
e

p
e
s
e
s
M
a
g
a
t
z
e
m

o
n
s
C
o
m
e
r
c
i
a
l
s

T
e
m
p
s
V
e
n
d
a

M
a
r
g
e
R
e
l
a
t
i
u
X

o
m
i
s
s
i
o
n
s
A
c
u
m

C
o
s
t
T
u
n
i
n
g
X

X
X

X
X
X
X
X
X

X X
X
X X
X X
X X
X X
X X
X X
X X
X X
X X
X X
X X

X
X
X

X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X X X
X X X

X
X
X
X
X
X
X

X
X
X
X
X
X
X
X
X

A la vista de estos datos, nos fijamos en aquellos que tienen la combinacin de una CP de
Mallows menor y una R2 (ajustada) mayor, aunque en realidad nos podramos quedar con la
observacin del primero simplemente. Con ello, parece que los mejores Subsets son los
siguientes:
a) R2 (ajustada) = 68,3 ; Cp Mallows = 0,1 ; Variables explicativas = Marge Brut, Despeses
Magatzem, Temps de venda
b) R2 (ajustada) = 69,2 ; Cp Mallows = 0,3 ; Variables explicativas = Antiguitat, Marge Brut,
Temps de venda i Marge Relatiu
An as, la respuesta del Best Subsets no siempre da el modelo perfecto. Esto se confirma al
realizar la regresin de los datos y observar los grficos de normalidad y residuos, estos no
muestran las caractersticas deseables.
Por ello, sin deshacerse de la informacin que ha aportado el Best Subsets, aunque no haya
sido del todo correcta, se puede pensar en una serie de combinaciones que pueden adecuar
nuestro modelo al que usaba Joan Vila. Por ello, tambin se aaden nuevas variables
(MargeRelatiu2, Descompte2, Descompte*Marge, LNmarge y LNdescompte). Entonces se
vuelve a emplear el Best Subsets, y se obtiene:

Regresin de los mejores subconjuntos: Comissio vs. Antiguitat; MargeBrut; ...


la respuesta es Comissio
R
e

Vars
1
1
2
2
3
3
4
4
5
5
6
6
7
7
8
8
9
9
10
10
11
11
12
12
13
13
14

R-cuad.
46,9
46,1
70,6
70,4
71,6
71,4
72,3
71,9
72,4
72,4
72,8
72,5
72,9
72,9
73,0
73,0
73,1
73,0
73,1
73,1
73,2
73,2
73,2
73,2
73,2
73,2
73,2

R-cuad.
(ajustado)
45,5
44,7
69,0
68,8
69,3
69,0
69,2
68,7
68,4
68,3
67,8
67,6
67,0
66,9
66,0
66,0
65,0
64,9
63,9
63,9
62,7
62,6
61,3
61,3
59,8
59,8
58,2

Cp de
Mallows
13,5
14,3
-6,6
-6,4
-5,5
-5,3
-4,2
-3,8
-2,3
-2,3
-0,6
-0,4
1,3
1,3
3,2
3,2
5,1
5,1
7,1
7,1
9,0
9,0
11,0
11,0
13,0
13,0
15,0

S
103,68
104,45
78,132
78,378
77,863
78,144
77,994
78,543
78,979
79,022
79,662
79,990
80,682
80,738
81,854
81,881
83,099
83,138
84,414
84,429
85,819
85,860
87,386
87,393
89,048
89,050
90,810

A
n
t
i
g
u
i
t
a
t

M
a
r
g
e
B
r
u
t

D
e
s
c
o
m
p
t
e

D
e
s
p
e
s
e
s
M
a
g
a
t
z
e
m

X
X
X
X
X
X
X
X

X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X

T
e
m
p
s
V
e
n
d
a

M
a
r
g
e
R
e
l
a
t
i
u

C
o
m
i
s
s
i
o
n
s
A
c
u
m

X
X
X
X
X
X

X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X

l
a
c
i
o
n
s
C
o
m
e
r
c
i
a
l
s

X
X

X
X
X
X

X
X
X
X X
X
X X
X
X X
X
X X
X
X X
X
X X
X
X X
X
X X
X
X X
X
X X
X
X X
X
X X
X
X X
X X X X
X
X X
X X X X

C
o
s
t
T
u
n
i
n
g

m
a
r
g
e
r
e
l
2
X

d
e
s
c
o
m
p
t
e
2

d
e
s
x
m
a
r
g
e

L
N
m
a
r
g
e

L
N
d
e
s
c
o
m
p
t
e

X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X

X
X
X
X
X
X
X
X
X
X X
X X
X
X X
X X
X X
X X
X X

X
X
X
X
X
X
X
X
X
X
X
X
X

X
X
X X
X
X
X
X X
X
X X
X
X X
X X

Se puede observar que la Cp de Mallows en este caso es mayor que en el caso anterior, pero
los residuos no muestran ninguna forma concreta, simplemente son una dispersin de puntos,
lo cual nos indica que este modelo es bueno cosa que el anterior no lo era. Se podra
encontrar, quizs, algn otro modelo que explique mejor el clculo de las comisiones, pero se
ha usado el mtodo prueba-error para los mejores subgrupos (los que tenan menor Cp), y se
ha obtenido el modelo siguiente:
Anlisis de regresin: Comissio vs. Descompte; MargeRelatiu
La ecuacin de regresin es
Comissio = 319 - 17,9 Descompte + 8,76 MargeRelatiu
Predictor
Constante
Descompte
MargeRelatiu

Coef
319,48
-17,852
8,758

SE Coef
66,57
3,211
1,155

T
4,80
-5,56
7,58

P
0,000
0,000
0,000

S = 78,1321

R-cuad. = 70,6%

R-cuad.(ajustado) = 69,0%

Anlisis de varianza
Fuente
Regresin
Error residual
Total
Fuente
Descompte
MargeRelatiu

GL
2
37
39
GL
1
1

SC
543188
225871
769060

MC
271594
6105

F
44,49

P
0,000

SC Sec.
192331
350857

Observaciones poco comunes


Obs
13
31
38

Descompte
2,1
14,8
15,2

Comissio
768,4
216,2
445,5

Ajuste
752,3
389,8
271,5

EE de
ajuste
41,9
13,3
22,6

Residuo
estndar
0,24 X
-2,26R
2,33R

Residuo
16,1
-173,6
174,0

R denota una observacin con un residuo estandarizado grande.


X denota una observacin cuyo valor X le concede gran apalancamiento.

El cual se considera que explica el clculo de las comisiones con suficiente bondad. La bondad,
como se ha comentado, no slo se expresa como el resultado de la R2, sino tambin a partir de
los grficos de normalidad y de residuos adjunto a continuacin:

Grficas de residuos para Comissio


vs. ajustes
200

90

100
Residuo

Porcentaje

Grfica de probabilidad normal


99

50

0
-100

10
1
-200

-100

0
Residuo

100

-200

200

200

400
600
Valor ajustado

vs. orden

16

200

12

100
Residuo

Frecuencia

Histograma

0
-100

4
0

800

-150

-100

-50

0
50
Residuo

100

150

-200

10
15
20
25
30
Orden de observacin

35

40

Como conclusiones, se extrae que este modelo es adecuado para explicar el clculo de las
comisiones, lo cual permitir reducirlas un 15%. El modelo calcula las comisiones en funcin de
las variables explicativas Descompte y Marge Relatiu.

Cuarta fase: Mtodo efectivo para calcular el PVP del coche


Para el clculo del PVP del coche, se tiene una base de datos de la cual se realizar un clculo
estadstico para calcular el mtodo ms adecuado o efectivo. Por ello, se realizar una
regresin de los datos que permita explicar cules son las variables significativas para calcular
el precio de venta. Se pone la limitacin de que slo se pueden utilizar entre 5 y 7 variables.
Entonces, llegados a este punto, se realiza un estudio estadstico con Minitab para calcular la
regresin que hay entre la variable respuesta (PVP) y las posibles variables explicativas. Por
ello, primero se hace el Matrix Plot y se observan las relaciones bivariantes, y esto se utiliza
para detectar posibles transformaciones. Ya que se observa que en la mayora de variables a
medida que aumenta la variable aumenta la dispersin realizaremos transformaciones
logartmicas. Adems a ojo creemos que Co2 y peso podra ser til realizar una transformacin
cuadrtica y realizar la inversa del tiempo de aceleracin. Tras muchos tanteos de modelos en
los cuales los residuos no daban un comportamiento correcto se ha decidido aplicarle el
logaritmo a la variable respuesta.
Incluyendo estas nuevas transformaciones creadas ejecutamos best-subsets para que nos
facilite la faena y nos escoja los mejores modelos.
Hemos configurado el best subsets para que slo nos de modelos de 5, 6 y 7 variables, debido
a requisitos del enunciado. Los resultados son los siguientes:
Regresin de los mejores subconjuntos: lnpvp vs. Potencia; CO2; ...
la respuesta es lnpvp

Vars
5
5
5
6
6
6
7
7
7

R-cuad.
89,1
89,0
88,8
92,4
92,4
92,3
93,0
92,9
92,9

R-cuad.
(ajustado)
88,6
88,5
88,3
91,9
91,9
91,8
92,5
92,4
92,4

Cp de
Mallows
69,3
70,0
72,9
20,8
21,0
22,5
13,6
14,4
14,8

S
0,18392
0,18433
0,18592
0,15444
0,15454
0,15553
0,14895
0,14951
0,14977

P
o
t
e
n
c
i
a
X
X
X
X
X
X
X
X
X

A
c
c
0
a
1
0
0

C
o
V
n
o
C s P l
O u e u
2 m s m
X
X
X

X
X
X

X
X
X
X
X
X

X
X
X
X

C
o
s
t
T
u
n
n
i
n
g
X
X
X
X
X
X
X
X
X

C
o
s
t
C
o
m
p
r
a

A
n
t
i
g
u
i
t
a
t

L
N
a
c
c
X

L
N
c
o
s
t
c
o
m
p
r
a
X
X
X
X
X

X
X
X X
X X
X
X
X X X
X X

El modelo de regresin que se escoge es el marcado en amarillo (7 variables).

L
N
a
n
t
i
g
u
i
t
a
t

p
o
t
e
n
c
i
a
2

c
o
^
2

p
e
s
2
X

1
/
a
c

Grficas de residuos para lnpvp


Grfica de probabilidad normal

vs. ajustes

99,9

0,4

90

Residuo

Porcentaje

99

50
10

0,2
0,0
-0,2

1
0,1

-0,50

-0,25

0,00
Residuo

0,25

-0,4

0,50

Histograma

vs. orden

0,2

15

Residuo

Frecuencia

11

0,4

20

10

0,0
-0,2

5
0

10
Valor ajustado

-0,3 -0,2 -0,1

0,0 0,1
Residuo

0,2

0,3

-0,4

0,4

10

20

30

40

50

60

70

80

90 100 110

Orden de observacin

Anlisis de regresin: PVP vs. Pes; CostCompra; ...


La ecuacin de regresin es
PVP = - 34166 + 9,45 Pes + 12,1 CostCompra + 10,7 CostTunning - 6429 LNacc
- 5998 LNantiguitat + 0,225 potencia2 + 0,118 co^2
Predictor
Constante
Pes
CostCompra
CostTunning
LNacc
LNantiguitat
potencia2
co^2

Coef
-34166
9,451
12,128
10,722
-6429
-5998
0,22489
0,11823

SE Coef
12163
1,490
2,440
1,649
1515
1024
0,04167
0,04113

S = 3859,96

R-cuad. = 88,5%

T
-2,81
6,34
4,97
6,50
-4,24
-5,86
5,40
2,87

P
0,006
0,000
0,000
0,000
0,000
0,000
0,000
0,005

R-cuad.(ajustado) = 87,7%

Anlisis de varianza
Fuente
Regresin
Error residual
Total
Fuente
Pes
CostCompra
CostTunning
LNacc
LNantiguitat
potencia2
co^2

GL
7
102
109
GL
1
1
1
1
1
1
1

SC
11666749113
1519725333
13186474445

SC Sec.
2787295625
4087638339
3043556174
699657481
260046701
665437449
123117343

Observaciones poco comunes

MC
1666678445
14899268

F
111,86

P
0,000

Obs
18
28
32
43
61
71
83
97
100

Pes
2128
1901
1806
1593
1949
1456
1452
1509
1657

PVP
41028
47667
18490
45890
14603
41192
28739
36680
47858

Ajuste
33161
40013
26758
35986
23237
32532
32012
33804
38223

EE de
ajuste
981
1225
1171
876
899
752
2191
1885
870

Residuo
7867
7654
-8268
9904
-8634
8660
-3273
2876
9635

Residuo
estndar
2,11R
2,09R
-2,25R
2,63R
-2,30R
2,29R
-1,03 X
0,85 X
2,56R

R denota una observacin con un residuo estandarizado grande.


X denota una observacin cuyo valor X le concede gran apalancamiento.

Los residuos dan un comportamiento de nube de puntos deseable, y los p valores del modelo y
de todas sus variables son correctos por lo que daremos el modelo por bueno. Adems este
modelo explica mucho ya que su R2 adj es del orden del 87%.
Es cierto que aparecen varias observaciones poco frecuentes, pero no disponemos de
bastante autoridad como para desestimar ningn dato, y la observacin ms rara es de 2,63R;
que se encontrara en el lmite que permitiramos.
Entonces, aceptando y aplicando este modelo se pueden calcular los precios de los siguientes
vehculos, con una confianza del 90%:
El procedimiento consistir mediante excel en calcular el valor que nos da el modelo y luego
calcular su intervalo de confianza utilizando el valor de s dado por ANOVA, t-student de 109
grados y la raz de las observaciones (110). Se adjunta Excel con el que se han calculado los IC.

Potencia: 150cv
Aceleracin: 12.6s
Consumo: 7.3 l/100km
Peso: 1300 kg
Volumen: 9.9 m3
Emisiones CO2: 160 g/km
Antigedad: 64 meses
Coste tunning: 3200
Coste compra: 3100
PVP: (16023,16796)

Potencia: 220cv
Aceleracin: 7.8 s
Consumo: 6.5 l/100km
Peso: 1650 kg
Volumen: 12 m3
Emisiones CO2: 195 g/km
Antigedad: 72 meses
Coste tunning: 3100
Coste compra: 3250
PVP: (30345,31809)

Potencia: 185cv
Aceleracin: 10.1 s
Consumo: 6.5 l/100km
Peso: 1540 kg
Volumen: 9.5 m3
Emisiones CO2: 200 g/km
Antigedad: 45 meses
Coste tunning: 3300
Coste compra: 3000
PVP:(25541,26774)
Potencia: 170cv
Aceleracin: 10.7 s
Consumo: 7.8 l/100km
Peso: 1500 kg
Volumen: 9.52 m3
Emisiones CO2: 195 g/km
Antigedad: 39 meses
Coste tunning: 3800
Coste compra: 2800
PVP:(27284,28600)
Potencia: 120 cv
Aceleracin: 10.6s
Consumo: 5.98 l/100km
Peso: 1250 kg
Volumen: 9.7 m3
Emisiones CO2: 133 g/km
Antigedad: 37 meses
Coste tunning: 3100
Coste compra: 3200
PVP:(16352,17411)

Anda mungkin juga menyukai