As pues un jugador que haya obtenido una valoracin negativa habr jugado un muy
mal partido, pero si obtiene de 10 en adelante habr jugado un buen partido. De ah la
importancia de cuantificar cuantos jugadores han obtenido ms de 10 puntos de valoracin
media al final del ao.
El resto de factores parecen a priori bastante significativos, mediante este anlisis
estadstico se comprobar si las teoras y leyendas tan ampliamente aceptadas en el mundo de
la canasta son realmente ciertas. Que el anlisis sea fiable y riguroso es bsico pues el equipo
que nos ha contratado se est jugando gran cantidad de dinero y expectativas en la que va a
ser una ilusionante temporada. Nuestro anlisis se basa en el uso de la regresin estadstica
como mtodo para poder predecir una serie de datos en funcin de otros datos, ms
especficamente nuestro objetivo es la correcta determinacin de un modelo de regresin
mltiple que relacione los datos anteriormente expuestos.
DATOS
Los datos han sido tomados de las ltimas 4 temporadas de la ACB. Las
estadsticas acumuladas de un equipo durante una temporada componen un set de
datos. En forma de tabla los datos son los siguientes:
% victoria
MPP
% tiro 3P
MRP
MVPs
jornada
Valoracin
mejor
jugador
Jugadores
que superan
valoracin
10
50
79
32
35
18
41
78
37
32
22
41
76
33
30
16
38
75
33
32
15
47
79
36
32
16
74
84
41
35
21
53
81
37
31
12
41
77
34
31
24
38
77
33
30
20
35
76
34
30
21
56
79
36
35
16
% victoria
MPP
% tiro 3P
MRP
MVPs
jornada
Valoracin
mejor
jugador
Jugadores
que superan
valoracin
10
76
81
38
34
18
44
77
35
31
12
68
83
39
33
19
59
76
35
32
18
35
77
36
33
16
35
76
31
34
17
74
82
38
33
17
47
83
42
32
18
47
77
35
31
16
34
77
33
33
15
25
74
32
32
18
31
76
36
33
15
38
74
37
33
20
28
73
32
30
14
69
83
37
33
16
63
80
38
34
14
34
77
34
33
14
50
77
35
31
11
72
84
36
36
23
81
81
39
35
19
44
74
31
33
13
88
90
36
34
21
75
83
39
33
17
25
71
32
32
15
66
80
38
32
28
% victoria
MPP
% tiro 3P
MRP
MVPs
jornada
Valoracin
mejor
jugador
Jugadores
que superan
valoracin
10
41
75
36
32
14
75
77
36
33
14
44
79
39
31
14
38
77
38
31
20
78
88
37
34
25
25
76
32
30
15
34
79
35
29
16
66
76
35
34
15
50
79
37
33
14
38
75
36
31
13
69
80
38
33
16
41
73
33
32
13
91
84
38
34
13
44
80
36
32
14
69
84
38
33
17
53
80
37
32
12
38
76
34
32
12
62
81
33
36
16
41
78
32
37
15
35
73
32
31
17
44
74
33
35
12
38
74
32
37
18
50
76
31
37
12
41
74
31
36
16
44
78
34
40
24
% victoria
MPP
% tiro 3P
MRP
MVPs
jornada
Valoracin
mejor
jugador
Jugadores
que superan
valoracin
10
62
78
32
32
12
47
78
32
36
15
74
83
33
36
16
35
75
32
36
17
24
73
35
31
15
68
81
34
34
19
35
75
33
33
17
56
76
33
34
16
76
84
32
38
22
68
81
30
40
18
71
50,9296
16,97
33,3205%
24,0
91,0
67,0
1,63296
-1,42093
Histogram
Box-and-Whisker Plot
30
fr e q u e n c y
25
20
15
10
5
0
0
20
40
60
80
100
24
% victorias
44
64
% victorias
84
104
71
78,2676
3,7415
4,78039%
71,0
90,0
19,0
2,37978
0,775226
Box-and-Whisker Plot
Histogram
24
20
frequenc y
16
12
8
4
0
70
74
78
82
MPP
86
90
94
71
75
79
83
87
91
MPP
% de tiro de 3 puntos:
Count
Average
Standard deviation
Coeff. of variation
Minimum
Maximum
Range
Stnd. skewness
Stnd. kurtosis
71
34,9155
2,6766
7,66594%
30,0
42,0
12,0
1,14231
-1,00584
Box-and-Whisker Plot
Histogram
18
frequenc y
15
12
9
6
3
0
29
32
35
38
41
44
30
% tiro de 3
32
34
36
% tiro de 3
38
40
42
71
33,2113
2,28608
6,88344%
29,0
40,0
11,0
2,91389
1,39895
Box-and-Whisker Plot
Histogram
30
frequenc y
25
20
15
10
5
0
28
31
34
37
40
43
29
31
33
MRP
35
MRP
37
39
41
71
1,61972
1,35611
83,725%
0,0
6,0
6,0
2,14455
0,173564
Box-and-Whisker Plot
Histogram
18
frequenc y
15
12
9
6
3
0
-0,4
1,6
3,6
MVPs de jornada
5,6
7,6
3
MVPs de jornada
71
16,6056
3,47842
20,9472%
11,0
28,0
17,0
3,19402
1,5696
Box-and-Whisker Plot
Histogram
24
frequenc y
20
16
12
8
4
0
10
14
18
22
Valoracion mejor jugador
26
11
30
14
17
20
23
Valoracion mejor jugador
26
29
71
3,26761
1,23007
37,6445%
1,0
6,0
5,0
0,288225
-0,971316
Box-and-Whisker Plot
Histogram
24
frequenc y
20
16
12
8
4
0
0
4
Jugadores superan 10 valoracion
2
3
4
Jugadores superan 10 valoracion
yi 0 j xi ui
ui
N (0, 2 )
Donde:
N (0 j xi , 2 )
Normalidad: yi | xi
Homocedasticidad: Var[ yi | xi ] 2
Independencia: Cov[ yi | yk ] 0
El primer paso es proceder con los contrastes individuales. Esto nos proporciona
informacin sobre que regresores influyen significativamente en nuestra variable
respuesta.
Los contrastes siguen el esquema siguiente:
H0 : j 0
H1 : j 0
Para que se determine que un regresor es significativo, debemos de poder rechazar la
hiptesis nula. j cumple que:
j
N ( j ,
2
nS x2
Parameter
Intercept
Slope
Coefficients
Least Squares
Standard
Estimate
Error
-237,594
24,9259
3,68638
0,318111
T
Statistic
-9,53204
11,5883
P-Value
0,0000
0,0000
Parameter
Intercept
Slope
Coefficients
Least Squares
Standard
Estimate
Error
-47,4184
23,9443
2,81674
0,6838
10
T
Statistic
-1,98037
4,11925
P-Value
0,0517
0,0001
Parameter
Intercept
Slope
Coefficients
Least Squares
Standard
Estimate
Error
-44,2162
27,4437
2,86486
0,824413
T
Statistic
-1,61116
3,47504
P-Value
0,1117
0,0009
Parameter
Intercept
Slope
Coefficients
Least Squares
Standard
Estimate
Error
37,1761
2,33083
8,49125
1,10658
T
Statistic
15,9498
7,6734
11
P-Value
0,0000
0,0000
Parameter
Intercept
Slope
Coefficients
Least Squares
Standard
Estimate
Error
31,1464
9,65997
1,19136
0,56954
T
Statistic
3,22427
2,09179
P-Value
0,0019
0,0401
Parameter
Intercept
Slope
Coefficients
Least Squares Standard
T
Estimate
Error
Statistic
15,9032
3,6472 4,36038
10,7193
1,04552 10,2526
P-Value
0,0000
0,0000
12
De esta manera nos encontramos con que solo tres regresores nos explican de
un modo alto la variabilidad del porcentaje de Victorias, que son Media de puntos,
MVPs de la Jornada y nmero de jugadores que superan 10 de valoracin. Es cierto
que todos influyen, puesto que el p-valor es significativo, pero no es la mejor manera
de explicar la variable independiente.
13
Grfico de Residuos
Residuo estudentizado
Residuo estudentizado
4,9
2,9
0,9
-1,1
-3,1
71
75
79
83
87
91
Grfico de Residuos
4,9
2,9
0,9
-1,1
-3,1
29
31
35
37
39
41
Grfico de Residuos
4,9
2,9
0,9
-1,1
-3,1
30
32
34
36
38
40
42
Grfico de Residuos
4,9
2,9
0,9
-1,1
-3,1
0
4,9
2,9
0,9
-1,1
14
-3,1
1
Residuo estudentizado
Grfico de Residuos
Mvp Jornada
%Tiro de 3
Residuo estudentizado
33
Media Rebotes
Residuo estudentizado
Residuo estudentizado
Media puntos
Grfico de Residuos
4,9
2,9
0,9
-1,1
-3,1
10
13
16
19
22
25
28
Residuo estudentizado
Grfico de Residuos
4,9
2,9
0,9
-1,1
-3,1
23
43
63
83
103
%Victorias predicho
Podemos observar en las grficas que la anchura a lo largo de la ordenada de
los residuos es suficientemente regular, no hay grandes agrandamientos ni
empequeecimientos, por lo que podemos hablar de una homocedasticidad bastante
significativa en el modelo. Por otro lado tambin se puede apreciar fcilmente que no
hay ninguna tendencia de los residuos ni hacia la parte positiva ni a la negativa, no
apreciamos ninguna curva, por lo que se mantiene la hiptesis de linealidad.
Tambin se observa, a raz de la ltima grfica, que los datos obtenidos
cumplen la hiptesis de independencia, esto se puede afirmar debido a la aparente
falta de orden de los residuos en la anterior grfica.
Comprobamos la normalidad hallando los residuos y viendo si se ajustan a una
distribucin normal con un nivel de confianza del 95%.
Test de Bondad de Ajuste para los residuos:
Chi-cuadrado = 1,45064 con 5 g.l. P-Valor = 0,918695
Estadstico DMAS de Kolmogorov = 0,0414651
Estadstico DMENOS de Kolmogorov = 0,0325109
Estadstico DN global de Kolmogorov = 0,0414651
15
Parameter
CONSTANT
% tiro de 3
MPP
Jugadores superan 10 valoracion
MRP
MVPs de jornada
Valoracion mejor jugador
Estimate
-154,071
0,839912
1,91175
4,56456
0,451594
2,62804
-0,489174
Standard
Error
33,5254
0,477534
0,425811
1,27461
0,569194
0,977091
0,308974
T
Statistic
-4,59565
1,75885
4,48967
3,58113
0,793392
2,68966
-1,58322
Analysis of Variance
Source
Sum of Squares Df Mean Square F-Ratio
Model
16127,1
6
2687,84
42,67
Residual
4031,59
64
62,9936
Total (Corr.)
20158,6
70
P-Value
0,0000
0,0834
0,0000
0,0007
0,4305
0,0091
0,1183
P-Value
0,0000
16
Una vez hecho el anlisis de regresin mltiple nos damos cuenta de algo que es
nocivo para nuestro modelo, como son los contrastes individuales de cada uno de los
regresores que incluimos en el modelo. Apreciamos que hay tres de ellos que nos
invitan a rechazarlos, ya que tienen un p-valor superior al de referencia que es 0,05,
con lo que nos indican que no son significativos y que no ayudan a determinar la
variable dependiente. Estos son los que en la regresin simple nos haban dado unos
coeficientes de correlacin bajos, con lo que se poda haber previsto, aunque no a
ciencia cierta.
A continuacin se presenta la matriz de correlacin para la regresin mltiple:
CONSTANT
CONSTANT
Superan 10
valoracin
MPP
MVPs de
jornada
% tiro de 3
1,0000
0,5529
Superan 10
valoracin
0,5529
1,0000
MPP
% tiro de
3
-0,2324
-0,0634
MRP
-0,6302
-0,4004
MVPs de
jornada
0,2585
-0,3257
-0,6401
-0,4672
Valoracin
mejor jugador
0,1493
0,2041
-0,6302
0,2585
-0,4004
-0,3257
1,0000
-0,2382
-0,2382
1,0000
-0,4929
0,0495
-0,0519
-0,0250
-0,1862
-0,2546
-0,2324
-0,0634
-0,4929
0,0495
1,0000
0,4282
-0,0709
MRP
Valoracin
mejor jugador
-0,6401
0,1493
-0,4672
0,2041
-0,0519
-0,1862
-0,0250
-0,2546
0,4282
-0,0709
1,0000
-0,1691
-0,1691
1,0000
La matriz de multicolinealidad nos indica que ciertos coeficientes (aquellos con valor
absoluto cercano a 1) indican cierta multicolinealidad. Cuando hay multicolinealidad, la
estimacin de los parmetros no es optima al verse incrementada la varianza de los
parmetros estimados, puede darse la situacin de que regresores que antes eran
significativos pasen a no serlo, y viceversa. La multicolinealidad se presenta debido a
que se proporciona informacin redundante al modelo. Al eliminar los regresores
detallados anteriormente como no significativos, esperamos poder eliminar la
multicolinealidad de nuestro modelo. No se podran aceptar las estimaciones de este
modelo por lo que el modelo no es fiable para describir la variable respuesta.
17
Parameter
CONSTANT
MPP
Jugadores superan 10 valoracion
MVPs de jornada
Estimate
-137,424
2,1541
4,97227
2,16708
Standard
Error
26,103
0,358905
1,11694
0,955965
T
Statistic
-5,26471
6,00188
4,45169
2,2669
Analysis of Variance
Source
Sum of Squares Df Mean Square F-Ratio
Model
15795,4
3
5265,13
80,85
Residual
4363,26
67
65,1233
Total (Corr.)
20158,6
70
P-Value
0,0000
0,0000
0,0000
0,0266
P-Value
0,0000
Con unos p-valor todos muy bajos, con lo que hemos encontrado un modelo en el que,
esta vez s, la variable dependiente es sensible a todos los regresores. Con los
siguientes intervalos de confianza para los parmetros estimados:
95,0% confidence intervals for coefficient estimates
Standard
Parameter
Estimate
Error
Lower Limit
Upper Limit
CONSTANT
-137,424
26,103
-189,526
-85,3226
MPP
2,1541
0,358905
1,43772
2,87048
Jugadores superan
4,97227
1,11694
2,74284
7,20169
MVPs de jornada
2,16708
0,955965
0,258963
4,0752
CONSTANT
MPP
Superan 10
valoracin
MVPs de jornada
CONSTANT
MPP
MVPs de jornada
-0,9943
1,0000
-0,3492
Superan 10
valoracin
0,3660
-0,3492
1,0000
1,0000
-0,9943
0,3660
0,3397
-0,3216
-0,3788
1,0000
18
0,3397
-0,3216
-0,3788
Modelo 2
2,1541
1,91175
4,97227
4,56456
2,16708
2,62804
MODELOS ALTERNATIVOS:
Es de inters para nuestra investigacin ver si alguna transformacin de datos nos
mejora el modelo significativamente. Se adjuntan las transformaciones de datos para
el modelo 2: log(% victorias), 1/(% victorias), (% victorias)^2
19
Parameter
CONSTANT
log(MPP)
log(Jugadores superan 10
valoracion)
log(MVPs de jornada)
Estimate
-10,662
3,25611
0,270783
Standard
Error
2,57721
0,60108
0,0761166
T
Statistic
-4,13704
5,4171
3,55747
P-Value
0,0001
0,0000
0,0008
0,110098
0,05237
2,10232
0,0407
Analysis of Variance
Source
Sum of Squares Df Mean Square F-Ratio
Model
3,84397
3
1,28132
51,64
Residual
1,21589
49
0,024814
Total (Corr.)
5,05985
52
P-Value
0,0000
Parameter
CONSTANT
1/(MPP)
1/(Jugadores superan 10
valoracion)
1/(MVPs de jornada)
Standard
Error
0,0109142
0,917139
0,00326383
T
Statistic
-4,8658
5,71737
4,12433
P-Value
0,0000
0,0000
0,0001
0,00368939 0,00180086
2,04868
0,0459
Estimate
-0,0531065
5,24362
0,0134611
Analysis of Variance
Source
Sum of Squares Df Mean Square F-Ratio
Model
0,00152982
3
0,00050994
50,79
Residual
0,000491995
49 0,0000100407
Total (Corr.)
0,00202182
52
R-squared = 75,6657 percent
R-squared (adjusted for d.f.) = 74,1758 percent
Standard Error of Est. = 0,00316871
Mean absolute error = 0,00235306
Durbin-Watson statistic = 2,06302 (P=0,5592)
20
P-Value
0,0000
Parameter
CONSTANT
(MPP)^2
(Jugadores superan 10 valoracion)^3
(MVPs de jornada)^2
Estimate
-8881,57
1,79544
10,6783
46,3588
Standard
Error
1460,46
0,252482
3,33755
24,9345
T
Statistic
-6,08133
7,11118
3,19945
1,85922
Analysis of Variance
Source
Sum of Squares Df Mean Square F-Ratio
Model
1,85717E8
3
6,19058E7
66,73
Residual
6,2153E7
67
927656,
Total (Corr.)
2,4787E8
70
P-Value
0,0000
0,0000
0,0021
0,0674
P-Value
0,0000
21
Parameter
CONSTANT
log(MPP)
log(Jugadores superan 10
valoracion)
log(MVPs de jornada)
log(% tiro de 3)
log(MRP)
log(Valoracion mejor jugador)
Estimate
-11,6439
2,87394
0,251659
Standard
Error
3,05486
0,697481
0,0856971
T
Statistic
-3,8116
4,12046
2,93661
P-Value
0,0004
0,0002
0,0052
0,136805
0,603366
0,316527
-0,21311
0,0527189
0,364086
0,419824
0,118578
2,59498
1,65721
0,753951
-1,79721
0,0127
0,1043
0,4547
0,0789
Analysis of Variance
Source
Sum of Squares Df Mean Square F-Ratio
Model
3,97828
6
0,663047
28,20
Residual
1,08157
46
0,0235124
Total (Corr.)
5,05985
52
P-Value
0,0000
Que desafortunadamente no introduce ninguna mejora, puesto que los regresores que
no eran significativos lo siguen siendo. De la misma manera ocurre cuando le hacemos
una trasformacin del tipo:
log( yi ) 0 1 (1/ x1i ) 2 (1/ x2i ) 3 (1/ x3i ) 4 (1/ x4i ) 5 (1/ x5i ) 6 (1/ x6i ) ui
Multiple Regression - 1/(% victorias)
Dependent variable: 1/(% victorias)
Independent variables:
1/(MPP)
1/(Jugadores superan 10 valoracion)
1/(MVPs de jornada)
1/(% tiro de 3)
1/(MRP)
1/(Valoracion mejor jugador)
Parameter
CONSTANT
1/(MPP)
1/(Jugadores superan 10 valoracion)
1/(MVPs de jornada)
1/(% tiro de 3)
1/(MRP)
1/(Valoracion mejor jugador)
Source
Model
Residual
Total (Corr.)
Sum of Squares
0,00157565
0,000446167
0,00202182
Estimate
-0,0608863
4,85387
0,0119371
0,00445813
0,334424
0,257058
-0,0738159
Standard
Error
0,0138683
1,0649
0,00365289
0,00182056
0,261479
0,290056
0,0401624
Analysis of Variance
Df
Mean Square
6
0,000262608
46
0,00000969929
52
22
T
Statistic
-4,39033
4,55804
3,26784
2,44877
1,27897
0,886236
-1,83793
F-Ratio
27,07
P-Value
0,0001
0,0000
0,0021
0,0182
0,2073
0,3801
0,0725
P-Value
0,0000
Conclusin:
23
Bibliografa
-Apuntes de estadstica, Departamento de ingeniera de Organizacin, Administracin
de Empresas y Estadstica.
-Regresin y Diseo de Experimentos, Daniel Pea, Editorial Alianza (2002)
-Archivo histrico, acb.com, Aos 2008/2004
http://www.acb.com/stsacum.php?cod_competicion=LACB&cod_edicion=53&cod_fas
e=LR
24