Anda di halaman 1dari 2

Taller Modelo de Regresin Lineal

Estadstica II
Problema 1. El siguiente conjunto de datos era tomado sobre grupos de trabajadoras de

Inglaterra y Gals en el perodo de 1970-72. Cada grupo est formado por trabajadores de
la misma profesin (mdicos, trabajadores textiles, decoradores,...etc,) y en cada uno de
los veinticinco grupos muestreados se han observado dos variables: el ndice de
estandarizado de consumo de cigarrillos (variable regresora x) y el ndice de muertes por
cncer de pulmn (variable dependiente y). (Occupational mortality: the registar generals
decennial supplement for England and Wales, 1970-72, series Ds, n.1, London:HMSO,149).

1. Estudiar el modelo de regresin lineal del ndice de mortalidad frente al ndice de


fumadores interpretndolos parmetros estimados.
2. Calcular la tabla ANOVA. Conclusiones.
3. Realice las pruebas de significancia de los parmetros estimados.
4. Determine el coeficiente de determinacin e interprete su valor.
5. Comprobar si se verifican las hiptesis del modelo.
x
77
137
117
94
116
102
111
93
88

y
84
116
123
128
155
101
118
113
104

x
102
91
104
107
112
113
110
125

y
88
104
129
86
96
144
139
113

x
133
115
105
87
91
100
76
66

y
146
128
115
79
85
120
60
51

Problema 2. En el archivo Problema-5-10 se encuentran datos relativos a partidos de la liga

ACB de baloncesto. Se desea estudiar si existe alguna relacin lineal entre la variable,
puntos por partido (PUNTPART) que es capaz de anotar un jugador de baloncesto
respecto a las siguientes variables explicatorias:
- La altura del jugador (ALTURA).
- Los minutos que juega por partido (MINPART).
- Los balones que pierde por partido (BPPART).
- Las faltas personales cometidas por partido (FPPART).
- El porcentaje en tiros de campo por partido (porcentaje obtenido de los tiros de dos
y tres puntos conseguidos e intentados) (POR_TC).

(Recogida de datos: Los datos para realizar la regresin se han obtenido a partir de la Gua
Oficial Liga 1989-1990, de la ACB (Asociacin de Clubs de Baloncesto), para lo cual se han
seleccionado 62 jugadores al azar de entre el total.) En base a estos datos, se pide:
1. Ajustar un modelo de regresin a estos datos, sin excluir ninguna variable e
interpretar el resultado. Es el ajuste bueno?
2. Cree que pueda existir multicolinealidad en el modelo anterior?
3. Con el modelo anterior Cules son las observaciones atpicas y/o influyentes?
4. Puede existir un modelo de regresin lineal ms adecuado segn estos datos?
Justificar la respuesta.
5. Analice los supuestos del modelo.
Problema 3. En el archivo Problema-5-14

se presentan datos de contaminacin


atmosfrica en 41 ciudades de EEUU relativos a los aos 1969-71. La variable de inters es
Y =contenido deSO2 en el aire en microgramos por metro cbico y se desea estudiar su
relacin con seis variables regresoras, dos relativas a ecologa humana y cuatro al clima.
Son las siguientes:
X1=temperatura media anual en grados Farenheit.
X2=nmero de fbricas con ms de 20 empleados
X3=nmero de habitantes, en miles
X4=Velocidad media del viento al ao en millas por hora
X5=precipitacin media anual en litros por pulgada
X6=nmero medio de das con lluvia al ao

El objetivo del estudio es encontrar un modelo de regresin mltiple que explique


adecuadamente el comportamiento de la variable Y, mediante el proceso de seleccin de
variables:
a) hacia adelante, mostrando todos los pasos del algoritmo.
b) hacia atrs, mostrando todos los pasos del algoritmo.
Del modelo resultante, realice prueba de significancia del modelo, inferencia sobre los
parmetros estimados, validacin de los supuestos del modelo y determine la calidad de
ajuste.

Anda mungkin juga menyukai