Anda di halaman 1dari 28

UNIVERSIDAD NACIONAL JORGE BASADRE GROHMANN

FACULTAD DE INGENIERA
ESCUELA ACADMICO PROFESIONAL DE INGENIERA DE MINAS

Estadstica y probabilidades

REGRESIN
LINEAL Y
CORRELACIN
INTEGRANTES:
- COMPLETALOS WEXD
1. REGRESIN LINEAL
En estadstica la regresin lineal o ajuste lineal es un modelo matemtico
usado para aproximar la relacin de dependencia entre una variable
dependiente Y, las variables independientes Xi y un trmino aleatorio .
Este modelo puede ser expresado como:

= 0 + 1 1 + 2 2 + + +

Donde:

Yt: Variable dependiente, explicada o regresando.

X1, X2, , Xp: Variables explicativas, independientes o regresores.

0, 1, 2, , p: Parmetros, miden la influencia que las variables


explicativas tienen sobre el regrediendo.

Donde 0 es la interseccin o trmino constante, las i (i>0) son los


parmetros respectivos a cada variable independiente, y p es el nmero
de parmetros independientes a tener en cuenta en la regresin. La
regresin lineal puede ser contrastada en la regresin no lineal.

2. HISTORIA
La primera forma de regresin lineal documentada fue el mtodo de los
mnimos cuadrados que fue publicada por Legendre en 1805,
Gauss public un trabajo en donde desarrollaba de manera ms profunda
el mtodo de los mnimos cuadrados, y en dnde se inclua una versin
del teorema de Gauss-Mrkov.
El trmino regresin se utiliz por primera vez en el estudio
de variables antropomtricas: al comparar la estatura de padres e hijos,
donde result que los hijos cuyos padres tenan una estatura muy superior
al valor medio, tendan a igualarse a ste, mientras que aquellos cuyos
padres eran muy bajos tendan a reducir su diferencia respecto a la
estatura media; es decir, "regresaban" al promedio. La
constatacin emprica de esta propiedad se vio reforzada ms tarde con
la justificacin terica de ese fenmeno.
El trmino lineal se emplea para distinguirlo del resto de tcnicas
de regresin, que emplean modelos basados en cualquier clase
de funcin matemtica. Los modelos lineales son una explicacin
simplificada de la realidad, mucho ms giles y con un soporte terico
mucho ms extenso por parte de la matemtica y la estadstica.
Pero bien, como se ha dicho, se puede usar el trmino lineal para
distinguir modelos basados en cualquier clase de aplicacin.

3. SUPUESTOS DEL MODELO DE REGRESIN LINEAL

Para poder crear un modelo de regresin lineal es necesario que se


cumpla con los siguientes supuestos:

- Que la relacin entre las variables sea lineal.

- Que los errores en la medicin de las variables explicativas sean


independientes entre s.

- Que los errores tengan varianza constante.

- Que los errores tengan una esperanza matemtica igual a cero (los
errores de una misma magnitud y distinto signo son equiprobables).

- Que el error total sea la suma de todos los errores.

4. APLICACIONES DE LA REGRESIN LINEAL

4.1. Lneas de tendencia:

Una lnea de tendencia representa una tendencia en una serie de


datos obtenidos a travs de un largo periodo. Este tipo de lneas
puede decirnos si un conjunto de datos en particular (como por
ejemplo, el PIB, el precio del petrleo o el valor de las acciones)
han aumentado o no en un determinado periodo. Se puede dibujar
una lnea de tendencia a simple vista fcilmente a partir de un
grupo de puntos, pero su posicin y pendiente se calcula de
manera ms precisa utilizando tcnicas estadsticas como las
regresiones lineales. Las lneas de tendencia son generalmente
lneas rectas, aunque algunas variaciones utilizan polinomios de
mayor grado dependiendo de la curvatura deseada en la lnea.

4.2. Medicina:

En medicina, las primeras evidencias relacionando la mortalidad


con el fumar tabaco vinieron de estudios que utilizaban la regresin
lineal. Los investigadores incluyen una gran cantidad de variables
en su anlisis de regresin en un esfuerzo por eliminar factores que
pudieran producir correlaciones espurias.

En el caso del tabaquismo, los investigadores incluyeron el estado


socioeconmico para asegurarse que los efectos de mortalidad por
tabaquismo no sean un efecto de su educacin o posicin
econmica.

No obstante, es imposible incluir todas las variables posibles en un


estudio de regresin. En el ejemplo del tabaquismo, un hipottico
gen podra aumentar la mortalidad y aumentar la propensin a
adquirir enfermedades relacionadas con el consumo de tabaco. Por
esta razn en la actualidad las pruebas controladas aleatorias son
consideradas mucho ms confiables que los anlisis de regresin.
PROBLEMAS REGRESIN LINEAL SIMPLE

Problema 1:
Cinco nios de 2, 3, 5, 7 y 8 aos pesan, respectivamente, 14, 20, 32, 42, 44
kilos.
A) hallar la ecuacin de la recta de regresin de la edad sobre el peso.

B) Cul sera el peso aproximado de un nio de seis aos?

xi yi xi2 yi2 xi yi

2 14 4 19 6 28

3 20 9 40 0 60

5 32 25 1 0 24 16 0

7 42 49 1 7 64 29 4

8 44 64 1 9 36 35 2

25 15 2 15 1 5 3 20 89 4


= = = = .


= = . = . = .


= . = .

= . ( ) = . .
. = . ( ) = . + .
= . + . = .
Problema 2:

Un centro comercial sabe en funcin de la distancia, en kilmetros, a la que se


site de un ncleo de poblacin, acuden los clientes, en cientos, que figuran en
la tabla:

N. de Clientes (X) Distancia (Y)


8 15
7 19
6 25
4 23
2 34
1 40

a) Calcular el coeficiente de correlacin lineal


b) Si el centro comercial se situ a 2km, Cuntos clientes puede esperar?
c) Si desea recibir a 5 clientes, a que distancia del ncleo de poblacin
debe situarse?

xi yi xi yi xi2 yi2
8 15 120 64 225
7 19 133 49 361
6 25 150 36 625
4 23 92 16 529
2 34 68 4 1 156
1 40 40 1 1 600
28 156 603 170 4 496

28 156
= = 4.67 = = 26
6 6
170 4496
2 = 4.672 = 6.53 2 = 262 = 73.33
6 6
= 6.53 = 2.55 = 73.33 = 8.56
603
= 4.677 26 = 20.92
6
20.92
= = 0.96
2.55 8.56

Correlacin Negativa muy Fuerte:


20.92
4.67 = ( 26) = 0.29 + 12.09
73.33
= 0.29 2 + 12.09 = 11.51 12
20.92
26 = ( 4.67) = 3.2 + 40.96
6.53
= 3.2 5 + 40.96 = 24.96
Problema 3:

Las notas obtenidas por cinco alumnos en Matemticas y Qumicas son:

Matemticas Qumica
6 6.5
4 4.5
8 7
5 5
3.5 4

Determinar las rectas de regresin y calcular la nota esperada en Qumica para


un alumno que tiene 7.5 en Matemticas.

xi yi xi yi xi2 yi2
6 6. 5 36 42. 25 39
4 4. 5 16 20. 25 18
8 7 64 49 56
5 5 25 25 25
3. 5 4 12. 25 16 14
26. 5 27 153. 25 152. 5 152

26.5 27
= = 5.3 = = 5.4
5 5
153.25 152.5
2 = 5.32 = 2.56 2 = 5.42 = 1.3
5 5
152
= 5.3 5.4 = 1.78
5
5.4 = 0.7( 5.3) = 0.7 + 1.69
5.3 = 1.33( 5.4) = 1.33 1.882
= 0.7 7.5 + 1.69 = 6.94

Problema 4:

Un conjunto de datos bidimensionales (X, Y) tiene coeficiente de correlacin r =


0.9, siendo las medias de las distribuciones marginales = 1, = 2. Se sabe
que una de las cuatro ecuaciones siguientes corresponde a la recta de regresin
de Y sobre X:

y = -x + 2 3x - y = 1 2x + y = 4 y = x + 1

Seleccionar razonadamente esta recta.

Como el coeficiente de correlacin lineal es negativo, la pendiente de la recta


tambin ser negativa, por tanto, descartamos la 2 y 4.

Un punto de la recta ha de ser (media de X., media de), es decir, (1, 2).

2-1+2
2*1+2=4

La recta pedida es: 2x + y = 4.

Problema 5:

Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:

Estatura (X) Pesos (Y)


186 85
189 85
190 86
192 90
193 87
193 91
198 93
201 103
203 100
205 101
Calcular:

a) La Recta de regresin de Y sobre X


b) El Coeficiente de Correlacin.
c) El peso estimado de un jugador que mide 208 cm.

xi yi xi2 yi2 xi yi
186 85 34 596 7 225 15 810
189 85 35 721 7 225 16 065
190 86 36 100 7 396 16 340
192 90 36 864 8 100 17 280
193 87 37 249 7 569 16 791
193 91 37 249 8 281 17563
198 93 39 204 8 649 18 414
201 103 40 401 10 609 20 703
203 100 41 209 10 000 20 300
205 101 42 025 10 201 20 705
1 950 921 380 618 85 255 179 971

1950 921
= = 195 = = 92.1
10 10
380618 85255
2 = 1952 = 36.8 2 = 92.12 = 43.09
10 10
= 36.8 = 6.07 = 43.09 = 6.56
179971
= 195 92.1 = 37.6
10
92.1 = 1.02( 195) = 1.02 106.8
37.61
= = 0.94
6.07 6.56

= 1.02 208 106.8 = 105.36

Problema 6:
Un trabajo estadstico asignado a un grupo de estudio consiste en obtener un
modelo de regresin lineal a nivel descriptivo para predecir las ventas semanales
de un producto especfico en funcin de la publicidad de 10 semanas y el
respectivo nmero de unidades vendidas del producto. Los datos se dan en la
tabla que sigue:

Semana 1 2 3 4 5 6 7 8 9 10
Publicidad X 20 30 30 40 50 60 60 60 70 80
Ventas Y 50 73 69 87 108 128 135 132 148 140

Grafique los datos y describa su tendencia


Observamos que tiene una relacin lineal positiva entre el nmero de artculos
vendidos y el tiempo de publicidad por la radio semanalmente.

Obtenga la recta de regresin lineal simple de mnimos cuadrados


Se tiene que:
= 10
= 500
= 500
= 59400

2 = 28400 2 = 125360
500 1070
= =5 =
100 100
= 107
Una manera de calcular b es:
sXy nXY XY 10 59400 900 1070 59000
b= = = = = 1.7353
sXx nX 2 (X)2 10 8400 (500)2 34000

Por otro lado = = 107 1.7353 50 = 20.235


Por lo tanto, la recta de regresin de la muestra es: = . + .
El coeficiente de correlacin:
590
= = = 0.9705
18.439 32.9697

Donde son las desviaciones estndar de X e Y


respectivamente

Aplique la regresin para predecir la venta de una semana donde se haran


100 minutos de propaganda. Es confiable su prediccin?
Si 1 = 100 , = 20.235 + 1.7353 100 = 193.765. El valor de r es un primer
criterio para concluir que este pronstico es confiable, pero, la bondad de ajuste
de la recta a los datos se mide con 2 .

Segn la regresin obtenida si la publicidad de una semana cualquiera se


incrementara en 5 minutos, Cunto seria el incremento de las ventas?
Si la publicidad de una semana se incrementara en 5 minutos, entonces, las
ventas en promedio se incrementaran 5x2=10 unidades

Los ingresos (X) y los gastos (Y) mensuales en dlares de una muestra de
100 familias han dado los siguientes resultados:

x = 210, y = 200, sx2 = 2.56, sy2 = 2.56, = 0.96

Determine la recta de regresin de mnimos cuadrados de Y en X y


pronostique el gasto de una familia si en un mes cualquiera tiene $250 de
ingresos


Dado que, = entonces, 0.96 = 2.41.6 resultando =3.6864

3.6864
Por otro lado, = = = 0.64
s2x 5.76
La recta de regresin de mnimos cuadrados de Y en funcin X es:
= ( )
200 = 0.64( 210)
= 65.6 + 0.64
Si en un mes cualquiera una familia tiene un ingreso de $250, entonces, se
predice que su gasto sera
= 65.6 + 0.64 250 = $225.6

Si para el siguiente mes se predice el gasto de una familia en $257.6. A


cunto asciende su ingreso del mes?
Si = 257.6 , entonces, , por lo tanto su ingreso seria x=$300

Problema 7:
En una muestra de 5 obreros de una fbrica se han observado sus aos de
experiencia (X) y el tiempo que tardan en realizar una determinada tarea (Y). Los
datos se muestran en la tabla que sigue:
X 1 2 3 4 5
Y 8 9 4 3 3

Compruebe que la variacin total es igual a la variacin no explicada ms


la variacin explicada por la regresin de Y en X. Luego, exprese la
particin de la varianza de Y en porcentajes de las varianzas que componen
De los datos de la muestra se obtiene la siguiente ecuacin lineal de regresin
(por mnimos cuadrados)
( )2 ( )2 ( )2
8 8.6 +2.6 -0.6 +3.2 6.76 0.36 10.24
9 7.0 +3.6 +2.0 +1.6 12.96 4.00 2.56
4 5.4 -1.4 -1.4 0.0 1.96 1.96 0.00
3 3.8 -2.4 -0.8 -1.6 5.76 0.64 2.56
3 2.2 -2.4 +0.8 -3.2 5.76 0.64 10.24
27 0.0 0.0 0.0 33.20 7.60 25.60

Por otro lado, el cuadro, resulta la siguiente particin de la varianza Y


= +
5 5 5
2 )2
(1 ) = (1 + ( )2
=1 =1 =1
33.20 = 7.60 + 25.60

La varianza de Y expresada en porcentajes de sus varianzas componentes.


(varianzas relativas), se obtiene la identidad de suma de cuadrados entre SCT.
Esto es:
33.20 7.60 25.60
= +
33.20 33.20 33.20
1 = 0.23 + 0.77
La lectura de la particin de la varianza de Y es como sigue:
El 100% de la varianza (total) de Y se particiona en 23% de varianza no
explicada ms 77% de varianza explicada por la ecuacin de regresin de
Y en X obtenida.
Problema 8:
El ingreso anual disponible y los gastos de consumo (en dlares) de una
muestra de 10 familias de un barrio residencial de Lima fueron tabulados en el
cuadro que sigue.
Halle la recta de regresin del consumo (Y) con respecto al ingreso (X),
utilizando la transformacin.

Ingreso Consumo
20.000.000 18.000.000
14.000.000 15.000.000
35.000.000 30.000.000
23.000.000 16.000.000
12.000.000 9.000.000
5.000.000 7.000.000
7.000.000 7.000.000
14.000.000 15.000.000
30.000.000 26.000.000
25.000.000 23.000.000


Realizando la codificacin = 1000000 , = 1000000 se obtienen los siguientes
resultados:
= 185
= 166
= 3745

2 = 4289 2 = 3314
= 18.5, = 16.6
sXy nXY XY 10 3745 185 166
b= = = = 0.778
sXx nX2 (X)2 10 4289 (185)2

La recta de regresin de Y en X es:


= ( )
Donde = 0.778, = 18.5, = 16.6
Resultando:
= . + .

Problema 9:
Al estudiar la relacin entre los costos (X) y las ventas (Y) en dlares de ciertos
productos, se obtuvo la siguiente informacin de la muestra:
= 15, = 5, = 4, = 50, = 100, = 62 + 0.76

Si los costos se incrementaran en $3 y las ventas correspondientes se


incrementarn en 6$.
Cmo cambia la ecuacin de regresin dada?
Si = + 3, = + 6, la ecuacin de regresin de en es:
= ( ) o = ( )

= + 6 = 106,
Donde, = = 0.76, = + 3 = 53.Esto es:

106 = 0.76( 53)


100 = 0.76( 50)
Qu porcentajes de la varianza de las ventas es explicada por la
regresin de ventas sobre costos?

De , = s2 ,se obtiene , = 19,entonces, de , = =0.95
x

Si se hace la transformacin = + 3, = + 6,el coeficiente de correlacin


r=0.95 no cambia.Por lo tanto, el porcentaje de la varianza de Y(o de Y)
explicada por la regresin de Y en X( o de Y en X) es la misma:
2 = 0.952 = 0.9025

PROBLEMA 10:

Un gerente de recursos humanos desea determinar el salario que debe pagar a


cierta categora de obreros. Para determinar dicho salario que debe pagar a
cierta categora de obreros. Para determinar dicho salario se realiza un estudio
en el que intervienen las variables Salario Mensual (en miles de ptas.), Nivel de
Produccin Anual en la Empresa (en millones de ptas.) y Nivel de especializacin
Media del Trabajador (de 0 a 10). El gerente obtiene esta serie de resultados:

Se pide:

1. Calcular el plano de regresin lineal mnimo cuadrtico que explica el salario en


funcin de la produccin y del nivel de especializacin.

2. Estudia la validez de la funcin obtenida en el apartado anterior por medio de una


medida descriptiva. Cunto vale la varianza residual?

3. Calcula el coeficiente de correlacin parcial para dos variables explicativas.

4. Comenta los resultados. Qu salario se debera pagar si el nivel de produccin


fuese de 315 millones de ptas. y el nivel medio de especializacin de 6.6?

SOLUCIN:
1. Variable Y=Salario Xi=Produccin X2=Nivel de especializacin.
La tabla de clculos es:

La recta a construir
tendr la forma y*=
a+b1x1+b2x2 y para
calcular los
coeficientes de la
recta aparece un
Sistema de
Ecuaciones Come
ste:

Con estos datos el sistema de ecuaciones a resolver es:


1221.3 = 10a +2831.3b1 +57.6b2
350112.2 =2831.3a +822889.6 b1 +16570.0b2
7141.8 =57.6a +16570.0b1 +349.7b2

Que tiene por solucin a=56198 b1=0.158 b2=3.664. Por tanto, el plano de
regresin es: y*=56.198+0.158x1+3.664x2

Las medidas descriptivas que vamos a utilizar son el coeficiente de


determinacin y el de correlacin. Y definidas seran as:
El coeficiente de determinacin mltiple viene expresado como:

Donde s2 es la variable residual. Una expresin de la varianza residual que


simplifique el clculo es:

En este caso R2 =0.438 R=0.661 s2 =138.506

El coeficiente de correlacin parcial entre la variable dependiente y una variable


explicativa mide la fuerza de la relacin lineal entre ambas cuando eliminamos
el efecto lineal de las otras variables explicativas. Su resultado es:

Donde SCE (xi) es la variacin no explicada. Observando esta expresin vemos


que el coeficiente de determinacin parcial nos da el incremento relativo de la
variable aplicada. El coeficiente de correlacin parcial se consigue de la raz
cuadrada del coeficiente de determinacin. En este caso:

SCE(x1)=1582.51 SCE(x2)=1643.06 SCE(x1, x2)=1385.06 r2 =0.157 y r2 =0.124

y*=56.198+0.158*315+3.664*6.6=130.15

Problema 11:
Un banco estatal de cierto pas est estudiando la posibilidad de bajar los tipos
de inters para incentivar la inversin privada, y as abrir la posibilidad de
creacin de puestos de trabajo. Para ello contrasta los tipos de inters real de
diferentes pases con la inversin privada en los mismos, todo ello durante el
ltimo perodo. Obtenindose los resultados que aparecen reflejados en la
siguiente tabla:

Tipos de Inters (en tantos por uno)


a) Existe relacin lineal entre ambas variables? Razona la respuesta.
b) Construye la recta de regresin que explica la inversin en fluencia de los tipos
de inters real.
c) Cmo variara la inversin si se produce un incremento de una unidad en los
tipos de inters real? Raznalo sin necesidad de hacer ningn clculo.
d) Si el tipo de inters real baja de 0.18 a 0.09, cmo variara la inversin?

SOLUCIN: Para facilitar el seguimiento de los clculos necesarios para


resolver el problema construimos la siguiente tabla resumen: (variable X=tipo
de inters real; variable Y=inversin).
X (media)=0.151; Y (media)=94.6; sx=0.055; sy=56.248; sxy=-2.870
1. Para estudiar la relacin lineal entre las variables tipo de inters e inversin
utilizaremos el coeficiente de determinacin como medida descriptiva de este
hecho.
2. y* =237.863-948.760x
3. El incremento en una unidad de la variable independiente coincide con el valor
de la pendiente de la recta; en este caso el incremento ser de -
948.760(observamos que en este problema el incremento es ficticio pues 1 se
sale del recorrido de la variable independiente).
4. El incremento ser el producto entre la pendiente y la diferencia entre el tipo
de inters en los dos estados, es decir, aumenta en -948.760*(0.09-0.18)
=85.388miles de millones.

Problema 12:
La siguiente tabla muestra el nmero de grmenes patgenos por centmetro
cbico de un determinado cultivo segn el tiempo transcurrido:

a) Calcula la recta de regresin para predecir el nmero de grmenes por cm3


en funcin del tiempo.
b) Qu cantidad de grmenes por cm3 es predecible encontrar cuando hayan
transcurrido 6 horas? Es buena esa prediccin?
SOLUCIN:
a) Y = 19.81 + 6.74X, donde: X nmero de horas, Y nmero de
grmenes
b) (6) = 60.25 = 60 grmenes. Es una buena prediccin, puesto que (y 6
est cercano al intervalo de valores considerado.
Problema 13:

Se seleccion una muestra de 12 casas vendidas la semana pasada en una


ciudad de EUA. Puede concluirse que a medida que aumenta la extensin del
inmueble (indicada en miles de pies cuadrados), el precio de venta (en miles de
dlares) aumenta tambin?
Problema 14
A partir de los siguientes datos referentes a horas trabajadas en
un taller (X), y a unidades producidas (Y), determinar la recta de
regresin de Y sobre X, el coeficiente de correlacin lineal e
interpretarlo.

xi yi xi y i xi2 y i2
80 300 6 400 90 000 24 000
79 302 6 241 91 204 23 858
83 315 6 889 99 225 26 145
84 330 7 056 108 900 27 720
78 300 6 084 90 000 23 400
60 250 3 600 62 500 15 000
82 300 6 724 90 000 24 600
85 340 7 225 115 600 28 900
79 315 6 241 99 225 24 885
84 330 7 056 108 900 27 720
80 310 6 400 96 100 24 800
62 240 3 844 57 600 14 880

936 3 632 73 760 1 109 254 285 908

Correlacin positiva muy fuerte


Problema 15:
Se ha solicitado a un grupo de 50 individuos informacin sobre el
nmero de horas que dedican diariamente a dormir y ver la
televisin. La clasificacin de las respuestas ha permitido
elaborar la siente tabla.

x 6 7 8 9 10
y 4 3 3 2 1
(fi) 3 16 20 10 1

Se pide:
- Calcular el coeficiente de correlacin .
- Determinar la ecuacin de la recta de regresin de Y sobre
X.
- Si una persona duerme ocho horas y media, cunto cabe
esperar que vea la televisin?

xi yi fi xi fi xi2 fi y i fi y i2 fi xi y i fi
6 4 3 18 108 12 48 72
7 3 16 112 784 48 144 336
8 3 20 160 1280 60 180 480
9 2 10 90 810 20 40 180
10 1 1 10 100 1 1 10
50 390 3082 141 413 1078

Es una correlacin negativa y fuerte.


Problema 16:
La tabla siguiente nos da las notas del test de aptitud (X) dadas a
seis dependientes a prueba y ventas del primer mes de prueba (Y)
en cientos de euros
.
X 25 42 33 54 29 36
Y 42 72 50 90 45 48

Hallar el coeficiente de correlacin e interpretar el resultado


obtenido.
Calcular la recta de regresin de Y sobre X. Predecir las ventas
de un vendedor que obtenga 47 en el test.

xi yi xi y i xi2 y i2
25 42 625 1 764 1 050
42 72 1 764 5 184 3 024
33 50 1 089 2 500 1 650
54 90 2 916 8 100 4 860
29 45 841 2 025 1 305
36 48 1 296 2 304 1 728
209 347 8 531 21 877 13 617
Problema 17:

Una compaa desea hacer predicciones del valor anual de sus


ventas totales en cierto pas a partir de la relacin de stas y la
renta nacional. Para investigar la relacin cuenta con los siguientes
datos:

X Y
189 402
190 404
208 412
227 425
239 429
252 436
257 440
274 447
293 458
308 469
316 469

X representa la renta nacional en millones de euros e Y representa


las ventas de la compaa en miles de euros en el periodo que va
desde 1990 hasta 2000 (a mbos inclusive). Calcular:
La recta de regresin de Y sobre X.

El coeficiente de correlacin lineal e interpretarlo.

Si en 2001 la renta nacional del pas fue de 325 millones de euros.


Cul ser la prediccin para las ventas de la compaa en este
ao?
xi yi xi y i xi2 y i2
189 402 35 721 161 604 75 978
190 404 36 100 163 216 76 760
208 412 43 264 169 744 85 696
227 425 51 529 180 625 96 475
239 429 57 121 184 041 102 531
252 436 63 504 190 096 109 872
257 440 66 049 193 600 113 080
274 447 75 076 199 809 122 478
293 458 85 849 209 764 134 194
308 469 94 864 219 961 144 452
316 469 99 856 219 961 148 204
2 753 4 791 708 933 2 092 421 1 209 720
Problema 18:
La informacin estadstica obtenida de una muestra de tamao 12
sobre la relacin existente entre la inversin realizada y el
rendimiento obtenido en cientos de miles de euros para
explotaciones agrcolas, se muestra en el siguiente cuadro:

Inversin Rendimiento
(X) (Y)
11 2
14 3
16 5
15 6
16 5
18 3
20 7
21 10
14 6
20 10
19 5
11 6
Calcular:
La recta de regresin del rendimiento respecto de la inversin.
La previsin de inversin que se obtendr con un rendimiento de
1 250 000 .

xi yi xi y i xi2 y i2
11 2 121 4 22
14 3 196 9 42
16 5 256 25 80
15 6 225 36 90
16 5 256 25 80
18 3 324 9 54
20 7 400 49 140
21 10 441 100 210
14 6 196 36 84
20 10 400 100 200
19 5 361 25 95
11 6 121 36 66
195 68 3 297 454 1 163
MI PARTE MODIFIQUENLA PLIZ

Ejercicio 19

El nmero de horas dedicadas al estudio de una asignatura y la calificacin obtenida


en el examen correspondiente, de ocho personas es:

X Y
20 6.5
16 6
34 8.5
23 7
27 9
32 9.5
18 7.5
22 8
Se pide:

1- Recta de regresin de Y sobre X.


2- Calificacin estimada para una persona que hubiese estudiado 28 horas.


16 6 256 36 96
18 7.5 324 56.25 135
20 6.5 400 42.25 130
22 8 484 64 176
23 7 529 49 161
27 9 729 81 243
32 9.5 1024 90.25 304
34 8.5 1156 72.25 289
192 62 4902 491 1534
Ejercicio 20

En la tabla siguiente se indica la edad (en aos) y la conducta agresiva (medida en una escala de
cero a 10) de 10 aos.

Edad Conducta agresiva


6 9
6.4 6
6.7 7
7 8
7.4 7
7.9 4
8 2
8.2 3
8.5 2
8.9 1

1- Obtener la recta de regresin de la conducta agresiva en funcin de la edad.


2- A partir de dicha recta, obtener el valor de la conducta agresiva que correspondera a
un nio de 7,2 aos.

6 9 36 81 54
6.4 6 40.96 36 38.4
6.7 7 44.89 49 46.9
7 8 49 64 56
7.4 7 54.76 49 51.8
7.9 4 62.41 16 31.6
8 2 64 4 16
8.2 3 67.24 9 24.6
8.5 2 72.25 4 17
8.9 1 79.21 1 8.9
75 49 570.72 313 345.2