INTEGRANTES:
PARALELO:
4/3
AULA:
202
TUTOR:
PERIODO:
2014 - 2015
TERMINOS
VARIABLES
DEPENDIENTES
INDEPENDIENTES
En la terminologa que se emplea en regresin, a la variable que se va a predecir se le llama
variable dependiente. A la variable o variables que se usan para predecir el valor de la
variable dependiente se les llama variables independientes. Por ejemplo, al analizar el
efecto de los gastos en publicidad sobre las ventas, como lo que busca el gerente de
mercadotecnia es predecir las ventas, esto indica que las ventas sern la variable
dependiente.
COEFICIENTE
DE
CORRELACION,
COEFICIENTE
DE
coordenada de cada punto sera su nota en estadstica, mientras que la segunda sera su
nota en matemticas. As, obtendramos una nube de puntos la cual podra indicarnos
El siguiente diagrama resume el anlisis del coeficiente de correlacin entre dos variable:
COEFICIENTE DE DETERMINACIN
El objetivo principal del anlisis de regresin es proyectar el valor de la variable
dependiente conociendo o suponiendo valores para la variable independiente. La
confiabilidad de las proyecciones est dada por la confiabilidad de la ecuacin, la cual se
mide a travs del coeficiente de determinacin y de los errores de los coeficientes de
regresin. El coeficiente de determinacin (R2 ) nos dice qu tanto se ajusta la lnea de
regresin a los datos.
Para deducir este coeficiente se tiene en cuenta la figura 4.2 en donde se tiene la ecuacin
ajustada a unos datos. Para un valor dado de X se ha tomado el correspondiente valor de Y.
, puede descomponerse
en dos partes que son: la distancia entre el valor observado y el estimado con la ecuacin de
regresin
, es
decir:
Siendo:
: Distancia Total.
(4.4)
Lo cual indica que la SCT puede descomponerse en dos partes, una describe la variacin de
los residuos (SCR) y representa aquella parte de la SCT que no ha sido explicada por la
ayuda de X y la otra parte describe los valores ajustados de Y, es decir, representa aquella
porcin de la SCT que ha sido explicada por la regresin de Y sobre X.
Dividiendo la ecuacin 4.4 por SCT se obtiene:
Donde:
dado por
como estimador de
EJERCICIO:
Un presidente de la sociedad de
estudiar el costo de los libros de texto. l cree que hay una relacin entre el nmero de
pginas en el texto y el precio de venta del libro. Para proporcionar una prueba, selecciona
una muestra de ocho libros de texto actualmente en venta en la librera.
DATOS
Libro
Pginas
Precio ($)
Intr. a la Historia
500
84
lgebra
700
75
Intr.a la Psicologa
800
99
72
Mercadotecnia
400
69
Intr. a la Biologa
500
81
Fund. de Jazz
600
63
93
Dibuje
un diagrama de dispersin.
Libro
Pginas
Precio ($)
XY
X2
Y2
84
42,000
250,000
7,056
lgebra
75
52,500
490,000
5,625
99
79,200
640,000
9,801
72
43,200
360,000
5,184
Mercadotecnia
69
27,600
160,000
4,761
700
400
81
40,500
250,000
6,561
Fund. de Jazz
63
37,800
360,000
3,969
93
74,400
640,000
8,649
636
397,200
3,150,000
51,606
600
Intr. a la Enfermera800
Total
4,900
oscilan entre
mejor es el
Ejemplo
En el ejemplo tratado, se calcula con el fin de medir la fuerza de asociacin lineal existente
entre la concentracin de biomasa ( ) y la densidad ptica ( ). En este caso
, un
hiptesis alternativa
es equivalente a apoyar la hipteSis alternativa
. Para
deteminar si el coeficiente de correlacin poblacional es diferente de cero se deben
plantear las siguientes hiptesis:
el cual se distribuye
con
caso se estn estimando dos parmetros).
EJEMPLO
En este ejemplo la prueba se realiz con un nivel de significacin de 5%. Al reemplazar en la
estadstica
de
prueba
los
valores
estadstico calculado es
se
tiene
que
el
por
, para una prueba de dos colas, se puede concluir que la hiptesis nula
se debe rechazar; es decir existe una asociacin lineal entre la densidad ptica y la
concentracin.
Sea
Donde
suma de productos cruzados
suma de cuadrados de
suma de cuadrados de
donde
, y
covarianza entre
varianza poblacional de
. calculada como
con
Demostrar que
es dado por
cuyo valor calculado se debe comparar con los valores apropiados de la distribucin normal
estndar.
Cuando la nube de puntos adopta una forma definida, se pueden aproximar sus puntos
mediante una lnea curva en general, que llamamos curva de regresin.
Slo nos ocuparemos del caso en el que la curva de regresin es una recta, llamada recta
de regresin. Nos centraremos entonces en calcular la ecuacin de una recta que "mejor
se adapte" a una nube de puntos dada. En los ejemplos anteriores lo hemos hecho a ojo,
ahora lo haremos con un criterio ms preciso.
Para ello existen varios mtodos, siendo el ms utilizado el de los mnimos
cuadrados. Consiste en hacer mnima la suma de los cuadrados de las diferencias
entre los valores experimentales y los obtenidos mediante la recta. Por lo tanto,
si consideramos la Y=aX+b, mediramos lo bien (o mal) que se ajusta a nuestros
puntos por medio de la cantidad
i=1 N ( y i ( a x i +b ) ) 2 = i=1 N ( y i a x i b ) 2
y la recta que estamos buscando es la que haga esta cantidad lo ms
pequea posible.
Una vez realizados los clculos correspondientes, se tiene que la ecuacin de la recta
de regresin es:
y y = xy x 2 (x x )
donde x y son las desviaciones tpicas de x e y.
Se comprueba que, como indicamos anteriormente, la recta obtenida pasa por el
punto (x, y) que coincide con el centro de gravedad de la nube de puntos.
Ejemplo:
Para el ejemplo de Pesos (kgs.) - Estaturas (cms.)
Peso en Kgs.
60
65
70
70
68
50
60
Altura en cms.
167
170
170
180
170
155
160
Frecuencias (ni)
y - y = 1.11(x-x )
atan (1.11) = 47,89
EJERCICIO
Temperatura
24
24
25
38
38
40
pH
6,9
6,8
6,6
6,7
6,7
6,6
6,6
6,5
Temperatura
45
50
55
56
60
67
70
78
pH
6,5
6,5
6,4
6,4
6,4
6,3
6,3
6,3
7.0
6.9
6.8
6.7
6.6
6.5
6.4
PH
6.3
6.2
0
20
40
60
80
Temperatura
V AR(X )
= p
V AR(X )V AR(Y )
V AR(Y )
SSxy
r= p
SSxx
SSxx
SSyy = p
SSyy
Un valor cercano o igual a 0 indica respectivamente poca o ninguna relacin lineal entre las
variables.
Cuanto ms se acerque en valor absoluto a 1 mayor ser el grado de aso- ciacin lineal entre
las variables. Un coeficiente igual a 1 en valor absoluto indica una dependencia lineal exacta entre
las variables.
Un coeficiente positivo indica asociacin lineal positiva, es decir, tienden a variar en el mismo
sentido.
Un coeficiente negativo indica asociacin lineal negativa, es decir, tienden a variar en sentido
opuesto.
Ntese que si 1 = 0 entonces r = 0 , en cuyo caso hay ausencia de linealidad. Por lo
tanto, contrastar si el coeficiente de correlacin lineal es significativamente distinto de 0 sera
equivalente a contrastar si 1 es significativamente distinto de cero, contraste que ya vimos en la
seccin anterior.
El coeficiente de determinacin
Segn hemos visto, el coeficiente de correlacin lineal puede interpretarse como una medida de la
bondad del ajuste del modelo lineal, concretamente, un valor del coeficiente igual a 1 o -1
indica dependencia lineal exacta, en cuyo caso el ajuste es perfecto.
No obstante, para
cuantificar la bondad del ajuste de un modelo, lineal o no, se utiliza una medida que se
denomina coeficiente de determinacin lineal R2 , que es la proporcin de variabilidad de la
variable Y que queda explicada por el modelo de entre toda la presente, y cuya expresin
es:
n
P
R2 =
(
y i y )2
=1
i=1
n
SSE
,
SSyy
(y i y
)2
i=1
que en modelo de regresin lineal coincide con el cuadrado del coeficiente de correlacin
lineal:
R2 = r 2
y = 0 + 1 x
Ambas cantidades estn sujetas a incertidumbre, que ser tanto mayor cuanto peor sea el
ajuste realizado mediante la recta de regresin. Para concluir el tema, establecemos un
intervalo de confianza para estas cantidades.
x)2
y t1/2,n2 ,
sR
(x
SSxx
Pieza
1
2
3
4
5
Presn (x)
1
2
3
4
5
Compresin (y)
1
1
2
2
4
Como el coeficiente de determinacin es igual a 0.81, las predicciones realizadas con la recta sern fiables en un 81%.
c. Determinar un Intervalo al 95% de confianza para el valor medio de compresin a una presin de 6 .
y t1/2,n2
sR
x)2
(6 3)2
(x
= 4.1 3.18 0.6
+
n
"
SSxx
10
= [2.1, 6.1]
BIBLIOGRAFIA
ESTADISTICA PARA ADMINISTRACION Y ECONOMIA 11AVA. EDICION
MARCHAL, MASSON.
http://www.ugr.es/~bioestad/_private/cpfund5.pdf
http://tarwi.lamolina.edu.pe/~fmendiburu/index-filer/academic/metodos1/Regresion.pdf
http://www.fao.org/docrep/003/x6845s/x6845s02.htm
http://www.uoc.edu/in3/emath/docs/RegresionLineal.pdf
http://www.inpahu.edu.co/tecnologias/Estadistica/analisis.html
http://www.uv.es/webgid/Descriptiva/6_coeficiente_de_determinacin.html
http://benasque.org/benasque/2005tae/2005tae-talks/232s5.pdf