Anda di halaman 1dari 16

ESTADISTICA ADMINISTRATIVA II

Ing. William Snchez Constantino | COPU 3a | Regresin Lineal y Correlacin

INTRODUCCION
Datos Bivariados:
Datos muestrales apareados

Relacin Lineal:
Cuando se grafican los puntos bivariados se aproximan a un patrn de lnea recta.

INTRODUCCION
Correlacin:
Existe entre dos variables cuando una de ellas se relaciona con la otra de alguna manera

Diagrama de Dispersin:
Grfica en la que datos muetrales apareados (x,y) se grafican en un eje x horizontal y un eje y vertical. Cada par individual se grafica como un solo punto

INTRODUCCION
mientras una variable crece, la otra disminuye? ejemplo A mayor cantidad de barcos, mayor cantidad de manates muertos?
MANATEE DEATHS FROM BOATS

Patrn:

90 80 70 60 50 40 30 60 70 80 REGISTERED BOATS 90

DIAGRAMAS DE DISPERSION
Correlacin Positiva entre y y x (r=1).

Correlacin Alta Positiva entre y y x (r=1).


Correlacin Positiva perfecta entre y y x (r=1). Correlacin Negativa entre y y x (r=-1). Correlacin Alta Negativa entre y y x (r=-1). Correlacin Negativa Perfecta entre y y x (r=-1). Sin Correlacin entre y y x (r=0). Relacin no lineal entre y y x.

COEFICIENTE DE CORRELACION LINEAL


Mide la fuerza de la relacin lineal entre los valores cuantitativos apareados (x,y) en una muestra. Tambin se conoce como coeficiente de correlacin producto momento de Pearson (Honor a Karl Pearson). =
[ 2 ) ( )( ) 2 [ 2 ) 2 ]

n= nmero de pares de datos presentes. -1 r 1 r 0 No hay correlacin lineal significativa. r 1 o -1 Hay una correlacin lineal significativa entre x y y. ejercicio

PROPIEDADES DEL COEFICIENTE DE CORRELACION


El valor de r siempre est entre -1 y 1. El valor de r no cambia si todos los valores de cualquier variable se convierten a una escala diferente El valor de r no se afecta por la eleccin de x o y. r mide la fuerza de una relacin lineal. (Ojo: solo lineal) Ejemplo.

SUPUESTOS
1. La muestra de datos apareados (x,y) es una muestra aleatoria de datos cuantitativos. 2. Los pares de datos (x,y) tienen una distribucin normal bivariada (para cualquier valor fijo de x, los valores correspondientes de y contengan una distribucin en forma de campana y para cualquier valor fijo de y los valores de x tengan tambin una distribucin en forma de campana).

INTERPRETACION DE R: VARIACION EXPLICADA


Si hay una correlacin lineal significativa podremos obtener una ecuacin lineal que exprese y en trminos de x. La ecuacin de regresin se utiliza para predecir valores de y a partir de valores dados de x.
90 80 MANATEE DEATHS FROM BOATS

y = 2.2741x - 112.71

70

60 Series1 50 Linear (Series1)

40

30 60 70 80 90 REGISTERED BOATS

CENTROIDE
Dado un conjunto de datos bivariados x,y (apareados), el punto ( , ) se denomina centroide. Si los puntos del diagrama de dispersin tienden a aproximarse a una lnea positiva, los valores individuales del producto (x )(y-) tienden a ser positivos debido a que la mayoria de los puntos se encuentran en el primero y tercer cuadrante.
regres
90 MANATEE DEATHS FROM BOATS centroide 80 70 60 50 40 30 60 70 80 REGISTERED BOATS 90

Linear (regres)

CAMBIO MARGINAL
Es la cantidad que cambia cuando la otra variable cambia exactamente una unidad. La pendiente en la ecuacin de regresin representa el cambio marginal que ocurre en y cuando x cambia una unidad.
regres 90 centr oide Linear (regre s)

80 MANATEE DEATHS FROM BOATS

y = 2.2741x - 112.71

70

60

50

40

30 60 70 80 90 REGISTERED BOATS

RESIDUAL
Es la diferencia entre un valor muestral observado y el valor de que es el valor de y predicho por medio de la ecuacin de regresin. Residuo = y observada y predicha =

DESVIACION TOTAL, VARIACION EXPLICADA Y SIN EXPLICAR


Desviacin total (a partir de la media) del punto (x,y) es la distancia vertical , que es la distancia entre el punto (x,y) y la recta horizontal que pasa por la media muestral . Desviacin explicada es la distancia vertical , que es la distancia entre el valor predicho y la recta horizontal que pasa por la media. Desviacin sin explicar es la distancia vertical , que es la distancia vertical entre el punto (x,y) y la recta de regresin. (Residual).

DESVIACION TOTAL, VARIACION EXPLICADA Y SIN EXPLICAR


Existe correlacin lineal significativa Ecuacin de la recta de regresin La media de y es 9 Uno de los pares de datos muestrales es (5,19) Desviacin explicada: existe una correlacin lineal significativa que est mejor descrita por la recta de regresin. variacin Total ( ) = ( ) + ( ) =

COEFICIENTE DE DETERMINACION
Un valor predicho de y no ser necesariamente el resultado exacto porque hay otros factores, a parte de x, que afectan a y. El valor de 2 es la proporcin de la variacin de y que se explica por la relacin lineal entre x y y. 2 =

ERROR ESTNDAR DEL ESTIMADO


Es una medida de las diferencias (o distancias) entre los valores muestrales de y observados y los valores predichos que se obtienen por medio de la ecuacun de regresin.

()2 2

Anda mungkin juga menyukai