Anda di halaman 1dari 27

Estadstica Aplicada a las Ciencias Polticas

3.2: Medidas numricas

Escaos

80
60
40
20
0
0

2E+06 4E+06 6E+06 8E+06 1E+07


Poblacin

Hemos visto que haba una relacin aproximadamente lineal entre


poblacin y escaos. Buscamos una medida de la fuerza de la relacin

Estadstica Aplicada a las Ciencias Polticas

La covarianza
La covarianza mide la fuerza de la relacin lineal entre dos
variables
La covarianza muestral puede calcularse mediante:

Una alta covarianza no implica efecto causal

Estadstica Aplicada a las Ciencias Polticas

Una frmula alternativa para la covarianza

Si tenemos que calcular la covarianza a mano, esta


frmula es ms fcil.

Estadstica Aplicada a las Ciencias Polticas

Interpretacin de la covarianza

La covarianza entre dos variables:


Cov(x,y) > 0:

X e Y tienden a moverse en la misma


direccin

Cov(x,y) < 0:

X e Y tienden a moverse en direcciones


opuestas.

Cov(x,y) = 0:

X e Y no estn relacionadas linealmente.

Estadstica Aplicada a las Ciencias Polticas

Inconveniente de la covarianza

En nuestro ejemplo, la covarianza es aproximadamente


36043027,5. Indica una relacin fuerte o no?

Cules son las unidades de la covarianza?


Cmo podemos corregir el problema?

Estadstica Aplicada a las Ciencias Polticas

La correlacin

-1<= r <= 1
r = 1: hay una relacin positiva perfecta
r = -1: hay una relacin lineal negativa perfecta
r = 0: no existe relacin lineal, datos incorreladas
En el ejemplo, r=0,967: una relacin fuerte y
positiva

Estadstica Aplicada a las Ciencias Polticas

r = -1

r = -.6

r=0
Y

r = +1

X
r = +.3

r=0

Estadstica Aplicada a las Ciencias Polticas

Clculo de la covarianza y correlacin mediante la tabla de


frecuencias conjuntas
Los siguientes datos son resultados de una encuesta
de alumnos de polticas sobre la asignatura de
estadstica.
Cantidad de trabajo hecho

Satisfaccin
con el
profesor

5 Total

14

16

15

20

10

10

17

17

18

72

Total

Estadstica Aplicada a las Ciencias Polticas

Correlacin y relaciones no lineales

En ambos grficos se ha usado la relacin y=x2. Una fuerte relacin no lineal!

Estadstica Aplicada a las Ciencias Polticas

Correlacin y causalidad I

Estadstica Aplicada a las Ciencias Polticas

Correlacin y causalidad II
Homero: No hay siquiera un oso a la vista. La "patrulla anti-osos" funciona de
maravilla!
Lisa: Eso es un razonamiento falaz, Pap.
Homero [sin comprender]: Gracias, hija.
Lisa: Usando tu lgica, yo puedo afirmar que esta roca aleja a los tigres.
Homero: Hmmm, y cmo funciona?
Lisa: No funciona. (pausa) Es slo una roca estpida!
Homero: Aj.
Lisa: Pero no veo ningn tigre alrededor, y t?
Homero: ( . . . pausa . . . ) Lisa, quiero comprar tu roca.

Estadstica Aplicada a las Ciencias Polticas

La recta de regresin
(x1, y1), (x2, y2),...,(xN, yN) : N pares de puntos observados
Hemos de encontrar una recta: y = + x que se ajuste lo mejor
posible a nuestros puntos:

Estadstica Aplicada a las Ciencias Polticas

Cmo ajustar la recta?


Queremos predecir la variable y en funcin de la variable x.
Si usamos una recta y = + x, entonces los residuos o errores de
prediccin son ri = yi - - xi para i = 1,,N.
Intentamos minimizar el error.
Usamos el criterio de mnimos cuadrados: elegimos la recta que
minimiza ri2
La recta de mnimos cuadrados es y = a + bx
donde b es la pendiente de la recta y a es el intercepto:

Estadstica Aplicada a las Ciencias Polticas

Demostracin

Estadstica Aplicada a las Ciencias Polticas

Escaos

Escaos y poblacin:
La recta de regresin ajustada

80
60
40
20
0
0

2000000

4000000

6000000

Poblacin

8000000

10000000

Estadstica Aplicada a las Ciencias Polticas

Output de Excel

Intercepcin
Variable X 1

Coeficientes
2,692069443
6,68437E-06

La recta ajustada es y = 2,69+0,0000069x

Estadsticas de la regresin
Coeficiente de correlacin mltiple
0,96372808
Coeficiente de determinacin R^2
0,928771813
R^2 ajustado
0,92458192
Error tpico
4,544275594
Observaciones
19

Cmo
predecimos el
nmero de
escaos en una
comunidad de
1000000 de
personas?
Y en una
comunidad sin
gente? Tiene
sentido la
prediccin?

Estadstica Aplicada a las Ciencias Polticas

Anlisis de los residuos I: la media y varianza residual


Se puede demostrar que la media de los residuos es 0.

Estadstica Aplicada a las Ciencias Polticas

y se puede calcular la varianza residual

Cmo interpretamos esta expresin?

Estadstica Aplicada a las Ciencias Polticas

Curva de regresin ajustada


70
60
50
Y

30

Pronstico para Y

40

20

10
0
0

2E+06 4E+06 6E+06 8E+06 1E+07


X

Estadstica Aplicada a las Ciencias Polticas

Anlisis de los residuos II: grficos

Si la recta de regresin se ajusta bien, los residuos deben aparecer como


ruido aleatorio sin relacin ninguna con x o y.

Grfico de los residuos frente a x


Parece bien
el ajuste?

15

Residuos

10
5
0
-5

2000000

4000000

6000000

-10
X

8000000

10000000

Estadstica Aplicada a las Ciencias Polticas

Ejercicio (Test 2: 2008-2009)


Se ha realizado una encuesta a 474 empleados de una compaa multinacional. Entre
los datos recogidos consta el salario anual (en miles) y los aos de educacin. Al
realizar el diagrama de dispersin asumiendo que el salario depende de los aos de
educacin se observa la siguiente nube de puntos:

Seala cual de las siguientes opciones


es la correcta:
a) La covarianza debe ser positiva y la
correlacin negativa.
b) La covarianza debe ser positiva y la
correlacin positiva.
c) La covarianza debe ser negativa y la
correlacin negativa.
d) La covarianza debe ser negativa y la
correlacin positiva.

Salario anual (en miles)

Diagrama de dispersin
160.000
140.000
120.000
100.000
80.000
60.000
40.000
20.000
0.000
0

10

15

Aos de educacin

20

25

Estadstica Aplicada a las Ciencias Polticas

Ejercicio (Test 2: 2008-2009)


Se ha realizado una encuesta a 474 empleados de una compaa multinacional. Entre
los datos recogidos consta el salario anual (en miles) y los aos de educacin.
Suponiendo Y=Salario, X=Aos de educacin
Varianza X = 8,305

Varianza Y = 290,963 Covarianza = 32,471

Seala cual es el valor correcto de la correlacin:


a)
b)
c)
d)

-0,53
0,066
-0,662
0,662

Estadstica Aplicada a las Ciencias Polticas

Ejercicio (Test 2: 2008-2009)


En una oficina se desea conocer el grado de satisfaccin de los empleados. Para ello
se realiza un cuestionario de satisfaccin a 10 de ellos y se les pide que valoren, en una
escala contina de 0 a 10, el ambiente en su puesto de trabajo. El valor 0 identifica un
psimo ambiente de trabajo y el 10 identifica un inmejorable ambiente de trabajo.
Adems se recoge la edad de los empleados.
Asumiendo que la valoracin depende de la edad se ha estimado la recta de regresin
obtenindose:

y i

6.13

0.087 x i

Ahora se deseara conocer cual es la valoracin media para un nuevo trabajador cuya
edad es 43 aos. Di cual de las siguientes opciones es la correcta:
a)
b)
c)
d)

2.19 puntos
2.39 puntos
4.69 puntos
-2.05 puntos

Estadstica Aplicada a las Ciencias Polticas

Ejercicio (Test 2: 2010-2011)


Los siguientes grficos muestran los niveles de satisfaccin con el lder de la oposicin
(lado izquierdo) y el primer ministro (lado derecho) como funcin del voto preferido.

Cul de las siguientes frases es la correcta?


a)
b)
c)
d)

En ambos casos, la correlacin entre satisfaccin y voto preferido es negativa.


La correlacin con el voto preferido es ms alta para el lder de la oposicin.
La correlacin es ms alta en el caso del primer ministro.
El pendiente es igual para ambas rectas de regresin.

Estadstica Aplicada a las Ciencias Polticas

Ejercicio (Test 2: 2010-2011)


El diagrama muestra el nivel de la deuda Americana como funcin del precio de oro.

La frmula para la recta de regresin es:


PRECIO DE ORO (nominal) = -522,86 +
(0,1334 * deuda en $ billones)
Si la deuda Americana es de $19000 billones,
calcular la prediccin para el precio de oro.
a)
b)
c)
d)

2011,74
3057,46
2933,14
-520,3254

Estadstica Aplicada a las Ciencias Polticas

Ejercicio (Examen: 2010)


El siguiente grfico muestra la relacin ente el riesgo argentino (LPRI) y el PBI (LPBI).

Seala cul de los siguientes es lo correcto?


a) La lnea de regresin es LPRA = 3,15+2,5
LPBI.
b) La correlacin entre LPRA y LPBI es igual a
cero.
c) La correlacin entre LPRA y LPBI es
negativa.
d) Ninguno de los anteriores.

Estadstica Aplicada a las Ciencias Polticas

Ejercicio (Examen: 2009)


El grfico siguiente muestra los niveles de conocimiento de Griego y de Latn para 10
jueces. Llamamos Y al nivel de conocimiento de Griego y X al nivel de conocimiento de
Latn. Si utilizamos la nota de Latn para determinar la nota en Griego mediante una
recta de regresin, observando el diagrama de dispersin, cul de las opciones
mostradas abajo podra ser la recta correcta?

a)
b)
c)
d)

Y=1.97+0.64X
Y=1.97-0.64X
Y=-1.97+0.64X
Y=-1.97-0.64X

Anda mungkin juga menyukai