TEMA 4
Caso
1
2
...
99
100
2010
Carmen Voces
40
35
30
25
20
15
10
5
0
35
30
25
10
Varn
Mujer
S
2010
No
Sexo (X)
Var
Varn
Mujer
Nombre
Francisco
Luc
Luca
...
In
Ins
David
Gnero (X)
Var
Varn
Mujer
...
Mujer
Var
Varn
Estr
Estrs
S
No
...
S
S
Asociacin y/o Relacin: dos variables estn relacionadas entre s, cuando ciertos
valores, de una de las variables, se asocian con ciertas valores de la otra variable.
En el ejemplo si sucede que cuando se tiene el valor varn en la variable gnero, hay
una incidencia mayor del valor s en la variable de estrs, y adems, cuando se tiene el
valor mujer en la variable gnero, hay una incidencia mayor del valor no en la variable
estrs, decimos que las variables gnero y estrs estn relacionadas. La asociacin o
relacin entre las variables gnero y estrs tambin podra ser al revs: los varones
tienden a no tener estrs y las mujeres tienden a tenerlo.
An existe otra opcin posible que puede darse en esta situacin: tanto los hombres
como las mujeres pueden estar equiparados en el estrs o no estrs. As, no existira
asociacin y/o relacin entre las variables consideradas
UNED
Introducci
TEMA 4
Introduccin al an
anlisis de datos
DOS VARIABLES CUALITATIVAS: TABLAS DE CONTINGENCIA
TEMA 4
Ejemplo: Hemos recogido los datos de una muestra de 100 sujetos con dos variables, X,
representa el gnero o sexo e Y el grado de estrs con dos categoras (s padece estrs o no
padece estrs). Se presenta a continuacin el principio y el fin del conjunto de datos
Estr
Estrs (Y)
S
No
30
10
25
35
55
45
40
60
100
2010
UNED
Introducci
TEMA 4
Introduccin al an
anlisis de datos
DOS VARIABLES CUALITATIVAS: ESTAD
ESTADSTICO X2
S
Sexo (X)
Var
Varn
Mujer
ne
30
25
55
2010
No
nt
22
33
ne
10
35
nt
18
27
45
nt(VarnS ) =
40 55
= 22
100
nt(VarnNo ) =
40 45
= 18
100
nt( Mujer S ) =
60 55
= 33
100
nt( Mujer No ) =
60 45
= 27
100
Estr
Estrs (Y)
Frecuencias
tericas
UNED
Introducci
Introduccin al an
anlisis de datos
CONCEPTOS PREVIOS
40
60
100
Sexo (X)
Var
Varn
Mujer
Estr
Estrs (Y)
S
No
-8
8
-8
8
UNED
Introducci
TEMA 4
Introduccin al an
anlisis de datos
DOS VARIABLES CUALITATIVAS: ESTAD
ESTADSTICO X2
UNED
Introducci
TEMA 4
Introduccin al an
anlisis de datos
DOS VARIABLES CUALITATIVAS: Coeficiente de contingencia, C
El coeficiente de contingencia, C, toma valores 0 C < 1. Su frmula es la siguiente:
X2 =
(ne nt )2
C=
nt
X2
X2 + n
10,78
= 0,312
10,78 + 100
En el ejemplo: C =
X2 =
18
33
Sexo (X)
Var
Varn
Mujer
ne
30
25
No
nt
22
33
ne
10
35
= 10,78
Estr
Estrs (Y)
S
27
El valor de C obtenido se puede comparar, dado que la Tabla de Contingencia tiene igual
nmero de filas que de columnas (k), con un C mximo definido como:
nt
18
27
Para resolver el problema que conlleva la interpretacin de la relacin entre dos variables, de
acuerdo al valor obtenido de X2, se ha definido el ndice o Coeficiente de Contingencia, C.
2010
UNED
Introducci
Introduccin al an
anlisis de datos
DOS VARIABLES CUALITATIVAS
TEMA 4
UNED
Y ( N
Nmero de aciertos en la identificaci
identificacin de
olores)
0
18
42
54
12
126
54
30
30
120
72
43
17
12
144
78
97
65
84
54
12
390
21
= 0,707
2
En el ejemplo, para k = 2: C mx =
Hemos considerado la asociacin entre dos variables cualitativas pero slo con dos valores
cada una de ellas. Las tablas de datos han sido de 2 x 2.
2010
Ejemplo: hemos recogido los datos de estas muestra de 390 sujetos con dos variables: X,
representa tres grupos de deterioro cognitivo (grupo control, deterioro leve y pacientes de
Alzheimer) e Y el nmero de aciertos en la identificacin de olores, con valores desde 0 a 5
aciertos.
k 1
k
Nuestro valor obtenido, C = 0,312, comparado con 0,707 (el C mximo) es casi la mitad. En
cuanto a la relacin, sta es cercana al tipo medio.
Relacin entre dos variables cualitativas cada una de ellas con ms de dos categoras.
Grupo control
X (Grupo
de deterioro Deterioro leve
cognitivo)
Alzheimer
C mx =
Introducci
Introduccin al an
anlisis de datos
DOS VARIABLES CUALITATIVAS
TEMA 4
Relacin entre dos variables cualitativas cada una de ellas con ms de dos categoras.
Y ( N
Nmero de aciertos en la identificaci
identificacin de olores)
0
X (Deterioro
cognitivo)
ne
nt
ne
nt
ne
nt
ne
nt
ne
nt
ne
nt
Grupo control
25,2
31,3
18
21,0
42
27,1
54
17,5
12
3,9
126
Deterioro leve
24,0
54
29,9
30
20,0
30
25,9
16,6
3,7
120
Alzheimer
72
24,8
43
35,8
17
24,0
12
31,0
19,9
4,4
144
78
X2 =
97
65
25,2
4,4
84
= 322,05 C =
54
X2
=
X2 + n
12
390
322,05
= 0,673
322,05 + 390
Ambos estadsticos indican que existe una relacin significativa entre los Grupos de deterioro
Cognitivo y el Nmero de Aciertos en la Identificacin de Olores. El Grupo control tiene el mayor
nmero de aciertos y no tiene ningn sujeto con menos de 2 aciertos. Los grupos con deterioro
no tienen ningn sujeto con ms de tres aciertos.
2010
2010
UNED
Introducci
TEMA 4
Introduccin al an
anlisis de datos
DOS VARIABLES CUALITATIVAS: Coeficiente de contingencia C
CARACTERSTICAS DEL COEFICIENTE C:
-
Cuanto mayor es el valor C, mayor es la relacin entre las dos variables, y al revs, cuanto
menor es el valor de C, menor es la relacin entre las dos variables. Si queremos utilizar el valor de
C para comparar la relacin entre las mismas variables, cuyos datos tenemos en dos tablas de
contingencia diferentes y son resultado de dos investigaciones distintas, tenemos que vigilar que ambas
tablas de contingencia tengan el mismo nmero de filas y de columnas y aproximadamente el mismo
nmero de datos. Si no tienen el mismo nmero de filas, de columnas, y aproximadamente el mismo
nmero de datos, los valores de C no permiten una comparacin vlida de la relacin de las variables en
ambas investigaciones
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
Y
Las frecuencias tericas, nt, sern
el producto del total de su fila por el
total de su columna dividido por la
frecuencia total, n.
nt =
Se puede estimar, en casos en que la tabla de contingencia tenga igual nmero de filas que de
columnas, un valor mximo que puede alcanzar C.
2010
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
2010
TEMA 4
UNED
1
2
3
insatisfecho normal muy satisfecho
nt =
2010
ni.
0 (No fuma)
13
10
12
35
1 (Fuma)
10
10
25
23
20
17
60
n.j
13
10
12
10
10
Tabla 2.
Variable X: Fumar; 0 = No fuma, 1 = Fuma.
Variable Y: Satisfaccin con proteccin medio
ambiente; 1 = insatisfecho, 2 = normal, 3 = muy
satisfecho
10
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
Aceptaci
Aceptacin
del
tratamiento
1
0
TEMA 4
UNED
nterica _ 13 =
X2 =
nt
Depresin
Trastorno de
personalidad
36
44
No
16
Tabla 2.
En una investigacin se estudi la aceptacin o
no del tratamiento psicolgico por parte de
pacientes que presentaban dos tipos de
trastornos psicolgicos. En la tabla de doble de
entrada se muestra la distribucin conjunta de
frecuencias absolutas de ambas variables
35 17
= 9,916
60
11
(ne nt )2
Trastorno psicolgico
2010
12
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
18. Con los datos de la Tabla 1, hemos obtenido un valor de X2, Chi cuadrado, igual a
6,352. El coeficiente C de Contingencia est
est comprendido entre:
a) 7,25
b) 0
c) 4,17
X2 =
(ne nt )2
nt
Trastorno de
personalidad
Depresin
ne
nt
ne
(4080)/10
32
48
32
8
Total
(36 32 )
32
(2060)/100
(44 48)
48
(4 8)
20
12
(16 12)
Divorciados
Nmero
de hijos
No
20
10
40
10
2 o ms
10
10
100
2
12
X2
X2 + n
80
60
2
C=
Total
48
12
8
40
nt
(8060)/100
(2040)/100
No
= 4,166 4,17
2010
13
UNED
a) 0,7 y 1
b) 0,4 y 0,7
c) 0,1 y 0.4
Trastorno psicolgico
Aceptacin
del
tratamiento
2 =
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
2010
14
TEMA 4
UNED
TEMA 4
18. Con los datos de la Tabla 1, hemos obtenido un valor de X2, Chi cuadrado, igual a
6,352. El coeficiente C de Contingencia est
est comprendido entre:
2 PARTE
Asociacin entre dos variables
cuantitativas
a) 0,7 y 1
b) 0,4 y 0,7
c) 0,1 y 0.4
C=
C=
X2
X2 + n
Divorciados
Nmero
de hijos
No
20
10
40
10
2 o ms
10
10
2010
15
Carmen Voces
UNED
Introducci
TEMA 4
Introduccin al an
anlisis de datos
DOS VARIABLES CUANTITATIVAS: Diagrama de Dispersi
Dispersin
UNED
X
4
8
10
12
16
Y
6
4
7
8
10
S XY =
Ni
Nio
1
2
3
4
5
10
9
8
7
6
5
4
3
2
1
0
0
10
11
12
13
14
15
16
17
17
Introducci
Introduccin al an
anlisis de datos
DOS VARIABLES CUANTITATIVAS: Covarianza
9
8
7
2,5
2
1,5
4
3
0,5
TEMA 4
X=
X
4
8
10
12
16
50
X = 50 = 10
i i
i =1
Y
6
4
7
8
10
35
XY
24
32
70
96
160
382
Y = 35 = 7
n
i =1
S XY =
Y =
X Y
XY
X Y
i i
S XY =
i =1
XY =
382
(10 7 ) = 6,4
5
La correlacin de Pearson es el segundo ndice que nos permite estudiar la posible relacin
lineal entre X e Y. El coeficiente de correlacin de Pearson entre dos variables X e Y, que
designaremos por rXY, viene definido de la siguiente manera.
rXY =
S XY
S X SY
rXY =
nXY XY
nX 2 ( X ) 2 nY 2 ( Y ) 2
1
0,5
0
0
COV ( X ,Y ) = S xy = 2
COV ( X ,Y ) = S xy = 3,6
COV ( X ,Y ) = S xy = 0
La covarianza presenta un grave problema, al igual que habamos visto para el coeficiente X2
(con variables cualitativas), desconocemos el rango de la covarianza. En este caso son los
valores mximos y mnimos que puede tener. Para evitar este problemas disponemos del
Coeficiente de Correlacin de Pearson, rXY.
2010
UNED
Introducci
TEMA 4
Introduccin al an
anlisis de datos
DOS VARIABLES CUANTITATIVAS: Correlaci
Correlacin de Pearson
2,5
)(
X Yi Y
3,5
4
3,5
1,5
2010
Podemos definir que la relacin lineal directa es la que asume que a valores mayores en una
de las variables, corresponden tambin valores mayores en la otra, y los valores menores en
una variable se corresponden con los valores menores en la otra.
Igualmente, definimos que la relacin lineal inversa es la que asume que a valores mayores
en una de las variables, corresponden valores menores en la otra variable y viceversa.
4,5
(X
2010
TEMA 4
La covarianza es el primer ndice que nos permite estudiar la posible relacin lineal entre X e
Y. El trmino covarianza hace referencia a la variacin conjunta de dos variables, y tanto por
su definicin como por su clculo, es un ndice que cuantifica la variabilidad conjunta de dos
variables. Se designa por Cov(X,Y), o por SXY.
11
UNED
Introducci
Introduccin al an
anlisis de datos
DOS VARIABLES CUANTITATIVAS: Covarianza
19
Ni
Nio
1
2
3
4
5
X
4
8
10
12
16
50
Y
6
4
7
8
10
35
X = 10
Y =7
S XY = 6,4
2010
XY
24
32
70
96
160
382
(X X )
SX =
=4
rXY =
(Y Y )
S XY
6,4
=
= 0,8
S X SY 4 2
SY =
=2
20
UNED
Introducci
TEMA 4
Introduccin al an
anlisis de datos
DOS VARIABLES CUANTITATIVAS: Correlaci
Correlacin de Pearson
UNED
Introducci
TEMA 4
Introduccin al an
anlisis de datos
DOS VARIABLES CUANTITATIVAS: Correlaci
Correlacin de Pearson
Relacin directa
Propiedades:
-1 rXY 1. Slo toma valores comprendidos entre -1 y 1. Valdr 0 cuando no exista
relacin lineal entre X e Y.
Relacin inversa
Para interpretar los resultados que se obtienen con el coeficiente de correlacin de Pearson
hay que tener en cuenta,
a) En primer lugar, el valor absoluto del coeficiente, cuanto mayor es el valor absoluto
ms fuerte es la relacin lineal entre las dos variables
b)
En segundo lugar, hay que tener en cuenta el signo del coeficiente de correlacin de
Pearson:
i.
ii.
2010
Relacin nula
22
UNED
Introducci
TEMA 4
Introduccin al an
anlisis de datos
DOS VARIABLES CUANTITATIVAS: Correlaci
Correlacin de Pearson
UNED
Introducci
TEMA 4
Introduccin al an
anlisis de datos
DOS VARIABLES CUANTITATIVAS: Correlaci
Correlacin de Pearson
Un coeficiente de correlacin lineal cercano a cero, indica que no existe relacin lineal entre
las variables, pero no excluye la posibilidad de que las variables tengan otras relaciones
entre s de carcter no lineal (por ejemplo, una relacin curvilnea).
Para analizar los valores de los coeficientes de correlacin de Pearson que elaboremos,
tenemos que tener en cuenta que no tienen una comparacin directa entre resultados de
estudios diferentes. Sabemos que rXY = 1 indica la correlacin lineal perfecta en cualquier
caso, y que rXY = 0 indica la ausencia total de correlacin lineal.
Es menos clara la situacin, cuando nos encontramos con un valor intermedio cualquiera, por
ejemplo, 0,55. No se puede afirmar que ese valor indica correlacin alta o baja. Depende del
tipo de datos que estemos analizando. Ser baja, si se trata de dos test similares, que
estemos aplicando a los mismos sujetos, o si tenemos pocos sujetos. Podra ser alta, si se
trata de test bastante diferenciados entre s, o si tenemos muchos sujetos. Un nmero grande
de sujetos en la muestra pueden tender a bajar el valor de los coeficientes de correlacin que
se obtienen. Los resultados de otros investigadores, con variables similares y muestras
equivalentes, son los que nos sirven de comparacin para evaluar los resultados que
obtengamos con nuestros datos. El coeficiente de correlacin evaluado ser bajo, si los
coeficientes de correlacin que obtienen otros investigadores en circunstancias similares, son
mucho ms altos. Y lo mismo se puede afirmar en la direccin contraria. Si nosotros
obtenemos unos coeficientes de correlacin mucho mayores que los encontrados por otros
investigadores en circunstancias similares, los nuestros sern muy elevados.
2010
23
Otro caso real, que sirve para ver la complejidad de deducir la causalidad entre dos variables,
cuando el coeficiente de correlacin es elevado. Por ejemplo, si se encuentra una alta
correlacin negativa entre el nmero de nios por mujer y los aos de escolarizacin de la
mujer en distintos pases. No se puede afirmar que la causa del tener menos hijos es que la
mujer tiene muchos aos de escolarizacin. No tiene que existir una relacin causal en la
correlacin. Puede existir una variable interviniente entre el nmero de hijos por mujer y los
aos de escolarizacin de ella. Una variable interviniente podra ser el tener las mujeres una
mayor libertad. Hay que ser muy cuidadoso en este aspecto para no afirmar como relaciones
causales las relaciones entre variables.
2010
24
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
a) 7,3
b) 9,6
c) 12,8
a) 7,3
b) 9,6
c) 12,8
(X
)(
X Yi Y
i =1
S XY =
i i
S XY =
i =1
XY
Y = 70
XY = 1528
X2 = 4640
Y2 = 530
Tabla 3.
Datos de las puntuaciones de 10 alumnos en
un test de autoestima (X) y la calificacin final
del curso (Y)
X Y
X
X = 200
XY
2010
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
XY
X = 200
Y = 70
XY = 1528
X2 = 4640
Y2 = 530
X Y
i i
S XY =
S xy
i =1
XY
1528
=
20 7 = 12,8
10
25
2010
TEMA 4
UNED
Tabla 3.
Datos de las puntuaciones de 10 alumnos en
un test de autoestima (X) y la calificacin final
del curso (Y)
26
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
16. Seg
Segn los datos de la situaci
situacin 1, el coeficiente de correlaci
correlacin de Pearson entre X e Y es:
16. Seg
Segn los datos de la situaci
situacin 1, el coeficiente de correlaci
correlacin de Pearson entre X e Y es:
a) -0,9
b) 0,9
c) 13,5
rXY =
S XY
S X SY
a) -0,9
b) 0,9
c) 13,5
rXY =
X =
X = 3000 = 30
Y =
Y = 600 = 6
X2 = 92500
SY = 3
S XY
XY = 19350
2010
100
100
XY
19350
=
XY =
30 6 = 193,5 180 = 13,5
n
100
rXY =
27
S XY
S X SY
2010
13,5
S XY
=
= 0,9
S X SY 5 3
28
UNED
Introducci
TEMA 4
Introduccin al an
anlisis de datos
DOS VARIABLES CUANTITATIVAS: Regresi
Regresin Lineal
Cuando existe una relacin lineal podemos utilizar la denominada recta de regresin para
efectuar pronsticos de los valores de una variable a partir de la otra variable. La ecuacin
general de una recta es de la forma: Y = a + bX. Donde b es la pendiente y a es la ordenada en
el origen.
UNED
Yi = a + bXi
a = Y bX
b=
X
4
8
10
12
16
50
Y
6
4
7
8
10
35
X2
16
64
100
144
256
580
XY
24
32
70
96
160
382
b=
a = Y bX = 7 0,4 10 = 3
YY
i ==aa++bbX
Xi ==330,4
Xi
0,4
0,4X
i
i
i
12
nXY XY
n X 2 ( X ) 2
Y (Calificacin en matemticas)
Introducci
TEMA 4
Introduccin al an
anlisis de datos
DOS VARIABLES CUANTITATIVAS: Regresi
Regresin Lineal
10
Yi = 3 0,4Xi
6
4
2
0
0
10
15
20
2010
UNED
29
Introducci
TEMA 4
Introduccin al an
anlisis de datos
DOS VARIABLES CUANTITATIVAS: Regresi
Regresin Lineal
2010
UNED
30
Introducci
TEMA 4
Introduccin al an
anlisis de datos
DOS VARIABLES CUANTITATIVAS: Regresi
Regresin Lineal
12
Nio
1
2
3
4
5
X
4
8
10
12
16
50
Y (Calificacin en matemticas)
Propiedades:
Puntuacin Puntuacin
Error
real
pronosticada
Y
Y=3 + 0,4X E = Y Y
6
4,6
1,4
4
6,2
-2,2
7
7,0
0,0
8
7,8
0,2
10
9,4
0,6
35
35
0,0
E = (Y Y ) = 0
i
'
i
2010
31
10
8
Yi
Residuo i
Yi
2
0
0
E i = Yi Yi'
2010
10
15
20
32
UNED
Introducci
TEMA 4
Introduccin al an
anlisis de datos
DOS VARIABLES CUANTITATIVAS: Regresi
Regresin Lineal
UNED
1.
Nio
1
2
3
4
5
Y =
X
4
8
10
12
16
50
(Y Y )
(Y Y)2
1
9
0
1
9
20
Y
6
4
7
8
10
35
35
=7
5
SY2 ' =
2
(Y 'Y ')
SY2 =
Puntuacin
Error
pronosticada
Y
Y Y
E = Y Y
E-E
5,76
1,96
4,6
1,4
0,64
4,84
6,2
-2,2
0
0
7,0
0,0
0,64
0,04
7,8
0,2
5,76
0,36
9,4
0,6
12,8
7,2
35
0,0
(E E )
12,8
= 2,56
5
2
SY2 = SY2 ' + SYX
2.
r2XY nos explica que podemos tomar el cuadrado del coeficiente de correlacin de Pearson
como el tanto por uno de varianza explicada (o proporcin de varianza explicada)
2 =
rXY
3.
20
=4
5
SY2 X =
2 =
1 rXY
4 = 2 , 56 + 1, 44
7,2
= 1,44
5
2010
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
SY2 '
SY2
1 r2XY nos explica que podemos tomar el resto a uno del cuadrado del coeficiente de
correlacin de Pearson como el tanto por uno, de la varianza no explicada en la regresin
lineal
2
SY
SX
El signo del coeficiente de correlacin de Pearson nos dice si la relacin lineal entre
variables es directa, inversa, pues el signo del coeficiente de X en la frmula de regresin
es el mismo del coeficiente de correlacin de Pearson. Las desviaciones tpica siempre son
positivas
SY = SY ' + SYX
Puntuacin real
Introducci
TEMA 4
Introduccin al an
anlisis de datos
DOS VARIABLES CUANTITATIVAS: Regresi
Regresin Lineal
33
2010
TEMA 4
UNED
SY X
SY2
34
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
a) Y
Y = -3 + 0,8X
b) Y
Y = -17 + 0,24X
c) Y
Y = 0,24X 10
a) Y
Y = -3 + 0,8X
b) Y
Y = -17 + 0,24X
c) Y
Y = 0,24X 10
Media
YY
i ==aa++bbX
Xi
i
i
b = rXY
SY
SX
a = Y bX
2010
Desviacin Covarianza
tpica
100
10
Media
YY
i ==aa++bbX
Xi ==--17
17 ++0,24
Xi
0,24
0,24X
i
24
rXY
Tabla 1.
Para estudiar la relacin entre las puntuaciones
en un test (X) y el rendimiento obtenido en una
asignatura (Y) se utiliza una muestra de 500
nios (n = 500), obtenindose los siguientes
resultados
35
S
24
= XY =
= 0,08
S X SY 10 3
b = rXY
SY
3
= 0,8 = 0,24
SX
10
a = Y bX = 7 0,24 100 = 17
2010
Desviacin Covarianza
tpica
100
10
24
Tabla 1.
Para estudiar la relacin entre las puntuaciones
en un test (X) y el rendimiento obtenido en una
asignatura (Y) se utiliza una muestra de 500
nios (n = 500), obtenindose los siguientes
resultados
36
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
a) 0,80
b) 0,64
c) 0,89
2
rXY
= XY
S
S
X Y
a) 0,80
b) 0,64
c) 0,89
2
XY
X = 200
Y = 70
XY = 1528
X2 = 4640
Y2 = 530
Tabla 3.
Datos de las puntuaciones de 10 alumnos en
un test de autoestima (X) y la calificacin final
del curso (Y)
2010
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
2
rXY
S
= XY
S X SY
12,8
=
= 0,802 = 0,64
82
S X2 =
X 2
n
X = 64
SY2 =
Y 2
n
Y = 4
37
2010
TEMA 4
UNED
XY
X = 200
Y = 70
XY = 1528
X2 = 4640
Y2 = 530
Tabla 3.
Datos de las puntuaciones de 10 alumnos en
un test de autoestima (X) y la calificacin final
del curso (Y)
38
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
a) 0,50
b) 1,05
c) 0,20
a) 0,50
b) 1,05
c) 0,20
nXY XY
b=
n X 2 ( X ) 2
X = 200
Y = 70
X2 = 4640
Y2 = 530
XY
XY = 1528
Tabla 3.
Datos de las puntuaciones de 10 alumnos en
un test de autoestima (X) y la calificacin final
del curso (Y)
2010
39
nXY XY
b=
n X 2 ( X ) 2
b=
10 1528 200 70
10 4640 (200 )
b = 0,20
2010
1280
6400
XY
X = 200
Y = 70
XY = 1528
X2 = 4640
Y2 = 530
Tabla 3.
Datos de las puntuaciones de 10 alumnos en
un test de autoestima (X) y la calificacin final
del curso (Y)
40