Anda di halaman 1dari 30

TEMA 3.

ANALISIS DE LA
VARIANZA
INDICE

 1. El modelo lineal general


 2. La lógica del ANOVA
 3. Modelos de ANOVA
 4. Análisis de la varianza de un factor
 4.1. Completamente aleatorizado
 4.2. De medidas repetidas
1. EL MODELO LINEAL GENERAL
 El término ANOVA procede de la expresión inglesa
ANalysis Of Variante
 Es la técnica de análisis de datos más utilizada en la
investigación psicológica
 Se utiliza cuando se quieren comparar las medias de
más de dos grupos y permite por tanto analizar la
relación entre una variable dependiente y una variable
independiente, cuando la VI tiene más de dos niveles.
 Problema de la replicación
 El ANOVA descompone la variabilidad de observada VD
en varios componentes
Variabilidad Variabilidad
Variabilidad debida a debida a
observada factores factores no
en la VD = tenidos en + controlados
cuenta (error)
3. MODELOS DE ANOVA
 No hay un solo modelo de ANOVA, vamos a ver como se clasifican
 Según el número de factores (VI)
 - 1 VI: ANOVA de un factor
 - 2 VI: ANOVA de dos factores
 Según el tipo de aleatorización: (forma en que los sujetos se
asignan a las condiciones)
 - Completamente aleatorizado
 - Aleatorizado en bloques
 - Medidas repetidas
 Según el muestreo de niveles:
 - De efectos fijos: se estudian todos los niveles
 - De efectos aleatorios: se aleatorizan los niveles, no hay interés
en niveles particulares de factor
 - Mixto
4.1. ANOVA DE 1 FACTOR
COMPLETAMENTE ALEATORIZADO
 1.- Hipótesis:
 Ho: µ1 = µ2 = … = µn (las medias poblacionales son iguales)
 H1: µj ≠ µj’ (alguna media es diferente)

 2.- Supuestos:
 - Independencia: las J muestras son aleatorias y las N observaciones
independientes entre si
 - Normalidad: las J poblaciones son normales
 - Homocedasticidad: esas J poblaciones tienen la misma varianza

 3.- Estadístico de contraste: F = MCinter / MCerror

Sumas de cuadrados Grados de Medias Cuadráticas


F
(SC) libertad (GL) (MC)
Intergrupos SCinter j-1 SCinter/glinter MCinter/MCerror
Error SCerror N-j SCerror/glerror
Total SCtotal N-1
ANOVA DE 1 FACTOR
COMPLETAMENTE ALEATORIZADO
 Comando Stata:
 oneway vd vi
 oneway vd vi, tabulate
 oneway vd vi, bon sid sch – (comparaciones
múltiples)
4.2. ANOVA DE 1 FACTOR DE MEDIDAS
REPETIDAS
 Usaremos este método cuando nuestro estudio implique mantener
constantes a todos los sujetos a través del estudio. Cada sujeto
pase por cada uno de los niveles del factor (VI).

 Ventaja: su economía, es necesario un menor número de sujetos


 Inconveniente: habrá mayor fatiga de estos sujetos, o incluso un
efecto de la práctica (en determinados casos). Esta última
desventaja se puede controlar por contrabalanceo del orden de
presentación de las condiciones.

 Hay que replantear el modelo que describe los resultados.


yi = µ+αj +βi + εij
 yi es la puntuación observada
 µ corresponde a la media poblacional
 αj es el efecto diferencial de la variable explicativa
 βi se refiere al efecto debido a la variación entre los sujetos
 εij el error correspondiente a cada observación.
4.2. ANOVA DE 1 FACTOR DE MEDIDAS
REPETIDAS
 Las fuentes de variabilidad que nos vamos a encontrar en este diseño serán:

Variabilidad VD = Variabilidad VI + Variabilidad participantes + Variabilidad error

 Variabilidad de la VI: la que existe entre los distintas niveles del factor (F).
 Variabilidad debida a los participantes: La variación de unos sujetos a otros (P)
 Variabilidad error: sería la parte no explicada (FxP)

 Supuestos de aplicación:
 - Normalidad: las poblaciones de donde se extraen las muestras son
normales
 - Homocedasticidad: estas poblaciones tienen la misma varianza
 - Esfericidad: independencia entre los αj, los βi y los εij. Es decir, los
tratamientos difieren (o no) los unos de los otros independientemente de los
sujetos sobre los que se aplican. Los sujetos tampoco interactúan con los
errores, por tanto las covarianzas entre las puntuaciones de cada par de
tratamientos son iguales.
4.2. ANOVA DE 1 FACTOR DE MEDIDAS
REPETIDAS
 1.- Hipótesis:
 Ho: µ1 = µ2 = … = µn (las medias poblacionales son iguales)
 H1: µj ≠ µj’ (alguna media es diferente)

 2.- Supuestos: independencia, normalidad, homocedasticidad y esfericidad

 3.- Estadístico de contraste: F = MCinter / MCerror

Fuente de variación Suma de Grados de Cuadrados medios F


cuadrados libertad
Entregrupos SCEG j-1 SCEG MCEG
MCEG  Fexp 
j 1 MCERROR
Entresujetos SCES n-1
Error SCERROR (j-i)(n-1) SCERROR
MCERROR 
( j  1)(n  1)
Total SCTOTAL N-1
 Un grupo de psicólogos quiere aplicar un programa para fomentar la
asistencia a clase en un determinado colegio. Para ello van a
comparar el número de faltas antes, durante y después de tal
programa.
Sujeto Faltas antes Faltas durante Faltas después
1 7 5 4
2 9 8 7
3 10 9 2
4 10 8 5

 VD: Número de faltas


 VI: momento (antes, durante, despues)

 ANOVA de 1 factor, medidas repetidas

 Ho: no hay efecto de la VI, no hay diferencias en el número de faltas


en los diferentes momentos
 H1: hay efecto de la VI
MEDIDAS REPETIDAS CON
STATA
 Vamos a utilizar la base de datos «repeated».
Pon en STATA:
 use http://www.ats.ucla.edu/stat/data/repeated_measures

 Son ocho sujetos a los que se les ha medido en


cuatro ocasiones
 Hasta ahora hemos trabajado con ficheros «wide», a
lo ancho, donde cada fila corresponde a un sujeto y
las columnas corresponden a las variables
 Para trabajar con diseños de medidas repetidas hay
que modificar el fichero y ponerlo en formato «long»
MEDIDAS REPETIDAS CON
STATA
 Formato wide
 4 variables que corresponden con la medición de la
variable en diferentes momentos
 1 variable id id y1 y2 y3 y4
1 3.5 4.5 7.5 7.5
2 6.5 5.5 8.5 8.5
3 3.5 4.5 7.5 9.5
4 3.5 3.5 6.5 8.5
5 1 2 5 10
6 2 3 6 10
7 2 4 5 9
8 2 3 6 11
MEDIDAS REPETIDAS CON
STATA
 Formato wide
 4 variables que corresponden con la medición de la
variable en diferentes momentos
 1 variable id id y1 y2 y3 y4
1 3.5 4.5 7.5 7.5
2 6.5 5.5 8.5 8.5
3 3.5 4.5 7.5 9.5
4 3.5 3.5 6.5 8.5
5 1 2 5 10
6 2 3 6 10
7 2 4 5 9
8 2 3 6 11
MEDIDAS REPETIDAS CON
STATA
 Para cambiar el formato de la base
 Comando : reshape
 Reshape long nuevavar, i (obser) j (subosberv)
 La variable que ponemos como observación debe estar ya
en el fichero (es la identificación del sujeto)
 La variable subobservación será la variable que en el nuevo
fichero informará de cual es el momento de la observación
 La nueva variable se crea con las variables que se repiten, y
se nombrará igual pero sin el número

 Reshape long y, i(id) j(momento)


MEDIDAS REPETIDAS CON
STATA
 Formato long id momento y
 1 variable id 1 1 3.5
 1 variable momento 1 2 4.5
 1 variable medida 1 3 7.5
1 4 7.5
2 1 6.5
2 2 5.5
2 3 8.5
2 4 8.5
3 1 3.5
MEDIDAS REPETIDAS CON
STATA
 Ahora que está en formato «long» se puede hacer el
anova de medidas repetidas.

 Comando: anova
 anova vd vi – anova completamente aleatorizado
 anova vd variableid vmomento, repeated (vmomento)
MEDIDAS REPETIDAS CON
STATA
Number of obs = 32 R-squared = 0.8825
Root MSE = 1.16496 Adj R-squared = 0.8265

Source Partial SS df MS F Prob > F

Model 214 10 21.4 15.77 0.0000

id 19.5 7 2.78571429 2.05 0.0957


momento 194.5 3 64.8333333 47.77 0.0000

Residual 28.5 21 1.35714286

Total 242.5 31 7.82258065

Between-subjects error term: id


Levels: 8 (7 df)
Lowest b.s.e. variable: id
MEDIDAS REPETIDAS CON
STATA
Repeated variable: momento
Huynh-Feldt epsilon = 0.4675
Greenhouse-Geisser epsilon = 0.4190
Box's conservative epsilon = 0.3333

Prob > F
Source df F Regular H-F G-G Box

momento 3 47.77 0.0000 0.0000 0.0000 0.0002


Residual 21

.
El ANOVA de medidas repetidas no presenta uno de los requisitos habituales en
las pruebas paramétricas: independencia, puesto que las mediciones que estamos
comparando son de las mismas personas.
De esta forma, al realizar el análisis se incluye una corrección del valor de la F (en
realidad tres posibles correcciones
En los tres casos son valores menores que uno que reducen el valor de la F evitando
la comisión de error tipo 1
1. LA INTERACCIÓN ENTRE FACTORES
 Hasta ahora hemos visto las siguientes fuentes de variación:
 - ANOVA entresujetos: factor ENTRE (VI) y ERROR
 - ANOVA intrasujetos: factor INTRA (VI), factor SUJETOS (S) e
interacción VI*S (ERROR)

 Consideramos ahora los grupos clasificados por dos variables


diferentes ANOVA entresujetos factorial. AHORA, tenemos 4 fuentes
de variación
 - factor ENTRE (A): variación debida al factor A. Su calculo y
grados de libertad son idénticos al ANOVA unifactorial
entresujetos
 - factor ENTRE (B): variación debida al factor B. Su cálculo y
grados de libertad son idénticos al ANOVA unifactorial
entresujetos
 - interacción A*B: corresponde a la interacción del factor A y B. Su
cálculo y grados de libertad es similar a la interacción A*S del
ANOVA intrasujetos
 - ERROR: se calcula de forma similar que en el ANOVA
unifactorial entresujetos
1. LA INTERACCIÓN ENTRE FACTORES
 En el ANOVA de 2 factores contrastamos varios grupos de hipótesis.
 - Contraste de hipótesis referente al factor A
 - Contraste de hipótesis referente al factor B
 - Contraste de hipótesis referente a la interacción

 Vamos a ver que diferentes efectos nos podemos encontrar en un ANOVA de


dos factores:
 - ¿Quiénes sacan mejor nota en selectividad: los chicos o las chicas?
 - ¿Quiénes sacan mejor nota en selectividad: los de ciencias o los de
letras?
 - ¿Quiénes tienen mejor nota en la rama de ciencias: los chicos o las
chicas?
 - ¿Quienes tienen mejor nota en la rama de letras: los chicos o las
chicas?

 Ej. Estudiamos el efecto del curso y el sexo en el rendimiento académico,


 - Efecto principal de rama: diferencias entre ciencias y letras
 - Efecto principal de sexo: las chicas tienen mayor rendimiento
 - Interacción: Si la mejora de puntuación en chicas sólo se verificara en
una de las ramas
1. LA INTERACCIÓN ENTRE FACTORES
 Efectos simples: Efecto de cada VI sobre cada nivel de la otra

 Ej. Nos fijamos en una de las variables (Rama), se pueden estimar dos efectos
simples:
 Comparar los valores de Ciencias para chicos y chicas 6 – 7
 Comparar los valores de Letras para la chicos y chicas: 8 – 5

 Ej. Nos fijamos en una de las variables (Sexo), se pueden estimar dos efectos
simples:
 Comparar los valores de Chicas para los alumnos de ciencias y letras 6 – 8
 Comparar los valores de Chicos para los alumnos de ciencias y letras 7– 5

Ciencias Letras

Chicas 6 8
Chicos 7 5
1. LA INTERACCIÓN ENTRE FACTORES

 Efectos principales: Efectos total de una VI, promediando a través de los


valores de la otra. Es como la acción global de cada variable, para ello se
analizan las diferencias entre las medias de los dos niveles de la variable
 - Efecto principal de la variable sexo: ¿hay diferencias entre chicos y
chicas?
 - Efecto principal de la variable rama: ¿hay diferencias entre ciencias y
letras?

 Interacción: Cuando el efecto de un factor sobre la VD depende de cual


sea el nivel del otro factor.

Ciencias Letras

Chicas 6 8 7
Chicos 7 5 6
6,5 6,5
1. LA INTERACCIÓN ENTRE FACTORES

 Nos podemos encontrar con diferentes


situaciones en un ANOVA de 2 factores.
 1. No hay ningún efecto:
1. LA INTERACCIÓN ENTRE FACTORES

 Nos podemos encontrar con diferentes


situaciones en un ANOVA de 2 factores.
 2. Efecto principal de UNA de las VI
1. LA INTERACCIÓN ENTRE FACTORES

 Nos podemos encontrar con diferentes


situaciones en un ANOVA de 2 factores.
 3. Efecto principal de las DOS VI pero sin
interacción
1. LA INTERACCIÓN ENTRE FACTORES

 Nos podemos encontrar con diferentes


situaciones en un ANOVA de 2 factores.
 4. Interacción sin efectos principales
1. LA INTERACCIÓN ENTRE FACTORES
 Nos podemos encontrar con diferentes situaciones en un ANOVA de
2 factores.
 5. Interacción y efectos principales

 Resumiendo:
 Cuando las líneas son paralelas: No hay interacción. Interpretamos
directamente cada VI en términos de su efecto principal
 Cuando las líneas no son paralelas: Hay interacción.
2. ANOVA DE DOS FACTORES
 1. Hipótesis:
 - Ho(A): μ1+ = μ2+ = … = μJ+
 Las J medias poblacionales correspondientes a los J niveles del factor
A son iguales

 -Ho(B): μ+1 = μ+2 = … = μ+Κ


 Las K medias poblacionales correspondientes a los K niveles del factor
B son iguales

 - Ho(AB): μjk - μj’k = μj+ -μj’+


 No hay efecto de interacción.

 2. Supuestos de aplicación:
 Independencia: Las muestras son aleatorias e independientes
 Normalidad: Las poblaciones de donde se extraen las muestras son
normales
 Homocedasticidad: Las poblaciones tienen, todas ellas, la misma
varianza
2. ANOVA DE DOS FACTORES
 Con STATA el comando sería:
 anova vd vi1 vi2 vi1*vi2
 anova vd vi1 ## vi2
 La tabla del análisis quedaría así.
Fuente de Suma de Grados de Cuadrados medios F
variación cuadrados libertad
Factor A SCA a-1 SCA CMA
CMA  FA 
a 1 CME
Factor B SCB b-1 SCB CMB
CMB  FB 
b 1 CME
Interacción SCI (a-1)(b-1) SCI CMI
CMI  FI 
(a  1)(b  1) CME
Error SCE N-ab SCE
CME 
n  ab
Total SCT N-1
2. ANOVA DE DOS FACTORES

Number of obs = 10 R-squared = 0.3712


Root MSE = 4.52769 Adj R-squared = 0.0567

Source Partial SS df MS F Prob > F

Model 72.6 3 24.2 1.18 0.3929

sexo#curso 72.6 3 24.2 1.18 0.3929

Residual 123 6 20.5

Total 195.6 9 21.7333333

Anda mungkin juga menyukai