1
El uso del celular mientras manejamos
disminuye tiempos de reaccin?
Un artculo en Psych. Science (2001, p. 462) describe un
experimento que asigna aleatoriamente 64 estudiantes de
la Univ. de Utah al grupo de telfonos celulares o al grupo
control (32 cada uno). Una mquina simuladora de manejo
present una luz roja o verde a periodos irregulares.
Instrucciones: Presionar el pedal del freno tan pronto como
sea posible cuando se detecta la luz roja.
Ver http://www.psych.utah.edu/AppliedCognitionLab/
3
4
Tipos de variables y muestras
5
Se utilizan diferentes mtodos para muestras
dependientes (parejas naturales entre un sujeto en una
muestra y un sujeto en otra muestra, tales como
estudios longitudinales, donde se observan sujetos
repetidamente a travs del tiempo) y muestras
independientes (muestras, no hay parejas, como en un
estudio transversal).
Ejemplo: Ms adelante consideramos experimentos
separados en donde el mismo sujeto form parte del
grupo control en un momento y al grupo de celular en
otro momento.
6
Ejemplo: Estudio de anorexia, estudiando el cambio en
el peso para 3 grupos (terapia de comportamiento,
terapia familiar, control)
7
se para diferencia entre dos estimaciones
(muestras independientes)
La distribucin muestral de la diferencia entre dos
estimaciones es aproximadamente normal (n1 y n2 grandes)
y tiene error estndar estimado
se (se1 )2 (se2 )2
8
se1 s1 / n1 89.6 / 32 15.84
se2 s2 / n2 65.3/ 32 11.54
se ( se1 ) 2 ( se2 ) 2 (15.84) 2 (11.54) 2 19.6
(Nota que es ms grande que cada se por separado. Por qu?)
12
Comentarios sobre ICs para la diferencia entre dos
proporciones poblacionales
Si el IC del 95% para 2 1 es (0.01, 0.03), entonces
el IC del 95% CI para 1 2 es (-0.03, -0.01). Es
arbitrario lo que llamamos el Grupo 1 y Grupo 2 y cul
es el orden para comparar las proporciones
Cuando 0 no est en el IC, podemos concluir que una
proporcin de la poblacin es ms alta que la otra.
(p.ej., si todos los valores son positivos cuando
calculamos Grupo 2 - Grupo 1, entonces concluimos
que la proporcin poblacional es ms alta en el grupo 2
que en el Grupo 1)
13
Cuando 0 est en el IC, es plausible que la proporciones
poblacionales sean idnticas.
Ejemplo: Asume que el IC del 95% para el cambio en la
proporcin poblacional (2001 1993) es (-0.01, 0.03)
Tenemos una confianza del 95% que la proporcin poblacional
que dice s fue entre 0.01 ms pequea y 0.03 ms grande en
2001 que en 1993.
Hay una prueba de significancia de H0: 1 = 2 que las
proporciones poblacionales son idnticas
(es decir, la diferencia 1 - 2 = 0), usando la estadstica de
prueba
z = (diferencia entre proporciones muestrales)/se
Para sexo no planeado en 1993 y 2001,
z = diferencia/se = 0.021/0.0056 = 3.75
valor-p de dos-lados = 0.0002
Esto parece ser estadsticamente significativo pero sin
significancia prctica!
14
Detalles sobre la prueba en pp. 189-190 del libro de texto;
usa se0 que junta los datos para obtener una mejor
estimacin bajo H0
(Estudiamos esta prueba como un caso especial de la
prueba ji-cuadrada en el prximo captulo, que trata con
posiblemente muchos grupos, muchas categoras de
respuesta)
La teora detrs del IC usa el hecho que las proporciones
muestrales (y sus diferencias) tienen una distribucin
muestral aprox. normal para ns grandes, por el Teorema
Central del Lmite, asumiendo aleatorizacin)
En la prctica, la frmula funciona ok si hay al menos 10
resultados de cada tipo para cada muestra
(Nota: No usamos la dist. t para inferencia sobre propociones; sin
embargo, hay mtodos especializados para muestras-pequeas,
p.ej., usando la distribucin binomial)
15
Respuestas Cuantitativas: Comparando Medias
Parmetro: 2 - 1
Estimador: y2 y1
s12 s22
Error estndar estimado: se
n1 n2
Dist. muestral: Aprox. normal (ns grandes, por TCL)
IC para muestras alreatorias independientes de dos
distribuciones poblacionales normales tiene la forma
s12 s22
y2 y1 t ( se), which is y2 y1 t
n1 n2
t
y2 y1 0
y2 y1
se s12 s22
n1 n2
19
Prueba estadstica tiene tiene la forma de costumbre
(estimacin del parmetro valor hipthesis nula)/error estndar
22
Inferencia alternativa comparando medias asume
desviaciones estndar poblacionales iguales.
No consideraremos frmulas para este enfoque aqu
(en Seccin 7.5 del libro de texto), ya que es un caso
especial de los mtodos de anlisis de varianza que
se estudian en el Captulo 12.
Este IC y prueba usan la distribucin t con
df = n1 + n2 - 2
Vamos a ver cmo el software muestra este enfoque y
el que hemos usado que no asume la igualdad de las
desviaciones estndar de la poblacin.
23
Ejemplo: Ejercicio 7.30, p. 213. Resultados de mejora para
terapia A: 10, 20, 30
terapia B: 30, 45, 45
A: media = 20, s1 = 10
B: media = 40, s2 = 8.66
Archivo de datos, el cul se importa en SPSS y analiza
Sujeto Terapia Mejora
1 A 10
2 A 20
3 A 30
4 B 30
5 B 45
6 B 45
24
25
Prueba de H0: 1 = 2 Ha: 1 2
26
Cmo obtiene el software los df para el mtodos de
varianzas desiguales?
Cuando permitimos s12 s22 recuerda que
s12 s22
se
n1 n2
Los grados de libertad ajustados para la distribucin t
es (aproximacin Welch-Satterthwaite) :
2
s12 s22
df 1
n n2
s2
2
s 2
2
1 n
2
n2
1
n1 1 n2 1
27
Algunos comentarios sobre comparacin de medias
28
Cuando los grupos tienen variacin similar, una medida
resumen del efecto de tamao (effect size) si
mean1 mean 2
effect size =
standard deviation in each group
Ejemplo: Las terapias tienen medias muestrales de 20
para A y 40 para B y desviaciones estndar de 10 y
8.66. Si la desviacin estndar en cada grupo es 9
(digamos), entonces
effect size = (20 40)/9 = -2.2
Media para terapia B se estima que est a dos desv. est.
ms que la media para la terapia A, un efecto grande.
29
Ejemplo: Cul estudio muestra el efecto ms grande?
1. y1 20, y2 30, s 10
3. y1 20, y2 25, s 2
30
Comparando medias con muestras dependientes
Situacin: Cada muestra tiene los mismos sujetos (como en
estudios longitudinales o transversales) o parejas de sujetos
(datos pareados)
Entonces, no es verdad que para comparar dos estadsticas,
se (se1 )2 (se2 )2
Debemos permitir correlacin entre estimaciones (Por
qu?)
Datos: yi = diferencia en mediciones para sujetos (par) i
Tratar los datos como una sola muestra de diferencia de
mediciones, con una media muestral yd y desviacin
estndar muestral sd y parmetro d = media poblacional de
diferencia de mediciones.
De hecho, d = 2 1
31
Ejemplo: Estudio de celular tambin experiment con los
mismos sujetos en cada grupo (datos en p. 194 de libro
de texto)
Para estos datos pareados, el archivo de datos tiene la
forma
Sujeto Celular_no Celular_s
1 604 636
2 556 623
3 540 615
(para 32 sujetos)
Medias muestrales son:
534.6 milisegundos sin celular
585.2 milisegundos, usando celular 32
Reducimos las 32 observaciones a 32 diferencias de
mediciones,
636 604 = 32
623 556 = 67
615 540 = 75
.
Y analizamos con mtodos estndar para una sola muestra
= 50.6 = 585.2 534.6, sd = 52.5 = std dev of 32, 67, 75
se sd / n 52.5/ 32 9.28
Para un IC del 95% CI, df = n 1 = 31, valor-t = 2.04
Obtenemos 50.6 2.04(9.28), (31.7, 69.5)
33
Tenemos una confianza del 95% que la media
poblacional usa el celular entre 31.7 y 69.5
milisegundos ms que sin celular.
Para probar H0 : d = 0 contra Ha : d 0, la estadstica
de prueba es
t = ( yd - 0)/se = 50.6/9.28 = 5.5, df = 31,
34
Con SPSS
Paired Differences
t df Sig. (2-tailed)
36
Algunos comentarios
39
Ejemplo: El departamento de justicia de EU reporta que
la proporcin de adultos en prisin es alrededor de
900/100,000 para hombres, 60/100,000 para mujeres