(Anlisis Estadstico
de Encuestas Rpidas
por Conglomerados )
(Windows)
Ralph R. Frerichs, D.V.M., Dr.P.H.
Profesor
Departamento de Epidemiologia
Universidad de California, Los ngeles (UCLA)
1
2
TABLA DE CONTENIDOS
Captulo 1
EPI INFO y STATA
Este manual de entrenamiento fue actualizado por ltima vez en el semestre de primavera
2008 para el curso de UCLA EPI 418 Encuestas Epidemiolgicas Rpidas en Pases en
Desarrollo. Ha sido modificado ligeramente para el Curso de Encuestas Rpidas ofrecido
va Web3. El enfoque principal del mismo es la aplicacin estadstica Epi Info la cual
permite el anlisis de datos de encuestas rpidas. Esta aplicacin, la cual puede copiarse
libremente, fue creada por los Centros para la Prevencin y Control de Enfermedades
(CDC por sus siglas en ingls) y distribuida con la colaboracin de la Organizacin
Mundial de Salud (OMS). Epi Info ha sido utilizado por epidemilogos en pases
alrededor del mundo, incluyendo la mayora de los pases en desarrollo. Los autores de
Epi Info han incluido tutoriales tiles junto con el software, as como un manual de
instrucciones en versin electrnica. En este manual se incluyen los grficos de la versin
orginal en ingls y a continuacin se encuentra su traduccin al espaol,
OBTENIENDO EL SOFTWARE
Los programas para este curso pueden ser obtenidos en Internet o de un amigo.
Internet. Se asume que usted est utilizando Internet Explorer de Microsoft . Una vez
que abra el navegador, introduzca el siguiente URL en la barra de direcciones
http://www.ph.ucla.edu/epi/. La pantalla mostrada en la Figura 1.1 debera aparecer.
http://www.ph.ucla.edu/epi/rapidsurveys/RScourse/index.html
Figura 1.1 Pantalla que muestra el sitio web del Departamento de Epidemiologa de
UCLA
Haga clic con el botn izquierdo del ratn en el enlace etiquetado recursos, el cual se
encuentra en la barra izquierda del sitio web presentado anteriormente. En la nueva
ventana que aparecer haga clic en el enlace etiquetado software. Al hacer esto, lo
presentado en la Figura 1.2 debera aparecer, es decir, se debera mostrar una lista de los
programas que se pueden descargar del sitio web del Departamento de Epidemiologa de
UCLA. En este momento usted debera encontrarse en la direccin
http://www.ph.ucla.edu/epi/software.html . Es importante mencionar que si bien solamente
algunos de los programas estn almacenados en el sitio web de UCLA, el sitio web
contiene instrucciones que le permiten enlazarse con otras computadoras conectadas a
Internet en la que se almacenan otros programas. A ese tipo de computadoras se les
conoce como Servidores de Archivos o simplemente como Servidores. El primer
programa a obtener es Epi Info, el cual puede descargarse haciendo clic con el botn
izquierdo del ratn en el enlace Epi Info (Windows). Seguidamente deber hacer clic en
Descargas (Downloads) para que aparezca lo presentado en la Figura 1.3. Note que la
pantalla se refiere a una direccin dentro del sitio web del CDC.
UCLA
Departamento
de
Epidemiologia
Escuela
de
Salud
Pblica
SOFTWARE
DE
EPIDEMIOLOGIA
Buscar
Versiones
de
DOS
y
Windows
nicamente
Bioterrorismo
Sitio
de
John
Snow
EpiInfo
(Windows)
Esta
es
la
versin
mas
fcil
de
usar
del
popular
programa
de
CDC
para
anlisis,
procesamiento
de
palabras
y
Departamento
de
gestin
de
bases
de
datos
para
epidemilogos.
El
Epidemiologia
de
UCLA
programa
incluye
mdulos
de
Muestras
Complejas
para
el
anlisis
de
encuesta
por
conglomerados,
Epimap,
un
sistema
de
informacin
geogrfica
y
Nutstat,
un
programa
de
antropometra
y
nutricin.
Este
software
es
utilizado
en
el
curso
EPI418
y
es
presentado
en
el
Manual
Sobre
EPI
de
Entrenamiento
de
Software
de
EPI
418.
Oferta
Acadmica
Cursos
y
Seminarios
Tutoriales
de
Epi
Info
Centros
y
Programas
Profesores
y
preceptores
EpiInfo
(DOS)
Recursos
Programa
de
anlisis,
procesamiento
de
palabras
y
Enlaces
gestin
de
bases
de
datos
para
epidemilogos.
Tambin
contiene
el
programa
Csample,
necesario
para
el
anlisis
de
encuestas
por
conglomerados.
Los
que
prefieren
trabajar
en
ambiente
DOS
deberan
considerar
esta
versin,
la
cual
no
es
utilizada
en
EPI
418.
OpenEpi (Web)
Departamento
de
Epidemiologia
Universidad
de
California,
Los
ngeles
(UCLA)
Escuela
de
Salud
Publica
CDC
CDC
Inicio
Personas
ms
sanas
y
seguras
Proyecto
mejorado
de
vigilancia
de
terrorismo
en
8
Inicio
de
DISS
ciudades
Buscar
Contctenos
Descargas
Epi
Info
Sistema
de
Nacional
de
Vigilancia
de
Enfermedades
de
Declaracin
Obligatoria
Qu es Epi Info?
Epi
Info
Versin
3.4.3
Descarga
tu
copia
hoy
Contenidos
Descargas
Epi Info
Mapas
Soporte
para
el
usuario
Instalacin
Tutoriales
Foro
de
Usuarios
Con
E
pi
I
nfo
y
u
na
c
omputadora
p
ersonal,
l
os
e
pidemilogos
y
o
tros
profesionales
mdicos
y
de
salud
pblica
pueden
crear
rpidamente
cuestionarios
o
formularios,
personalizar
el
proceso
de
digitacin
de
datos
y
analizarlos.
Las
estadsticas
epidemiolgicas,
as
como
tablas,
grficos
y
mapas
pueden
ser
producidos
con
comandos
simples
tales
como
READ
,
FREQ,
LIST,
TABLES,
GRAPH
Y
MAPA.
Epi
Map
genera
mapas
construidos
con
informacin
de
Epi
Info.
Sistemas
de
datos
Vigilancia
de
Salud
Publica
Csurvey. Adems de Epi Info, usted tambin debera obtener Csurvey 2.0, el cual es un
programa para Windows que automatiza los pasos necesarios para implementar encuestas
rpidas. Este programa fue escrito por Muhammad N. Farid, un estudiante de postgrado
del Departamento de Epidemiologia, en colaboracin con el profesor Frerichs, con el
patrocinio del Programa Internacional de Entrenamiento en VIH/SIDA de Fogarty
International. Una versin previa de Csurvey para DOS fue escrita, tambin en
colaboracin con el Dr. Frerichs, por Iwan Ariawan, M.D., M.P.H., un antiguo estudiante
de postgrado de Epidemiologia, quien en la actualidad forma parte del profesorado de la
Universidad de Indonesia.
Cuando termine de obtener EpiInfo, regrese al sitio web de software del Departamento de
Epidemiologa haciendo clic en el botn Atrs ubicado en la parte superior izquierda de
su navegador. Baje en la pantalla hasta posicionar el puntero del ratn en el enlace
etiquetado Csurvey 2.0 para Windows y con el botn izquierdo del mismo haga clic en
Csurvey. La pantalla mostrada en la Figura 1.4 aparecer. Baje en la pantalla hasta
posicionar el puntero del ratn en la seccin de la Versin de Windows, en la parte inferior
de la pgina. Descargue el programa tal y como se indic anteriormente, haciendo clic con
el ratn. De ser necesario, deber utilizar el programa para descomprimir archivos con
extensin ZIP. Note que estos son programas para DOS (no para Windows) dado que
fueron escritos hace mucho tiempo. Para instalar el programa en su computadora, cambie
los directorios a la ruta C:\download\ y digite install. El programa crear automticamente
un directorio llamado C:\CSURVEY en su computadora y copiar los archivos necesarios.
UCLA
Departamento
de
Epidemiologia
Escuela
de
Salud
Pblica
PROGRAMA
CSURVEY
Buscar
Ralph R. Frerichs
Este
programa
es
necesario
para
planear
y
organizar
encuestas
bietapicas
por
conglomerados.
Si
bien
se
ensea
sobre
este
programa
en
el
curso
EPI
418
Encuestas
Rpidas,
el
mismo
est
disponible
de
forma
gratuita
para
cualquier
persona
que
lo
requiera.
Bioter
roris
mo
Historia
contempornea
del
bioterrorismo
Detectives
de
enfermedades
Instalacin
de
Csurvey
Informacin
para
usuarios
de
Windows
XP
(en
formato
PDF)
para
descargar,
extraer
e
instalar
el
archivo
zip
que
contiene
el
programa
para
encuestas
por
conglomerados
Csurvey.
Encuestas Rpidas
Csurvey
Manual
Departamento
de
Epidemiologia
de
UCLA
Manual
de
Csurvey
(archivos
PDF).
Requiere
contar
con
Adobe
Acrobat
Reader
para
ver
e
imprimir
el
manual.
Sobre EPI
Cursos y Seminarios
Centros y Programas
Profesores y preceptores
Recursos
Convertidor
de
datos
de
formato
Epi
Info
a
formato
Stata.
Enlaces
Departamento
de
Epidemiologia
Universidad
de
California,
Los
ngeles
(UCLA)
Escuela
de
Salud
Publica
Informacin general
Cmo convertir?
Fax
El
programa
Csurvey
2.0,
recientemente
revisado
est
disponible
ahora.
Si
bien
se
ensea
sobre
este
programa
en
el
curso
EPI
418
Encuestas
Rpidas,
el
mismo
est
disponible
de
forma
gratuita
para
cualquier
persona
que
lo
requiera.
10
Epi2dct.exe. Este pequeo programa le permite convertir datos introducidos en Epi Info
en un archivo con un formato compatible con Stata. El mismo puede ser encontrado en la
seccin Epi Info to Stata Format (Convertir de formato Epi Info a formato Stata) en el
siguiente enlace dentro del sitio web de UCLA: http://www.ph.ucla.edu/epi/csurvey.html (
ver Figura 1.4)
Stata. En comparacin con Epi Info, Stata permite realizar anlisis multivariados ms all
de la capacidad disponible en el primero. Stata cuenta con un conjunto de mdulos de
encuestas que facilitan el anlisis de encuestas bietapicas por conglomerados tales como
las presentadas en el Curso de Encuestas Rpidas. Tanto el programa como los manuales
de usuario pueden ser comprados a la Corporacin Stata. Para mayor informacin, visite el
sitio
web
del
Curso
de
Encuestas
Rpidas
en:
http://www.ph.ucla.edu/epi/rapidsurveys/RScourse/RSstmanual.html .
.
11
INTRODUCCION
Este ejercicio requiere imaginacin y paciencia. Suponga que una encuesta basada en la
comunidad fue realizada en las regiones rurales de un pas en desarrollo con el fin de
obtener informacin para un programa de intervencin relacionado al SIDA. Proceda,
pacientemente, a leer las pginas de este ejercicio y trate de aprender las fortalezas y
debilidades de Epi Info para digitar, editar y analizar los hallazgos de la encuesta.
Suponga que una encuesta bietpica por conglomerados fue realizada en septiembre
pasado para obtener informacin sobre conocimientos acerca del VIH/SIDA; ocurrencia
de prcticas de inyeccin y varias formas de actividad sexual; y prevalencia de VIH
medida por la presencia de anticuerpos del VIH en la saliva4- . Trescientos hombres entre
las edades de 20 y 39 aos fueron incluidos en una muestra de 360 unidades de vivienda
seleccionadas de un total de 93,250 unidades de vivienda. Dichos hombres fueron
entrevistados y se les solicitaron muestras de saliva. Los investigadores que crearon el
presente estudio estaban interesados en obtener informacin sobre las creencias de las
personas con respecto al VIH/SIDA y su prevencin; la prevalencia de prcticas de
inyeccin de alto riesgo, actividad sexual e infeccin por VIH; y la asociacin entre las
infecciones actuales y diferentes factores de riesgo. De acuerdo a su pensamiento, con
esta informacin seran capaces de 1) tener una idea de la velocidad con la cual la
infeccin por VIH se est propagando en la poblacin, 2) proveer informacin para
planear un programa de educacin en salud y 3) construir una lnea de base para evaluar
medidas de control del VIH.
PREGUNTAS POR RESPONDER
Especficamente los investigadores estaban interesados en responder las siguientes
preguntas:
1. Saben los hombres jvenes y de mediana edad de las aldeas que sus amigos y
vecinos podran estar infectados con el VIH pero an no tienen el SIDA o que no
hay vacuna pare prevenir la infeccin por VIH o que no existen medicamentos
disponibles para curar a una persona con VIH/SIDA?
2. Qu tan efectivos son, en la opinin de los hombres, los diversos dispositivos o
mtodos para prevenir la infeccin por VIH? En estos se incluyen el uso de
diafragma, condn, la realizacin de vasectoma o limitar las prcticas sexuales a
dos personas que no tienen el VIH.
3. Cul es el porcentaje de hombres quienes el ao pasado fueron inyectados con
una aguja, recibieron una transfusin de sangre o perforaron su piel por alguna
razn tal como acupuntura o tatuajes?
4. Cul es la proporcin de hombres quienes el mes pasado tuvieron sexo vaginal y
anal con una, dos o ms parejas?
5. Cul es la prevalencia de infeccin por VIH sobre la base de los anticuerpos de
VIH en la saliva?
4
Frerichs, R.R., Htoon, M.T., Eskes, N. and Lwin, S.: Comparison of saliva and serum for HIV surveillance
in developing countries. The Lancet 340: 1496-1499, 1992.
Frerichs, R.R., Eskes, N. and Htoon, M.T.: Validity of three assays for HIV-1 antibodies in saliva. Journal
of Acquired Immune Deficiency Syndrome 7(5), 522-524, 1994.
Frerichs, R.R., Silarug, N. Eskes, N. Pagcharoenpol, P., Rodklai, A. Thangsupachai, S. and Wongba, C.:
Saliva-based HIV antibody testing in Thailand. AIDS 8: 885-894, 1994.
12
13
Departamento de Epidemiologia
Diga
lo
siguiente
a
todos
los
hombres
con
edades
entre
los
20
y
39
aos
viviendo
en
el
hogar.
1)
Que
algunas
de
las
preguntas
son
sobre
su
vida
personal
y
que
hablar
con
l
en
privado.
2)
Que
la
informacin
obtenida
se
utilizar
para
apoyar
en
la
planificacin
de
los
servicios
para
la
comunidad
y
que,
3)
Nadie
conocer
su
identidad
dado
que
su
nombre
no
ser
escrito
en
el
cuestionario.
1.Estudio
No.
___
___
___
2.
Regin
No.
___
___
___
3.
Conglomerado
No.
___
___
4.Hogar
No.
___
___
5.
No.
de
individuo
en
el
hogar
___
___
6.
Edad
___
aos
(escribir
99
si
no
se
conoce
la
edad)
7.
Casado
y
con
esposa
que
reside
en
el
hogar
[1]
Si
[2]
No
[9]
Desconocido
o
no
responde.
10. Que hay un medicamento disponible que puede curar a una persona con SIDA?
9.
Que
una
persona
puede
estar
infectada
con
VIH
y
no
tener
SIDA?
[1]
Si
[2]
No
[3]
No
sabe
[9]
No
responde
14
Qu
tan
efectivo
cree
usted
que
es
..
para
prevenir
la
infeccin
por
VIH
a
travs
de
la
actividad
sexual?
[1] Muy efectivo [2] Medianamente efectivo [3] No efectivo del todo
[1] Muy efectivo [2] Medianamente efectivo [3] No efectivo del todo
[1] Muy efectivo [2] Medianamente efectivo [3] No efectivo del todo
14.
La
prctica
de
relaciones
sexuales
nicamente
entre
dos
personas
que
no
tienen
el
VIH
[1] Muy efectivo [2] Medianamente efectivo [3] No efectivo del todo
El ao pasado
15.
Recibi
usted
una
inyeccin
con
una
aguja
en
su
musculo,
vena
o
piel?
[1]
Si
[2]
No
[3]
No
sabe
[9]
No
responde
16.
Recibi
usted
una
transfusin
de
sangre
o
de
alguno
de
sus
componentes(
plaquetas
o
plasma)?
[1]
Si
[2]
No
[3]
No
sabe
[9]
No
responde
17.
Sin
contar
las
inyecciones
o
transfusiones
mencionadas
anteriormente,
ha
perforado
alguna
parte
de
su
cuerpo
(para
acupuntura
o
tatuajes
o
perforaciones
en
orejas,
nariz
o
pezones)
o
algo
por
el
estilo?
[1]
Si
[2]
No
[3]
No
sabe
[9]
No
responde
15
El mes pasado
18.
Tuvo
usted
una
relacin
sexual
en
la
cual
puso
su
pene
en
la
vagina
de
su
compaera?
[1]
Si
[2]
No
[3]
No
sabe
[9]
No
responde
19.
Si
la
respuesta
es
"Si",
hizo
esto
el
mes
pasado
con
ms
de
una
compaera?
[1]
Si
[2]
No
[3]
No
sabe
[9]
No
responde
20.
Tuvo
usted
relaciones
sexuales
durante
las
cuales
puso
su
pene
en
el
recto
de
su
compaera?
[1]
Si
[2]
No
[3]
No
sabe
[9]
No
responde
21.
Si
la
respuesta
es
"Si",
hizo
esto
el
mes
pasado
con
ms
de
una
compaera?
[1]
Si
[2]
No
[3]
No
sabe
[9]
No
responde
16
Este ser nuestro primer estudio por lo cual el Nmero de Estudio ser 001. La poblacin
objetivo son todos los hombres entre los 20 y 39 ao en la Regin 234 del pas. Se estima,
sobre la base de los registros censales, que existe una poblacin de 548,529 personas en
las 510 comunidades o pueblos (denominadas conglomerados) potencialmente accesibles
a nuestros entrevistadores. Estas personas viven en 111,900 hogares con un promedio de
4.9 personas en cada uno de ellos. Adems, se estima que aproximadamente 83% de los
hogares tienen al menos un hombre entre las edades de 20 a 39 aos. En la primera etapa
de nuestro proceso bietpico de muestreo, muestreamos 30 de los 510 conglomerados con
probabilidad proporcional al nmero de hogares en el conglomerado. A este mtodo se le
conoce como probabilidad proporcional al tamao (PPS por sus siglas en Ingls) y ser
explicado con mayor detalle en el taller. En cada conglomerado, seleccionamos
aleatoriamente 12 hogares y entrevistamos a todos los hombres entre los 20 y 39 ao
viviendo en los mismos. La muestra resultante correspondi a 300 hombres en los 360
hogares seleccionados.
Revise el cuestionario. Todas las variables que sern digitadas en la computadora deben
tener un nmero y nombre. Usted tambin debera pensar cmo quiere presentar los
resultados. Con Epi Info usted construir una pantalla de entrada de datos, introducir
datos y con el conjunto de datos completo aidsal.mdb (el cual ser provisto) realizar
anlisis inicial del los mismos.
Un vistazo a Epi Info
Epi Info es un programa amigable con muchos mensajes de apoyo que aparecen en
diversos lugares. Para iniciar el programa, haga clic en el cono
y
la
pantalla
mostrada en la Figura 1.6 debera aparecer. La fila de arriba
muestra
los
diferentes componentes del programa . Exploraremos brevemente cada uno de ellos.
17
Epi
Info
Salir
Crear Vista
Crear Mapas
Digitar Datos
Crear Reportes
Analizar Datos
18
Programas
Editar
Configuracin
Utilidades
Digitar Datos
Analizar Datos
Crear
Mapas
Crear
Reportes
Epi Info
Nutricin
Salir
Ayuda
19
En este ejercicio usted utilizar las funciones para Crear Vistas, Digitar Datos y Analizar
Datos. Sin embargo, esto se har una vez que se hayan explicado otras funciones del
programa. Usted retornar muchas veces a este men que muestra los programas
principales.
A continuacin, mueva el puntero a Editar presionando la flecha roja [] y el men
mostrado en la Figura 1.8 aparecer.
Programas
Editar
Configuracin
Utilidades
Ayuda
Imagen
Botones
encendidos
o
apagados
Epi Info
20
Programas
Editar
Configuracin
Utilidades
Ayuda
Seleccionar Idioma
Administrar Traducciones
Epi Info
Seleccionar
el
AO
y
AO
PARTIDO
(SPLITYEAR)
de
Importacin
de
Epi
6
21
Seleccione
el
formato
por
defecto
para
crear
nuevas
bases
de
datos
(MDB)
Access 2000
Las nuevas bases de datos creadas por Epi Info sern creadas en un
OK
Cancelar
22
c:
C:
Epi Info
418
OK
Cancelar
23
Programas
Editar
Configuracin
Utilidades
Ayuda
Calculadora de Estadsticas
Comparacin de Datos
Visualizar Datos
Compacto
Procesador de Palabras
24
Programas
Editar
Configuracin
Utilidades
Ayuda
Contenidos
Traducciones
Tutoriales
Novedades
25
26
Salir
Crear Vista
Crear Mapas
Digitar Datos
Crear Reportes
Analizar Datos
27
Departamento de Epidemiologia
1.Conglomerado No. ___ ___ ___ 2. Hogar No. ___ ___ ___ 3. Persona No. ___ ___ 4. Edad____ aos
5. Casado y con esposa que reside en el hogar [1] Si [2] No [9] Desconocido o no responde.
28
Tabla 1.1 Etiquetas de datos y caractersticas necesarias para utilizar el programa Crear
Vista.
No.
Descripcin corta
Nombre
Dgitos
12 Negrita
Nmero de Conglomerado
Conglomerado
Arial
12 Regular
Nmero de Hogar
HH
Arial
12 Regular
Nmero de la Persona
PN
Arial
12 Regular
Edad
Casado
y
con
esposa
que
reside
en
el
hogar
Edad
Arial
12 Regular
Casado
Arial
12 Regular
vacuna
disponible
vacuna
1
1
Arial
Arial
12
Negrita
12
Regular
infectado
Arial
12 Regular
Arial
12 Regular
5
Cree
usted
que
..
6
29
HH
PN
23
37
27
23
25
26
39
10
35
11
12
35
13
27
37
34
36
28
26
28
10
11
26
12
28
13
39
13
20
ENTRADA DE DATOS
Para digitar los datos mostrados anteriormente en la Tabla 1.1 usted necesitar una
pantalla de entrada de datos. Esta puede crearse utilizando el programa Crear Vista de Epi
Info. Para hacer esto usted primero deber introducir una versin abreviada del
cuestionario para la entrada de datos. La intencin de esto es contar con suficientes
palabras que sirvan de referencia a la persona que digita los datos en el campo de una
variable particular y que a la vez dichas palabras no carguen la pantalla con demasiada
informacin. Usted deber digitar el ttulo y a continuacin el nombre corto para los
diversos tems o preguntas con la informacin suficiente para recordarle a la persona que
digita los datos sobre cual campo o variable ser considerada.
30
Para iniciar, haga clic en Crear Vista, ya sea en el botn ubicado en la parte izquierda de
la pantalla o en el men de Programas ubicado en la parte superior de la misma. Cuando
aparezca la pantalla para Crear/Editar Vista, haga clic en Archivo ubicado en la parte
superior- y luego en Nuevo. Cree un archivo llamado aidsex1, el cual ser almacenado en
el subdirectorio c:\Epi_Info\418\, tal y como se muestra en la Figura 1.16. Una vez que
haya digitado los datos este archivo almacenar una base de datos llamada aidsex1.mdb.
Mis
Documentos
Recientes
Escritorio
Mis Documentos
Mi PC
Abrir
Cancelar
31
A cada pgina dentro de la funcin Crear Vista se le denomina una vista. Si bien slo
utilizaremos una pgina, esta debe ser nombrada. Para los propsitos de nuestro ejemplo,
la vista recibir el nombre de A, tal y como se muestra en la Figura 1.17. Haga clic en el
botn OK para continuar.
C:\Epi_Info\418\aidsex1.MDB
Nombre la Vista
Cancelar
OK
Cambiar
Proyecto
32
Definicin
de
campo
Pregunta
o
Texto
Campo o variable
Nombre
del
campo
FaCTORRiesgoSIDA
Crear
Cuadricula
Vista Relacionada
Tipo de letra
Repetir anterior
Rango
Tablas de cdigos
Requerido
Valores legales
Slo Lectura
Cdigos
OK
Cancelar
33
34
Definicin
de
campo
Pregunta
o
Texto
1. Nmero de Conglomerado
Campo
o
variable
Tipo:
Nmero
Patrn:
##
Tipo
de
letra
Repetir
anterior
Requerido
Slo
Lectura
Bsqueda
Sonora
(Soundex)
Rango
OK
Usted deber continuar realizando el mismo proceso descrito anteriormente para introducir
la informacin para las 7 variables restantes y la segunda etiqueta, tal y como se present
previamente en la Tabla 1.1. Cuando acabe, su pantalla para Crear Vista debera parecerse
a lo presentado en la Figura 1.20.
35
Crear/Editar Vista: A
Pgina: 1
Archivo
Editar
Ver
Insertar
Formato
Herramientas Ayuda
1.
Nmero
de
Conglomerado
2.
Nmero
de
Hogar
3.
Nmero
de
persona
4.
Edad
(en
aos)
5.
Casado
y
con
esposa
que
reside
en
el
hogar
36
Crear/Editar Vista: A
Archivo
Editar
Ver
Pgina: 1
1. Nmero de Conglomerado
2. Nmero de Hogar
3. Nmero de persona
6. vacuna disponible
37
En la Figura 1.21 note que cuatro de las variables tienen espacios para introducir dos
dgitos. Las otras cuatro solamente tienen espacio para un dgito. Si este no fuera el caso
en su pantalla para Crear Vista, usted debera regresar y ajustar los campos antes de
continuar. Cuando est satisfecho con los mismos, haga clic en Archivo y luego en
Guardar para guardar el archivo para Crear Pantalla, aidsex1.mdb.
38
Seleccione el proyecto
Mis
Documentos
Recientes
Escritorio
Mis Documentos
Mi PC
Cancelar
Abrir
HH
PN
23
Recuerde que la variable conglomerado tiene dos dgitos. Por ende, cuando usted digite 1,
el valor aparecer como 01. Introduzca cada uno de los nmeros en los campos apropiados
de la pantalla y recuerde presionar [Entrar] cada vez (i.e. la tecla Entrar). Detngase
despus de haber introducido el valor 2 en el campo de la variable Medicamento y antes de
presionar la tecla [Entrar]. La pantalla resultante debera parecerse a lo presentado en la
Figura 1.23.
39
Entrada
1
Pgina
Archivo
Editar
Opciones Ayuda
1.
Nmero
de
Conglomerado
2.
Nmero
de
Hogar
Grabar
Datos
Marca
registro
como
Borrado
3.
Nmero
de
persona
Encontrar
Nuevo
4.
Edad
(en
aos)
5.
Casado
y
con
esposa
que
reside
en
el
hogar
Cree
usted
que
6.
vacuna
disponible
7.
Infectado
pero
sin
enfermedad
8.
Medicamento
disponible
para
curar
40
01
01
01
23
1
1
2
2
Presione la tecla [Entrar] y los datos para el primer individuo sern almacenados en la
computadora y aparecer una pantalla de datos en blanco, la cual estar lista para recibir
los datos del siguiente individuo. Debe tener presente que algunos de los hogares no
cuentan con individuos elegibles. Por ende, los campos de datos para los mismos se
dejarn en blanco. El primero de estos casos es el individuo con el nmero 5, cuyos datos
deberan ser digitados as: 1, 5, 0, seguido de espacios en blanco. Siguiendo un proceso
similar al descrito anteriormente contine digitando los datos restantes de la Tabla 1.2
hasta llegar al ltimo campo del ltimo hogar.
Tabla 1.2 Datos para la para la pantalla de entrada de datos de Crear Vista
CONGLOMERADO
HH
PN
13
20
Si por alguna razn no sabe en qu registro se encuentra, tenga presente que el nmero del
mismo se muestra en la parte inferior izquierda de la pantalla. Para el registro nmero 6,
por ejemplo, aparecera lo siguiente:
Registro
6
<<
Nuevo Registro
<
>
>>
41
Entrada
Archivo Editar
1 Pgina
1. Nmero de Conglomerado
02
13
3. Nmero de persona
02
20
Grabar Datos
Nuevo
2. Nmero de Hogar
Opciones Ayuda
6. vacuna disponible
Registro
27 de 27
42
Si su pantalla muestra que usted est digitando datos para el individuo nmero 27 y los
valores son los mostrados en la figura anterior, presione [Entrar]. Haga clic en el botn
Guardar Datos tal y como se muestra en la Figura 1.25.
Entrada
1 Pgina
Grabar
Datos
Marca
registro
como
Borrado
Encontrar
Registro
1
de
27
<<
<
>
>>
Avance por los diferentes registros presionando el botn > y realice cambios, si es que
estos son necesarios. Cuando acabe, haga clic en [x] en la parte superior derecha de la
pantalla para cerrar el programa de Entrada de Datos.
Regrese al men principal para proceder con el anlisis de los datos.
43
Leer
Proyecto Actual
C:\Epi_Info\Muestra.Mdb
Formatos de Datos
Epi
2000
Fuente de Datos
C:\Epi_info\418\aidsex1.mdb
Mostrar
Vistas
Todo
Vistas
VistaA
Cambiar
Proyecto
Slo
Guardar
Limpiar
OK
Ayuda
Cancelar
44
45
Anlisis
Salir
Conglomerado
Hogar
Nmero
de
Persona
Edad
Casado
Vacuna
Llave
Infectado
Vacuna
nica
RecStatus
Comandos de Anlisis
Datos
Leer (Importar)
Relacionar
Ausente
Ausente
Ausente
Ausente
Escribir(exportar)
Combinar
Variables
Ausente
Ausente
Ausente
Ausente
Definir
Revertir definicin
Asignar
Recodificar
Presentar
Seleccionar/Si
Seleccionar
Editor
de
Programa
-
Nuevo
Programa
Cancelar Seleccin
Archivo
Editar
Ver
Tipo
de
letra
Ejecutar
Ayuda
Si (condicional)
Ordenar
Cancelar ordenamiento
Estadsticas
Listar
Frecuencias
Tablas
Emparejar/hacer coincidir
Medias
Grfico
Mapa
Mapa
Estadsticas Avanzadas
Regresin Lineal
Regresin Logstica
Nuevo
Abrir
Anlisis
de
Sobrevivencia
Kaplan
Meier
Riesgos
Proporcionales
de
Cox
Frecuencias
de
Muestras
Complejas
Tablas
de
Muestras
Complejas
Guardar
Ejecutar
este
Imprimir
Ejecutar
comando
Muestras
de
Muestras
Complejas
Resultados
46
Note que el conjunto de datos contiene 26 hogares. Siete de estos no tienen hombres
elegibles (i.e. entre las edades de 20 y 39 aos), lo cual implica que los 19 restantes si los
tienen. Por otro lado, el hogar nmero 13 del conglomerado 2 tiene 2 hombres elegibles.
Por ende, el nmero total de registros es 27 [i.e., (25 x 1)+ (1 x 2) y el nmero total de
registros con datos para las diferentes variables es 20 [i.e., (18 x 1)+(1x2)].
FRECUENCIA
Frecuencia de
Estratificar por
Edad
Total
Conglomerado
Medicamento
Hogar
Infectado
Ponderacin
Casado
Nmero de Persona
Resultados
en
la
Tabla
Configuracin
Grabar nicamente
OK
Limpiar
Ayuda
Cancelar
47
Epi Info utiliza para generar frecuencias, a saber, FREQ, seguido de la variable casado.
Esta sintaxis es la misma que se utiliza en la versin de Epi Info para DOS.
48
Anlisis
Salir
Comandos
de
Anlisis
Datos
Previo
Siguiente
ltimo
Historial
Abrir Marcar
Imprimir
Maximiza
r
Fecha
Leer (Importar)
Relacionar
FREQ Casado
Escribir(exportar)
Combinar
Siguiente Procedimiento
Variables
Definir
Adelante
Revertir definicin
Asignar
Frecuencia
Porcentaje
Porcentaje acumulado
Recodificar
Total
Presentar
Seleccionar/Si
Seleccionar
Editor
de
Programa
-
Nuevo
Programa
Cancelar Seleccin
Archivo
Editar
Ver
Ayuda
Si (condicional)
Ordenar
Cancelar ordenamiento
Estadsticas
Listar
Frecuencias
Tablas
Emparejar/hacer coincidir
Medias
Grfico
Mapa
Estadsticas Avanzadas
Regresin Lineal
Regresin Logstica
Nuevo
Abrir
Guardar
Imprimir
Ejecutar
Ejecutar
este
comando
LEER
LISTAR * TABLA
FREQ Casado
Resultado
Encabezado
49
50
Anlisis
Salir
Previo
Siguiente
ltimo
Historial
Abrir
Marcar
Imprimir
Maximizar
Comandos
de
Anlisis
Datos
Leer (Importar)
Relacionar
FREQ vacuna
Escribir(exportar)
Combinar
Variables
Definir
Adelante
Revertir definicin
Asignar
6. Vacuna disponible
Frecuencia
Porcentaje
Porcentaje
acumulado
Recodificar
Total
Presentar
Seleccionar/Si
Seleccionar
Cancelar Seleccin
Archivo
Editar
Ver
Tipo de letra
Ejecutar
Ayuda
Si (condicional)
Ordenar
Cancelar ordenamiento
Estadsticas
Listar
Frecuencias
Tablas
Emparejar/hacer coincidir
Medias
Grfico
Mapa
Estadsticas Avanzadas
Regresin Lineal
Regresin Logstica
Nuevo
Abrir
Guardar
Imprimir
Ejecutar
Ejecutar
este
comando
LEER
LISTAR * TABLA
FREQ Casado
FREQ vacuna
Resultado
Encabezado
Tipo
51
Tablas, Surge la siguiente pregunta: Tienen los hombres solteros mayor
conocimiento sobre el SIDA que los hombres casados? El anlisis apropiado para
contestar esta pregunta corresponde a una tabla cruzada de las variables casado y vacuna.
Para crear esta tabla cruzada, en la seccin de Estadsticas seleccione el programa Tablas.
En este ejemplo la variable de exposicin es casado y la variable de resultado es vacuna,
es decir, queremos determinar si la exposicin al matrimonio tiene un efecto sobre el
resultado de creencia sobre la disponibilidad de una vacuna. Los hallazgos de este
anlisis se presentan en la Figura 1.31.
52
Anlisis
Previo
Siguie
nte
Salir
Comandos de Anlisis
Datos
Marcar
Impri
mir
Maximi
zar
ltimo Historial
Abrir
Leer
(Importar)
Relacionar
FREQ vacuna
Escribir(exportar)
Procedimiento
Anterior
Siguiente
Procedimiento
Conjunto
de
Datos
Actual
Combinar
Variables
Definir
Adelante
Revertir definicin
Asignar
Recodificar
6. VACUNA DISPONIBLE
Presentar
5.
Casado
y
con
esposa
que
reside
en
el
hogar
Seleccionar/Si
Seleccionar
Fila
Cancelar Seleccin
Columna
Si (condicional)
Ordenar
Fila
Cancelar ordenamiento
Columna
Estadsticas
Listar
TOTAL
Fila
Frecuencias
Columna
Tablas
Emparejar/hacer coincidir
Medias
Grfico
Mapa
Estadsticas Avanzadas
Regresin Lineal
Regresin
Logstica
Anlisis
de
Sobrevivencia
Kaplan
Meier
Riesgos
Proporcionales
de
Cox
Frecuencias
de
Muestras
Complejas
Tablas
de
Muestras
Complejas
Muestras
de
Muestras
Complejas
Archivo
Editar
Ver
Guardar
Ayuda
Ejecutar
este
comando
Abrir
Ejecut
ar
Ejecut
ar
Nuevo
Tipo
de
letra
Impr
imir
LEER
LISTAR * TABLA
FREQ Casado
FREQ vacuna
Resultado
Encabezado
Tipo
TOTAL
53
Si quisiramos limitar el anlisis a aquellas personas que tuvieron una opinin definitiva
(i.e., los que respondieron s o no), necesitaramos remover temporalmente de los datos el
cdigo [3] de las posibles respuestas a la pregunta relacionada con la existencia de una
vacuna. Epi Info le permite hacer esto mediante instrucciones de recodificacin tales como
la instruccin si-entonces (if-then statement). La sintaxis de dicha instruccin es la
siguiente: si el valor de vacuna es igual a 3, entonces el valor de vacuna ser
recodificado a ausente (missing). Para crear una instruccin si-entonces, haga clic en
Seleccionar/Si en la columna de los Comandos de Anlisis. Posteriormente, haga clic en s
y de la lista bajo la etiqueta
Variables Disponibles seleccione vacuna. A
continuacin, haga clic en y
finalmente digite 3. En la seccin etiquetada
Entonces digite vacuna=(.) como se
muestra en la Figura 1.32.
54
Si
Condicin Si
vacuna=3
"Si"
"No"
"Ausente"
Variables Disponibles
vacuna
De lo contrario
vacuna=(.)
Entonces
Funciones
Grabar nicamente
OK
Limpiar
Ayuda
Cancelar
Figura 1.32 Crear una instruccin si..-entonces para limitar las respuestas almacenadas en
la variable a vacuna a S o No.
Haga clic en OK. Note que la instruccin en cuestin ha sido aadida dentro del la ventana
del Editor del Programa. Una vez que se hayan limitado las respuestas de la variable
vacuna a si y no, usted deber volver a ejecutar el programa de Tablas. Para hacer
esto, haga clic en Tablas en la seccin de Estadsticas en la columna de Comandos de
Anlisis. Posteriormente seleccione, como lo hizo anteriormente, las variables vacuna y
casado para que aparezca lo presentado en la Figura 1.33.
55
56
Anlisis
Salir
Previo
Siguiente ltimo
Historial Abrir
Marcar
Imprimir
Maximizar
Comandos de Anlisis
Datos
Leer (Importar)
Relacionar
Escribir(exportar)
Combinar
Variables
Definir
Adelante
Revertir definicin
Asignar
Recodificar
Presentar
5.
Casado
y
con
esposa
que
reside
en
el
hogar
TOTAL
Seleccionar/Si
Seleccionar
Fila
Cancelar Seleccin
Columna
Si (condicional)
Ordenar
Fila
Cancelar ordenamiento
Columna
Estadsticas
TOTAL
Listar
Fila
Frecuencias
Columna
Tablas
Emparejar/hacer coincidir
Anlisis
de
una
sola
tabla
Medias
Grfico
Estadsticas Avanzadas
Regresin Lineal
Regresin Logstica
Archivo
Editar
Ver
Tipo
de
letra
Ejecutar
Nuevo
Abrir
Guardar
Imprimir
Ejecutar
Ayuda
Ejecutar
este
comando
Mapa
6.
VACUNA
DISPONIBLE
1
LEER
LISTAR * TABLA
FREQ Casado
FREQ vacuna
Resultado
Encabezado
Si vacuna=3 entonces
Tipo
Vacuna=(.)
FIN
Figura 1.33 Conocimiento de la existencia de una vacuna entre los hombres casados
.
57
Razones de riesgos y probabilidades. Note que al comparar dos variables
dicotmicas (i.e., de dos categoras) como casado y vacuna usted obtiene una tabla 2x2, la
cual es utilizada por el programa para generar varias estadsticas epidemiolgicas. Estas
estadsticas se mostrarn al revisar la parte inferior la pgina de resultados como se
muestra en la Figura 1.34.
58
Advertencia:
El
valor
esperado
de
una
celda
es
<5.
Se
debera
usar
la
Prueba
Exacta
de
Fisher.
PARAMETROS:
Basados
en
probabilidades
Razn
de
probabilidades
(producto
cruzado
Razn
de
probabilidades
(Estimacin
de
mxima
verosimilitud)
Estimacin
Puntual
Intervalo
de
Confianza
al
95%
0,0000
0,0000
Inferior
Superior
No definido
No definido(T)
PARAMETROS:
Basados
en
riesgos
Razn
de
riesgos
(RR)
Diferencia
de
Riesgos
(RD%)
(T)
(F)
(T
=
Series
de
Taylor;
C=Cornfield,
M=Valor
P
medio
(Mid-p);
F=
Prueba
Exacta
de
Fisher)
PRUEBAS
ESTADIISTICAS
Chi
cuadrado
no
corregido
Chi
cuadrado
(Mantel
-
Haenzel)
Chi
cuadrado
Corregido
(Yates)
Valor
P
medio
exacto
(Mid
P
exact)
Valor
resultante
de
la
Prueba
Exacta
de
Fisher
Chi-cuadrado
Valor p , 1 cola
Figura 1.34 Razones de probabilidad y de riesgo para la asociacin entre los valores de
las variables casado y vacuna.
Dado que una de las celdas contiene un cero, la razn de riesgos resultante tambin es
cero. La razn de riesgo de 0.65 indica que la probabilidad de creer que existe una vacuna
contra el VIH/SIDA es 35% menor en los hombres casados en comparacin con los
solteros. Es importante notar que tanto el intervalo de confianza al 95% como las
numerosas pruebas estadsticas presentadas son inapropiadas para nuestro conjunto de
datos dado que la informacin proviene de una encuesta bietpica por conglomerados con
diferentes estimaciones de varianza. Las pruebas estadsticas de esta seccin de Epi Info
asumen que los datos fueron recolectados utilizando el mtodo de muestreo aleatorio
simple y que cada individuo es independiente del resto. Este supuesto no es vlido para las
59
Medias. Para el ejercicio de anlisis final, usted determinar si los hombres que
creen en la existencia de una vacuna contra el VIH/SIDA (i.e., los que contestaron si) son
diferentes en cuanto edades que aquellos que respondieron no. Dado que Edad es una
variable continua, en lugar de generar una tabla como en el caso de datos categricos,
usted debera utilizar el comando de medias. Para hacer esto, haga clic en Medias en la
seccin de Estadsticas de la columna de Comandos de Anlisis e introduzca Medias de
Edad cruzada con vacuna. Los resultados en la seccin extendida de anlisis se muestran
en la Figura 1.35.
60
61
62
Adelante
6. VACUNA DISPONIBLE
TOTAL
Fila
Columna
Fila
Columna
Fila
Columna
TOTAL
Fila
Columna
Observacin
Total
Media
Varianza
Desviacin Estndar
Mnimo
Media
Mximo
Variacin
Grados de Libertad
M3
Estadstico F
Inter/Entre
Intra (within)
Total
Estadstico T
Valor P
Valor P
Un
valor
p
pequeo
(e.g.
menor
que
0.05)
sugiere
que
la
varianzas
no
son
homogneas
y
que
el
anlisis
de
varianza
(ANOVA)
podra
no
ser
apropiado.
Prueba
de
Dos
Medias
de
Mann-Whitney/Wilcoxon
(Prueba
de
Kruskal
Wallis
para
Dos
Grupos)
Grados de Libertad
Valor P
Figura 1.35 Resultados del anlisis de medias para el cruce de variables entre edad y
vacuna.
63
Las personas que creen en la disponibilidad de una vacuna contra el VIH/SIDA son en
promedio menores, por 4.3 aos aproximadamente, que aquellos que no creen en la
existencia de dicha vacuna (i.e., media de 28.4 aos versus una media de 32.7 aos
respectivamente). Si esta hubiera sido una muestra aleatoria simple, el anlisis de varianza
(ANOVA por sus siglas en Ingls) hubiera sido apropiado y hubiera sugerido que la
diferencia no es estadsticamente significativa. Dado que los hallazgos provienen de una
encuesta por conglomerados, las pruebas estadsticas de esta seccin de Epi Info no
deberan ser usadas. Sin embargo, los valores de las medias si son vlidos.
Programas
Editar
Configuracin
Utilidades
Ayuda
Calculadora de Estadsticas
Comparacin de Datos
Visualizar Datos
Compacto
Procesador de Palabras
64
Suponga que tiene a su disposicin los nmeros presentados a continuacin, en los cuales
se relaciona la pregunta Cree usted que existe un medicamento que puede curar a una
persona con VIH/SIDA? con la pregunta Cun efectivo cree usted que es el uso de condn
para prevenir la transmisin del VIH a travs de la actividad sexual? y se estratifican los
resultados por estado civil.
Disponibilidad
de
medicamento
Casado
Soltero
Otro
Si
Si
No
No
Efectivo
Otro
En lugar de seguir cada uno de los pasos para digitar datos de 264 personas y realizar los
anlisis descritos anteriormente, lo nico que usted desea es un simple clculo de medidas
de asociacin para los datos disponibles. Como ver a continuacin, StatCalc es una
herramienta til para ello. Para usar este programa presione [Entrar] y la Figura 1.37
aparecer.
65
Epi
Info
Versin
6
F1
Ayuda
StatCalc
Tablas
(2x2m
2
x
n)
Tamao
y
potencia
de
la
muestra
Chi
Cuadrado
para
tendencia
F6
Abrir
Archivo
Noviembre
1993
F10
Hecho
66
StatCalc
Enfermedad
Noviembre
1993
E
x
p
o
s
i
c
n
F1 Ayuda
67
Epi
Info
Versin
6
StatCalc
Enfermedad
Noviembre
1993
86
70
27
27
E
x
p
o
s
i
c
n
F4 Calcular
F1 Ayuda
68
Despus de digitar los nmeros presione [F4 Calcular] y aparecer la Figura 1.40.
StatCalc
Enfermedad
156
86
70
54
27
27
113
97
E
x
p
o
s
i
c
n
210
Noviembre
1993
Anlisis
de
una
Tabla
Razn
de
Riesgos
Lmites
de
Confianza
de
Cornfield
al
95%
para
las
razones
de
riesgo
Riesgo
Relativo
Lmites
de
Confianza
al
95%
de
las
Series
de
Taylor
para
las
riesgo
relativo
Ignore
el
riesgo
relativo
si
es
se
trata
de
un
estudio
de
casos
y
controles.
Chi
Cuadrado
Valores
de
P
No
Corregido
Mantel
Haenzel
Yates
corregida
F6 Abrir Archivo
F10
Hecho
69
Este es el anlisis intermedio del estrato 1. Para introducir el estrato dos para los hombres
solteros presione [F2] (ver la lnea de cdigos en la parte inferior de la pantalla).
Introduzca el siguiente grupo de nmeros que se muestran en la Figura 1.41.
StatCalc
Enfermedad
Noviembre
1993
19
17
11
17
E
x
p
o
s
i
c
n
F1 Ayuda
70
Enfermedad
StatCalc
36
19
17
18
11
30
24
E
x
p
o
s
i
c
n
54
Noviembre
1993
Anlisis
de
una
Tabla
Razn
de
Riesgos
Lmites
de
Confianza
de
Cornfield
al
95%
para
las
razones
de
riesgo
Riesgo
Relativo
Lmites
de
Confianza
al
95%
de
las
Series
de
Taylor
para
las
riesgo
relativo
Ignore
el
riesgo
relativo
si
es
se
trata
de
un
estudio
de
casos
y
controles.
Chi
Cuadrado
Valores
de
P
No
Corregido
Mantel
Haenzel
Yates
corregida
F6 Abrir Archivo
F10
Hecho
71
Dado que no hay ms estratos presione [Entrar] y el programa generar las medidas
estadsticas de resumen que se muestran en la Figura 1.43.
StatCalc
Enfermedad
36
19
17
18
11
30
24
E
x
p
o
s
i
c
n
54
Noviembre
1993
***Anlisis
Estratificado****
Resumen
de
dos
Tablas
Razones
crudas
de
probabilidades
para
todos
los
estratos
Razones
de
probabilidades
ponderadas
Mantel
Haentzel
Lmites
de
Confianza
de
Cornfield
al
95%
Chi
Cuadrado
resumen
de
Mantel
Haenszel
Valor
P
Riesgo
Relativo
Crudo
para
todos
los
estratos
Riesgo
Relativo
Ponderado
de
Mantel
Haenszel
para
la
enfermedad,
dada
la
exposicin
Lmites
de
Confianza
de
Greenland/Robins
<ENTRAR>
para
ms.
F10
para
salir.
F6 Abrir Archivo
F10
Hecho
72
Y an hay ms, Los intervalos de confianza para las razn de probabilidades resumen son
estimaciones y no valores exactos. Si bien algunas veces, la estimacin es muy cercana al
valor exacto, en otras, estos pueden diferir considerablemente. El programa StatCalc
puede calcular el valor exacto para usted. Para hacer esto, haga clic en [Entrar] y
aparecer lo presentado en la Figura 1.44.
StatCalc
Noviembre 1993
Enfermedad
19
17
Enfermedad
19
17
StatCalc
Noviembre 1993
73
Noviembre 1993
Enfermedad
StatCalc
36
19
17
18
-
E
x
p
o
s
i
c
n
11
30
24
54
F6 Abrir Archivo
F10
Hecho
74
Epi
Info
Versin
6
StatCalc
Enfermedad
Noviembre
1993
E
x
p
o
s
i
c
n
F1 Ayuda
75
Otra funcin de Epi Info corresponde a un conjunto de tres programas para el anlisis de
encuestas por conglomerados. Epi Info es el nico programa, no tan complejo como otros
paquetes estadsticos como Stata y SUDAAN, que permite este tipo de anlisis. En el
programa se incluyen dos conjuntos de datos creados por mi persona, los cuales envi al
Dr. Dean para que fueran utilizados como ejemplos. Estos conjuntos de datos, cuyos
nombres son EPI1 y EPI10, respectivamente, han sido incluidos como vistas dentro del
archivo Sample.mdb (i.e., vistaEpi1 y vistaEpi10). El primero de estos contiene datos de
una encuesta por conglomerados bietpica de 210 nios. En la primera etapa se
seleccionaron 30 conglomerados por medio del mtodo de probabilidad proporcional al
tamao (PPS por sus siglas en ingls). En la segunda etapa se seleccionaron 7 nios por
conglomerado. El segundo conjunto de datos contiene informacin de 2,152 nios,
correspondiente a 10 encuestas por conglomerados bietpicas. En todas estas encuestas se
utiliz el mtodo de PPS en la primera etapa, se construyeron estratos de acuerdo a la
ubicacin geogrfica (cada encuesta corresponde a un estrato diferente) y se utilizaron
ponderaciones con respecto a la poblacin muestreada. Ambos conjuntos de datos
corresponden a una serie de encuestas por conglomerados realizadas en Irn hace algunos
aos. Usted podr encontrarlos en el archivo C:\Epi_Info\Sample.mdb, el cual es
distribuido con el software Epi Info.
En esta seccin analizaremos con Epi Info datos de las encuestas por conglomerados. En la
siguiente seccin, analizaremos la misma informacin utilizando el software estadstico
Stata. Como podr notar, Epi Info es muy til tanto para el anlisis de estimaciones
puntuales (i.e., la ocurrencia de condiciones de salud presentadas como proporciones o
porcentajes) como para la construccin de tablas cruzadas de dos variables. Sin embargo,
es importante notar que el programa no realiza ajustes del efecto de confusin (i.e., efectos
de variables que ocultas o no observadas) y no puede ser usado para realizar anlisis
multivariado (i.e., estimacin y ajuste de modelos de regresin). Por esta razn, para
realizar este tipo de anlisis utilizaremos Stata.
EPI1 y EPI10. Epi Info incluye datos de dos encuestas por conglomerados que
realizaron pruebas con el fin de averiguar si los nios/as cuyas madres recibieron atencin
prenatal eran ms o menos propensos/as a recibir series completas de inmunizacin en
comparacin con aquellos/as cuyas madres no recibieron atencin prenatal. El anlisis fue
realizado sobre la base de los archivos EPI1 (una pequea encuesta en una regin) y EPI10
(una encuesta mucho ms grande realizada en diez regiones). Las dos tablas 2x2 para este
anlisis se muestran en la Figura 1.48.
EPI1
Recibieron
atencin
prenatal
EPI10
Vacunacin completa
Vacunacin completa
Si
No
Si
No
Si
78
87
Si
675
413
1088
No
77
46
123
No
567
497
1064
155
55
210
1242
910
2152
76
Figura 1.48 Los dos conjuntos de datos incluidos como ejemplos en Epi Info.
Ubicacin 1
VAC
Si
Atencin Prenatal
Si
Ubicacin 2
Ubicacin 3
Ubicacin 4
Ubicacin 5
VAC
VAC
VAC
VAC
No
Si
No
Si
No
Si
No
Si
No
Si
Si
Si
No
No
No
No
n=225
n=219
n=212
n=219
n=212
N=9870
N=33600
N=14130
N=27900
N=12750
Ubicacin 6
Ubicacin 7
Ubicacin 8
Ubicacin 9
Ubicacin 10
VAC
VAC
VAC
VAC
VAC
Si
No
Si
No
Si
No
Si
No
Si
No
Atencin Prenatal
Si
Si
Si
Si
No
No
No
No
n=214
n=210
n=212
n=217
n=212
N=15,610
N=16,050
N=180740
N=9020
N=25650
77
TABLAS
Variable de Exposicin
Variable de Resultado
Estratificar por
PRENATAL
VAC
Ponderacin/Peso
POPW
UPM
ENFERMO
ALTURA
UBICACION
CONGLOMERADO
Grabar nicamente
OK
Limpiar
Ayuda
Cancelar
78
comparacin con madres que no recibieron atencin prenatal (PRENATAL=2). Una vez
que se seleccionen las variables, haga clic en OK y aparecer lo presentado en Figura 1.51.
79
Anlisis
Salir
Previo
Siguiente
ltimo
Historial
Abrir
Marcar
Imprimir Maximizar
Comandos de Anlisis
Datos
Leer (Importar)
Relacionar
Siguiente Procedimiento
Escribir(exportar)
Combinar
Adelante
Variables
Definir
Siguiente
Revertir
definicin
Asignar
Recodificar
Presentar
VAC
PRENATAL
1
1
TOTAL
Fila
Seleccionar/Si
Columna
Seleccionar
Fila
Columna
Fila
Columna
Cancelar
Seleccin
Si
(condicional)
Ordenar
TOTAL
Cancelar
ordenamiento
Estadsticas
Listar
Frecuencias
Tablas
Emparejar/hacer coincidir
Editor
de
Programa
-
Nuevo
Programa
Medias
Archivo
Editar
Ver
Tipo
de
letra
Ejecutar
Ayuda
Grfico
Mapa
Estadsticas Avanzadas
Regresin Lineal
Regresin
Logstica
Anlisis
de
Sobrevivencia
Kaplan
Meier
Nuevo
Abrir
Guardar Imprimir
Ejecutar
Ejecutar
este
comando
Resultado
Encabezado
Tipo
80
81
Dentro del grupo de madres que recibieron atencin prenatal, el riesgo de que sus hijos
fueran \vacunados era 1.427 veces mayor al observado en el caso del grupo de madres que
no recibi atencin prenatal. El intervalo de confianza al 95% para la razn de riesgos
(estimada ahora de forma correcta ya que toma en cuenta el diseo muestral) va de 1.23 a
1.66. La diferencia en la tasa de vacunacin de los/as nios/as entre los dos grupos de
madres es de 18 puntos porcentuales (i.e., 60.7%-42.5%) con un intervalo del confianza, al
95%, que va de 10 puntos porcentuales a 26 puntos porcentuales.
82
A pesar que los tres programas para Muestras Complejas de Epi Info realizan muchas
cosas importantes, estos no realizan ajustes de variables confusoras (i.e., terceras variables
que ocultan verdaderos efectos) como el sexo, edad y similares para las razones de
probabilidad, las razones de riesgo o las diferencias de riesgos .Tales ajustes pueden
hacerse nicamente utilizando los comandos en la seccin de Estadsticas de Epi Info, los
cuales, desafortunadamente, utilizan la varianza equivocada. Por consiguiente, no hay una
solucin simple para hacer anlisis adicionales de los datos en Epi Info. Dada esta
situacin, en lugar de utilizar este software, utilizaremos el programa ms sofisticado para
anlisis de encuestas incluido en Stata (presentado en nuestro curso) u otro software como
SUDAAN (ver Apndice). Si se piensa que la confusin es un problema grande en los
datos de la encuestas, una solucin posible es dividir los datos en uno o ms sub-conjuntos
sobre la base de los niveles de la variable confusora y analizarlos por separado.
Realizaremos un anlisis de este tipo en esta seccin y compararemos los valores con los
resultados obtenidos por el programa de la seccin de Estadsticas.
Primero, analizaremos los datos en la forma equivocada considerando que estos forman
parte de una muestra aleatoria simple. Para hacer esto, inicie el programa Analizar Datos,
seleccione Leer(Importar) y marque el archivo AIDSAL.mdb (ubicado en
C:\Epi_Info\418)., haga clic con el botn izquierdo del ratn en Mostrar Todos, haga clic
nuevamente en la A, acepte a TMPLNK_1 como el enlace temporal haciendo clic en el
botn OK. La pantalla debera mostrar que el conjunto de datos con 360 registros ha sido
cargado en la memoria de la computadora.
En este ejemplo, analizaremos la relacin entre los anticuerpos del VIH (representados por
la variable llamada VIH), presentes en la saliva, y el hecho de haber tenido relaciones
sexuales anales (representadas por la variable SEXA). Este anlisis ser estratificado de
acuerdo a las creencias sobre la existencia de un medicamento para curar el VIH/SIDA
(representadas por la variable MEDICAMENTO). Dado que la creencia en la existencia de
un medicamento para curar el VIH/SIDA podra ser un factor de riesgo independiente de
la variable VIH (variable de resultado) y podra estar asociada a la vez con el hecho de
tener relaciones sexuales anales (la variable de exposicin), podra considerarse a la
variable MEDICAMENTO como una potencial variable confusora en nuestro anlisis de
SEXA y VIH. En la Figura 1.53 se presenta la estructura del anlisis para las razones de
probabilidad (OR), las razones de riesgo (RR, de hecho una razn de prevalencia), y la
diferencia de riesgos (RD, de hecho una diferencia de prevalencias).
83
Anticuerpos
de
VIH
en
la
saliva
Tuvo
relaciones
sexuales
anales
durante
el
mes
pasado?
Si
No
Si
No
Si
a1
b1
a1+b1
Si
a2
b2
a2+b2
No
c1
d1
c1+d1
No
c2
d2
c2+d2
OR1
=
a1xb1
c1xd1
RR1
=
a1/(a1+b1)
c1/(c1+d1)
RD1=
a1/(a1+b1)
-
c1/(c1+d1)
OR
=
a2xb2
c2xd2
a2/(a2+b2)
c2/(c2+d2)
RD1=
RR1
=
a2/(a2+b2)
-
c2/(c2+d2)
84
proceso no requiere ninguna prueba estadstica, puede ser usado tanto en el caso de
encuestas basadas en muestreo aleatorio simple y encuestas por conglomerados. Para
generar la distribucin de frecuencias, haga clic con el botn izquierdo del ratn en
Frecuencias, bajo la seccin de Estadsticas en la columna de Comandos de Anlisis. A
continuacin, seleccione la variable SEXA en la seccin etiquetada Frecuencia de en la
pantalla de FREQ. Los resultados deberan ser como los presentados en la Figura 1.54.
FREQ
SEXA
Siguiente
Procedimiento
Adelante
SEXA
Frecuencia
Porcentaje
Porcentaje
acumulado
TOTAL
Lmites
de
Confianza
el
95%
Figura
1.54.
Distribucin
de
frecuencias
de
la
variable
SEXA.
De los 300 hombres entrevistados, 52 reportaron haber tenido relaciones sexuales anales
durante el mes anterior a la encuesta y 15 hombres se rehusaron a responder la pregunta
pues consideraron que era demasiado personal. Ya que no sabemos si estos hombres
tuvieron relaciones sexuales anales o no, no podemos usar a los 300 hombres para estimar
el porcentaje de los que tuvieron relaciones sexuales anales. Ms detalles sobre esto se
presentarn en breve. Pero primero, haga clic nuevamente en Frecuencias y esta vez
seleccione VIH, variable de resultado. La imagen mostrada en la Figura 1.55 debera
aparecer.
85
FREQ
VIH
Procedimiento
Anterior
Siguiente
Procedimiento
Conjunto
de
Datos
Actual
Adelante
VIH
Frecuencia
Porcentaje
Porcentaje
acumulado
TOTAL
Lmites
de
Confianza
el
95%
86
SI
Condicin Si
SEXA=9
Variables Disponibles
SEXA
Entonces
De lo Contrario
SEXA=(.)
Funciones
Limpiar
Grabar
nicamente
Ayuda
Ok
Cancelar
Figura 1.56 Instruccin Si-entonces para remover los casos de no respuesta de la variables
SEXA
Este procedimiento reemplaza, con valores ausentes (missing), los 15 casos que tenan
inicialmente valores de 9. Pero este reemplazo no es permanente y los datos almacenados
en el disco no son cambiados. A continuacin, haga clic con el botn izquierdo del ratn
en Frecuencias y seleccione la variable SEXA en la seccin etiquetada como Frecuencia
de. Posteriormente haga clic en OK. La distribucin de frecuencia mostrada en la Figura
1.57 debera aparecer.
87
FREQ
SEXA
Procedimiento
Anterior
Siguiente
Procedimiento
Conjunto
de
Datos
Actual
Adelante
SEXA
Frecuencia
Porcentaje
Porcentaje
acumulado
TOTAL
Lmites
de
Confianza
el
95%
88
FREQ
VIH
Procedimiento
Anterior
Siguiente
Procedimiento
Conjunto
de
Datos
Actual
Adelante
VIH
Frecuencia
Porcentaje
Porcentaje
acumulado
TOTAL
Lmites
de
Confianza
el
95%
Figura 1.59 Distribucin de Frecuencias para la variable VIH, de la cual se han removido
los valores 3 y 9.
Observe que la prevalencia de infeccin por VIH fue 9.2% entre los hombres de quienes
se pudieron obtener muestras clasificables La tercera variable que ser considerada es la
correspondiente a la creencia sobre la existencia de una medicamento para curar el
VIH/SIDA (i.e., la variable MEDICAMENTO). La distribucin de frecuencias para esta
variable se muestra en la Figura 1.60 (haga esto solo).
89
FREQ
MEDICAMENTO
Procedimiento
Anterior
Siguiente
Procedimiento
Conjunto
de
Datos
Actual
Adelante
MEDICAMENTO
Frecuencia
Porcentaje
Porcentaje
acumulado
TOTAL
Lmites
de
Confianza
el
95%
90
Seleccionar. En este punto usted necesitar utilizar el comando Seleccionar
(ubicado bajo la seccin Seleccionar/Si de la columna de Comandos de Anlisis) para
compactar el conjunto de datos hasta que este tenga un nmero menor de casos con
valores apropiados para las variables SEXA, VIH y MEDICAMENTO. Esto quiere decir
que eliminaremos los registros de 21 individuos (6 de estos por los valores de la variable
VIH, 15 por los valores de la variable SEXA y ninguno en el caso de la variable
MEDICAMENTO) de tal forma que todas las variables puedan ser tratadas como
variables binarias o dicotmicas (i.e., dos posibles valores) y nos permitan realizar todos
los anlisis en el mismo conjunto de datos.
Por medio de los programas de Estadsticas disponibles en Epi Info, calcularemos la
ocurrencia de relaciones sexuales anales recientes, la prevalencia de VIH y la proporcin
de hombres que creen en la existencia de un medicamento curativo para el VIH/SIDA.
Adems, calcularemos los intervalos de confianza al 95% para las primeras dos variables.
He titulado esta seccin como Anlisis Incorrecto porque no hemos considerado que los
datos fueron recolectados mediante una encuesta por conglomerados, sino que hemos
supuesto que los datos se recolectaron mediante una encuesta que utiliz muestreo
aleatorio simple.
Como primer paso, sin embargo, utilizaremos el comando Seleccionar para eliminar los
registros de 15 individuos del anlisis de la variable SEXA y los registros de 6 individuos
del anlisis de la variable VIH. Esto reducir el tamao del conjunto de datos a 279
registros con valores de 1 y 2 para las variables SEXA, VIH y MEDICAMENTO. Bajo la
seccin Seleccionar/Si, de la columna de Comandos de Anlisis, haga clic en Seleccionar.
En el espacio bajo la etiqueta Criterios de Seleccin introduzca los siguientes criterios:
SEXA < 9 AND VIH<3 (i.e., seleccione slo los casos de personas que respondieron la
pregunta sobre relaciones sexuales anales y los casos de personas que tuvieron resultados
de pruebas positivos o negativos). Esta informacin debera introducirse como se muestra
en la Figura 1.61.
91
.
SELECCIONAR
Criterios
de
Seleccin
SEXA<9
AND
VIH<3
Variables
de
Anlisis
VIH
Y
O
"Si"
"No"
"Ausente"
Funciones
Grabar
nicamente
Abrir
Ayuda
OK
Cancelar
Figura 1.61 Instruccin Seleccionar utilizada para remover los valores no deseados para
el anlisis de las variables SEXA y VIH.
Haga clic en OK y observe que ahora hay solamente 279 registros en lugar de los 300
originales.
92
ESCRIBIR
(EXPORTAR)
Todas
Variables
ESTUDIO
REGION
CONGLOMERADO
HH
NP
EDAD
CASADO
VACUNA
INFECTADO
MEDICAMENTO
Todas
(*)
Excepto
Examinar
Limpiar
Modalidad
de
Salida
Anexar
Reemplazar
Formatos
de
Salida
Epi
2000
Nombre
del
Archivo
C:\Epi_Info\418\aidsal2
Tabla
de
Datos
A
Grabar
nicamente
OK
Ayuda
Cancelar
93
Variable
de
Exposicin
Exp
No
exp
Variable
de
Resultado/Enfermedad
Enfermo
No
enfermo
a
b
c
d
Para recodificar, Epi Info, crea tablas con las etiquetas de variables en orden alfabtico o
numrico. Por ende, cuando se utiliza la etiqueta exp (para expuesto) y no exp (para
no expuesto), la letra e precede a la letra u en el alfabeto, por lo que la lnea
correspondiente a exp se lista primero, como se muestra en la figura de arriba. Si
continuamos utilizando las etiquetas 1 (para s) y 2 (para no), Epi Info tambin
realizar el anlisis correcto dado que 1 precede a 2 en el orden numrico.
Posteriormente, sin embargo, recodificaremos los valores de 1 y 2 a 1 (i.e., s) y 0
(i.e. no) para utilizarlos en los anlisis de regresin logstica en Stata. Para un conjunto
de datos como este, Epi Info listara las variables en orden inverso (i.e,, la fila de no
expuestos [codificada con el valor de 0] sera listada primero), por lo cual se producira un
anlisis incorrecto. Este punto ser discutido posteriormente con ms detenimiento en el
Manual de Entrenamiento del Software.
En nuestro conjunto de datos de 279 registros recodificaremos las etiquetas de resultados
de la variable VIH como enfermo y no enfermo. Las etiquetas de los valores de la
variable SEXA, por otro lado, sern recodificadas como exp y no exp. En primer
lugar, recodifique la variable VIH haciendo clic con el botn izquierdo del ratn en el
comando Recodificar, ubicado bajo la seccin de Variables en la columna de Anlisis de
Datos de Epi Info. Seleccione la variable VIH en la seccin etiquetada De. A
continuacin defina el rango para el valor 1 (i.e., 1 a 1) en la primera fila de la tabla de
recodificacin. Mientras el valor recodificado para 1 ser enfermo, el valor recodificado
para 2 ser no enfermo. Para insertar una segunda lnea en la tabla de recodificacin,
presione [entrar]. Cuando haya terminado de hacer esto, justo antes de presionar el botn
OK, la tabla de recodificacin de la variable VIH debera verse como la presentada en la
Figura 1.63,
94
RECODIFICAR
De
VIH
Valor
(en
blanco
=
otro)
1
2
A
Al
valor
(si
hay
alguno)
1
2
Valor
Recodificado
enfermo
no
enfermo
Frecuencias. Con el botn derecho del ratn, haga clic en Frecuencias, bajo la
seccin de Estadsticas de la columna de Comandos de Anlisis. Obtenga nuevamente una
distribucin de frecuencias de las variables VIH y SEXA como se muestra en la Figura
1.64., slo que esta vez hgalo utilizando una sola instruccin.
FREQ
ENFERMO
FRECUENCIA
%
+
-
Total
Peso/Ponderacin
Presentar
Resultados
en
la
Tabla
Configuracin
Limpiar
Frecuencia
de
Todas
(*)
Excepto
VIH
SEXA
Grabar
nicamente
Ayuda
Estratificado
por
OK
Cancelar
95
Haga clic en OK. El resultado debera ser como el mostrado en la Figura 1.65.
96
Porcentaje
Porcentaje
Porcentaje
Acumulado
Porcentaje
Acumulado
Figura 1.65 Distribucin de frecuencias de las variables VIH y SEXA con etiquetas
recodificadas sobre la base de un conjunto de datos compacto.
97
98
Adelante
exp
Fila
TOTAL
Fila
VIH
SEXA
enfermo
no enfermo
Columna
TOTAL
no
exp
Fila
Columna
Columna
PARAMETROS
Basados
en
Probabilidades
Razones
de
probabilidad
(Producto
Cruzado)
Razones
de
probabilidad
(Estimacin
de
Mxima
Verosimilitud)
PRUEBAS ESTADISTICAS
Chi cuadrado
P de una cola
P de dos colas
Intervalo
de
Confianza
al
95%
Estimacin Puntual
Inferior
Superior
99
FREQ
MEDICAMENTO
Procedimiento
Anterior
Siguiente
Procedimiento
Conjunto
de
Datos
Actual
Adelante
MEDICAMENTO
Frecuencia
Porcentaje
Porcentaje
acumulado
TOTAL
Lmites
de
Confianza
al
95%
100
resultados (al menos los valores de las razones de probabilidad) con los obtenidos del
mismo anlisis realizado correctamente en Stata.
ESCRIBIR (EXPORTAR)
Modalidad de Salida
Todas
Anexar
Reemplazar
Variables
ESTUDIO
Formatos de Salida
REGION
Epi 2000
CONGLOMERADO
HH
NP
C:\Epi_Info\418\aidsal3.mdb
EDAD
CASADO
Tabla de Datos
VACUNA
INFECTADO
MEDICAMENTO
Examinar
Grabar nicamente
OK
Limpiar
Ayuda
Cancelar
101
Anlisis Incorrecto Estratificacin. Si usted se detuvo por un rato, retorne
ahora a la seccin Analizar Datos de Epi Info, haga clic en Leer (Importar) seleccione el
archivo ubicado en la siguiente ruta C:\Epi_Info\418\aidsal3.mdb. Para encontrar la tabla
de datos A, seleccione Mostrar Todas y mueva el puntero a dicha tabla de datos y haga
clic en el botn OK. Esto cargar en memoria el conjunto de datos reducido con los
registros de 279 personas y con las etiquetas recodificadas de las variables VIH y SEXA.
Utilizaremos el comando de Tablas (ubicado bajo la seccin de Estadsticas en la columna
de Comandos de Anlisis) para crear una tabla 2x2 que compara la prevalencia de VIH
(variable de resultado) entre las personas que tuvieron relaciones sexuales anales
recientemente (variable de exposicin, SEXA=exp) versus aquellas que no tuvieron dichas
relaciones (SEXA=no exp). El anlisis ser dividido en dos estratos determinados por la
creencia y no creencia en la existencia de un medicamento para curar el VIH/SIDA
(MEDICAMENTO=1, s; MEDICAMENTO=2, no). Despus de hacer clic con el botn
izquierdo en Tablas, seleccione la variable SEXA como la variable de exposicin, VIH
como la variable de resultado y MEDICAMENTO como la variable de estratificacin.
Los resultados deberan ser como los presentados en la Figura 1.69.
102
103
SEXA;
VIH;
MEDICAMENTO=1
Adelante
exp
Fila
VIH
SEXA
enfermo
no enfermo
Columna
TOTAL
no
exp
Fila
Columna
TOTAL
Fila
Columna
Advertencia:
Los
valores
esperados
de
una
celda
son
<5.
La
Prueba
Exacta
de
Fisher
debera
ser
utilizada
PARAAMETROS
Basados
en
Probabilidades
Razones
de
probabilidad
(Producto
Cruzado)
Estimacin Puntual
Inferior
Superior
Razones
de
probabilidad
(Estimacin
de
Mxima
Verosimilitud)
PARAAMETROS
Basados
en
Riesgo
Razones de Riesgos(RR)
T
=
Series
de
Taylor;
C=Cornfield,
M=Valor
P
medio
(Mid-p);
F=
Prueba
Exacta
de
Fisher)
PRUEBAS ESTADISTICAS
Chi cuadrado
P de una cola
P
de
dos
colas
Figura 1.69 Tabulacin cruzada de las variables VIH y SEXA, controlando por la variable
MEDICAMENTO
104
VIH
SEXA
enfermo
no enfermo
TOTAL
exp
Fila
Columna
no exp
Fila
TOTAL
Fila
Columna
Columna
105
106
Advertencia: Los valores esperados de una celda son <5. La Prueba Exacta de Fisher debera ser utilizada
Razones de Riesgos(RR)
PRUEBAS ESTADISTICAS
Chi cuadrado
P de una cola
P de dos colas
RESUMEN
INFORMACIOON RESUMEN
Parmetros
Estimaciones de OR
OR Bruto (MLE)
OR ajustado (MH)
OR ajustado (MLE)
Chi cuadrado
P de una cola
P de dos colas
En las siguientes dos pruebas, valores p bajos indican que las razones difieren por estrato
Chi cuadrado para razones de probabilidad que difieren, por estrato (interaccin)
Inferior
Estimacin Puntual
107
Superior
La Figura 1/69 aparece en dos pantallas. Observe que tanto las razones de probabilidad
ajustadas como las razones de riesgo difieren ligeramente de la razn bruta de
probabilidad (5.07). o de la razn bruta de riesgo (4.05), lo cual indica que la variable
MEDICAMENTO es, , aunque slo levemente, una variable confusora.
Observe tambin que los valores de las razones de probabilidad y las razones de riesgo son
ms grandes en el estrato 1 ( ambos con valores positivos altos) que en el estrato 2 (ambos
con valores ligeramente positivos). Esto sugiere que el efecto de la variable SEXA en la
variable VIH es modificado por la tercera variable MEDICAMENTO. Si esto es as ,
entonces la variable MEDICAMENTO sera considerada como una variable
modificadora de efectos as como una leve variable de confusin. Note tambin que los
intervalos de confianza para las razones de probabilidad y de riesgo de los dos estratos son
bastante amplios. Por ende, las diferencias en el tamao de stas entre los dos estratos
podran deberse a variaciones azarosas y, por ende, no ser reales.
La porcin inferior del anlisis se muestra en la continuacin de la Figura 1.69. Aqu
vemos las estadsticas de resumen que combinan a los dos estratos en una razn de
probabilidades ajustada y una razn de riesgos ajustadas. Observe que la razn bruta de
probabilidades (5.07) es casi la misma que la razn de probabilidades ajustada por medio
de Maentel Haenszel (4.45). Esto indica que la confusin creada por la variable
MEDICAMENTO no distorsion la asociacin bruta entre la variable SEXA y la variable
VIH de una manera notable, an cuando la variable MEDICAMENTO es una variable
modificadora de efectos con resultados dramticamente diferentes en los dos estratos.
Debe observar tambin que en la parte inferior de la Figura 1.69, la prueba de chi
cuadrado, la cual evala si los estratos difieren con respecto a la magnitud de las razones
de probabilidad o riesgo (i.e., chi cuadrado para razones diferenciadas de probabilidad y
riesgo [interaccin]). Parece ser que la modificacin de efectos que observamos en las
razones de probabilidad no es estadsticamente significativa, con una probabilidad de
18.4% que la diferencia entre los estratos (i.e., interaccin)] se deba a variaciones
generadas por el azar. Los expertos en estadsticas se refieren a la modificacin de efectos
como interaccin, de tal forma que usted ver que este trmino ser usado tambin. Es
posible que se presente una modificacin de efectos en las dos razones de riesgo
especficas para cada estrato, aunque el resultado de la prueba de interaccin tiene un
valor de 0.2471, lo cual indica que existe una probabilidad de 24.7% que la diferencia se
deba a variaciones generadas por el azar, inherentes al proceso de muestreo. Tpicamente
los valores p deberan ser menores que 5 porciento (i.e., <0.05) antes de asombrarnos por
los hallazgos relacionados a la modificacin de efectos. Sin embargo, esta no es una regla
que se siga siempre.
Con esto concluye la seccin del anlisis incorrecto (incorrecto porque el anlisis supone
que se utiliz muestreo aleatorio simple, pero en realidad los datos provienen de una
encuesta por conglomerados). A continuacin compararemos los resultados del anlisis
correcto con los que han sido obtenidos hasta el momento.
108
Anlisis correcto Estimaciones de Prevalencia: En las secciones previas usted
gener la distribucin de frecuencias para la variable VIH utilizando el comando
inapropiado Frecuencias, ubicado bajo la seccin de Estadsticas en la columna de
Comandos de Anlisis (ver Figura 1.65). El programa present tanto los porcentajes para
el grupo codificado como enfermo (i.e., la estimacin de prevalencia) como los
intervalos de confianza para la estimacin de prevalencia. Ahora realizaremos el mismo
anlisis, slo que esta vez lo haremos de manera correcta, suponiendo que los datos se
generaron a partir de una encuesta por conglomerados. Sin embargo, primero necesitamos
recodificar los valores de las variables VIH y SEXA para convertirlas en variables con
valores de 0 y 1, dado que los comandos para Muestras Complejas no utilizan etiquetas
como enfermo o exp.
RECODIFICAR
De
VIH
Valor Recodificado
enfermo
no enfermo
109
Nuevo
Abrir
Grabar
Imprimir
Ejecutar
LEER
enfermo = 1
1=1
2=(.)
FINALIZAR
no
enfermo
=
(.)
FINALIZAR
no
exp
=
(.)
FINALIZAR
Figura 1.71 Error en el comando Recodificar como resultado de la digitacin del valor 0.
En el editor de programas, note que el valor no exp se ha recodificado como (.) [i.e., la
notacin de Epi Info para los valores ausentes (missing), en lugar de presentar el valor 0,
como se haba especificado]. Para corregir esta falla, ubicando el puntero del ratn y
110
utilizando la tecla [retroceso] en los lugares adecuados, reemplace los valores (.) con 0
(ceros), como se muestra en la Figura 1.72.
Nuevo
Abrir
Grabar
Imprimir
Ejecutar
LEER
enfermo = 1
no enfermo = 0
FINALIZAR
exp = 1
no exp = 0
FINALIZAR
1=1
2=0
FINALIZAR
Figura 1.72 Correccin del error del comando de Recodificacin, producido al asignar
valores de 0.
Seguidamente, haga clic en el botn Ejecutar para volver a ejecutar el programa de
recodificacin.
111
CONFIGURAR
112
Representacin
de
Valores
Especiales
SI
como
No
como
Si
No
Mostrar
Smbolo
Completo
Mostrar
Grficos
Mostrar
Hipervnculos
Estadsticas
Ninguna
Intermedias
Incluir
Ausentes
Procesar
registros
Normal
(no
borrados)
Ambos
Grabar
Todo
Grabar
nicamente
Restablecer
Ayuda
AUSENTE
como
Ausente
Mostrar
Criterios
de
Seleccin
Mostrar
Porcentajes
Mostrar
Tablas
en
los
Resultados
Mnimas
Avanzadas
Borrados
OK
Cancelar
113
MEDIAS
VIH
Siguiente
Procedimiento
Adelante
VIH
Total
FRECUENCIA
PORCENTAJE
Observaciones
Total
Media
Varianza
Desv.
Estnd.
Mnimo
Media
Mximo
Moda
PORCENTAJE
ACUMULADO
Figura 1.74 Media, varianza y desviacin estndar de la variable VIH, codificada con
valores 0 y 1.
El valor obtenido arriba es ligeramente diferente del 0.0877 mostrado en la Figura 1.74. La
varianza de la media es
114
115
MEDIAS
VIH
PSUVAR=CONGLOMERADO
Siguiente
Procedimiento
Adelante
Siguiente
Conteo
Media
Error
Estndar
TOTAL
Diseo
Muestral
Incluido
Variable
de
Ponderacin:
Ninguna
Variable
de
la
UPM:
CONGLOMERADO
Variable
de
Estratificacin:
Ninguna
Registros
con
valores
ausentes:
0
Lmites
de
Confianza
Inferior
Superior
Mnimo
Mximo
Figura 1.75 Media de la variable VIH, codificada con valores 0 y 1. Se presenta tambin
el error estndar y los lmites de confianza al 95%.
Compare los resultados de la Figura 1.65 (anlisis incorrecto) con lo de la Figura 1.75.
(anlisis correcto). Observe que ambas muestran que la prevalencia de VIH es 9.7%.
Evidentemente, esto es correcto. Sin embargo, los resultados difieren con respecto al
tamao de los intervalos de confianza al 95%, generados a partir de la varianza del valor
de prevalencia. En la Figura 1.65 (anlisis incorrecto), los lmites de confianza van de
6.5% a 13.8%. En otras palabras, el tamao del intervalo de confianza es de 7.3 puntos
porcentuales (i.e., 13.8-6.5=7.3). En la Figura 1.75 (anlisis correcto), los lmites de
confianza se extienden desde 4.1% hasta 15.2%, es decir, el intervalo de confianza tiene
un tamao de 11.1 puntos porcentuales o es un 52% ms ancho que el observado en el
caso del anlisis incorrecto basado en el supuesto de utilizacin de una muestra aleatoria
simple. Al contar con lmites de confianza ms anchos, los hallazgos se consideran menos
precisos o menos confiables (i.e., stos tienen una mayor varianza).. Tal incremento en la
varianza es tpico de una encuesta por conglomerados y explica la razn por la cual usted
debe utilizar un software especial para compensar por el hecho de contar con una varianza
ms grande en el anlisis. En este sentido, es importante mencionar que los programas
para Muestras Complejas en Epi Info toman en cuenta por el incremento en la varianza.
Ahora repita el proceso anterior con la variable SEXA. Seleccione la variable SEXA
como el parmetro de la seccin titulada Medias de. Seguidamente, seleccione la variable
CONGLOMERADO como la UPM. Posteriormente, haga clic con el botn izquierdo del
ratn en OK. Los resultados se muestran en la Figura 1.76.
116
Intervalos
de
Confianza
Inferior
Superior
Mnimo
Mximo
Figura 1.76 Media y lmites de confianza al 95% de la variable SEXA, codificada con
valores 0 y 1.
Nuevamente compare los resultados de la Figura 1.76 con los de la Figura 1.65 (anlisis
incorrecto). Ambos muestran que la prevalencia de relaciones sexuales anales es 18.6%.
La estimacin puntual permanece igual, independientemente del uso del programa
117
118
TABLAS
Variable
de
Exposicin
SEXA
Ponderacin
UPM
CONGLOMERADO
Presentar
Salidas
en
Tabla
Estratificar
Variable
de
Resultado
por
VIH
Enfermo
Altura
Grabar
nicamente
OK
Limpiar
Ayuda
Cancelar
Figura 1.77 Anlisis de la asociacin bruta entre las variables SEXA y VIH
Los resultados del anlisis dos-por-dos se muestran en la Figura 1.78. La razn de
probabilidad de las variables SEXA y VIH es 5.071, y la razn de riesgos es 4.054, la
misma que se observ en los datos no relacionados a encuestas analizados con el comando
Tablas en Epi Info (ver Figura 1.66). La diferencia entre las dos estimaciones radica en el
tamao de los lmites de confianza, lo cual evidencia las varianzas diferentes observadas
en encuestas por conglomerados. En la Figura 1.66 presentada previamente usted observ
que el intervalo de confianza para las razones de probabilidad era 2.21-11.61. Sin
embargo, para el anlisis de la encuesta por conglomerados, mostrado en la Figura 1.78,
dicho intervalo de confianza era de 2.33 11.053, es decir, ligeramente ms estrecho que
el obtenido mediante el anlisis incorrecto de Tablas. El mismo hallazgo inusual es
evidente al observar el intervalo de confianza obtenido para la razn de riesgos, el cual era
de 2.03-8.10 en el anlisis de Tablas (ver Figura 1.66) versus un intervalo de 2.07-7.928
presentado en la Figura 1.78. Por qu? La respuesta radica en la naturaleza del anlisis de
tabas cruzadas dado que ste refleja la variabilidad conjunta de las dos variables, la cual
algunas veces ser mayor o menor que lo observado en encuestas por conglomerados.
Finalmente, observe el efecto de diseo, la medida de cunto ms grande es la variancia de
una encuesta compleja en comparacin con una encuesta con el mismo nmero de
individuos, analizada como una muestra aleatoria simple. En la Figura 1.78, el efecto de
diseo se genera a partir de la ocurrencia del VIH, primero entre aquellos individuos para
quienes el valor de la variable SEXA es SEXA=exp (i.e., 0.233), luego en aquellos para
quienes el valor de dicha variable es SEXA=no exp (i.e., 1.735) y, finalmente, para los
valores totales de la variable VIH (i.e., 2.366). Esto significa que la varianza de la
estimacin de prevalencia en nuestra encuesta por conglomerados es 2.366 veces mayor
que si los datos se hubieran analizado errneamente como una muestra aleatoria simple
(una varianza mayor implica un intervalo de confianza mayor).
119
Note que este es el mismo valor mostrado en la parte inferior de la Figura 1.78 (i.e.,
0.0273 = 2.723%). Para calcular el efecto de diseo para la razn de probabilidad o la
razn de riesgo en Epi Info, usted necesita realizar los clculos ya sea mediante el anlisis
incorrecto (i.e., utilizando los comandos de Estadsticas, los cuales suponen que los datos
se generaron como observaciones independientes) o bien mediante el anlisis correcto
(i.e., utilizando los comandos de Estadsticas Avanzadas para Muestras Complejas).
Posteriormente, se elevan al cuadrado los errores estndar y se comparan los tamaos de
las varianzas (ver la ecuacin presentada abajo).
120
121
Epi
Info
Biblioteca
de
Resultados
Vista
Actual:
C:\Epi_Info\418\aidsal3.mdb:A
Conteo
de
Registros:
279
Fecha:
4/3/2005
3:34:22PM
TABLAS
SEXA
VIH
PSUVAR=CONGLOMERADO
Siguiente
Procedimiento
Adelante
Siguiente
SEXA
Enfermo
Exp
Fila
Columna
SE
Efecto de Diseo
No exp
Fila
Columna
SE
Efecto de Diseo
TOTAL
Fila
Columna
SE
Efecto de Diseo
VIH
No
enfermo
TOTAL
Figura 1.78 Asociacin bruta entre la variable SEXA y la variable VIH, estimada a partir
de datos de encuesta.
122
CTABLAS
MUESTRA
COMPLEJAS
DISEO
ANALISIS
DE
TABLA
2X2
Razones
de
Probabilidad
(OR)
Error
Estndar
Lmites
de
Confianza
al
95%
Razones
de
Riesgo
(RR)
Error
Estndar
Lmites
de
Confianza
al
95%
RR=(Riesgo
de
VIH=enfermo
si
SEXA=exp)
/
(riesgo
de
VIH=enfermo
si
SEXA=unexp)
Diferencia
de
Riesgos
(RD)
Error
Estndar
Lmites
de
Confianza
al
95%
RD=(Riesgo
de
VIH=enfermo
si
SEXA=exp)
-
(riesgo
de
VIH=enfermo
si
SEXA=unexp)
Diseo
Muestral
Incluido
Variable
de
Ponderacin
Ninguna
Variable
UPM:
CONGLOMERADO
Variable
de
Estratificacin:
Ninguna
Registros
con
valores
ausentes:0
123
124
ESCRIBIR
(EXPORTAR)
Todas
Variables
ESTUDIO
REGION
CONGLOMERADO
HH
NP
EDAD
CASADO
VACUNA
INFECTADO
MEDICAMENTO
Todas
(*)
Excepto
Examinar
Limpiar
Modalidad
de
Salida
Anexar
Formatos
de
Salida
Epi6
Nombre
del
Archivo
C:\Epi_Info\418\aidsal4
Tabla
de
Datos
Grabar
nicamente
Ayuda
Reemplazar
OK
Cancelar
125
Departamento de Epidemiologia
UCLA
Buscar
Ralph R. Frerichs
Este
programa
es
necesario
para
planear
y
organizar
encuestas
bietpicas
por
conglomerados.
Si
bien
se
ensea
sobre
este
programa
en
el
curso
EPI
418
Encuestas
Rpidas,
el
mismo
est
disponible
de
forma
gratuita
para
cualquier
persona
que
lo
requiera.
Bioterroris
mo
Historia
contempornea
del
bioterrorismo
Detectives
de
enfermeda
des
Controversi
as
sobre
VIH
Sitio
web
de
John
Snow
Encuestas
Rpidas
Instalacin de Csurvey
Informacin
para
usuarios
de
Windows
XP
(en
formato
PDF)
para
descargar,
extraer
e
instalar
el
archivo
zip
que
contiene
el
programa
para
encuestas
por
conglomerados
Csurvey.
Csurvey
Manual
Departamento
de
Epidemiologia
de
UCLA
Manual
de
Csurvey
(archivos
PDF).
Requiere
contar
con
Adobe
Acrobat
Reader
para
ver
e
imprimir
el
manual.
Sobre EPI
Cursos y Seminarios
Centros y Programas
Se
requiere
el
programa
para
descomprimir
los
archivos
zip
y
el
manual.
Departamento
de
Epidemiologia
Universidad
de
California,
Es
una
utilidad
para
convertir
datos
de
Epi
Info
al
formato
Los
ngeles
(UCLA)
Escuela
de
Salud
Publica
de
Stata
Profesores
y
preceptores
Recursos
Convertidor
de
datos
de
formato
Epi
Info
a
formato
Stata.
Enlaces
Informaci
n
general
Fax
Cmo
convertir?
Informacin
sobre
cmo
convertir
datos
de
Epi
Info
al
formato
de
Stata
126
Si usted usa Windows XP, para descomprimir el archivo descargado epi2dct.zip necesitar
abrir el Explorador de Windows para encontrar dicho archivo. Una vez que lo encuentre
haga clic en l y en la columna en la izquierda de la pantalla haga clic en
Tareas
de
Carpeta
Extraer
todos
los
archivos
Si usted est utilizando Winzip siga los pasos descritos a continuacin. Cuando el
Asistente de Extraccin o el Asistente de Winzip aparezca introduzca C:\Stata (o
cualquiera que sea el nombre de su directorio de Stata) como .se muestra en la Figura 1.81.
127
Si usted est usando las instrucciones de UCLA para trabajar con el archivo epi2dct,
asegrese que el nombre sea aidsal4 en lugar de epi1 como en el ejemplo. Una vez que el
archivo epi2dct est listo para usarse, usted deber hacer clic en
(ubicado en la parte inferior izquierda de la pantalla) y a continuacin haga clic en
. Posteriormente haga clic en
. Cambie el
directorio a C:\Stata (vea la Figura 1.82 para el comando cd Stata) y luego introduzca el
comando para epi2dct como se muestra en la Figura 1.82.
128
Cerrar
Comando
infile
using
c:\Stata\Data\AIDSAL4.dct
129
Revisin
Nmero de serie
Diccionario [
Estudio "ESTUDIO"
Regin "REGION"
Conglomerado "CONGLOMERADO"
edad edad
Escritorio
casado "CASADO"
Mis documentos
vacuna "VACUNA"
Mi PC
Variables
infectado "INFECTADO"
Mis Redes
Condn "Condn"
Grabar
SEXA "SEXA"
Datos de Stata
Cancelar
MEDICAMENTO "MEDICAMENTO"
Grabar
C:\stata\data\aidsal4.dta
Archivo
C:\stata\data\aidsal4.dta
grabado
Anlisis de Medias en Stata. Primero veremos cmo los resultados del comando
svy: mean de Stata se comparan con los del programa de Medias para Muestras
Complejas de Epi Info. Sin embargo, antes de realizar el anlisis, usted necesita decirle a
Stata cual variable (i.e., Conglomerado) corresponde a las unidades primarias de muestreo
(UPM). Para hacer esto escriba el comando svyset conglomerado en la ventana de
Comandos de Stata. El programa presentar lo siguiente en la ventana de Resultados de
Stata:
130
Figura 1.85 Estimacin de la media para las variables VIH y SEXA en Stata
131
Por favor note que la media y el intervalo de confianza al 95% son los mismos en Stata y
Epi Info (ver Figura 1.75 para la variable VIH y la Figura 1.76 para la variable SEXA).
Para calcular el efecto de diseo, el cual compara la varianza de una encuesta por
conglomerados con la de una encuesta de tamao similar que utiliza muestreo aleatorio
simple, digite el comando estat effects, deff como se muestra en la Figura 1.85a.
Media
Error
Estndar
Linearizado
Deff
Deff
132
Numero de UPMs: 1
Tamao Poblacional
F(1, 29)
Probabilidad
>
F
vih
sexa
vih
sexa
_cons
Figura 1.86 Razones de probabilidad calculadas en Stata para las variables VIH y SEXA.
El tamao de los intervalos de confianza presentados en la Figura 1.86 es igual al que se
calcul anteriormente mediante el procedimiento de Tablas de Epi Info (el cual es
incorrecto, dado que no considera que se est trabajando con una encuesta por
conglomerados. Ver Figura 1.66) y mediante el comando Tablas de Muestras Complejas
(correcto para encuestas por conglomerados. Ver Figura 1.78). En general, favorezco el
anlisis en Stata, pero considero aceptable el anlisis de Tablas de Muestras Complejas de
Epi Info siempre y cuando se cite la fuente. El procedimiento de anlisis de Tablas de Epi
Info no es aceptable para encuestas por conglomerados.
133
134
Numero de UPMs: 1
Tamao Poblacional
F(2, 28)
Probabilidad > F
vih
sexa
medicamento
vih
sexa
medicamento
_cons
Figura 1.87 Razones de probabilidad calculadas en Stata para las variables VIH y SEXA
y MEDICAMENTO.
En este caso la razn de probabilidad ajustada (6.42) es similar pero ligeramente mayor
que la razn de probabilidad ajustada por medio de la estimacin de mxima verosimilitud
(MLE por sus siglas en ingls) y estimada en el anlisis de Tablas de Epi Info (i.e. 6.32,
ver Figura 1.69) y mucho ms grande que la razn de probabilidad ajustada por medio de
Mantel Haenszel en dicho programa (i.e., 5.76, ver Figura 1.69). Stata utiliza un
procedimiento estadstico que crea una estimacin de mxima verosimilitud (MLE por sus
siglas en ingls) de las razones de probabilidad (OR por sus siglas en ingls) en lugar de la
versin de Mantel Haenszel, la cual es preferida por los epidemilogos. Finalmente,
tambin los intervalos de confianza son diferentes en los dos programas. El programa
errneo de Tablas de Epi Info con el OR Ajustado (MLE) gener un intervalo de confianza
de 2.60-15.43 (ver Figura 1.69) versus el generado con Stata de 2.8014.74 (ver Figura
1.87). Consecuentemente, el intervalo de confianza de los datos de la encuesta, generado
en Stata, es ligeramente ms estrecho (como lo indica el efecto de diseo menor que 1.0
ver el comentario de arriba) que el observado en el caso de las estimaciones de
prevalencia. Este tiene que ver ms con la variabilidad especfica de los datos en aidsal4 y
no puede ser generalizado a otros conjuntos de datos.
135
Cuando se analiza la relacin entre una variable de exposicin y una variable de resultado,
los epidemilogos usan frecuentemente las razones de riesgo (i.e., el riesgo de ocurrencia
de enfermedad entre las personas expuestas dividido por el riesgo de la enfermedad entre
los no expuestos) y tambin usan comnmente las razones de probabilidad (i.e.,
probabilidad entre los expuestos dividida por la probabilidad entre los nos expuestos). El
programa Epi Info genera ambas medidas, es decir, tanto OR como RR para datos
regulares y para datos de encuestas por conglomerados. Sin embargo, en el caso de
encuestas por conglomerados, el programa Epi Info no puede ser utilizado para analizar la
relacin entre una variable de exposicin y una variable de resultado, controlando por una
o ms variables confusoras. Para hacer esto, usted necesita utilizar Stata. El procedimiento
para calcular una razn de probabilidad ajustada despus de controlar por el efecto de
confusin se present anteriormente. Aqu presentar cmo calcular una razn de riesgos
ajustada despus de controlar por el efecto de confusin (o razn de prevalencia si se
utilizan datos de prevalencia).
Previamente, tal como se present en la Figura 1.66, usted analiz la relacin entre la
variable SEXA y la variable VIH utilizando el comando de Tablas (ubicado bajo la
seccin de Estadsticas en la columna de Comandos de Anlisis). Usted observ que la
razn de riesgos era de 4.0536 con un intervalo de confianza al 95% de 2.0288 a 8.0993.
Es decir, si no existe sesgo o un efecto de confusin adicional, usted puede tener una
confianza del 95% que la verdadera razn de riesgo en la poblacin muestreada est
incluida dentro del intervalo mencionado.
Sin embargo, estos datos fueron analizados como si provinieran de una muestra aleatoria
simple y no de una encuesta por conglomerados. El anlisis correcto para una encuesta por
conglomerados se mostr en la Figura 1.78. Aqu la razn de riego fue igual que la
obtenida con el comando de Tablas (i.e., 4.054 versus 4.0536), pero los lmites del
intervalo de confianza fueron ms estrechos (i.e., 2.13, 7.71 versus 2.0288,
8.0993). Como se mencion anteriormente, cuando se realizan estimaciones puntuales
para una sola variable como la prevalencia de VIH o la prevalencia de relaciones sexuales
anales, los intervalos de confianza para las encuestas por conglomerados son generalmente
ms grandes que los calculados en una encuestas de tamao similar que utiliza muestreo
aleatorio simple (SRS por sus siglas en ingls). Sin embargo, cuando se compara una
variable con otra, tal como se hace en una razn de riesgo, no hay un patrn consistente en
las estimaciones de varianza obtenidas en las encuestas basadas en muestro aleatorio
simple (SRS) versus las obtenidas en las encuestas por conglomerados.
A continuacin, nos enfocaremos en la estimacin de razones de riesgo para la variable
SEXA, considerando a sta como un factor de riesgo para el VIH. Tambin estimaremos
la razn de riesgo para SEXA como factor de riesgo para el VIH, controlando por el efecto
de la variable MEDICAMENTO. Para hacer esto, usted realizar un anlisis de regresin
de Poisson utilizando el comando svypoisson para calcular las razones de riesgo o razones
de prevalencia.
136
- Anlisis Bruto: En Stata, haga clic con el botn izquierdo del ratn en el men Archivo
y luego en Abrir. A continuacin seleccione el archivo aidsal4.dta. La ventana de Revisin
debera indicar use "C:\Stata\data\aidsal4.dta", clear y la ventana de Variables debera
mostrar los nombres de todas las variables. En la ventana de Comandos de Stata
introduzca el comando svy: poisson vih sexa, irr. Seguidamente introduzca el comando
estat effects, deff para calcular el efecto de diseo. Los resultados se muestran en la Figura
1.88. Observe nuevamente que el efecto de diseo es menor que 1.0, lo cual indica que
nuestro anlisis de encuestas por conglomerados es ms eficiente que una encuesta de
tamao similar que utilice muestreo aleatorio simple. Tenga en mente, sin embargo, que
usted no puede hacer generalizaciones sobre el efecto de diseo cuando calcula una razn
de riesgos o una razn de probabilidad.
.
svy:
poisson
vih
sex,
irr
(ejecutando
el
comando
poisson
en
la
muestra
para
estimacin
Encuesta:
Regresin
de
Poisson
Nmero
de
estratos:
1
Nmero
de
Observaciones:
Numero
de
UPMs:
30
Tamao
Poblacional
Grados
de
Libertad
del
Diseo
F(2,
28)
Probabilidad
>
F
vih
IRR
Error
Estndar
Linearizado
t
P>|t|
[Intervalo
de
Confianza
al
95%]
sexa
.
estat
effects,
deff
vih
Coeficiente
Error
estndar
linearizado
Efecto
de
Diseo
sexa
137
_cons
138
Numero de UPMs: 30
Tamao Poblacional
F(2, 28)
Probabilidad > F
vih
sexa
medicamento
vih
sexa
medicamento
_cons
Figura 1.89 Regresin de Poisson para HIV y SEXA, controlando por la variable
MEDICAMENTO
139
140
Figura 1.91 Diferencia en el valor de VIH segn los valores de la variable SEXA
La diferencia del valor de VIH en el grupo para el cual la variable SEXA=1 versus el
grupo para el cual el valor de esa variable es 0 es de 18.8 puntos porcentuales con lmites
de confianza al 95% de 6.5% a 31.2%. Usted realiz el mismo anlisis anteriormente con
Comando de Anlisis regular de Epi Info (ver Figura 1.66), pero ste no tom en cuenta
que los datos provenan de una encuesta por conglomerados.
El valor de la diferencia de riesgos es el mismo de antes, pero hay una pequea diferencia
en los lmites de confianza. Observe que la diferencia de riesgos calculada en Stata es
similar al valor obtenido en Epi Info mediante el comando de Estadsticas Avanzadas (ver
Figura 1.74). Para algunas variables, la varianza obtenida del anlisis incorrecto (i.e., Epi
Info con el Comando de Anlisis regular) no difiere mucho de la varianza obtenida del
anlisis correcto (i.e., un anlisis que toma en cuenta el efecto de la variable
conglomerado). Note que el efecto de diseo en este anlisis tiene un valor de 0.94, lo cual
indica que el intervalo de confianza ser similar al de muestra aleatoria simple de tamao
similar. Dado que usted no conoce de antemano si la varianza ser mayor o menor que en
una encuesta de tamao similar que utilice muestreo aleatorio simple, cuando trabaje con
datos de encuestas rpidas usted siempre debera utilizar los comandos de Estadstica
Avanzadas de Epi Info o los comandos de encuestas de Stata.
141
Resumen. Todas las pruebas estadsticas trabajan con supuestos que pueden o no
cumplirse. Usualmente, el valor de estas pruebas es debatido por profesionales d
estadstica y es evaluado por estudiantes de estadstica a nivel de postgrado. Los
epidemilogos han preferido por largo tiempo los estimadores de Mantel Haenszel tanto
para el clculo de razones de probabilidad como para el clculo de razones de riesgo.
Estos estimadores son especialmente tiles cuando existen menos de 10 individuos por
estrato. La razn de esto es que los estimadores de Mantel Haenszel son ms precisos en
un rango ms amplio de valores. Sin embargo, los estimadores de Mxima Verosimilitud
tambin son populares y tienden a ser usados en muchos paquetes estadsticos. Para datos
de encuestas, sugiero usar los mdulos de Muestras Complejas de Epi Info o los comandos
svy de Stata. No sugiero usar las estadsticas regulares de Epi Info, aunque el programa es
muy til para la digitacin de datos, edicin y anlisis preliminar. Para anlisis avanzados
que consideran ms de dos variables, sugiero utilizar Stata en lugar de Epi Info.
CONCLUSIONES
La belleza de Epi Info radica en el hecho de permitir a los epidemilogos de todo el
mundo analizar sus datos y usar estadsticas para mejorar su visin de los procesos
epidemiolgicos. Para dar el paso de la informacin hacia la formulacin e
implementacin de polticas necesarias para tomadores de decisiones-, los epidemilogos
necesitan ser capaces de comunicar sus resultados de una manera comprensible. Los
errores estndar (o, de manera ms relevante, las varianzas) no son fcilmente
comprendidos por la mayora de las personas. Por otro lado, los intervalos de confianza
son muy efectivos para comunicar hallazgos o la falta de certeza sobre los mismos. En
epidemiologa hemos llegado lejos con respecto a nuestra capacidad para simplificar
nuestros hallazgos de investigacin. Esta es nuestra fortaleza. Al crear un software gratuito
que satisface las necesidades de los epidemilogos y expertos en muestreo, con
estimaciones de parmetros y lmites de confianza, el CDC y la Organizacin Mundial de
Salud han hecho una gran labor para promover el uso de encuestas rpidas como
instrumentos para obtener informacin en pases en desarrollo.
A pesar de ser bueno, el programa Epi Info no es perfecto para encuestas por
conglomerados. El programa puede analizar la prevalencia, la incidencia de enfermedades
o condiciones (generadas en forma de proporciones), las razones de probabilidad y las
razones de riesgo que relacionan a dos variables tales como factores de riesgo y
enfermedades. Este programa puede calcular tambin la diferencia entre dos proporciones,
medida como una diferencia de riesgos. Sin embargo, el programa no puede realizar
anlisis complicados que involucran a variables de confusin o intervencin.
Afortunadamente, existen otros programas que realizan tales anlisis avanzados. El que se
presenta en esta clase es Stata.
142
Captulo 2
CREACIN DE FORMULARIOS
INTRODUCCIN
Existen varios programas de computacin para apoyar en la implementacin de estudios
de campo. Usted ya ha aprendido a usar dos de estos programas, a saber, Epi Info y Stata,
los cuales son tiles para capturar, procesar y analizar datos de encuestas de manera
oportuna. Este captulo le ayudar a aprender a usar la funcin de Tablas en su programa
procesador de palabras para crear los formularios necesarios para administrar una
investigacin de campo.
La mayora de los estudios requiere dos tipos de formularios: en primer lugar, formularios
de entrevista (denominados tambin boletas) y en segundo lugar, formularios de control
o administracin. Las boletas, las cuales usualmente se crean un programa procesador de
palabras, se utilizan para recopilar la informacin que se analizar. Con el fin de obtener
beneficios de las sabidura colectiva de mltiples expertos, las versiones borradores de las
boletas se distribuyen para revisin y critica. Las mltiples revisiones se incorporan en un
borrador de seguimiento y son distribuidas nuevamente. Cuando el investigador est
satisfecho con las boletas, estas son sometidas a prueba en un grupo pequeo de personas
con caractersticas similares a la poblacin a encuestar. Dicha prueba se conoce como un
estudio de factibilidad. Si los individuos tienen problemas comprendiendo las preguntas
o si el personal de campo tiene problemas en la implementacin de los procedimientos
para aplicar el cuestionario, se realizan revisiones adicionales y continan las pruebas de
campo. Finalmente, cuando las boletas han sido revisadas satisfactoriamente, se puede
conducir un pequeo estudio piloto en una comunidad similar a otra en la que se realizar
el estudio eventualmente. Este paso final ayuda a asegurar que todos los aspectos del
estudio funcionan de la manera esperada. Para hacer todo esto rpidamente, es esencial
contar con un buen programa procesador de palabras. Sin embargo, si no hay ninguno
disponible, el componente de procesamiento de palabras de Epi Info podra ser utilizado.
Los formularios administrativos se diferencian de las boletas porque los primeros no se
utilizan para recopilar datos, sino para mantener un registro de quien:
Ha sido invitado a participar en el estudio (i.e., la poblacin elegible)
Ha dado su consentimiento para participar (i.e., personas a entrevistar), y
Ha proporcionado datos analizables (i.e., individuos).
El supervisor de campo utiliza los formularios administrativos para especificar el
porcentaje de personas que participaron en el estudio y para resumir la disposicin final de
143
cada participante. Tal y como se mostrar mas adelante en este captulo, estos formularios
se crean generalmente por medio de la funcin de creacin de tablas de los programas
procesadores de palabras. Despus que se han creado formularios para un estudio, estos
pueden ser modificados rpidamente y pueden ser utilizados tambin para otros estudios.
144
FORMULARIOS ADMINISTRATIVOS
La Encuesta por conglomerados sobre factores de riesgo de VIH/SIDA ser nuestro
primer estudio. Por consiguiente, el nmero del estudio ser 001. Tanto el nmero del
estudio como su nombre se incluyen con la informacin descriptiva en la parte superior de
cada formulario.
145
formulario se orienta diagonalmente de manera que el punto de inicio pueda ser dibujado
en la parte inferior izquierda de la pgina y que el punto de finalizacin se presente en la
parte superior derecha. Un ejemplo del Formulario 1 se muestra en la Figura 2.2. Los
mensajes en las cajas sombreadas no son parte de estos formularios, sino tan solo unas
guas para este manual.
Departamento
de
Epidemiologia
Formulario 1
MAPA DE HOGARES
Estudio No.
001
Nombre
del
Estudio
Conglomerado No.
Nombre de la Comunidad
Entrevistador(es)
Asignado(s)
Total
de
hogares
a
lo
largo
de
la
lnea
Hogar
de
inicio
aleatorio
No.
Mostrar el Norte
Tabla
Ventana
Ayuda
Adobe PDF
Dibujar
Tabla
Normal
Insertar
Tabla
Comentarios
de
Acrobat
Formulario
146
Tabla
de
Figura 2. 6 Nmeros
aleatorios enteros de 1 a 100
Nmeros Aleatorios. Para seleccionar el hogar de inicio aleatorio, es necesario crear una
tabla de nmeros aleatorios. Si generalmente se observa que hay menos de 1000 hogares
desde el centro de un conglomerado (i.e., pueblo) hasta la periferia del mismo a lo largo de
una lnea imaginaria, entonces se puede crear un formulario de nmeros aleatorios con
valores que vayan desde 1 hasta 999, tal como se muestra en Excel en la Figura 2.5. Si a lo
largo de esa lnea imaginaria se observa que generalmente existen menos de 100 hogares,
entonces el formulario estar compuesto por nmeros aleatorios de dos dgitos (ver Figura
2.6).
En la mayora de los casos en las reas rurales, las tablas de nmeros aleatorios de 2-3
dgitos sern suficientes. Una vez que los nmeros aleatorios han sido generados, se
debern copiar a una tabla en el programa procesador de palabras (por ejemplo, Microsoft
Word), la cual deber incluir apropiadamente el ttulo Formulario 2. Se podran generar
dos tablas de nmeros aleatorios como parte de este formulario, a saber, una tabla con
nmeros aleatorios entre 1 y 100 (mostrada en la Figura 2.7) y una segunda tabla con
nmeros
aleatorios
entre
el
1
y
el
1000.
147
Estudio No.
001
Nombre
del
Estudio
148
Conglomerado
No.
Nmero
secuencial
del
hogar
Adulto en casa?
Nombre de la Comunidad
NO
Hombre
de
20
a
39
aos
en
casa?
SI
NO
SI
Hombre
de
20
a
39
aos
dispuesto
a
participar?
Hombre
de
20
a
39
aos
dispuesto
a
participar?
NO
Nmero
que
se
Nmero
encuentra
entrevistado
en
casa
SI
Pgina
No.
COMENTARIOS
Total
Formulario
4a
Estudio
No.
001
Nombre
del
Estudio
149
Conglomerado
No.
Hogares
con
adulto
en
casa
Nmero
de
Participacin
(%)
registros
en
la
PC
Nmero
de
discado
giratorio
Cdigo
de
entrevistador
(1)
(2)
COMENTARIOS
En casa
Entrevistados
10
11
12
13
14
15
Hay espacio para los cdigos del entrevistador en cada conglomerado y para los nombres
y cdigos de todos los entrevistadores en el estudio ( ver Formulario 4b en la Figura
2.10). Se solicitan las fechas en la parte inferior del formulario tanto para el inicio como
para el final de las actividades de campo, para el momento en el que se envan las tablas y
grficos iniciales y para el momento en el que se completa la elaboracin del informe
final. Tambin hay un espacio pequeo para comentarios. Nuevamente, es importante
considerar que los mensajes en las cajas sombreadas no son parte del formulario, sino tan
slo guas para este manual.
150
Departamento
de
Epidemiologia
DISPOSICION
DEL
ESTUDIO
Formulario 4a
Nombre
del
Estudio
Estudio No.
001
Conglomerad
o
No.
Hogare
Hombres
entre
los
20
y
39
aos
de
edad
s
con
adulto
en
casa
En
casa
Entrevistados
Participacin
(%)
25
26
27
28
29
Registre
el
total
para
todos
los
conglomerados
30
Total
Nombre
COMENTARIOS
FECHA
DE
ENVIO
DE
HALLAZGOS
Grficos
y
tablas
iniciales
COMENTARIOS
Cdigo No.
Cdigo
de
entrevistador
(1)
(2)
Nombre
Nmero
de
discado
giratorio
Nmero
de
registros
en
la
PC
Final
Informe
Final
CONCLUSIONES
Con esto concluye el captulo sobre creacin de formularios. Usted ha podido observar la
apariencia de estos, tiene una idea de su uso y ha recibido sugerencias sobre cmo
crearlos. Una vez que se ha completado este proceso, los formularios pueden ser utilizados
en otros estudios, claro est, con las modificaciones apropiadas. Con una impresora
porttil de burbuja, los formularios pueden ser creados en el campo y tener la apariencia
de haber sido tipeados, lo cual aadir una presentacin profesional a su estudio.
151