Anda di halaman 1dari 232

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/313823025

Manual de Investigación para Ciencias Sociales y de la Salud en Grado y


Posgrado

Book · September 2016

CITATION READS

1 309

1 author:

Eulogio Real Deus


University of Santiago de Compostela
57 PUBLICATIONS   400 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Programa de acompañamiento pedagógico familiar como agente de prevención en situaciones de riesgo. View project

Deseño de medidas para mellora-las actitudes cara ó galego e incrementa-lo seu uso View project

All content following this page was uploaded by Eulogio Real Deus on 18 February 2017.

The user has requested enhancement of the downloaded file.


MANUAL DE INVESTIGACIÓN PARA
CIENCIAS SOCIALES Y DE LA SALUD EN
GRADO Y POSGRADO
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO
Y POSGRADO
Eulogio Real Deus
UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA
4.0, CC BY-NY-SA
CC
Diagramación, diseño e impresión:
EDILOJA Cía. Ltda.
Telefax: 593-7-2611418
San Cayetano Alto s/n
www.ediloja.com.ec
edilojainfo@ediloja.com.ec
Loja-Ecuador
Primera Edición
ISBN físico
Maquetación y diseño digital
EDILOJA Cía. Ltda.

La versión impresa y digital han sido acreditadas bajo la licencia Creative Commons 4.0, CC
BY-NY-SA: Reconocimiento-No comercial-Compartir igual; la cual permite: copiar, distribuir y
comunicar públicamente la obra, mientras se reconozca la autoría original, no se utilice con
fines comerciales y se permiten obras derivadas, siempre que mantenga la misma licencia al
ser divulgada. https://creativecommons.org/licenses/by-nc-sa/4.0/deed.es

Septiembre, 2016
Índice

1. Introducción................................................................................................ 5
1.1. La necesidad de un manual de investigación.......................................6
1.2. Aspectos éticos..................................................................................8
1.3. Esquema básico de una investigación................................................11
2. El proceso de investigación......................................................................... 17
2.1. Selección y documentación sobre el tema de investigación................. 18
2.2. Determinación del problema objeto de investigación........................ 23
2.2.1. El marco teórico...................................................................25
2.2.2. El problema objeto de investigación......................................25
2.3. Documentación bibliográfica sobre investigaciones previas............... 27
2.4. Estrategia de investigación..............................................................30
2.5. Diseño de investigación – enfoque metodológico............................... 37
2.5.1. Tipos de estudios..................................................................37
2.6. Objetivos e hipótesis........................................................................ 39
2.7. Elaboración de instrumentos........................................................... 41
2.7.1. Escalas de medida............................................................... 45
2.7.2. Escala de respuesta............................................................. 50
2.7.3. Elaboración de ítems............................................................53
2.7.4. Fiabilidad........................................................................... 60
2.7.5. Validez............................................................................... 66
2.8. Selección de la muestra....................................................................70
2.8.1. Tipos de muestreo................................................................73
2.8.2. Cálculo del tamaño muestral................................................78
2.9. Recogida de datos............................................................................82
2.9.1. Trabajo de campo................................................................ 82
2.9.2. Codificación de los datos.......................................................83
2.9.3. Depuración de los datos....................................................... 88
2.10. Análisis de datos........................................................................... 103
2.10.1. Descripción de la muestra................................................. 104
2.10.2. Índices de posición: percentiles y puntuaciones estándar......108
2.10.3. Relaciones entre variables de escala.....................................111
2.10.4. El contraste de hipótesis.....................................................126
2.10.5. Otros tipos de relaciones.....................................................146
2.10.6. Relaciones entre variables categóricas y de escala................ 159
2.10.7. Técnicas de reducción de datos: el análisis factorial..............182
2.10.8. Otras técnicas de reducción de datos...................................190
2.10.9. Técnicas de clasificación.................................................... 208
2.11. Integración de resultados.............................................................. 218
2.12. Redacción de la memoria............................................................... 219
3. Bibliografía..............................................................................................228
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

1. Introducción
Este libro pretende servir de orientación y ayuda a investigadores de
las Ciencias Sociales o las Ciencias de la Salud (y, más concretamente,
de disciplinas próximas a la Psicología, a la que pertenece el autor). No
obstante, también podría ser de utilidad para investigadores de otras
disciplinas, como la Biología o la Economía. En cuanto a la orientación,
proporciona una guía para organizar un proyecto de investigación
desde el principio hasta el final, indicando los pasos a seguir, así como
la importancia y lugar que cada uno de estos pasos ocupa en el proceso
investigador. En cuanto a la ayuda, está pensado como un manual de
investigación, que puede ser empleado como referencia para aclarar
conceptos, estrategias de investigación, o aspectos metodológicos y
estadísticos, así como proporcionar información bibliográfica relevante
acerca de todos estos aspectos.

El público al que se dirige este manual incluye cualquier investigador, ya


se trate de un estudiante de Grado que deba preparar su Proyecto Fin de
Grado, un estudiante de Posgrado que quiera preparar su Proyecto de Fin
de Máster o su Tesis Doctoral, o un profesional de la enseñanza que desee
introducirse en el mundo de la investigación, o profundizar en el mismo.

Para facilitar la lectura y la consulta de este manual, los diferentes


apartados estarán organizados en forma secuencial, siguiendo la sucesión
de pasos habitual en cualquier proceso investigador. No obstante, la
extensión de estos apartados no será la misma, sino que se hará énfasis
en lo que se refiere a la parte metodológica y estadística del trabajo. Esto
se debe no sólo a que se trata de aspectos fundamentales y básicos que
debemos tener en cuenta, sino también al hecho de que existen diferentes
metodologías y multitud de herramientas de análisis estadístico de los
datos a nuestra disposición, por lo que para un mismo objeto de estudio
pueden existir múltiples estrategias metodológicas y de análisis. El
conocimiento de las distintas opciones existentes ayudará al investigador
a decidir cuál es la estrategia más adecuada para conseguir los objetivos
de su trabajo o, si fuera el caso, dar respuesta a las hipótesis de trabajo
planteadas. Sin embargo, no se expondrán aquí las bases matemáticas
y estadísticas de los procedimientos recogidos en este libro, salvo en los

5
Eulogio Real Deus

casos más sencillos en los que su introducción resulte didáctica. La razón


para este proceder es doble: por un lado, existen manuales especializados
que pueden consultarse para ampliar conocimientos sobre cualquiera
de los aspectos tratados en este manual sobre lo que el lector quiera o
necesite profundizar. Por otra parte, el principal objetivo de este libro es
el de ser una fuente de información clara y asequible tanto para alumnos
como para profesores, por lo que se intentará facilitar la lectura, evitando
en la medida de lo posible recurrir a fórmulas matemáticas. En aquellos
casos en los que se incluyan fórmulas, se hará de forma que éstas no sean
imprescindibles para la comprensión del texto.

Finalmente, dado que la estadística forma una parte muy importante


del trabajo investigador en nuestras disciplinas, se comentarán los
distintos procedimientos utilizando los diálogos de entrada y los
resultados proporcionados por un programa de software estadístico.
Existen diversos programas de este tipo existentes en el mercado, pero
el software SPSS (Statistical Package for the Social Sciences) de IBM es
uno de los más empleados, por lo que será nuestra elección a la hora
de ilustrar cómo se llevan a cabo los procedimientos estadísticos y qué
información proporciona el programa. Además, SPSS es también uno de
los programas de análisis estadístico para los que se han escrito mayor
número de manuales (incluyendo una serie de guías que IBM proporciona
de forma gratuita en formato PDF), además de ser una referencia habitual
en los manuales de estadística para Ciencias Sociales (Arce & Real, 2000).
Por todo ello, el lector dispone de abundante bibliografía en la que puede
profundizar para conocer mejor los distintos procedimientos estadísticos
y el modo en que se solicitan usando SPSS.

1.1. La necesidad de un manual de investigación


La actividad investigadora ha ido constantemente en aumento, y a un
ritmo creciente, en las últimas décadas. Ha pasado de ser una actividad
propia de equipos especializados en unas pocas universidades a ser una
de las actividades más relevantes para cualquier universidad, y uno de
los criterios fundamentales para evaluar a los centros, a su profesorado,
e incluso también a sus alumnos. La razón principal para esta explosión
de la actividad investigadora es la constatación de que muchos de los

6
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

avances experimentados en nuestra calidad de vida y en nuestro progreso


económico y social se derivan de la misma. Así pues, se ha planteado
necesidad de fomentar la actividad investigadora como condición
necesaria para el progreso económico y social, y como una competencia a
desarrollar en la Educación Superior.

No obstante, este hecho ha dado lugar a no pocos problemas entre


aquellos que se asoman por primera vez a este mundo. La investigación
es una actividad exigente, que requiere de mucho rigor y un trabajo
exhaustivo para ser útil y provechosa. La falta de cuidado en algún aspecto
del proceso puede dejarnos con un trabajo de utilidad muy limitada, o
incluso nula. La finalidad de este manual es la de cubrir esta carencia,
que suele darse más a menudo en las Ciencias Sociales y de la Salud que
en otras ciencias con mayor tradición investigadora, como la Física, la
Química o la Biología. Por otro lado, la investigación en Ciencias Sociales
y de la Salud tiene unas características y unas limitaciones propias y
exclusivas de nuestra área, que deben ser tratadas de modo específico.

Esto no quiere decir que investigar sea muy difícil, sino que se trata
de una actividad que requiere de una mayor planificación y estudio
previo que otro tipo de actividades académicas menos formales. Las
consecuencias del descuido o la falta de planificación son generalmente
muy negativas. Si llevamos a cabo nuestra investigación sin revisar
concienzudamente la literatura existente sobre el tema, corremos el
riesgo de cometer errores que hubieran sido fácilmente evitables de
otro modo. Si diseñamos de forma incorrecta nuestra investigación no
podremos responder a las preguntas que nos planteamos. Si empleamos
instrumentos inadecuados, nuestras medidas sufrirán de falta de validez
y fiabilidad. Si medimos de forma inadecuada nuestras variables,
perderemos información importante y dificultaremos el análisis de los
datos obtenidos. Y, por supuesto, si cometemos varios de estos errores a la
vez, nuestra investigación podría no tener valor alguno.

Desgraciadamente, este tipo de errores no son infrecuentes en trabajos


de investigación en Ciencias Sociales y de la Salud. Como consecuencia,
mucha de la investigación realizada no podrá ser publicada en
revistas importantes, o no podrá ser publicada en absoluto. Dado que

7
Eulogio Real Deus

las publicaciones son el principal criterio para evaluar la actividad


investigadora, este hecho implica que gran parte del esfuerzo investigador
realizado en nuestras áreas de conocimiento se pierde, y se malgasta el
esfuerzo invertido en llevarlo adelante. Así pues, este manual pretende
proporcionar una guía para llevar a cabo un proyecto de investigación
con las garantías de rigurosidad y exhaustividad necesarias para poder
presentar un proyecto de Fin de Grado o Máster, o una Tesis Doctoral, así
como también para conseguir un proyecto de investigación, o para poder
publicar nuestra investigación en una revista científica.

1.2. Aspectos éticos


Debemos tener en cuenta que el trabajo investigador, tenga o no como
objetivo una aplicación práctica, se lleva a cabo con la finalidad de
introducir mejoras, ya sea en diagnóstico, en comprensión de los procesos
físicos, psicológicos o sociales, o directamente en el bienestar de las
personas. Por ello es importante tener siempre presente el respeto a los
imperativos éticos que deben regir todo estudio. Estos imperativos vienen
dados no sólo por la propia conciencia del investigador (ética personal),
sino que también forman parte de las directrices propias de su disciplina
(ética profesional y comités de bioética), e incluso cuentan con legislación
internacional. Dos son los aspectos principales a tener en cuenta a este
respecto (Schweigert, 1994): (1) el tratamiento de los sujetos de nuestro
estudio, y (2) el tratamiento de los resultados de la investigación.

El primero de estos aspectos es de especial relevancia, por cuanto los


estudios realizados en Ciencias Sociales y de la Salud suele involucrar
a personas como sujetos de investigación, aunque también la
experimentación con animales está sujeta a estándares éticos no menos
relevantes. Cuando desarrollamos nuestro diseño de investigación y
sabemos qué clase de información precisamos por parte de los sujetos
y la forma en que vamos a recopilarla, es importante plantearse la
aceptabilidad ética de la metodología seguida en nuestro estudio.

El principal criterio ético que debemos tener en mente es el de la


voluntariedad de la participación de nuestros sujetos en el estudio, que
implica que los sujetos son totalmente libres de participar o no en el mismo.

8
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Como consecuencia, es éticamente inaceptable obligar a los sujetos a


participar en el estudio, así como recurrir a estratagemas o abusar de una
hipotética posición de poder para obtener su consentimiento. Además,
el carácter voluntario de la participación de los sujetos implica también
que éstos pueden decidir en cualquier momento abandonar el estudio
si así lo consideran oportuno. En este caso, el investigador también está
obligado a permitir al sujeto abandonar el estudio sin recurrir a ningún
tipo de estrategias para retenerlo dentro del mismo. Dado que el rechazo
a participar o el abandono son una fuente importante de problemas para
una investigación, se contempla la posibilidad de facilitar la adherencia
de los sujetos proporcionando algún tipo de incentivo (económico,
académico, etc.), con la única condición de que este incentivo no sea
excesivo, sino proporcionado a la dificultad de la tarea que deben realizar
los sujetos.

Un segundo criterio a tener en cuenta es si va a colocarse a los sujetos


en una situación de riesgo, entendiendo por tal que el sujeto se vaya a
encontrar en una situación donde su nivel de riesgo físico o psicológico
es mayor que el existente en cualquier actividad de su vida cotidiana.
En este caso, debe replantearse la metodología para ver si es posible
buscar alternativas libres de riesgo y/o si los beneficios proporcionados
por la investigación superan ampliamente a los riesgos involucrados
en la misma. En cualquier caso, si se considera que los sujetos pueden
encontrarse en una situación de riesgo, será imprescindible pedirles
previamente su consentimiento informado por escrito para poder
participar en el estudio, lo que implica proporcionarles toda la
información necesaria sobre el tipo de riesgos potenciales derivados de su
participación, aunque también es posible informarles de los potenciales
beneficios de la misma. No obstante, es importante tener en cuenta que,
incluso con un consentimiento informado, el investigador será siempre el
último responsable de cualquier violación de la ética que se produzca en
su estudio, aunque no sea él directamente el autor de dicha violación (por
ejemplo, si algún colaborador se comporta de forma poco ética, tanto él
como el investigador principal serían los responsables de dicha falta).

Un tercer criterio más difícil es el concerniente a si el estudio somete a


los sujetos a algún tipo de ocultación o engaño. Puede darse el caso de

9
Eulogio Real Deus

que no sea posible proporcionar a los sujetos toda la información de


que disponen los investigadores, porque ello implicaría comprometer
la validez de los resultados del estudio. Por ejemplo: estamos llevando a
cabo un estudio sobre el estrés, para lo cual vamos a colocar a nuestros
sujetos experimentales en una serie de situaciones estresantes, pero no
podemos avisarles de ello, porque entonces podrían preparar estrategias
de afrontamiento ante el mismo. O bien planteamos una situación
experimental para comprobar una hipótesis determinada, pero no
podemos informar a los sujetos de cuál es nuestra hipótesis porque eso
podría afectar a sus respuestas (por ejemplo, intentando “ayudarnos” a
confirmarla). En este caso es necesario plantearse si no existen opciones
alternativas que permitan recoger estas respuestas sin tener que recurrir
a ocultación o engaño. Si ello no fuese posible, es necesario proporcionar
esta información oculta a los sujetos una vez hayan participado en el
estudio, bien inmediatamente después de su participación, bien una vez
se hayan recogido la totalidad de los datos.

Finalmente, también debemos tener en cuenta si nuestro estudio vulnera


en alguna medida la privacidad de los sujetos. La mayor parte de las
preguntas que hacemos a los sujetos en una investigación se refieren a
aspectos privados. Algunos son de menor importancia, por lo que no suele
resultar problemático para los sujetos informarnos acerca de sus hábitos
de consumo, de ocio, de lectura, etc. Sin embargo, otros son mucho más
delicados, como los referidos a conductas de consumo de sustancias, o
prácticas sexuales. Por ello, es imprescindible garantizar por escrito la
confidencialidad y el anonimato de la información proporcionada por
los participantes en nuestro estudio, sea del tipo que sea. Esta garantía
supone que esta información no será tratada nunca de forma individual,
sino agregada, y que ningún sujeto del estudio podrá ser identificado en
la base de datos correspondiente. En muchos países esta privacidad está
garantizada por ley1, por lo que la violación de este compromiso supone la
comisión de un delito. Además, el estudio no ºdebe someter a escrutinio
la privacidad de los sujetos, por ejemplo mediante el empleo de cámaras
o escuchas en situaciones comprometidas o incómodas.

1 En el caso de España, por ejemplo, por la Ley Orgánica 15/1999 de Protección de Datos (LOPD).

10
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Por lo que se refiere al tratamiento ético de los resultados derivados


de una investigación, afectan principalmente a cualquier posible
manipulación de los datos, bien sea mediante la fabricación de datos
falsos, bien mediante la manipulación deliberada de datos reales. Ambas
actividades constituyen un fraude, por lo que su descubrimiento implicará,
automáticamente: (1) la pérdida de prestigio por parte del investigador
autor del fraude, y (2) la eliminación de todas las contribuciones hechas
por el investigador en la línea o líneas de investigación afectadas por dicho
fraude. Así pues, es importante tener en cuenta que, independientemente
de cuál sea nuestra posición acerca del tema de estudio, o de los
resultados que nuestros promotores o patrocinadores pudiesen preferir,
la manipulación de los resultados de nuestra investigación constituye
una violación flagrante de la ética profesional, y motivo suficiente de
expulsión de la comunidad académica.

Así pues, y como conclusión de todo lo anterior, los aspectos éticos de


nuestra investigación constituyen una parte relevante de la misma, que
es necesario tener muy en cuenta a la hora de llevar a cabo la planificación
de nuestro diseño, la selección de nuestra muestra, la forma de recoger
los datos, y el tratamiento posterior que se dará a los mismos.

1.3. Esquema básico de una investigación


La mayor parte de los trabajos de investigación publicados siguen una
secuencia fija y predecible de apartados, independientemente de que
se trate de un Trabajo de Fin de Grado o Máster, de una Tesis Doctoral,
de un artículo científico, o de un informe de investigación. Esto es así
porque esa secuencia es un reflejo del proceso de investigación que dio
lugar a esa publicación, y la mejor forma de informar a nuestros lectores
acerca de nuestra investigación es hacerles recorrer la misma senda que
hemos seguido nosotros para llevarla a cabo. El esquema habitual de una
investigación incluye los siguientes apartados:

11
Eulogio Real Deus

1. Título.
2. Resumen o Abstract.
3. Introducción. Sección Teórica
4. Objetivos de la investigación.
5. Muestra.
6. Instrumentos.
Sección Empírica
7. Método.
8. Resultados.
9. Discusión y Conclusiones
10. Bibliografía Sección Bibliográfica

Como vemos, el trabajo se identifica con (1) un título, que deberá dar
una indicación clara del problema que es investigado, y de las principales
características del trabajo. A continuación (2) se proporciona un resumen
del trabajo, entre 100 y 200 palabras, cuya finalidad es proporcionar
información sobre el propósito del trabajo, el método utilizado, los
resultados obtenidos y las conclusiones. El trabajo de investigación
propiamente dicho comienza por (3) una introducción al tema de
estudio, que servirá para que el lector se sitúe dentro del marco teórico
de la investigación, conozca la literatura más importante sobre el tema,
así como las variables involucradas en estos estudios. La parte final de
la introducción entrará de forma más específica en la finalidad de la
investigación, una vez situada ésta en su contexto. A continuación, (4)
se enumeran los objetivos de la investigación; en el caso de que existan
expectativas concretas acerca de los resultados que deberían obtenerse,
estas expectativas se expresarán en forma de hipótesis científicas, en lugar
de meros objetivos. Posteriormente, (5) se describirán las características
de la muestra, así como también (6) de los instrumentos empleados
para medir las variables o constructos de interés en dicha muestra.
Seguidamente, (7) se especificará el método seguido para la recogida
y análisis de los datos. En la sección de resultados (8) se explicarán
detalladamente los análisis realizados y los resultados obtenidos en los

12
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

mismos; los resultados deben relacionarse con los objetivos y/o hipótesis
de la investigación, y ser interpretados a la luz de los mismos. Por último,
(9) se lleva a cabo una integración de los resultados obtenidos para llegar
a una conclusión clara sobre los objetivos planteados en la investigación,
situar estos resultados en el contexto de la investigación realizada,
indicando las aportaciones de nuestro trabajo, así como posibles líneas
de investigación futura, y/o las limitaciones inherentes a nuestro estudio,
de cara a su mejora en estudios posteriores. La sección bibliográfica final
(10) contiene todas las referencias utilizadas en la elaboración de nuestro
trabajo, para que el lector pueda, si así lo desea, ampliar la información
sobre algún aspecto del trabajo.

Este esquema no es fijo e inamovible. El orden de los apartados “Muestra”


e “Instrumentos” podría cambiar, o podríamos crear apartados separados
para la Discusión de Resultados y para las Conclusiones. O alguno de
los apartados podría incluir a su vez sub-apartados: por ejemplo, la
Introducción Teórica podría subdividirse en: “Antecedentes”, “Revisión
histórica” y “Estado actual de la Investigación”. Esto es habitual cuando se
trata de documentos largos y exhaustivos, como Informes de investigación
o Tesis Doctorales. Sin embargo, el formato habitual de comunicación
de los resultados de investigación sigue siendo el artículo científico, y su
estructura se ajusta muy bien a este esquema.

Lo primero que podemos apreciar en el esquema es que la Sección


Empírica ocupa buena parte del mismo, mientras que las secciones Teórica
y Bibliográfica ocupan un único apartado cada una. Estas proporciones
son engañosas. En realidad, estas dos últimas secciones forman la base
de cualquier investigación. Una vez decidido el objetivo de investigación,
la bibliografía consultada debe permitirnos, entre otras cosas, desarrollar
un marco teórico para nuestra investigación, conocer todos los factores
relacionados con nuestro objeto de estudio, encontrar formas válidas y
fiables de medir las variables que nos interesan, descubrir qué aspectos
no han sido aclarados todavía, y analizar las tendencias futuras de
investigación en el campo que nos ocupa. En resumen, la bibliografía es
la recopilación de todas las fuentes que hemos empleado para nuestra
investigación, y refleja el grado de profundidad con que la hemos
llevado a cabo. Por su parte, la Sección Teórica sistematiza y organiza la

13
Eulogio Real Deus

información encontrada, y plantea una aportación al problema objeto de


estudio, cuya resolución se comentará en la Sección Empírica.

Para el caso del trabajo de investigación más importante, la Tesis Doctoral,


Rodenes, Chismol, & Arango (2000), mencionan, por orden secuencial, las
fases más críticas de la misma, que pueden asimilarse también a otros
tipos de trabajos de investigación:

1. Selección del área general de


investigación.
2. Selección de los temas a
considerar. Sección Teórica-
Bibliográfica
3. Exploración del tema y propuesta
de Tesis.
4. Realización de un índice detallado.
5. Búsqueda bibliográfica de
Sección Bibliográfica
investigaciones previas.
6. Investigación y análisis. Sección Empírica
7. Escritura y defensa de la Tesis. Redacción Final

En este nuevo esquema podemos apreciar la relevancia de las secciones


Teórica y Bibliográfica en las fases principales de todo proyecto de
investigación. Además, ambas secciones no sólo incluyen cinco de las
siete fases críticas del proyecto de Tesis, sino que, además, estas cinco
fases corresponden a los momentos iniciales del proceso investigador. Así
pues, la falta de cuidado en los momentos iniciales puede dar al traste con
toda la investigación, o reducir en gran medida sus aportaciones antes
incluso de que hayamos empezado a recoger los datos. Por el contrario,
una planificación y documentación exhaustiva de la investigación en las
fases iniciales no sólo incrementará el interés y la utilidad del trabajo de
investigación, sino que también hará más difícil cometer errores en las
fases subsiguientes de investigación y análisis, puesto que los trabajos
revisados no sólo nos habrán proporcionado información sobre el objeto
de estudio, sino que también nos permitirán decidir qué variables serán

14
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

relevantes para nuestro estudio, cómo medirlas correctamente, qué


instrumentos emplear, qué diseño de investigación es el más adecuado
para nuestros fines, cómo recoger los datos, y qué técnicas de análisis de
datos son las más adecuadas.

Debemos ser conscientes de que la verdadera investigación es un proceso


acumulativo, en el que cada trabajo aporta un nuevo dato al conocimiento
existente, de tal modo que este conocimiento va aumentando conforme
aumenta el número de investigaciones. Pero para que esto sea posible
es necesario que la investigación actual tome como punto de partida lo
ya hecho en otros trabajos. De no hacerlo así, cada nueva investigación
tendría que “reinventar la rueda”, con lo que se imposibilita la acumulación
de conocimiento. Además, es necesario insistir en que una investigación
que no aporta nada nuevo, o que está plagada de errores, dará lugar a
un trabajo que recibirá una mala evaluación (en caso de tratarse de un
trabajo de Fin de Grado o Máster, o una Tesis Doctoral), o que no podrá
ser publicado (en caso de tratarse de un informe de investigación o un
artículo científico).

Así pues, y como conclusión a todo lo anterior, observamos que la


actividad investigadora es un proceso intelectual exigente, que necesita
del cumplimiento de una serie de requisitos para resultar útil, y que sigue
una serie de etapas o fases para llegar hasta el documento definitivo.
Cada una de estas etapas tendrá unos requisitos diferentes, y todos ellos
deben ser adecuadamente resueltos para que el trabajo produzca sus
máximos beneficios. A partir de los esquemas planteados anteriormente
se plantea ahora el orden que seguirán los capítulos de este manual, y que
se corresponden con las diferentes etapas, ordenadas secuencialmente,
de las que suele constar cualquier investigación en nuestra área:

1. Selección y documentación sobre el tema de investigación.


2. Determinación del problema objeto de investigación.
3. Documentación bibliográfica sobre investigaciones previas.
4. Estrategia de investigación.
5. Diseño de investigación – enfoque metodológico.

15
Eulogio Real Deus

6. Objetivos e hipótesis.
7. Elaboración de instrumentos.
8. Selección de la muestra.
9. Recogida de datos.
10. Análisis de datos.
11. Integración de resultados.
12. Redacción de la memoria.

Dado el carácter secuencial de los capítulos de este libro, se recomienda su


lectura ordenada, especialmente para aquellos que deseen introducirse
en el mundo de la investigación, de tal modo que puedan formarse una
idea cabal de los principales problemas que van apareciendo a medida
que se profundiza en el tema objeto de estudio. Sin embargo, aquellos
con cierta experiencia en el mundo de la investigación podrían utilizar
este libro como un manual de consulta para aspectos más específicos que
necesiten aclaración.

16
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

2. El proceso de investigación
Antes de comenzar a describir cada una de las etapas por las que atraviesa
un trabajo de investigación, conviene aclarar algunos conceptos previos
que son importantes.

En primer lugar, debemos tener en cuenta quiénes son los actores


involucrados en el proceso de investigación. En el caso de los trabajos
de Fin de Grado o Máster, así como en las Tesis Doctorales, el principal
responsable del trabajo es el estudiante de grado o posgrado, que
estará asistido por uno o más directores, cuya función será la de orientar,
asesorar, criticar y apoyar el trabajo desarrollado por el estudiante. En
otros casos, la investigación será llevada a cabo por una única persona
o un equipo compuesto por varios investigadores. En el caso de que se
trate de un trabajo en equipo, la tarea puede facilitarse en gran medida si
éste incluye especialistas que puedan encargarse de secciones diferentes
del trabajo y responsabilizarse de aquellas decisiones relacionadas con
su campo de especialización. Así, el equipo podría contar con personas
que conozcan a fondo el tema de estudio, lo que facilitaría la preparación
del marco teórico del trabajo y la determinación de aquellos aspectos no
aclarados del objeto de estudio y que podrían dar lugar a una investigación
que aporte conocimiento sobre éste. También podría contar con expertos
en estadística o metodología para preparar el diseño de investigación,
elaborar instrumentos o realizar los análisis estadísticos pertinentes, o
expertos en informática para la preparación de herramientas digitales de
recogida de la información o de codificación de la misma, etc. En el caso
de que se trate de un investigador trabajando solo, podría ser conveniente
ponerse en contacto con especialistas en informática o metodología para
cubrir las posibles dudas o resolver problemas técnicos o estadísticos.

En segundo lugar, es necesario tener en cuenta que la mayor parte de la


investigación que se realiza en la actualidad tiene su origen en el mundo
anglosajón, por lo que se recomienda un nivel mínimo de conocimiento
del idioma inglés por parte del investigador o investigadores involucrados.
Los trabajos de mayor calidad se publican en revistas internacionales,
por lo que la literatura que tiene mayor relevancia e interés para nuestra
investigación estará, con toda seguridad, escrita en inglés. Así pues, un

17
Eulogio Real Deus

buen nivel de inglés es una garantía para realizar la investigación con


plenas garantías. Una de las razones por las que muchas investigaciones
realizadas en países de habla hispana no obtienen la suficiente
visibilidad internacional viene dada por las limitaciones del idioma, que
tienen un doble efecto. Por un lado, limitan el alcance y la profundidad
de la documentación para realizar la investigación puesto que, como
ya hemos comentado, la información más relevante y de mayor calidad
suele estar escrita en la lengua de Shakespeare. Por otro lado, esta falta de
profundidad en la documentación repercutirá en la calidad del trabajo y,
por tanto, también en sus posibilidades de difusión.

2.1. Selección y documentación sobre el tema de investigación


El primer paso lógico es decidir cuál va a ser el área de investigación
dentro de la cual se enmarcará nuestro trabajo. Generalmente el área de
investigación vendrá determinada por las inquietudes del investigador,
o por su línea de investigación. No obstante, es posible que si el trabajo
de investigación tiene un director (como, por ejemplo, los trabajos de
fin de Grado o Máster, o las Tesis Doctorales), sea éste quien proponga al
alumno el tema de investigación. En este caso, lo normal es que se trate de
un tema ya conocido por el director, lo que facilitará mucho la elaboración
del mismo, al menos en cuanto a las etapas iniciales del trabajo. En caso
de que el investigador no tenga clara su área de investigación, algunas
de las fuentes que pueden proporcionar temas de investigación son las
siguientes (Rodenes, Chismol, & Arango, 2000):

1. Sucesos actuales.
2. Sugerencias de otros trabajos ya aprobados o líneas de
investigación iniciadas.
3. Sugerencias de autoridades en el área.
4. Suposiciones aceptadas generalmente, pero no demostradas.
5. Teorías y conceptos sin investigación que los fundamente.
6. Enfoques diferentes para comprobar resultados importantes.

18
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Uno de los peligros que amenazan una investigación es su alcance: si


planteamos unos objetivos excesivamente amplios o generales, corremos
el riesgo de no poder profundizar la suficiente como para poder llegar a
conclusiones definitivas. Así pues, esta fase inicial no busca solamente
decidir sobre el tema de investigación, sino que debe servir para encontrar
el/los problema(s) concreto(s) que pretendemos comprobar o aclarar.
Por tanto, esta fase debe servir para hacerse una idea general del área en
la que vamos a investigar, y decidir a qué aspecto o aspectos concretos
vamos a dedicar nuestra investigación.

Podemos imaginar esta parte de preparación del trabajo de investigación


como un proceso que va de lo general a lo específico, siendo la elección
del tema de investigación el aspecto más general, mientras que la
decisión sobre el problema o problemas concretos a estudiar representa
el aspecto más concreto de nuestros objetivos de investigación. En este
sentido, la búsqueda de información bibliográfica correspondiente, que
es la actividad fundamental en esta fase del trabajo, también puede
organizarse desde la más general a la más específica. Podríamos empezar
nuestra búsqueda desde cero, acudiendo primero a fuentes secundarias
de información, tales como diccionarios y enciclopedias, manuales, libros
de texto, índices, revistas de resúmenes, Tesis Doctorales o bibliografías.
Las fuentes secundarias contienen información de muchas fuentes
originales o primarias, organizada y sistematizada para proporcionar una
perspectiva completa y actualizada acerca de un tema concreto. Veamos
la utilidad de cada una de estas fuentes por separado.

vv Los diccionarios y enciclopedias: Proporcionan definiciones para los


conceptos importantes de nuestro tema de investigación. También
pueden proporcionar información histórica o proporcionarnos una
lista de los autores más importantes en el tema.

vv Los manuales y libros de texto: Son más específicos que los


anteriores y nos permiten adentrarnos en el conocimiento
del área de investigación, sus características, los desarrollos
experimentados en la misma, o las teorías más importantes
existentes.

19
Eulogio Real Deus

vv Índices: Proporcionan revisiones y/o resúmenes de documentos


acerca de un tema concreto. Muchos de estos índices contienen
resúmenes o abstracts de los documentos incluidos en los mismos,
lo que permite realizar búsquedas por palabras o expresiones
clave. Por ejemplo, en el campo de la Psicología, el Psychological
Abstract, es un índice de resúmenes de las publicaciones realizadas
dentro de la Psicología.

vv Revistas de resúmenes: Proporcionan revisiones de los trabajos


realizados en un área concreta para un período dado, resumiendo
y sistematizando los principales hallazgos conseguidos, y los
aspectos por clarificar. Por esta razón pueden resultar de gran
ayuda en esta primera fase del trabajo investigador, ya que
ahorran una gran cantidad de tiempo y energía en la recopilación
de esa información. Asimismo, las referencias bibliográficas
incluidas en los artículos de este tipo de revistas nos permite una
primera recopilación de fuentes primarias de información. Este
tipo de revistas se identifica fácilmente porque incluyen siempre
en su nombre la palabra “review” (por ejemplo: Annual Review of
Psychology).

vv Tesis doctorales: Se trata de trabajos de investigación de gran


envergadura, y que suelen incluir una introducción teórica mucho
más amplia y completa que los artículos de revistas. Por esta
razón, las Tesis Doctorales realizadas dentro de nuestra área de
investigación pueden ser muy útiles a la hora de proporcionarnos
un panorama claro y estructurado de esa área, además de
numerosa bibliografía. Por otro lado, dado que se trata de trabajos
de investigación, nos proporcionarán también información
importante de cara a otras fases de nuestra investigación.
En España existe la base de datos TESEO, desarrollada por el
Ministerio de Educación, Cultura y Deporte, que contiene todas las
Tesis Doctorales leídas en este país desde 1976.

vv Bibliografías: Además de constituir un apartado importante de las


fuentes secundarias antes comentadas, las bibliografías también
pueden encontrarse en bases de datos informatizadas sobre
publicaciones.

20
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

ŸŸ Por ejemplo, la base de datos PsycINFO, perteneciente a


la American Psychological Association (APA), contiene
casi cuatro millones de registros sobre Ciencias del
Comportamiento y la Salud, que abarcan desde mediados
del siglo XIX. A nivel europeo, otra base de datos importante
es la PubPsych, publicada por el Leibniz Institute for
Psychology Information.

ŸŸ Otra fuente de bibliografía relevante son los Citation Index,


que son bases de datos que nos informan de qué trabajos
son los más citados en un área de investigación particular,
junto con las publicaciones y los autores que los han
citado. Para el caso de las Ciencias Sociales, existe el Social
Sciences Citation Index (SSCI), desarrollado por el Institute
for Scientific Information (ISI) y gestionada por la editorial
canadiense Thomson Reuters.

ŸŸ Una combinación de los dos anteriores la constituyen


otras bases de datos bibliográficas y de citas como Scopus,
gestionada por la editorial holandesa Elsevier, o la Web of
Science (WoS), antes conocida como Web of Knowledge,
también desarrollada por el ISI y gestionada por Thomson
Reuters.

ŸŸ Por último, existen herramientas de acceso a la bibliografía


de carácter general y gratuito, como Google Scholar (http:/
scholar.google.com) o Microsoft Academic (http://academic.
research.microsoft.com/). El interés de estas herramientas
reside no sólo en sus potentes motores de búsqueda y
posibilidad de filtrar los resultados, sino que también
proporcionan información importante sobre el trabajo, las
versiones existentes, citas del mismo, trabajos relacionados
y acceso al abstract, o incluso al texto completo (cuando el
documento está accesible libremente o a través de algún
servicio al que nosotros o nuestra institución se encuentre
suscrita).

21
Eulogio Real Deus

A partir de estas herramientas es posible acceder a las fuentes primarias de


información; es decir, a los trabajos originales que son de nuestro interés.
Estas fuentes primarias incluyen: artículos de investigación en revistas
científicas, libros, capítulos de libros, actas de Congresos, Tesis Doctorales,
fuentes de datos, censos, encuestas, etc. Estas fuentes primarias pueden
obtenerse en bibliotecas o por préstamo interbibliotecario, en formato
papel, o mediante su descarga, gratuita o de pago, en internet. En cuanto
a este último aspecto, cabe mencionar que el desarrollo experimentado
en las tecnologías de la información ha dado lugar a nuevos medios para
acceder a los documentos de investigación originales. Una de las opciones
más interesante últimamente es la existencia de redes sociales diseñadas
específicamente para investigadores, tales como ResearchGate (http://
www.researchgate.net) o Academia.edu (http://www.academia.edu).
Estas redes sociales permiten a los investigadores compartir sus trabajos
de investigación en la red, ponerse en contacto con otros profesionales
interesados en su misma línea de investigación, plantear preguntas
sobre temas de investigación, o seguir a sus investigadores de referencia,
obteniendo información actualizada sobre su trabajo. Estas redes
también proporcionan al investigador información sobre el número de
citas obtenidas por sus publicaciones, quién las ha leído, y cuántas visitas
y/o descargas han recibido, así como también les mantiene informados
sobre la actividad de sus colegas y coautores.

Así pues, una vez terminada esta fase del proceso investigador, nuestro
conocimiento del área de interés debería haberse incrementado
sustancialmente, y deberíamos tener una idea clara de cuáles podrían
ser los problemas más interesantes o más accesibles para nosotros que
necesitan clarificación. Nuestra comprensión del marco teórico de la
investigación debería ser completa en este momento, o estar al menos
muy avanzada. De no ser así, probablemente ello se deba a que no hemos
realizado una documentación suficientemente exhaustiva y deberemos
ampliarla, a menos que estemos trabajando en un área poco conocida
o escasamente investigada. Por otro lado, nuestra base bibliográfica
debería ser abundante ya en este momento, y debería habernos
proporcionado un panorama suficientemente preciso de la situación del
área de investigación y de los principales problemas y dudas existentes
dentro de la misma. Nuestro siguiente paso será decidir sobre cuáles de
los problemas encontrados va a tratar nuestra investigación.
22
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

2.2. Determinación del problema objeto de investigación


Una vez superada la etapa anterior, nos encontramos con uno o varios
problemas que podrían ser susceptibles de ser estudiados en nuestra
investigación. Para decidir a qué aspectos concretos vamos a dirigir
nuestro trabajo, conviene hacerse una serie de preguntas sobre el propio
objeto de estudio:

1. El estudio que pretendo realizar, ¿es alcanzable para mí en cuanto


a sus requisitos? En este aspecto debemos considerar todos los
posibles obstáculos a la realización del estudio: su duración, el
coste o financiación del mismo, su dificultad, la recogida de datos,
el instrumental requerido, etc.

2. ¿Mi estudio es un trabajo independiente, o es una mera replicación


de otros estudios? Si bien a veces es necesario replicar estudios
para confirmar los resultados obtenidos por otros, generalmente
nuestra intención será hacer una aportación. En otras ocasiones,
nuestro estudio puede ser una replicación de otro realizado en
un contexto nacional o cultural diferente, para con la finalidad
de encontrar diferencias transculturales en cuanto al objeto de
investigación.

3. ¿Cuáles serán las implicaciones prácticas de mi estudio? En áreas


como la Educación o la Salud, es deseable a menudo que la
investigación realizada sirva para mejorar la práctica profesional
o encontrar alternativas más eficientes a la práctica actual.
Obviamente, esto no implica que la investigación sin aportaciones
prácticas no deba realizarse, sino que satisfacer este aspecto
incrementará el interés del estudio.

4. ¿Sus resultados producirán una aportación significativa al


conocimiento? Este es uno de los objetivos que debe ser revisado
con mayor detenimiento. Cuanto más seguros estemos de que
la respuesta a esta pregunta es afirmativa, tanto mejor. La no
aportación de conocimiento por parte del trabajo lo convierte en
irrelevante.

23
Eulogio Real Deus

5. En relación con lo anterior, ¿será un estudio publicable? Además de


las consideraciones que hemos hecho en el párrafo anterior, sería
conveniente que nos preguntásemos si la investigación reunirá
los requisitos de calidad y escrupulosidad que suelen exigir las
revistas científicas.

6. En caso de que mis hipótesis de partida no se viesen confirmadas,


¿seguiría siendo útil el estudio? Puede ocurrir que la utilidad
de nuestro estudio sea muy dependiente de los resultados. Por
ejemplo, si estamos comprobando la eficacia de un método nuevo
para tratar un determinado problema y nuestros resultados son
negativos, esto reduciría mucho el interés del artículo. Una posible
solución podría ser la comparación de nuestro nuevo método con
otro u otros ya existentes para el tratamiento del problema.

7. ¿Será importante el estudio para mis intereses profesionales?


El tema de investigación debería estar relacionado con los
intereses profesionales o académicos del investigador para
resultar de máxima utilidad. Resulta mucho más enriquecedor
si mi actividad investigadora está relacionada con mi trabajo
que si ambas pertenecen a mundos separados. Por el contrario,
si mis intereses profesionales e investigadores coinciden, toda la
experiencia acumulada en una de estas actividades se transferirá
fácilmente a la otra. Otro aspecto relacionado con este tema es el
de la motivación: nos sentiremos mucho más motivados si nuestro
tema es relevante para nosotros que si se encuentra muy apartado
de nuestra esfera personal o profesional.

Llegados a este punto, es necesario comprobar que estamos


suficientemente preparados para acometer las siguientes etapas del
proceso investigador. Los dos aspectos a los que debemos prestar atención
son el marco teórico general, por una parte, y el problema elegido como
objeto de investigación, por otra.

24
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

2.2.1. El marco teórico


Sirve para situar la investigación en un contexto más amplio, de tal
modo que ésta queda perfectamente descrita dentro de este marco.
En este momento no sólo deberíamos tenerlo completado, tal y como
comentamos en el apartado anterior, sino que deberíamos tenerlo
esquematizado y/o redactado, al menos como borrador. La razón para ello
estriba en que es importante que nuestro objeto de investigación esté ya
perfectamente inscrito dentro de este marco, por lo que la existencia de
cualquier punto oscuro o no revisado puede afectar al proceso de decisión,
o puede dar lugar a que nos encontremos más adelante con problemas
que nos obliguen a retroceder de nuevo a este punto, o que invaliden
algunos de los objetivos de nuestro trabajo. La delimitación y construcción
de un marco teórico bien definido a partir de la revisión bibliográfica es
fundamental, puesto que sin ella es imposible pasar a las siguientes fases
del estudio. Además, el marco teórico también constituye el referente
para someter a contraste nuestros resultados con los encontrados en la
literatura, corroborar o refutar nuestras hipótesis. En suma, “poner en
valor las aportaciones de nuestro trabajo” (Delgado, 2014). Por otro lado, el
marco teórico nos informará sobre la relevancia de nuestra investigación,
puesto que la relaciona con la investigación precedente, permitiéndonos
hacernos una idea de la potencial contribución de nuestro trabajo.

2.2.2. El problema objeto de investigación


La delimitación del problema a investigar vendrá determinada
por aquellos aspectos encontrados en la literatura que no estén
suficientemente claros, no hayan sido tenidos en cuenta, o existan
diferentes perspectivas sobre los mismos. La razón para ello es evitar
repetir estudios anteriores y “descubrir la rueda” (a menos que nos
hayamos planteado la replicación de algún trabajo previo). En el extremo
opuesto, si nuestro objeto de estudio no ha sido tratado antes, pero lo
abordamos sin enmarcarlo en investigaciones previas, tendremos que
realizar este encaje posteriormente, y sin garantías de éxito. Resulta muy
difícil dar sentido a unos resultados a la luz de un contexto teórico cuando
estos mismos datos fueron recogidos sin tener este contexto en cuenta.

25
Eulogio Real Deus

Como ya se ha repetido en varias ocasiones, el aspecto fundamental que


nos debe preocupar a la hora de seleccionar nuestro objeto de estudio
es la aportación que supondrá nuestra investigación al conocimiento
existente. Incluso en el caso de que realicemos una replicación de otro
estudio, nuestros resultados producirán una aportación que será, en su
caso, confirmar los hallazgos encontrados por otros autores, bien en el
mismo contexto, bien generalizándolo a otros contextos. Algunas de las
aportaciones que puede originar una investigación podrían ser:

1. Proporcionar una metodología nueva o mejorada. Constantemente


aparecen nuevos dispositivos y tecnologías que permiten mejorar
los resultados de investigación. El uso de nuevas tecnologías, o
la adaptación de tecnologías de otros campos es una fuente de
investigación muy importante.

2. Comparar y confrontar explicaciones alternativas a un fenómeno


concreto. En muchas ocasiones existen teorías rivales a la hora de
explicar algún aspecto de la realidad. Someter a comprobación
estas teorías permite descartar vías muertas y avanzar en las
direcciones más prometedoras.

3. Evaluar la efectividad de un procedimiento. Los tratamientos y


las intervenciones pretenden solucionar problemas, y su grado de
efectividad debe ser comprobado, así como las circunstancias en
que resulta más efectivo, o menos.

4. Aclarar la relación existente entre constructos asociados a un


mismo tema. En muchas ocasiones se definen nuevos constructos
(como, por ejemplo, inteligencia emocional) cuya relación con
otros constructos debe ser evaluada con la finalidad de delimitar
sus características.

5. Generar o mejorar instrumentos de medida para variables o


constructos relevantes. La mejora de escalas, o la comprobación
de sus propiedades psicométricas también constituye una tarea
habitual en investigación en Ciencias Sociales y de la Salud.

26
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

6. Organizar o sistematizar el conocimiento existente sobre algún


aspecto de la realidad. Otro aspecto muy útil es la revisión de la
investigación, ya sea en forma de reviews, o artículos que presentan
una panorámica del campo de investigación, o mediante estudios
que empleen técnicas como el meta-análisis, para determinar los
efectos estadísticos más claros detectados en la literatura existente
en un campo de investigación determinado.

2.3. Documentación bibliográfica sobre investigaciones previas


En esta fase volvemos a documentarnos, sólo que en esta ocasión
lo haremos específicamente sobre el objeto de estudio de nuestra
investigación, una vez que nos hemos documentado sobre los aspectos
más generales del mismo. Nuestra nueva búsqueda será ahora de
investigaciones previas realizadas sobre el mismo problema en el que
estamos interesados o en problemas afines. Además, mientras que en
la primera fase de documentación podemos emplear fuentes primarias
de todo tipo, en esta segunda fase nos centraremos casi exclusivamente
artículos publicados en revistas científicas

Como ya hemos comentado, los artículos científicos son trabajos muy


estructurados, de contenido complejo, y cuya lectura no se parece en
nada a la de otros trabajos escritos. Por ello, a la hora de revisar artículos
científicos es muy importante no leerlo de la misma forma que lo
hacemos con un libro o un trabajo literario, yendo de principio a fin del
texto de forma pasiva. En lugar de ello, debemos ver el artículo como un
esquema compuesto de partes que pueden ser examinadas por separado,
sin importar si se encuentran al principio o al final del documento. Esto
nos permite hacernos una idea más clara de lo que el artículo puede tener
de interés para nosotros, y nos evita tener que leer aspectos del mismo
que no nos interesan tanto.

Los artículos siguen una estructura bastante predecible: título, resumen


o abstract, introducción, objetivos, muestra, instrumentos, método,
resultados, discusión y conclusiones, y bibliografía. Cada uno de estos
apartados puede tener más o menos relevancia para nosotros, por lo
que existen estrategias mucho mejores y más eficientes que leerlo de

27
Eulogio Real Deus

cabo a rabo. Estas estrategias serán más útiles cuanto mayor sea nuestro
conocimiento del tema de estudio y todos los factores que le rodean. Por
ejemplo, si ya hemos desarrollado nuestro marco teórico, el apartado de
introducción de un artículo probablemente no nos aporte información
nueva o interesante, pero si estamos planteándonos cuál va a ser nuestro
diseño de investigación, el apartado de método sí nos puede parecer de
gran importancia.

Existen distintas estrategias para leer artículos científicos que son


mencionadas por la mayoría de investigadores expertos a la hora de
explicar su propia estrategia. Una de las más empleadas consiste en
leer con detenimiento el abstract. Los abstracts suelen proporcionar un
resumen de la totalidad del trabajo en muy poco espacio, por lo que nos
informan rápidamente del interés del artículo. Una serie de aspectos
que siempre suelen reflejar los abstract son: para qué se hizo el estudio
(propósito del mismo), cómo se hizo (metodología empleada), qué
resultados se encontraron (resultados), y qué significan (conclusiones).
Bajo el abstract figuran las palabras clave del estudio (keywords), que nos
indican los términos de búsqueda más importantes relacionados con el
contenido del trabajo. Si el aspecto en el que estamos interesados figura
entre las palabras clave, probablemente el artículo es útil para nosotros.

Una segunda estrategia muy utilizada consiste en leerse directamente las


conclusiones del artículo. Las conclusiones suelen retomar las razones por
las que se realizó el estudio, las relacionan con los resultados y extraen
consecuencias de ello. Por tanto, este apartado es muy informativo acerca
de la utilidad de la investigación para nuestros propósitos.

Una tercera estrategia, empleada por los más expertos en el tema, consiste
en revisar las tablas y figuras del trabajo para ver qué metodología se
aplicó y cuáles fueron los resultados obtenidos. Los encabezados de las
tablas y los pies de las figuras nos ayudarán a interpretar los datos allí
reflejados.

28
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

No obstante lo anterior, puede que, como ya hemos dicho, en determinadas


circunstancias algunos apartados diferentes a éstos puedan resultarnos
de interés. El apartado introductorio, por ejemplo, puede sernos útil si
todavía no tenemos suficientemente claro el marco teórico o el objeto
de investigación. Al igual que el propio proceso de documentación
teórica, la introducción suele partir de lo general (qué es lo que se sabe
del tema), para ir a lo particular (qué es lo que no se sabe), y de ahí, al
objetivo de la investigación (qué preguntas se desea responder o qué
problema se desea solventar). Por su parte, los apartados metodológicos
(Método, Muestra, Instrumentos, etc.) nos proporcionan información
sobre el diseño de investigación empleado y la metodología empleada
para recoger la muestra, medir las variables de interés, etc. Aunque es
un apartado más complejo y técnico, proporciona información detallada
de cómo se realizó la investigación, lo que puede ser de nuestro interés si
estamos preparando nuestro propio diseño de investigación. Finalmente,
el apartado de resultados nos proporciona la información bruta obtenida
en la investigación, junto con las tablas y figuras que la resumen.

En cualquier caso, es muy importante que nos acostumbremos a tomar


notas de aquellos trabajos que nos hayan parecido relevantes y, en
general, de todo aquello que nos parezca importante tener en cuenta. Las
notas nos permitirán ir ordenando nuestras ideas y serán una fuente de
información breve y personalizada sobre lo leído. No es recomendable
fiarlo todo a la memoria, porque la cantidad de información y la variedad
de fuentes nos harán, con toda probabilidad, imposible recordar
cada detalle y aspecto que nos haya llamado la atención y juzguemos
relevante, y asociarlo con la publicación donde figura. Tampoco es
recomendable recurrir al subrayado de los trabajos, porque nos obligará
a volver a repasar los documentos uno por uno hasta que encontremos lo
que buscamos. Nuestra libreta de notas es una forma rápida y cómoda de
ir generando conocimiento sobre el tema, e irlo organizando poco a poco,
generando esquemas y diagramas donde podamos sintetizar nuestro
marco teórico, las relaciones que esperamos encontrar entre variables, las
diversas interpretaciones que admite un mismo fenómeno, etc. Así pues,
aunque es bueno ir recopilando bibliografía y guardarla en papel o en
soporte digital, nuestra libreta de notas resultará una forma más cómoda
y práctica de llevar con nosotros de forma actualizada la información
importante de nuestro estudio.
29
Eulogio Real Deus

2.4. Estrategia de investigación


Llegados a este punto, una vez revisada la literatura, elaborado el marco
teórico, y definido nuestro objetivo de investigación, procede decidir
qué aproximación vamos a emplear para llevar a cabo nuestro estudio.
Esta aproximación puede venir determinada por el tema de estudio
elegido o la literatura revisada, pero en otros casos existirá más de
una opción a nuestra disposición. Una distinción habitual al hablar de
diferentes aproximaciones al objeto de estudio es la que diferencia entre
aproximaciones cuantitativas frente a cualitativas.
vv Aproximación cuantitativa. Cuando se adopta una perspectiva
cuantitativa, el interés se centra en la medición de variables o
constructos que reflejan aspectos de la vida real, y en la relación
existente entre estos aspectos. La investigación cuantitativa
pretende recoger información objetiva, libre de la influencia de los
prejuicios del investigador, que se apoya fundamentalmente en la
recogida de datos empíricos, susceptibles de análisis matemático
o estadístico, a partir de formatos de recogida estandarizados,
cuyo análisis permitirá llegar a conclusiones que puedan ser
generalizadas. Debido a estas características, la aproximación
cuantitativa es la norma en los estudios de investigación, y entre
las publicaciones de las principales revistas científicas de cualquier
disciplina. Debido a ello, esta será la aproximación preferente
adoptada en este manual, aunque también se proporcione
información sobre otras opciones de investigación.
vv Aproximación cualitativa. En este caso, el interés no se centra
en lo general, sino en lo particular, en la percepción que tienen
los sujetos de la realidad, y parte de la idea de que no existe una
realidad objetiva, sino subjetiva, y que el método científico no
se ajusta a la realidad humana. Por ello, no se parte de un marco
teórico general para evaluar aspectos concretos del mismo, sino
que el marco teórico se va construyendo a medida que se recoge
información, sin que exista un proceso claramente definido para
ello. Además, la muestra de casos empleada en estos estudios suele
ser muy pequeña, y la información con la que se trabaja es verbal
o visual, en lugar de numérica. Debido a estas características, la

30
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

aportación de este tipo de estudios al conocimiento científico es


muy escasa, dada la ausencia de preocupación por aspectos como
la medición, la estandarización de procedimientos, la posibilidad
de replicar el estudio, la posibilidad de generalizar los resultados o
las conclusiones del estudio, o la excesiva interferencia e influencia
del investigador sobre lo investigado.

En el siguiente cuadro se muestran algunas de las estrategias de


investigación posibles, junto con el tipo de investigación al que se ajusta
cada uno de ellos (Denscombe, 2014):

Estrategia Finalidad de la investigación


ŸŸ Medir algún aspecto de un fenómeno social o una
Encuestas
tendencia.
(Surveys)
ŸŸ Recoger datos para comprobar una teoría.
Estudios de caso ŸŸ Comprender las complejas relaciones entre factores
(Case Studies) cuando operan en un marco social particular.
ŸŸ Identificar la causa de algún fenómeno.
Experimentos
ŸŸ Observar la influencia de factores específicos.
ŸŸ Describir prácticas y tradiciones culturales.
Etnografía ŸŸ Interpretar las interacciones sociales dentro de una
cultura.
ŸŸ Describir la esencia de tipos específicos de
Fenomenología
experiencias personales.
ŸŸ Clarificar conceptos o producir nuevas teorías.
Teoría fundamentada
ŸŸ Explorar un tema nuevo y proporcionar nuevas
(Grounded Theory)
perspectivas.
Investigación-Acción ŸŸ Resolver un problema práctico.
(Action Research) ŸŸ Generar directrices para una mejor práctica.
ŸŸ Obtener una visión objetiva de la evidencia sobre un
Revisiones sistemáticas tema específico.
ŸŸ Evaluar la efectividad de proyectos o intervenciones.

ŸŸ Evaluar una nueva política y medir su impacto.


Métodos mixtos ŸŸ Comparar perspectivas alternativas sobre un
(Mixed Methods) fenómeno.
ŸŸ Combinar aspectos de las otras estrategias.

31
Eulogio Real Deus

Cada una de estas estrategias tiene, como vemos, diferentes finalidades


pero, además, cada una de ellas tiene sus propias características, ventajas
e inconvenientes (Bell & Waters, 2014; Denscombe, 2014; Delgado,
2014), que se solapan con las características, ventajas e inconvenientes
de la aproximación de la que proceden: cuantitativa en el caso de las
encuestas o los experimentos, y cualitativa en el caso de la etnografía, la
fenomenología, la teoría fundamentada, o la investigación-acción. Las
revisiones sistemáticas se refieren a la obtención de información a partir
de la investigación existente empleando criterios explícitos, por lo que
está relacionada con aspectos teóricos y es, por tanto, compatible con
ambas aproximaciones. En el caso de los métodos mixtos, las fortalezas y
debilidades del estudio realizado serán los de aquellas estrategias que lo
compongan. Veamos cada una de estas estrategias por separado:

vv Las encuestas: Es uno de los métodos más empleados, bien


sea mediante el uso de cuestionarios o de entrevistas, en
persona, en papel, por correo, o por internet. Una muestra de
encuestados responde a una serie de preguntas en formato
estructurado, semiestructurado o libre, que permitirán obtener
datos cuantitativos (números) o cualitativos (texto) a partir de las
respuestas de los sujetos. Los datos así obtenidos proporcionan
amplia y detallada información sobre los encuestados en un
momento concreto. Otros términos también empleados en este
contexto son el de cuestionario y el de escala. Aunque no existe
total acuerdo en cuanto a las diferencias entre estos distintos
conceptos, podemos asumir que un cuestionario es un instrumento
que contiene una serie de preguntas referidas a temas variados,
con la finalidad de analizar luego las relaciones existentes entre
las variables incluidas en el mismo, mientras que una escala es
un instrumento que contiene una serie de ítems cuya finalidad es
medir con la mayor precisión y calidad posible un único aspecto,
por lo que proporcionará una sola medida, generalmente obtenida
a partir de la suma o la media de los ítems.

32
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

vv Los experimentos: Constituye el método de investigación con


mayores garantías de control y es el único que nos permitirá
establecer relaciones de causa-efecto entre variables. El ejemplo
prototípico de un estudio experimental es aquel en el que se desea
conocer el efecto de un tratamiento (variable independiente: VI)
sobre un problema concreto (variable dependiente: VD). Para
garantizar la detección del efecto provocado por la VI sobre la VD,
se crean dos grupos al azar: (1) un grupo experimental, que va a
recibir el tratamiento cuyo efecto se desea probar; (2) un grupo
control, que no va a recibir el tratamiento, sino un placebo. A
continuación, se mide la VD en ambos grupos. Dado que no hay
diferencias entre el grupo control y el experimental, puesto que los
sujetos han sido asignados al azar a ambos grupos, si se encuentran
diferencias en la medida de la VD entre ambos, se deberán al
efecto de la VI, que estaba presente en el grupo experimental, pero
no en el control. Cuando la asignación de los sujetos a los grupos
no es aleatoria, hablamos de un diseño cuasi-experimental, donde
el grado de control es menor que en un diseño experimental. El
experimento es más adecuado cuando queremos comprobar
hipótesis de investigación muy específicas y que impliquen
causalidad, y es menos adecuado cuando se busca responder a
preguntas muy generales, o resulta muy difícil manipular la VI, o
bien cuando el control necesario para llevar a cabo un experimento
puede dar lugar a un contexto muy artificial, lo que dificultará la
generalización al mundo real de los resultados obtenidos con el
mismo (falta de validez ecológica).

vv Estudios de caso: Pretenden estudiar en profundidad un aspecto


concreto de un problema mediante observación o entrevistas, con
la finalidad de aprehender la dinámica de funcionamiento de una
organización o colectivo, o estudiar las consecuencias de cambios
introducidos en el mismo. Como su propio nombre indica, es un
estudio de un solo caso, sea éste un individuo, una organización
o un colectivo concreto, por lo que la generalización no es fácil en
este tipo de estudios.

33
Eulogio Real Deus

vv Fenomenología: La estrategia fenomenológica se centra en lo


subjetivo, en la forma en que cada individuo interpreta de forma
idiosincrática la realidad. Debido a este énfasis en la subjetividad,
por oposición a lo objetivo, la fenomenología adopta una
estrategia en cierto modo opuesta a la del método científico, que
busca obtener información lo más objetiva posible para buscar
regularidades y patrones en la misma.

vv Etnografía: Intenta estudiar los fenómenos sociales a través del


análisis de las actividades humanas, pero dando énfasis a la
interpretación que los propios sujetos hacen de éstas, sin imponer
una teoría externa a esta interpretación. Así pues, la aproximación
etnográfica emplea información subjetiva, adoptando una
perspectiva fenomenológica, pero realizando la recogida en el
entorno natural de los sujetos, e intentando capturar la totalidad
del contexto social, cultural y económico. Una estrategia también
de corte naturalista, pero mucho más susceptible de cuantificación
es la proporcionada por la metodología observacional.

ŸŸ La observación puede resultar atractiva para los


momentos iniciales del proceso investigador, como una
forma de aproximarnos a un tema de estudio que puede
observarse fácilmente, como las interacciones sociales o
las elecciones de compra. Además, esta estrategia admite
diversos grados de intervención, desde la observación
naturalista, donde el observador no participa ni obstruye
en los acontecimientos, hasta la observación participativa,
donde el observador interviene en la situación. El caso más
extremo de intervención sería el experimento de campo,
en el que se realizan modificaciones en el entorno para
registrar los efectos que dichas modificaciones tienen
sobre los participantes (por ejemplo: dejar tendido a
alguien en la calle para ver cuántas personas se acercan a
socorrerle). Por último, la estrategia observacional permite
no sólo la recogida de registros narrativos, sino también
la obtención de datos cuantitativos mediante matrices
que recojan la presencia, intensidad y frecuencia de las

34
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

conductas a observar. A su vez, la recogida de este último


tipo de información también permitirá evaluar la fiabilidad
de las observaciones, posibilitando el cálculo de índices de
acuerdo entre observadores. Finalmente, la observación
permite obtener datos con mayor validez ecológica que
los proporcionados por un estudio de laboratorio, donde
resulta mucho más difícil conseguir que los sujetos se
comporten de forma natural.
vv Teoría fundamentada: Trata de construir conocimiento teórico
a partir directamente de la evidencia existente, sin limitarse a
un único tipo de fuente y sin establecer exclusiones. La teoría se
desarrolla de forma interactiva, ajustando la teoría a medida que
se recopila más información. Este suele ser el método habitual de
recogida de información teórica en la investigación cualitativa.
vv Investigación-Acción: Pretende intervenir en una realidad
o problema que involucra a un colectivo, una tarea o un
procedimiento para, a través del testimonio de los sujetos
implicados, investigar con la finalidad de producir un cambio. Es
decir, la propia investigación se hace con la finalidad de intervenir
sobre la realidad, y no sólo para conocerla o comprenderla. En
principio, esta estrategia permitiría el uso de información rigurosa
y objetiva; sin embargo, en la mayoría de los casos, estos estudios
no buscan la generalización de resultados, sino la participación de
los actores implicados y la implementación de cambios mediante
el uso de información cualitativa.
Como ya hemos comentado, este manual hará énfasis en las estrategias de
investigación asociadas a la aproximación cuantitativa, frente a aquellas
asociadas a la aproximación cualitativa. Esta elección no es caprichosa,
sino que responde a una serie de razones:
1. Incrementar la relevancia científica de nuestra investigación. Uno
de los principales problemas de la aproximación cualitativa pura
es su falta de interés por las bases del método científico, lo que
implica que muchas de las investigaciones realizadas bajo sus
presupuestos no cumplan con los requisitos mínimos exigibles

35
Eulogio Real Deus

en ciencia. En este sentido, el carácter disperso de la investigación


realizada dentro de la aproximación cualitativa contrasta con el
carácter acumulativo y progresivo de la aproximación cuantitativa.
2. Facilitar la difusión y replicación de los resultados obtenidos.
Relacionado con lo anterior, la excesiva subjetividad, ausencia de
mediciones, y escasa o nula fundamentación metodológica de los
estudios realizados dentro de la aproximación cualitativa dificulta
en gran medida la posibilidad de replicar sus resultados. Una de
las consecuencias es que estos estudios difícilmente contribuyen
al conocimiento existente, incluso dentro del propio marco de
la investigación cualitativa. Por esta razón, estos estudios son
difícilmente publicables en revistas de cierto prestigio
3. Simplificar y clarificar las fases del proceso investigador. En la
investigación cualitativa no existen, por sus propios presupuestos
de partida, formas sistemáticas o estandarizadas de recopilar
información, obtener datos, o interpretarlos. Por esta razón, el
proceso de investigación aquí es más complicado, a pesar de su
aparente mayor libertad. Así, por ejemplo, para un mismo tema de
investigación uno puede elegir muchas formas distintas de llevar a
cabo un estudio cualitativo. Esto implica que las conclusiones de los
distintos estudios pueden ser muy diferentes, y las posibilidades
de sistematizarlos, mucho más escasas que en el caso de la
aproximación cuantitativa.
4. Acceder a una metodología apta para un mayor abanico de
situaciones. En muchas ocasiones se etiqueta como “cualitativos”
a aspectos que pueden ser abordados desde un enfoque
cuantitativo. Por ejemplo, en algunas ocasiones se denomina
cualitativos a datos que pueden analizarse perfectamente desde
una aproximación cuantitativa. Este error, que es muy común,
procede de la identificación de lo “cuantitativo” con los niveles de
medida superiores (escalas de intervalo o razón), y lo “cualitativo”
con los niveles de medida inferiores (nominal y ordinal)2. En otros

2 Para mayor información sobre las distintas escalas y niveles de medida, ver el apartado 2.7.1:
“Escalas de medida”.

36
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

casos, por ejemplo, se apela a la aproximación cualitativa para


evitar la excesiva artificialidad o falta de “validez ecológica” de las
investigaciones experimentales. Sin embargo, es posible recoger
datos observacionales sin interferir en el desarrollo natural de
los acontecimientos, de forma objetiva y cuantificable. Así, la
observación sistemática puede ser una buena alternativa a la
estrategia etnográfica para investigar fenómenos sociales en su
entorno natural, sin renunciar al uso de información cuantitativa.

2.5. Diseño de investigación – enfoque metodológico


2.5.1. Tipos de estudios
Uno de los aspectos que va a determinar el enfoque que vamos a dar a
nuestra investigación se refiere al alcance que vamos a dar a la misma.
Los tipos de estudios posibles en función de este criterio van desde
los estudios descriptivos, en el nivel inferior, pasando por los estudios
correlacionales, en un nivel intermedio, para llegar al máximo alcance
en los estudios explicativos, en el superior. Sin embargo, es importante
tener en cuenta que estos enfoques no son excluyentes entre sí: un mismo
estudio puede limitarse a la descripción para algunos aspectos de la
realidad investigada, pero emplear un enfoque de mayor alcance para
otros.

vv Estudios descriptivos. Como su propio nombre indica, un estudio


descriptivo es aquel cuya finalidad es únicamente describir
y caracterizar la realidad. Un ejemplo sencillo de este tipo de
estudios son los informes y censos publicados periódicamente por
organismos públicos o privados, que proporcionan estadísticas
o recopilaciones de datos sobre diversos asuntos, indicando su
situación actual o las tendencias existentes, pero sin intentar
relacionar las diferentes variables analizadas, hacer pronósticos ni
buscar explicaciones a lo encontrado.

vv Estudios correlacionales. Los estudios correlacionales, sin renunciar


a la descripción y caracterización de las variables contempladas
en el estudio, muestran además interés en la determinación de

37
Eulogio Real Deus

las relaciones existentes entre estas variables, así como en la


posibilidad de desarrollar predicciones a partir de las relaciones
encontradas. Los estudios de este tipo permiten establecer
asociaciones entre conjuntos de variables, aunque la interpretación
de estas asociaciones se ve afectada por una importante limitación:
la ausencia de causalidad. Aunque puedan establecerse relaciones
entre variables, éstas no pueden ser interpretadas en términos de
causa-efecto. Esto se debe a que, para probar este tipo de relaciones
es necesario ejercer un control y manipulación de variables que no
es posible en un estudio correlacional. Por ello, cuando se encuentra
una asociación clara entre dos fenómenos, no podemos asegurar
cuál de ellos representa la causa, y cuál al efecto. Es incluso posible
que la correlación entre estas dos variables no indique una relación
de causa-efecto entre ellas, sino a la intervención de una tercera
variable que no ha sido tenida en cuenta. Por ejemplo, si en un
estudio correlacional se encontrase una relación entre la tasa de
alfabetización de un país y el porcentaje de población con celular,
esto no implica que la alfabetización (causa) provoque una mayor
compra de celulares (efecto), ni tampoco que podamos mejorar
la tasa de alfabetización (efecto) regalando celulares a la gente
(causa), porque tanto una como otra variables podrían ser efectos
de una causa común: el grado de desarrollo socioeconómico. A
pesar de estas limitaciones, los estudios correlacionales sí permiten
realizar pronósticos a partir de las relaciones encontradas, por lo
que la imposibilidad de demostrar relaciones de causalidad no
será un obstáculo para elaborar modelos predictivos a partir de
nuestros datos.

vv Estudios explicativos. Los estudios explicativos pretenden superar


las limitaciones de los estudios correlacionales, permitiendo
establecer relaciones de causalidad entre dos o más variables,
minimizando la posibilidad de que los resultados obtenidos
puedan deberse a errores de medida o a otras variables que no
sean las implicadas en el estudio. Dado que el grado de control
y manipulación necesario para poder establecer este tipo de
relaciones sólo es posible en un contexto experimental, podemos
asimilar este tipo de estudio con la investigación de laboratorio

38
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

mediante experimentos. Así, los estudios correlacionales podrían


también etiquetarse como “no experimentales”, mientras
que los estudios explicativos podrían ser etiquetados como
“experimentales”. En los estudios explicativos, las variables que se
manejan son de tres tipos:
ŸŸ Variables independientes: Llamamos variable
independiente a aquella que pensamos que actúa como la
causa de los cambios experimentados por otras variables.
Para comprobar este efecto, la variable independiente es
manipulada por el investigador, al mismo tiempo que mide
la otra variable para poder registrar el efecto producido por
dicha manipulación.
ŸŸ Variables dependientes: La variable dependiente es
aquella que recibe el efecto de la variable independiente. El
investigador no realiza ningún tipo de manipulación sobre
esta variable, sino que únicamente registra los cambios
experimentados en la misma.
ŸŸ Variables extrañas: Son variables que también se
encuentran involucradas en la relación investigada, y
cuyo efecto debe ser eliminado o controlado cuando se
diseña el experimento, para evitar que puedan contaminar
los resultados del mismo. Se distingue entre diseños
experimentales o cuasi-experimentales en función del
mayor o menor grado de control ejercido por el investigador
sobre este tipo de variables.

2.6. Objetivos e hipótesis


Los objetivos e hipótesis de un trabajo de investigación son una serie
de proposiciones, presentadas de forma clara y sencilla, que están
relacionadas con las preguntas a las que pretendemos responder con
nuestra investigación. En el caso de las hipótesis, estas proposiciones están
planteadas de forma más breve y concreta, para un resultado particular,
y anticipan el resultado que debería producirse según el investigador. Un
ejemplo de una hipótesis de investigación sería la siguiente:

39
Eulogio Real Deus

“Se espera encontrar un mejor resultado en la prueba para los hombres


frente a las mujeres.”

Como vemos, la hipótesis plantea por anticipado cuál de los dos grupos
de sujetos (hombres o mujeres) obtendrá un mejor resultado en una
prueba concreta. En caso de que los resultados de la investigación sean
compatibles con lo planteado por nuestra hipótesis, ésta quedará
confirmada. Por el contrario, si los datos no respaldan nuestra hipótesis,
ésta quedará refutada. Es decir, si los resultados de nuestra investigación
muestran que no hay diferencias entre hombres y mujeres en la prueba,
o que éstas muestran mejor resultado que los hombres, quedaría
demostrado que nuestra hipótesis era falsa y, por tanto, quedaría refutada.

En el caso de los objetivos, la proposición suele ser más general, no incluye


ningún resultado esperado, y suele ir precedida de un verbo en infinitivo.
Por ello, los objetivos son más apropiados cuando nos aproximamos a un
tema nuevo o poco investigado, mientras que las hipótesis se plantean
más a menudo en temas donde, a partir de la literatura existente,
podemos plantearnos qué resultados debería obtener nuestro estudio.
Un ejemplo de un objetivo de investigación sería este:

“Conocer la relación existente entre el género y los resultados obtenidos


en la prueba”

Como vemos, nuestro objetivo es menos concreto que la hipótesis


correspondiente, ya que no plantea ningún resultado a priori, sino que
pretende averiguar si existe o no relación entre género y resultados en la
prueba y, en caso de que exista, conocer el tipo de relación que se produce.

En muchas ocasiones, sobre todo en trabajos de cierta envergadura, los


objetivos suelen subdividirse en generales y específicos, en función del
nivel de conocimiento que proporcionen. El objetivo empleado como
ejemplo más arriba sería un caso de un objetivo específico, que podría
formar parte, junto con otros objetivos específicos, de un objetivo más
general, a saber: “Conocer las características de la prueba y su relación con
variables sociodemográficas”.

40
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Los objetivos e hipótesis que nos hemos planteado a estas alturas de


nuestra investigación deben ser contestados a partir de los análisis que
realicemos en un momento posterior, y de los resultados obtenidos en
los mismos. Por ello, al llegar a este momento es importante tener claro
no sólo cuáles van a ser los objetivos e hipótesis de nuestro estudio,
sino también cómo vamos a alcanzarlos. Por ello, es muy importante no
limitarse a enunciarlos, sino que también será necesario comprobar que
nuestro diseño de investigación nos permitirá responder a los mismos, y
que sabemos qué técnicas de análisis de datos debemos emplear, y con
qué variables, para conseguir este fin. Así pues, llegados a este punto
debemos comprobar que contamos con instrumentos para medir las
variables o constructos a los que se refieren los objetivos o hipótesis de
nuestro trabajo, que nuestra muestra es adecuada, que conocemos la
técnica estadística que debemos emplear con nuestros datos, y que éstos
son adecuados para dicha técnica. De no ser así, podríamos encontrarnos
imposibilitados o muy limitados en nuestra capacidad de alcanzar
nuestros objetivos, o de comprobar nuestras hipótesis.

2.7. Elaboración de instrumentos


Nuestros objetivos o hipótesis de investigación plantearán cuestiones
relativas a las relaciones existentes entre diferentes características,
conceptos o aspectos de la realidad que será preciso medir para encontrar
una respuesta a dichas cuestiones. Cada una de estas características
o aspectos será una de las variables de nuestro estudio y, para poder
medirlas, será necesario definir operacionalmente dichas variables.

Una definición operacional se diferencia de una mera definición


conceptual en que, además de proporcionar una abstracción verbal
de lo que se pretende definir, incluye también los procedimientos o
indicaciones necesarias para poder medirlo. De este modo, se facilita que
otros investigadores puedan medir la misma variable de forma idéntica
a la nuestra, facilitando así el acceso a mediciones independientes que
posibiliten la comparación de resultados, algo indispensable para poder
someter los resultados de cualquier estudio a una contrastación empírica.

41
Eulogio Real Deus

Vamos a ilustrar este proceso mediante un ejemplo. Imaginemos que


nuestro estudio plantea el siguiente objetivo: “Comprobar el efecto que
la aptitud para las matemáticas tiene sobre el rendimiento académico,
así como determinar si existen diferencias en esta aptitud en función del
sexo, el estatus socioeconómico y la autoestima”. Para poder dar respuesta
a este objetivo será preciso recopilar información sobre todos los aspectos
incluidos en el mismo, y obtener medidas de éstos en una muestra de
sujetos. Esta medición sólo será posible si definimos operacionalmente
cada uno de estos aspectos o conceptos. Es decir: si nos planteamos que
existe un efecto de la aptitud para las matemáticas sobre el rendimiento
académico, deberemos incluir ambas características como variables de
nuestro estudio para poder cuantificar dicho efecto. Del mismo modo, si
nos planteamos la posible existencia de diferencias en función del sexo,
el estatus socioeconómico y el autoconcepto, será también necesario
medir estas tres características e incluirlas también como variables de
nuestro estudio. Así pues, para contestar al objetivo propuesto, nuestro
estudio precisa de información acerca de cinco variables (aptitud para las
matemáticas, rendimiento académico, sexo, estatus socioeconómico, y
autoestima). El siguiente paso será definir operacionalmente cada una de
estas variables. Esto será muy sencillo en el caso del sexo; una definición
operacional podría ser la siguiente: “modalidad sexual (hombre o mujer)
a la que pertenece el sujeto, auto-informada mediante una pregunta
con respuesta dicotómica”. Sin embargo, en el caso de las otras cuatro
variables no resulta tan sencillo encontrar una definición operacional.

La razón de esta dificultad estriba en que el sexo es una característica


directamente observable, mientras que las otras cuatro variables no lo
son. Aspectos como el sexo, la edad, la estatura, etc., son fáciles de definir
y pueden ser medidos directamente, bien preguntándole a los propios
sujetos, bien midiendo estas características con instrumentos sencillos,
como una báscula o una cinta métrica.

Por el contrario características como la aptitud para las matemáticas, el


rendimiento académico, el estatus socioeconómico o la autoestima no
pueden observarse directamente: son constructos teóricos. Un constructo
es un concepto cuya existencia no puede demostrarse empíricamente ni
medirse directamente, pero sí puede ser cuantificado de forma indirecta

42
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

a partir de otra información que sí es observable y que está relacionada


con dicho constructo. Por ejemplo, yo no puedo saber directamente cuál
es el estatus socioeconómico de un sujeto, pero sí puedo inferirlo a partir
de la información obtenida sobre su nivel de estudios y de ingresos, que
sí podría obtener directamente. Así, para medir el nivel socioeconómico
de los sujetos de mi estudio y reflejarlo en la variable correspondiente,
necesitaré incluir dos nuevas variables: nivel de estudios y nivel de
ingresos. Además, deberé plantear qué combinaciones de estos niveles
dan lugar a cada uno de los niveles de estatus socioeconómico. Una
versión simplificada de estas combinaciones podría ser la siguiente:

Nivel de Nivel de Estatus


Puntuación
ingresos estudios socioeconómico
Bajo Bajo Bajo 1
Bajo Medio Medio-bajo 2
Bajo Alto Medio 3
Medio Bajo Medio-bajo 2
Medio Medio Medio 3
Medio Alto Medio-alto 4
Alto Bajo Medio 3
Alto Medio Medio-alto 4
Alto Alto Alto 5

Como vemos, las distintas combinaciones de los tres niveles de ingresos


y los tres niveles de estudios dan lugar a una puntuación en estatus
socioeconómico que irá de 1 (Bajo) a 5 (Alto).

La naturaleza no observable de los constructos tiene como consecuencia


que pueden existir diferentes definiciones operacionales para un mismo
constructo, y diferentes instrumentos para medirlo, en función de qué clase
de información observable sea necesaria. Nuestra definición operacional,
pues, dependerá tanto de cuál es nuestra definición conceptual de lo que
es el constructo como de cuál va a ser el instrumento que emplearemos
para medirlo. En el caso de la aptitud para las matemáticas, si entendemos
por tal exclusivamente la capacidad para manejar números, podremos

43
Eulogio Real Deus

medirla a partir de las respuestas de los sujetos a un test de cálculo


numérico (por ejemplo, a partir del número de aciertos en el test). Por el
contrario, si nuestra definición es más amplia, e incluye la capacidad de
razonamiento y abstracción, tendremos que incluir también otros test
que midan estas competencias (por ejemplo, pruebas de razonamiento
analítico-sintético, de razonamiento lógico, de razonamiento abstracto,
etc.). La puntuación final en el constructo será una combinación (por
ejemplo, la media aritmética) de las puntuaciones obtenidas para cada
una de estas competencias.

Por fortuna, existen instrumentos ya desarrollados para medir multitud de


constructos como los que estamos comentando. En la mayoría de los casos
se trata de test, inventarios o cuestionarios que proporcionan un medio
para obtener, a partir de las respuestas a los diversos ítems de la prueba,
una puntuación global en el constructo que nos interesa (inteligencia,
personalidad, autoestima, etc.). Es muy posible que estos instrumentos
vengan ya determinados por nuestro tema de estudio, puesto que la
literatura que hemos revisado al preparar nuestra investigación también
ha trabajado con las mismas variables que nosotros, e informará de los
instrumentos empleados para medirlas. La utilización de esos mismos
instrumentos para nuestro estudio facilitará la comparabilidad entre
nuestros resultados y los encontrados en la literatura. Por ejemplo,
si la mayoría de los estudios que hemos revisado utilizan la escala de
Rosenberg (1989) para medir la autoestima, sería buena idea que nuestra
investigación también emplease esa escala, y no otra.

Sin embargo, también puede darse el caso de que sea necesario construir
el instrumento necesario para medir el constructo que nos interesa, bien
porque todavía nadie ha desarrollado dicho instrumento, o bien porque los
instrumentos existentes no gozan de buenas propiedades psicométricas3,
o bien porque nuestra investigación pretende precisamente obtener un
instrumento de mayor calidad y/o utilidad que los ya existentes. En este
último caso, debemos tener en cuenta que es necesario cumplir algunas
condiciones para poder considerar a nuestro instrumento como una
herramienta apta para medir adecuadamente el constructo (Foddy, 1993);

3 La Psicometría es la “disciplina que abarca el conjunto de métodos, técnicas y teorías implicadas


en la medición de las variables psicológicas” (Muñiz J. , 1992)

44
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

estas condiciones están especificadas como directrices a seguir para


adaptar o traducir escalas (Muñiz, Elosúa, & Hambleton, 2013). En primer
lugar, debemos tener en cuenta qué tipo de escala de medida es la más
adecuada para nuestro instrumento. A continuación, debemos decidir
cuál va a ser la escala de respuesta que vamos a presentar a los sujetos
de nuestra muestra para que nos proporcionen la información que
pretendemos recoger con el instrumento. Seguidamente, elaboraremos
los ítems del instrumento. Finalmente, debemos comprobar que nuestro
instrumento mide con adecuada precisión y estabilidad (fiabilidad),
y que mide lo que pretende medir (validez). Veamos cada uno de estos
aspectos por separado.

2.7.1. Escalas de medida


Parafraseando a Amón (1982, p. 25), podemos definir la medida como
la “atribución de números a los objetos según ciertas reglas”. Por lo
tanto, medir implica codificar las distintas modalidades o grados en
que un sujeto posee una determinada característica, de tal modo que
las relaciones entre los valores utilizados en la codificación reflejen las
relaciones existentes entre esas distintas modalidades.

Nuestros instrumentos nos proporcionarán medidas de las características


de los sujetos que son de interés para nuestra investigación. Dado que
esas medidas variarán de un sujeto a otro, cada una de ellas constituye
una variable. Por otra parte, estas medidas deben hacerse de tal modo
que reflejen con la mayor fidelidad posible el grado o la modalidad en
que el sujeto posee la característica de interés. Por ello, la elección de la
escala de medida que vamos a emplear en nuestro instrumento es de la
máxima importancia. Existen 4 tipos básicos de escalas de medida, según
Stevens (1957):

1. Escala Nominal: Cuando una variable está medida a nivel de escala


nominal, únicamente podemos establecer relaciones de igualdad
o diferencia en cuanto a la característica medida por la variable.
Cuando medimos empleando este tipo de variables, simplemente
asignamos una etiqueta, o categoría, al resultado. Si dos sujetos
han recibido la misma etiqueta, son iguales en la característica

45
Eulogio Real Deus

medida por la variable. Si reciben etiquetas distintas, son diferentes


en cuanto a esa misma característica. Ejemplos típicos de variables
medidas en este tipo de escala son el sexo (hombre, mujer) o la
nacionalidad (español, inglés, mexicano, etc.). Un caso especial
de este tipo de variables lo constituyen las variables dicotómicas
o binomiales, en las que sólo hay dos resultados posibles: éxito (1)
y fracaso (0).

2. Escala Ordinal: Cuando una variable está medida en este tipo


de escala, no sólo podemos establecer relaciones de igualdad o
diferencia, sino también de orden, de ahí su nombre. Una variable
ordinal contiene, al igual que la nominal, una serie de categorías
diferentes para los posibles resultados. Sin embargo, en este
caso las categorías pueden ser ordenadas de menor a mayor, o
viceversa. Cuando realizamos clasificaciones ordenadas en rangos
solemos emplear escalas ordinales. Por ejemplo, en el caso de los
hoteles o restaurantes (número de estrellas o tenedores), o los
rangos militares o laborales (asistente, secretario, ejecutivo, jefe de
departamento, etc.).

3. Escala de Intervalo: La mayor limitación de la escala ordinal es que


carece de una unidad de medida. Esto quiere decir que no sabemos
qué diferencia real hay entre las diferentes categorías de la escala
(¿la diferencia entre un restaurante de 2 tenedores y otro de 3 es la
misma que la que existe entre un restaurante de 3 tenedores y otro
de 4?). Esta limitación no existe en el caso de la escala de intervalo.
Cuando una característica está medida en esta escala, no sólo
podemos establecer relaciones de igualdad y diferencia y de orden,
sino que también disponemos de una unidad de medida que nos
permite saber si la diferencia entre dos resultados dados es la
misma que la existente entre otro par de resultados diferentes. En
otras palabras, podemos establecer igualdades de intervalos. Uno
de los ejemplos de escala de intervalo más empleados es el de la
temperatura, donde la unidad de medida es el grado (centígrado
o Farenheit). Esto nos permite decir que la diferencia entre una
temperatura de 10⁰ y otra de 18⁰ es la misma que existe entre una
temperatura de 18⁰ y otra de 26⁰ (8⁰). La escala temporal de nuestro

46
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

calendario es otro ejemplo claro, donde la unidad de medida es el


año, que contiene 365 días. Aunque posee una escala de medida,
la escala de intervalo también tiene una limitación importante:
carece de un origen, de un cero absoluto. Efectivamente, si
pensamos en la escala Celsius o Farenheit, un valor de 0⁰ no indica
ausencia de temperatura, sino que existen temperaturas inferiores
a ésta, que se establecen en forma de valores negativos. Del mismo
modo, el año cero del calendario cristiano no corresponde al origen
del tiempo, sino al año de nacimiento de Cristo. Esta limitación
implica que no podremos establecer razones entre valores: no
podemos decir que a 20⁰ hay el doble de temperatura que a 10⁰, o
que hasta el año 2000 ha transcurrido el doble de tiempo que hasta
el año 1000.

4. Escala de Razón: Este tipo de escala sí tiene un origen que indica


ausencia total de la característica medida, por lo que no sólo es
posible establecer relaciones de igualdad o diferencia, de orden, o
de igualdad de intervalos, sino que también es posible establecer
igualdades de razones. Las escalas empleadas para medir
magnitudes físicas como el peso, la longitud, la velocidad, etc.,
son de este tipo, lo que nos permite decir que una persona tiene
el doble de años que otra, o que su peso es 2/3 del de otra persona.

Las principales características de cada una de estas escalas, junto con sus
propiedades y tipos principales, se muestran en el cuadro siguiente, en
el que podemos apreciar que los dos primeros tipos de escala (nominal
y ordinal) proporcionan un mismo tipo de datos, que se caracterizan
porque no existen valores numéricos propiamente dichos, sino solamente
categorías diferentes (que pueden ordenarse, en el caso de la escala
ordinal). Por su parte, los otros dos tipos de escala (de intervalo y de razón)
proporcionan datos de tipo cuantitativo, numéricos, también conocidos
como datos de escala, porque poseen una unidad de medida que permite
establecer escalas, y realizar con ellos operaciones aritméticas. En el caso
de la escala de intervalo, dado que no hay origen absoluto en la escala,
pueden realizarse adiciones y sustracciones, por ejemplo para averiguar
la diferencia entre dos puntuaciones, o sumar las puntuaciones de dos
ítems. En el caso de la escala de razón, también pueden hallarse razones

47
Eulogio Real Deus

o productos entre puntuaciones, lo que nos permite afirmar que un


sujeto tiene el doble o la mitad de puntuación que otro. Las variables
de escala pueden ser discretas o continuas, en función del número de
valores posibles que admitan entre dos valores dados. Si esta cantidad
es fija, entonces la escala es discreta (por ejemplo, el número de años de
experiencia o el número de errores cometidos en una prueba); si, por el
contrario, esta cantidad es potencialmente ilimitada, entonces la escala
será continua (por ejemplo, la estatura o el peso).

Escala Datos Características Propiedades Tipos principales


Categorías a las ŸŸ Dicotómicas
Categóricos
Nominal que se puede =≠ (0-1)
(no métricos) asignar un nombre ŸŸ Politómicas
Categóricos Categorías que se ŸŸ Clasificaciones
Ordinal =≠><
(no métricos) pueden ordenar ŸŸ Rangos
Datos numéricos
Escala ŸŸ Discretas
Intervalo con unidad de =≠><+-
(métricos) ŸŸ Continuas
medida
Datos numéricos
Escala ŸŸ Discretas
Razón con origen (cero = ≠ > < + –* /
(métricos) ŸŸ Continuas
absoluto)

A partir de la clasificación de Stevens es evidente que las propiedades


de los distintos tipos de escala son acumulativas; es decir, que la escala
con menos propiedades es la escala nominal, mientras que la escala de
razón sería la que tiene mayores propiedades. Si tenemos en cuenta que,
a mayor número de propiedades, mayor cantidad de información nos
proporcionará la escala, veremos que las escalas de intervalo y razón
son las que más nos interesan, y que las escalas nominal y ordinal nos
interesarían menos. Es decir, intentaríamos que nuestros datos fuesen
de escala, y no categóricos. Sin embargo, hay una serie de cuestiones
que debemos tener en cuenta y que son de gran importancia a la hora de
recoger datos para nuestra investigación:

48
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

vv En el caso de muchas variables, no podremos elegir la escala de


medida, sino que ésta nos viene impuesta por las características
de la variable. Por ejemplo, el sexo es una variable nominal por
naturaleza, por lo que no podremos emplear otro tipo de escala
para medirlo.
vv En el caso de que podamos elegir la escala de medida para nuestros
datos, deberemos elegir aquella con más propiedades. Es decir, si
podemos medir una característica empleando una escala de razón,
no emplearemos una escala de intervalo, y así sucesivamente. Hay
dos buenas razones para ello:

1. Dado que una escala contiene todas las propiedades de


aquellas que le preceden, siempre podremos convertir
la información de un tipo superior de escala en otro tipo
inferior, mientras que la operación contraria no será posible.
Por ejemplo, si hemos preguntado a los sujetos empleando
una escala de razón (años de edad), y queremos convertir
estos datos a escala ordinal, podemos hacerlo fácilmente
asignando valores a tramos de edad (menor de 18 años,
entre 19 y 30 años, entre 31 y 40 años, etc.). Sin embargo, si
hemos recogido la edad empleando tramos de edad, luego
no podremos saber cuál era la edad exacta de los sujetos.

2. Cuando no elegimos adecuadamente la escala a emplear


con nuestros datos, podemos encontrarnos con problemas
a la hora de analizar los datos. La mayoría de las técnicas de
análisis de datos (ver Apartado 2.10) están diseñadas para un
tipo de datos específico (categóricos, de escala, o una mezcla
de ambos). Si nuestra técnica requiere datos categóricos y
nosotros tenemos datos de escala, podemos categorizarlos
y adaptarlos a la técnica. Por el contrario, si nuestra técnica
requiere datos de escala y hemos recogido la información
usando datos categóricos, no podremos emplearlos en el
análisis, o su utilidad quedará muy limitada.

49
Eulogio Real Deus

vv La elección de la escala de medida también es relevante para saber


qué estrategia de análisis de datos podemos emplear que nos
proporcione respuestas a las preguntas que nos hemos planteado
en la investigación. Como ya hemos comentado, la mayoría de
las técnicas de análisis de datos están pensadas para datos de un
tipo concreto, o para una combinación concreta de los mismos.
Si intentamos analizar nuestros datos con una técnica que no fue
diseñada para ellos, los resultados serán engañosos y no tendrán
validez alguna. Afortunadamente, existe gran cantidad de técnicas
que pueden tratar con tipos de datos muy diferentes, por lo que
probablemente este tipo de limitación no nos impedirá realizar
nuestros análisis. Por ello, es importante conocer en qué escala
están medidas nuestras variables de interés, para saber qué
estrategias de análisis de datos estarían a nuestra disposición.

Una vez vistos los tipos de escalas de medida, pasaremos a continuación


a decidir el tipo de escala de respuesta que emplearemos en nuestro
instrumento. En este punto, es importante distinguir si el instrumento
que vamos a diseñar es un cuestionario o una escala. Ambos son
instrumentos de medida que incorporan una serie de ítems, pero en
el caso del cuestionario, cada ítem recoge información de un aspecto
concreto y particular, por lo que los distintos ítems pueden emplear
escalas de medida y escalas de respuesta diferentes. Sin embargo, en el
caso de la escala, todos los ítems miden un mismo constructo, por lo que
la escala de respuesta debe ser la misma para todos ellos, ya que deben
proporcionar una única puntuación global. Además, dado que una escala
mide algo no observable de forma directa, será necesario comprobar su
fiabilidad y validez, para verificar que los ítems empleados son adecuados
y suficientes. En el caso del cuestionario, por el contrario, no será necesario
tener en cuenta consideraciones sobre su fiabilidad y validez, puesto que
cada ítem mide un aspecto diferente.

2.7.2. Escala de respuesta


La escala de respuesta debe proporcionarnos información lo más exacta
posible y sin ambigüedades sobre la característica que queremos medir
con el ítem correspondiente. Así pues, en el caso de variables medidas

50
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

en escala de razón (edad, número de hijos, peso, estatura, años de


experiencia, etc.), la escala de respuesta habitual consistirá simplemente
en un valor numérico que el sujeto debe proporcionar. Ítems de este tipo
serían, por ejemplo:

Por favor, indique a continuación su edad en años: _________

Indique en una escala de 0 a 10, su grado de satisfacción con la atención


recibida: _________

La escala de intervalo suele emplearse con frecuencia cuando el


instrumento que estamos elaborando es una escala y no un cuestionario.
La razón es que a menudo resulta difícil emplear un formato de respuesta
que proporcione datos en escala de razón, mientras que los datos de
tipo ordinal y nominal no son muy adecuados para analizar la fiabilidad
y validez de la escala. Así pues, los datos de intervalo proporcionan un
nivel de precisión y calidad suficiente para la mayoría de los propósitos.
El formato de respuesta habitual en este caso suele ser una escala de 5
ó 7 puntos. Por ejemplo, para medir el grado de ansiedad que padece un
sujeto podríamos emplear la siguiente escala de respuesta, preguntándole
en qué medida se identifica con cada una de las afirmaciones que se le
presentan:

Nada Poco Algo Bastante Mucho

A menudo me siento inquieto y 1 2 3 4 5


agitado.
A veces siento que me falta la 1 2 3 4 5
respiración.

n tipo de escala de respuesta muy utilizado, sobre todo en estudios sobre


actitudes, es la escala tipo Likert, donde un sujeto debe expresar su grado
de acuerdo o desacuerdo con las opiniones expresadas en una serie de
frases, como por ejemplo:

51
Eulogio Real Deus

Totalmente en desacuerdo

Totalmente de acuerdo
En desacuerdo

De acuerdo
Neutral
El alcohol debería ser declarado ilegal. 1 2 3 4 5
Conducir bebido debería estar castigado con la 1 2 3 4 5
cárcel.

En caso de que los datos sean ordinales, la escala de respuesta suele


incluir las categorías de respuesta en forma ordenada:

En su opinión, la
calidad de la atención
sanitaria recibida es: Deficiente (1) Insuficiente (2) Suficiente (3)

Un tipo de datos ordinales especiales son las clasificaciones por


preferencia, en las que el sujeto debe ordenar los elementos de una lista en
función de algún criterio, asignando un 1 al primero, un 2 al segundo, y así
sucesivamente. Este tipo de escalas de respuesta es útil cuando queremos
obligar a los sujetos a priorizar los elementos de la lista, maximizando las
diferencias existentes entre ellos.

Finalmente, en el caso de las variables nominales, una escala de respuesta


especial es la dicotómica o binomial, donde sólo existen dos posibles
respuestas, que suelen etiquetarse como éxito (1) o fracaso (0), aunque
también se ajustan a otro tipo de etiquetas (Verdadero-Falso, Si-No,
Presente-Ausente, etc.).

Si nuestra estrategia de investigación implica la recogida de información


observacional, nuestro instrumento de medida será una hoja de registro
en forma de matriz, en la que podemos anotar la presencia de una
conducta, la hora a la que se produjo, su intensidad, su duración, etc.

52
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Por ejemplo, esta podría ser una hoja de registro para estudiar el tipo de
clientes que se paran delante de un determinado escaparate:

Hora Sexo Edad (aprox.) Tiempo Acompañantes


16:00 Mujer 40 3’ 00’’ 1
16:12 Mujer 30 1’ 05’’ 0
16:15 Hombre 40 0’ 10’’ 0

En todos los casos anteriores, el formato de respuesta es cerrado; es decir,


los sujetos tienen que escoger una respuesta entre una serie de opciones.
Existen ocasiones en las que es posible que no hayamos recogido como
opción la respuesta que quiere dar el sujeto, en cuyo caso, podemos añadir
una opción abierta, donde el sujeto pueda especificar una respuesta
diferente a las presentadas en las opciones. Por ejemplo:

Cuál es la situación
de su vivienda: En alquiler (1) Propia (2) Otra (indicar):_______

También podemos incluir formatos de respuesta abiertos cuando


necesitemos ampliar información que sería difícil preguntar a los sujetos
utilizando un formato de respuesta cerrada. La desventaja de este tipo de
información es que para poder codificarla es necesario un procesamiento
bastante complicado, mientras que la proporcionada por un formato
de respuesta cerrado ya está codificada de antemano. No obstante, las
preguntas abiertas pueden ser de interés cuando queremos disponer no
sólo de información cuantitativa, sino también cualitativa, a la hora de
abordar el tema de estudio.

2.7.3. Elaboración de ítems


Tanto si estamos elaborando una encuesta, un cuestionario o una
escala, hay una serie de datos que es necesario recoger de los sujetos:
su información sociodemográfica. Este bloque contiene datos como el
género, la edad, el nivel de ingresos y de estudios, etc., y suele colocarse
al final, aunque en ocasiones también se le sitúa al principio para
familiarizar al sujeto con el instrumento antes de entrar en cuestiones
más específicas.
53
Eulogio Real Deus

Es necesario tener en cuenta que nuestro instrumento no debe tener


una longitud excesiva, para no agotar innecesariamente a los sujetos.
La duración ideal de una prueba escrita es de alrededor de 15 minutos o
menos, y no es recomendable que supere los 20 minutos, especialmente
si se presenta por vía postal, informática o telefónica.

Un aspecto muy relevante en la elaboración de ítems es la forma en que


están redactados. Una mala redacción de los ítems puede llevar a que
los sujetos malinterpreten las preguntas de nuestra prueba, con lo que
los datos quedarían invalidados. Para evitar este problema, es necesario
tomar una serie de precauciones (Schweigert, 1994; Delgado, 2014):

1. Las preguntas que van a hacerse deben ser exactamente las


necesarias para obtener la información que necesitamos, ni más ni
menos. Es importante asegurarse de que no dejamos sin abordar
ningún aspecto relevante, pero también que no cansamos a los
encuestados haciéndoles preguntas irrelevantes y/o innecesarias.
2. El orden lógico de las preguntas es, a menudo, importante, y debe
ir de lo general a lo específico, para facilitar la tarea al sujeto que
responde a la prueba.
3. Las preguntas deben redactarse de forma clara y breve (no más
de 20 palabras) y en un lenguaje comprensible para los sujetos,
evitando complejidades tanto en la estructura de la pregunta
como en los términos empleados. Una frase como: “No estoy en
contra de la enseñanza privada” contiene una doble negación que
hace mucho más difícil su interpretación que una frase más directa
como: “Estoy a favor de la enseñanza privada”. Por lo que respecta
a la terminología, una frase como “Las redes sociales promueven el
narcisismo” puede resultar incomprensible para muchas personas,
por incluir jerga psicológica, algo que podría evitarse reformulando
la frase con términos más sencillos (“Mucha gente utiliza las redes
sociales para promocionarse a sí mismos”).
4. Evitar la ambigüedad en la redacción, de tal modo que todos los
sujetos interpreten la pregunta del mismo modo. Por ejemplo,
un ítem sobre relaciones familiares como: “Mis padres lo saben

54
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

todo de mí” podría ser interpretado por algunos sujetos como


algo positivo (“mis padres me conocen bien”), mientras que otros
sujetos podrían interpretarlo en forma negativa (“Mis padres
controlan mi vida”).
5. Evitar términos vagos o universales, presentes en expresiones como
“nadie”, “todo el mundo”, “siempre”, “nunca”, etc. En estos casos los
sujetos suelen moderar su respuesta para compensar el carácter
extremo de la pregunta, produciendo así un efecto indeseable de
una menor variabilidad de las respuestas.
6. Comprobar que la pregunta solicita única y exclusivamente
la información que nos interesa, es decir, que el ítem es
unidimensional. Cuando la pregunta abarca más de un aspecto
de la realidad, no podremos saber a cuál de esos aspectos ha
contestado el sujeto. Para ilustrar este problema, piense en el
siguiente ítem: “Creo que la mayoría de la gente es egoísta, y eso
me entristece”. Este ítem mide simultáneamente nuestra opinión
sobre la gente (si es mayoritariamente egoísta o no), y nuestra
respuesta emocional ante un defecto concreto (si el egoísmo me
entristece o no).
7. Emplear un tono neutro, y evitar incluir términos con carga
emocional, sesgados o con doble sentido. Por ejemplo, el ítem
“¿Cree usted que la política económica actual llevará al país a la
ruina?”, contiene una fuerte carga emocional negativa y, por tanto,
podría producir una respuesta diferente en el sujeto de la que
daría si no existiese dicha carga (por ejemplo: “¿Cree usted que la
política económica actual es perjudicial para el país?”). Un caso
grave de falta de neutralidad se produce cuando el ítem se redacta
de forma sesgada, de tal modo que el sujeto se ve dirigido hacia
una respuesta concreta. Si queremos saber la opinión del sujeto
sobre el cambio climático, no sería muy lógico redactarla de esta
forma: “La mayoría de expertos creen que el cambio climático
es un hecho ¿Cuál es su opinión?”, puesto que sitúa al sujeto en
una posición muy incómoda en caso de que sea escéptico acerca
del cambio climático. Finalmente, los ítems con doble sentido
preguntan más de una cosa a la vez, dificultando así la respuesta

55
Eulogio Real Deus

del sujeto. Así, una pregunta como: “¿Cree usted que la propuesta
educativa del Gobierno es efectiva o innovadora?” no deja claro
si ambos términos son excluyentes (o bien es efectiva, o bien es
innovadora), o deben ir juntos (o se cumplen ambos, o ninguno).
Cualquier sujeto tendrá grandes dificultades para contestar a un
ítem como este.
8. Evitar la deseabilidad social por parte de los sujetos, que se
produce cuando el que responde es consciente de que una opción
de respuesta cuenta con mayor respaldo social que otras, entre las
cuales puede estar la del propio sujeto. Esto puede llevarle a darnos
una respuesta falsa simplemente para dar una mejor imagen de
sí mismo. Este tipo de sesgo de respuesta es mucho más probable
si la pregunta se refiere a un tema sensible, como las adicciones,
la conducta sexual, el nivel económico, la política, la religión o la
intolerancia, entre otros. La propensión a la deseabilidad social
puede minimizarse garantizando el anonimato de las respuestas,
o redactando los ítems de forma que no sea tan evidente cuál es la
respuesta socialmente aceptable. Por ejemplo, en el caso de una
conducta de consumo, en lugar de preguntar: “¿Ha consumido
alcohol en los últimos doce meses? ”, podemos reformular la
pregunta de esta forma: “El 75% de los españoles afirma haber
consumido alcohol en los últimos doce meses ¿Es este su caso?”.

9. Si la pregunta contiene una condición, es importante situar


esta condición en la parte inicial de la misma, y no al final, para
evitar que el sujeto conteste precipitadamente sin haber leído
completamente la pregunta. Por ejemplo, la pregunta “Es sencillo
estudiar cuando el profesor da indicaciones claras sobre lo que
es importante en la asignatura” puede dar lugar a que el sujeto
conteste a la primera parte de la pregunta sin haber leído la
condición previa. Para evitar esto, la condición debería situarse al
principio: “Cuando el profesor da indicaciones claras sobre lo que
es importante en la asignatura resulta más sencillo estudiar”.
10. Evitar ítems que no discriminen. La capacidad discriminativa de un
ítem está relacionada con el grado en que los sujetos pueden variar
en su respuesta al mismo; a mayor variabilidad, mayor capacidad

56
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

discriminativa, y viceversa. Así pues, un ítem que no discrimina


adecuadamente será aquel ante el cual las respuestas de los sujetos
son bastante similares. Por ejemplo, si estamos construyendo
una escala de actitudes hacia los inmigrantes, un ítem como: “Los
inmigrantes buscan una vida mejor” será poco discriminativo
porque, independientemente de su actitud hacia los inmigrantes,
la inmensa mayoría de los sujetos estará de acuerdo en que esto
es así.
11. En el caso de que nuestra escala sea una prueba de aptitud en una
habilidad o competencia determinada, también es importante
comprobar el índice de dificultad de los ítems que la componen.
La dificultad de un ítem se calcula como la proporción de aciertos
cometidos por el sujeto sobre el total de ítems (ID=A/N). Así, un
índice de dificultad de 0.1 indica alta dificultad, ya que sólo el 10% de
los sujetos contesta correctamente esa pregunta, mientras que un
índice de dificultad de 0.5 indicaría dificultad media, ya que el 50%
de los sujetos acierta, y el otro 50% falla esa pregunta. Para que una
prueba de aptitud discrimine adecuadamente entre los distintos
niveles de habilidad o competencia que poseen los sujetos, es
necesario que contenga una combinación de ítems de dificultad
baja, media y alta en proporciones adecuadas (por ejemplo, 25%,
50%, y 25%, respectivamente). Dado que el índice de dificultad es
la proporción de aciertos en un ítem dado, está relacionado con la
media de la escala, que es el promedio de aciertos totales, hasta el
punto de que la media en la escala no es más que la suma de los
índices de dificultad de los ítems que la componen

12. También en el caso de que nuestra escala sea una prueba de


aptitud, debemos tener en cuenta la posibilidad de que los sujetos
acierten los ítems al azar. Esto es relativamente frecuente en el
caso de los ítems que emplean un formato de respuesta tipo
test, con varias alternativas de respuesta, de las cuales sólo una
es correcta. Cuanto menor sea el número de alternativas, mayor
es la probabilidad de acertar al azar: si sólo hay dos alternativas

57
Eulogio Real Deus

de respuesta, la probabilidad de acertar al azar es de ½=0.5,


mientras que la probabilidad de acertar al azar cuando hay cuatro
alternativas de respuesta es de sólo ¼=0.25. Así pues, cuando
estemos desarrollando una escala de aptitud con un formato de
respuesta tipo test, y queramos calcular el índice de dificultad de
sus ítems, o puntuar a los sujetos que cumplimentaron la escala,
será necesario corregir el efecto de los aciertos al azar en ambos
casos. Así, el índice de dificultad corregido por azar se calculará
como:

donde:

A es el número de sujetos que aciertan el ítem.


E es el número de sujetos que fallan el ítem.
k es el número de alternativas del ítem.
N es el número de sujetos que intentan resolver el ítem.

Del mismo modo, para calcular la puntuación de un sujeto


corrigiendo el efecto del azar, ésta puede obtenerse con la siguiente
fórmula:

donde:

A es el número de aciertos cometidos por el sujeto.


E es el número de errores cometidos por el sujeto.
k es el número de alternativas del ítem.

Además de todas las precauciones anteriores, resulta de gran interés, una


vez que tenemos redactado nuestro instrumento, aplicarlo a una pequeña
muestra piloto de sujetos, y tomar nota detallada de todas las preguntas y

58
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

dudas que los sujetos puedan manifestar a la hora de contestar. Esto nos
permitirá detectar los fallos de redacción o planteamiento que podamos
haber cometido en nuestro instrumento, y corregirlos antes de aplicarlo a
la muestra definitiva. La muestra piloto debería tener unas características
similares a las de la población diana a la que se dirige el estudio, y debería
estar formada, al menos, por el doble de personas que ítems incluidos en
la escala.

Cuando el cuestionario incluye varios ítems sobre un mismo aspecto, o


cuando estamos desarrollando una escala, donde todos los ítems miden
el mismo constructo, puede ser necesario balancear el sentido de los
ítems, colocando unos en forma favorable, y otros en forma desfavorable.
Esto evita que los sujetos den respuestas estereotipadas, o socialmente
deseables, o que respalden sin más las actitudes expresadas en la escala
(aquiescencia). Además, el balanceo de los ítems obliga a los sujetos
a prestar atención a los ítems de forma individual. Imaginemos que
estamos desarrollando una escala de clima familiar, que contiene los
siguientes ítems:

Nada Poco Algo Bastante Mucho

Tengo disputas con mis 1 2 3 4 5


padres.
Discutimos sobre la hora de 1 2 3 4 5
llegar a casa.
Mis padres controlan a mis 1 2 3 4 5
amigos.
Me dicen lo que tengo que 1 2 3 4 5
hacer.

Es evidente que, tal y como están redactados los ítems, las puntuaciones
altas indicarían mal clima familiar, y las bajas, buen clima familiar. Esto
puede provocar que los sujetos tiendan a dar respuestas bajas para
aumentar su deseabilidad social, o simplemente que detecten que no
conviene dar respuestas altas, por lo que adoptarán la estrategia de
puntuar bajo en la escala. Para evitar este problema, los mismos ítems
podrían ser reformulados de forma balanceada:

59
Eulogio Real Deus

Nada Poco Algo Bastante Mucho


Tengo disputas con mis 1 2 3 4 5
padres.
Tengo libertad sobre la hora 5 4 3 2 1
de llegar a casa.
Mis padres controlan a mis 1 2 3 4 5
amigos.
Me dejan hacer lo que quiera. 5 4 3 2 1

En este segundo caso resulta imposible dar respuestas estereotipadas,


porque no hay un patrón de respuesta sistemático posible, y tampoco
es tan fácil detectar qué respuestas son positivas y cuáles son negativas.
Es importante recordar que cuando balanceamos las preguntas de una
escala los ítems “apuntan” en direcciones opuestas, por lo que es necesario
orientarlos en el mismo sentido antes de calcular la puntuación total en la
escala. Hemos reflejado este hecho en la escala de respuesta de nuestra
prueba para ilustrar el cambio de dirección experimentado por los ítems,
aunque esto no suele hacerse en la escala real, para que los sujetos no
detecten fácilmente el sentido de las respuestas.

2.7.4. Fiabilidad
Como ya hemos comentado, la fiabilidad, junto con la validez, son dos de
los criterios más importantes que debemos evaluar cuando utilizamos
una escala, sobre todo si la hemos creado nosotros, o empleamos una
que ha sido creada para un contexto o un idioma diferente. No obstante,
incluso cuando empleamos como instrumento una escala ya probada en
el mismo contexto e idioma que el que vamos a emplear nosotros, puede
ser conveniente comprobar que los resultados sobre fiabilidad y validez
son adecuados.

La fiabilidad hace referencia al grado de precisión y consistencia de la


escala. Naturalmente, cuando hablamos de precisión no queremos
decir que el instrumento proporcione un valor absolutamente preciso,
dado que esto es muy difícil. Pensemos, en primer lugar, que las escalas,
como instrumentos de medida, usan formatos de respuesta de precisión

60
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

limitada (5 o 7 puntos), y se presentan a sujetos que pueden variar su


respuesta en función de múltiples factores que no es posible controlar,
como su estado de ánimo, su grado de cansancio, hambre o sed, etc.
Por ello, cuando decimos que una escala debe ser precisa, no estamos
implicando que deba ser exacta, sino más bien a que sus mediciones
sean estables. Por otro lado, la fiabilidad también está relacionada con
la consistencia interna de la escala, entendida ésta como el grado en
que los ítems de la escala están relacionados entre sí. Si algunos de los
ítems guardan poca relación con el resto, la escala adolecerá de baja
consistencia interna y, por tanto, de baja fiabilidad.
La fiabilidad se ve afectada por dos factores fundamentales, además
de los comentados anteriormente: la variabilidad de la muestra y la
longitud (número de ítems) de la escala. Cuanto mayor es la variabilidad
de la muestra, mejor será el valor de fiabilidad obtenido. Esto se debe a
que la escala discriminará mejor si la muestra es heterogénea que si los
sujetos son muy similares, puesto que la correlación se ve favorecida
cuando hay grandes diferencias entre los sujetos, y debilitada cuando
éstos son muy similares. Por ello, es importante contar con una muestra
lo más heterogénea posible para nuestro estudio, con el fin de mejorar
la variabilidad de las respuestas de los sujetos. En el caso de la longitud,
dado que todos los ítems de una escala miden el mismo constructo,
cada ítem que se añade a la escala incrementa un poco la precisión de
la medida, por lo que, a mayor número de ítems, mayor fiabilidad de la
escala. Existen fórmulas que permiten estimar la fiabilidad de una escala
para distintos valores de variabilidad muestral y para distintas longitudes
de la escala que pueden consultarse en cualquier manual de Psicometría.
Existen varias formas de obtener la fiabilidad de una escala, una vez que la
hemos aplicado a una muestra de sujetos, pero hay dos formas que son las
más utilizadas: el método test-retest, y el cálculo de la consistencia interna.
vv El método test-retest consiste en aplicar la escala dos veces a
la misma muestra, en momentos temporales diferentes. La
fiabilidad, en este caso, puede calcularse como la correlación entre
los resultados obtenidos en las dos aplicaciones4.

4 Para saber más sobre el coeficiente de correlación, consulte el apartado 2.10. Análisis de datos.

61
Eulogio Real Deus

vv El cálculo de la consistencia interna se obtiene a partir de una única


aplicación de la escala, por lo que es más fácil obtener un índice
de fiabilidad empleando este método. La consistencia interna se
mide habitualmente mediante el coeficiente alfa (α) de Cronbach.
Su cálculo viene dado por la siguiente fórmula:

donde:

n es el número de ítems de la escala.


Σσj2 es la suma de las varianzas de los n ítems.
σx2 es la varianza de las puntuaciones en la escala total.

Tanto el coeficiente de correlación como el coeficiente alfa de Cronbach


proporcionan un índice que oscila entre 0 y 1. Un valor de 0 indicaría
ausencia total de fiabilidad en la escala, mientras que un valor de 1
indicaría una fiabilidad perfecta. Como regla general, se considera que
un valor de 0.7 o superior indicaría una fiabilidad aceptable, mientras que
valores por encima de 0.8 indicarían una buena fiabilidad, y por encima
de 0.9, una fiabilidad excelente.

Veamos cómo se obtendría en SPSS el índice α de Cronbach con datos


reales. Hemos aplicado la escala de autoestima EAR (Rosenberg, 1989) a
una muestra de sujetos, y hemos codificado sus respuestas en una base
de datos de SPSS. El archivo de datos tiene este aspecto5:

5 Para saber más sobre el archivo de datos de SPSS, ver la sección 2.9.2. Codificación de los datos.

62
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Como podemos ver, los datos aparecen en una matriz similar a las
empleadas en hojas de cálculo como Excel. Cada una de las casillas de
la matriz corresponde a la puntuación obtenida por un sujeto (fila) en
una variable (columna). Las 10 columnas que aparecen en la imagen
corresponden cada una de ellas a un ítem de la escala (EAR01 a EAR10;
10 ítems en total), y los valores representan las respuestas dadas por los
sujetos en una escala de 1 (“totalmente en desacuerdo”) a 7 (“totalmente
de acuerdo”). Los ítems de la escala están balanceados, por lo que algunos
indican mayor autoestima cuanto mayor puntuación, mientras que
otros indican menor autoestima cuanto mayor sea la puntuación. Por
ejemplo, el ítem 1 de la escala (“Creo que tengo buenas cualidades”) es del
primer tipo, mientras que el ítem 2 pertenece al segundo tipo (“Desearía
respetarme más a mí mismo”). Puede observarse que los ítems 2, 4, 6, 7 y
9 llevan la letra “R” al final del nombre, para indicar que las puntuaciones
de estos ítems deben ser invertidas antes de emplearlas para obtener
la puntuación global en la escala6. Una vez que hemos invertido estas
puntuaciones podremos calcular la consistencia interna de la escala. Para
ello, seleccionamos en el menú las opciones: Analizar → Escala → Análisis
de fiabilidad. Esto nos mostrará el siguiente cuadro de diálogo:

6 Para invertir los valores de una escala que va de 1 a n, basta con restar a (n+1) los valores originales
obtenidos. En el caso de una escala de 1 a 7, las puntuaciones pueden invertirse restando a 8 el
valor obtenido. Por ejemplo, si un sujeto ha respondido con un 3 en la escala original, su valor
invertido será 8-3=5. En el caso de que la escala vaya de 0 a n, el valor del que restar será n, en
lugar de (n+1).

63
Eulogio Real Deus

A la izquierda se encuentran todas las variables del archivo de datos.


A la derecha, hemos seleccionado las 10 variables que contienen las
puntuaciones de los sujetos en la escala EAR, para analizar la fiabilidad
de esta escala. El cálculo del alfa de Cronbach aparece ya seleccionado en
la casilla “Modelo”. Podemos ver que tenemos otro botón que nos permite
seleccionar los Estadísticos que nos interesa obtener. Si lo pulsamos
aparecerá este otro cuadro de diálogo:

Las opciones que nos interesa marcar aquí son: solicitar los descriptivos
para cada elemento o ítem, para la escala total, y para la escala si se
elimina un elemento. También puede ser de interés obtener la matriz

64
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

de correlaciones entre elementos, para ver las relaciones existentes


entre los distintos ítems. Los resultados del análisis se mostrarán en la
ventana de resultados que se reproduce más abajo. Como podemos ver,
en la zona izquierda de la ventana podemos navegar por los distintos
análisis efectuados (en nuestro caso, un análisis de fiabilidad) y, dentro
de éstos, por los distintos resultados proporcionados para un mismo
análisis (estadísticos de fiabilidad, estadísticos de los elementos, matriz
de correlaciones, etc.). En la zona de la derecha se muestran las tablas y
gráficos que resumen esos resultados. La primera de las tablas nos resume
el procesamiento de los casos (sujetos), donde podemos ver que nuestra
muestra consta de 110 sujetos, y que ningún sujeto ha sido excluido de la
muestra (0 excluidos). A continuación se proporciona el coeficiente alfa
de Cronbach para el total de la escala (.88), que nos indica que la escala
EAR muestra una buena consistencia interna, a pesar de que contiene
pocos ítems, y de que ha sido aplicado a una muestra pequeña de sujetos.
Así pues, ya tenemos una idea clara de que nuestra escala posee una
consistencia interna adecuada.

Además del valor concreto del alfa de Cronbach, también puede


interesarnos ver los estadísticos total-elemento que solicitamos en el
análisis, junto con la matriz de correlaciones. La tabla siguiente muestra
estos estadísticos en sus columnas. Los índices que más nos interesan
son el índice de discriminación (Correlación elemento-total corregida)

65
Eulogio Real Deus

y el valor del alfa de Cronbach para la escala eliminando un ítem concreto


(Alfa de Cronbach si se elimina el elemento). Recordemos que el índice de
discriminación nos indica hasta qué punto un ítem discrimina tanto como
la escala total, por lo que cuanto mayor sea el mismo, mayor capacidad
discriminativa del ítem correspondiente. Puede apreciarse que el ítem más
discriminativo es el EAR10 (“A grandes rasgos, estoy satisfecho conmigo
mismo”; .788), y el menos discriminativo es el ítem EAR02R (“Desearía
respetarme más a mí mismo”; .478). Dado que el valor del índice de
discriminación suele considerarse aceptable a partir de un valor de .30
o .40, podemos concluir que todos los ítems de la escala EAR poseen una
adecuada capacidad discriminativa. En cuanto a los valores del alfa de
Cronbach, apreciamos que la supresión de alguno de los ítems nunca
mejora el valor de fiabilidad de la escala total, lo que viene a indicar que
todos ellos contribuyen a la consistencia interna de la misma, y que esta
consistencia interna no podría mejorarse eliminando ninguno de los ítems.

Estadísticos total-elemento
 

Media de la escala si se Varianza de la escala si se Correlación elemento-total Correlación múltiple al Alfa de Cronbach si se
elimina el elemento elimina el elemento corregida cuadrado elimina el elemento
EAR01 44,16 90,945 ,527 ,505 ,874
EAR02R 46,52 86,656 ,478 ,350 ,880
EAR03 43,48 93,004 ,567 ,450 ,873
EAR04R 44,37 87,190 ,530 ,318 ,875
EAR05 45,06 83,767 ,644 ,456 ,866
EAR06R 45,25 82,632 ,619 ,462 ,868
EAR07R 43,88 83,555 ,739 ,641 ,859
EAR08 44,21 91,470 ,547 ,464 ,873
EAR09R 44,57 78,541 ,751 ,663 ,856
EAR10 44,06 86,372 ,788 ,674 ,858

2.7.5. Validez
 
 

La validez constituye el otro pilar de una buena escala: de nada nos


sirve que nuestra escala sea precisa y consistente (fiable) si, al mismo
tiempo, no mide lo que pretendemos que mida (válida). Inversamente, de
nada nos sirve que nuestra escala sea válida para el constructo que nos
interesa, si las medidas que nos proporciona no son fiables. Es necesario,
por tanto, que ambos criterios se cumplan para que nuestra escala pueda
ser considerada un instrumento adecuado.

66
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Cuando decimos que una escala es válida estamos asumiendo que las
puntuaciones en esa escala o test para un sujeto concreto serían buenas
estimaciones del grado en que el sujeto posee la característica medida
por la escala. Es decir, suponemos que la escala es adecuada para realizar
inferencias acerca del grado en que el sujeto posee dicha característica; una
escala de Neuroticismo será válida si, a partir de los resultados obtenidos
por un sujeto en la misma, podemos conocer el grado en que el sujeto es
o no estable emocionalmente. Suponemos que un sujeto muy estable
obtendrá una puntuación baja en la escala, uno de estabilidad intermedia
obtendrá una puntuación también intermedia, y un sujeto inestable
emocionalmente obtendrá una puntuación alta. Así pues, la estimación de
la validez de una escala se refiere a la adecuación entre un valor obtenido de
forma empírica por el sujeto (el test) y el valor correspondiente al grado en
que el sujeto posee realmente la característica de interés (el criterio). Cuanto
mayor sea la relación entre el resultado proporcionado por el test y el valor
real del criterio, mayor será la validez de nuestra escala. De forma clásica
(Muñiz J. , 1992) suele distinguirse entre tres tipos de validez: (1) validez de
contenido; (2) validez predictiva; y (3) validez de constructo.

vv Validez de contenido. Se refiere a la necesidad de que los ítems de


la escala constituyan una muestra representativa y adecuada de
los contenidos y el alcance del constructo que la escala pretende
medir. Dado que los constructos no pueden medirse directamente,
y dado que cada ítem sólo proporciona información sobre un
determinado aspecto de un constructo dado, es necesario que los
ítems de la escala incidan en todos los posibles aspectos que es
necesario tener en cuenta para ilustrar dicho constructo. Pensemos
en una escala que pretenda medir las competencias lingüísticas de
los adolescentes, pero que sólo contenga ítems de vocabulario. Sus
puntuaciones carecerán de validez, puesto que no tienen en cuenta
otro tipo de competencias como la capacidad de análisis y síntesis,
su comprensión lectora, su expresión escrita, etc. Así pues, en
resumen, la validez de contenido implica que para poder realizar
inferencias sobre el criterio, es necesario que nuestro test incluya
una muestra representativa de los contenidos que componen ese
criterio. Los pasos habituales para conseguir que nuestra escala
tenga validez de contenido serían los siguientes:

67
Eulogio Real Deus

ŸŸ Enumerar los diversos contenidos que se pretende evaluar


con la escala.
ŸŸ Elaborar varios ítems para cada contenido.
ŸŸ Seleccionar una muestra de expertos en el constructo a
evaluar.
ŸŸ Pedir a los expertos que evalúen cada ítem en cuanto a su
adecuación a los diversos contenidos que se pretende medir.
ŸŸ Seleccionar los ítems que han obtenido mejores
evaluaciones por parte de los expertos.

vv Validez predictiva. Como ya se comentó al principio de este


apartado, una escala pretende realizar una predicción o inferencia
sobre el grado en que un sujeto posee la característica que mide
esa escala. La validez predictiva se refiere al grado de eficacia
con que nuestro test predice el criterio o, en términos prácticos,
al grado de correlación existente entre test y criterio; a mayor
correlación, mayor capacidad predictiva del test y, por tanto, mayor
validez predictiva o de criterio. El único punto problemático acerca
de este tipo de validez es, como puede imaginarse, la obtención de
los valores verdaderos de los sujetos en el rasgo que pretendemos
medir con la escala, es decir, del criterio. Si nuestra escala pretende
medir el rendimiento de los sujetos en algún aspecto observable
sería posible medir el criterio sin problemas. Por ejemplo, si la escala
pretende medir la competencia laboral de los sujetos, sería posible
obtener evaluaciones de los sujetos por parte de sus empleadores
con posterioridad, y compararlas con sus puntuaciones en la escala
(validez de pronóstico). O también podemos medir previamente el
criterio y luego aplicar la escala a los sujetos (validez retrospectiva);
por ejemplo, cuando desarrollamos una escala para diagnosticar
el grado de depresión, y la aplicamos a una muestra de pacientes
previamente diagnosticados por un experto. Cuando no es posible
observar directamente el criterio, la validez predictiva puede
obtenerse comparando sus resultados con otra prueba cuya
relación con el criterio haya sido probada previamente. Aplicando
ambas pruebas simultáneamente a la misma muestra de sujetos

68
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

nos permitiría correlacionarlas y obtener indicios de la validez


predictiva de nuestra escala (validez concurrente).

vv Validez de constructo. Como ya se ha comentado anteriormente,


las escalas miden constructos, conceptos, características o atributos
de los sujetos que no pueden ser medidos de forma directa, como
la inteligencia, la extraversión, el autoritarismo, etc. Por ello, para
que una escala tenga validez de constructo es necesario que se
demuestre empíricamente la existencia previa de dicho constructo.
Aunque existen diferentes estrategias para alcanzar este objetivo,
el método más empleado en la práctica es el empleo del análisis
factorial para detectar aquellos ítems que miden un mismo
constructo, lo que se conoce como validez factorial.

ŸŸ La validez factorial se obtiene sometiendo a los ítems de


la escala a la técnica del análisis factorial7. Esta técnica
permite analizar las relaciones existentes entre un conjunto
de variables, y trata de recuperar la mayor cantidad
posible de la información proporcionada por todas esas
variables recurriendo a un número menor de las mismas,
denominadas dimensiones o factores, que pueden ser
interpretadas como variables latentes subyacentes a las
variables observadas que hemos sometido al análisis.
Así, cada factor o dimensión puede interpretarse como
una variable no observable cuyo valor puede deducirse a
partir de un conjunto mayor de variables observables, que
guardan una estrecha relación con el mismo. Si nuestra
escala pretende medir un determinado constructo, el
análisis factorial de los ítems debería poner de manifiesto la
existencia de dicho constructo como un factor o dimensión
con el cual guardarían relación todos los ítems de la escala
(coherencia factorial).

Finalmente, la validez se ve afectada, del mismo modo y en el mismo sentido


que lo estaba la fiabilidad, por la longitud de la escala y por la variabilidad

7 Para más información sobre los fundamentos y la aplicación del análisis factorial, véase el
apartado 2.10.7. Técnicas de reducción de datos. El análisis factorial.

69
Eulogio Real Deus

de la muestra. Es decir, que la relación de una escala con un constructo


será mayor cuanto mayor sea el número de ítems relacionados con dicho
constructo que incorpore dicha escala. De forma similar, la relación de la
escala con el constructo será más fácil de apreciar si hay mucha variabilidad
en la muestra de sujetos, que si hay poca variabilidad. Por tanto, es de
esperar que la validez aumente a medida que aumenta la longitud de la
escala, y también a medida que aumenta la variabilidad de la muestra.

Otro aspecto a tener en cuenta si estamos construyendo una escala, es la


necesidad de contar con un número elevado de ítems para cada uno de los
aspectos a evaluar, al menos el doble del número deseado para la escala
definitiva (Prat & Doval, 2003). Hay que tener presente que no todos los
ítems resultarán adecuados para los objetivos de la escala por lo que, una
vez evaluada la fiabilidad y validez de la misma, será necesario eliminar
aquellos que ofrezcan peores índices con el fin de obtener una medida de
la máxima calidad.

2.8. Selección de la muestra


Una vez que sabemos qué es lo que queremos investigar, qué variables
están involucradas, qué objetivos o hipótesis pretendemos clarificar, y
hemos recopilado y/o desarrollado los instrumentos necesarios para
ello, procede a continuación seleccionar una muestra de sujetos a la que
aplicaremos estos instrumentos, a través de los cuales obtendremos las
medidas pertinentes de las variables incorporadas en nuestro estudio.

Una muestra no es más que un conjunto de elementos (generalmente


sujetos), obtenidos de un universo total que constituye la población diana.
Así pues, una muestra no es más que un subconjunto de la población
objetivo de nuestra investigación. Podemos definir una población
como el conjunto de elementos que poseen una o varias características
en común; las características de la población que sean relevantes para
nosotros dependerán de los objetivos de nuestro trabajo. Por ejemplo,
si mi investigación se refiere al uso de servicios sociales por parte de
personas de la tercera edad, mi población objetivo son las personas que
comparten una única característica: tener 65 o más años de edad. Si mi
investigación estudia los efectos que tiene la violencia de género en las

70
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

mujeres, mi población objetivo son las personas que comparten estas dos
características: (1) son mujeres; (2) han sufrido violencia de género por
parte de sus parejas.

Las razones por la que empleamos muestras, y no la población general son


básicamente de tipo logístico, de tiempo y económico, ya que el acceso a
la totalidad de los elementos de la población suele ser muy complicado,
costoso, lento y, en muchas ocasiones, materialmente imposible. No
obstante, la población sigue siendo nuestro objetivo de investigación,
por lo que es necesario que nuestra muestra cumpla con una serie de
requisitos para que pueda ser una fuente útil de datos sobre la población.
Ese conjunto de requisitos pueden resumirse en uno solo: la muestra
ha de ser representativa de la población, es decir, ha de representar
adecuadamente a la población de la cual ha sido extraída. Cuando la
muestra no es representativa de la población, hablamos de sesgo en el
muestreo, o definimos a nuestra muestra como sesgada.

La calidad de la representación que nos proporciona la muestra respecto


de la población vendrá determinada, pues, por la similitud entre ésta
y aquella. Esta similitud, a su vez, debe darse al menos en cuanto a las
variables que puedan ser relevantes para nuestro estudio. Es decir, la
composición de la muestra debe ser una versión en miniatura de la
composición de la población, al menos en cuanto a las variables clave
de nuestro estudio. Para saber cuáles pueden ser las variables clave de
nuestro estudio, pensemos en diferentes ejemplos: si estoy llevando a
cabo un estudio sobre actitudes ante algún aspecto de la realidad y mi
muestra se compone exclusivamente de universitarios, estaré empleando
una muestra sesgada. Esto se debe a que las actitudes pueden verse
afectadas por diversos factores, como el nivel educativo de los sujetos.
Si mi muestra sólo contiene universitarios, estoy dejando fuera de la
misma a aquellos elementos de la población con otro tipo de estudios,
por lo que las posibles diferencias en función del nivel de estudios no
quedarán reflejadas en mis resultados. También es posible que existan
diferencias en las actitudes en función de otros aspectos, como el sexo o
la edad, por lo que tendré que garantizar que mi muestra es muy similar a
la población, al menos en cuanto a su distribución en función del sexo, la
edad y el nivel educativo.

71
Eulogio Real Deus

Así pues, la representatividad de nuestra muestra dependerá de cómo


hayamos seleccionado a los componentes de la misma. El proceso de
selección de los componentes de una muestra es lo que se conoce como
muestreo, y la calidad de la muestra obtenida dependerá del grado
de control que hayamos ejercido sobre dicho muestreo para evitar la
posibilidad de sesgos en la selección. Existen dos formas de controlar
la calidad del muestreo o, dicho de otro modo, dos formas de control
del muestreo: el control específico y el control inespecífico (Manzano &
Braña, 2003).

1. Control específico. Consiste en actuar directamente sobre aquellas


variables que consideramos clave para nuestro estudio. Mediante
este tipo de control imponemos una serie de restricciones al
proceso de muestreo con el fin de garantizar que la distribución en
nuestra muestra de esas variables clave es idéntica a la existente
en la población objetivo. Volviendo al ejemplo del estudio de
actitudes, si en la población existe una distribución al 50% de
hombres y mujeres, nuestra muestra también debe cumplir esa
distribución. Del mismo modo, si en la población hay un 20% de
sujetos menores de 18 años, un 30% de sujetos entre 18 y 40 años,
un 35% de sujetos entre 41 y 65 años, y un 15% de sujetos de más de
65 años, nuestra muestra debe mostrar los mismos porcentajes de
cada una de estas cohortes de edad. Finalmente, si los porcentajes
de sujetos con educación primaria, secundaria y superior en la
población son, respectivamente, del 10%, el 60% y el 25%, nuestra
muestra deberá mostrar también esos mismos porcentajes.

2. Control inespecífico. Cuando existe un número elevado de


variables clave, el control específico se complica rápidamente.
Volviendo al ejemplo anterior, si el sexo tiene 2 categorías, la edad
tiene 4 categorías o cohortes, y el nivel educativo tiene 3 categorías,
el número de combinaciones de estas tres variables es de 2x4x3=24
perfiles diferentes de sujetos en función de su sexo, su edad y
su nivel educativo. Así pues, garantizar la representatividad de
la muestra exclusivamente mediante control específico puede
resultar muy complicado. El control inespecífico resulta una
forma rápida y económica de garantizar esta representatividad,

72
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

recurriendo única y exclusivamente al azar. Existen formas


sencillas de hacer intervenir al azar en el proceso de muestreo,
como seleccionar al azar calles de una ciudad donde recoger la
información, determinar que el sujeto a entrevistar será el 5º,
o el 10º sujeto con quien se cruce en la calle, etc. El azar tiende a
proporcionarnos los valores que esperábamos a medida que
recogemos más y más sujetos para nuestra muestra. Así, si la
proporción de hombres y mujeres en la población es del 50% para
ambos sexos, un muestreo totalmente aleatorio nos proporcionará
probablemente esas mismas proporciones en nuestra muestra, si
ésta tiene un tamaño suficiente.

2.8.1. Tipos de muestreo


Como ya hemos dicho, la finalidad del muestreo es la de proporcionarnos
una muestra que pueda servir como réplica en miniatura de la población,
de tal modo que, a partir de la primera podamos hacer inferencias sobre
la segunda. Existen cuatro tipos fundamentales de muestreo, de los
cuales dos hacen uso únicamente del control inespecífico, y otros dos que
emplean ambos tipos de control.

1. Muestreo aleatorio simple. Es el más sencillo de todos, e implica


únicamente control inespecífico. Se toma una población de
tamaño N, y se selecciona aleatoriamente de la misma una
muestra de tamaño n. Si el tamaño de la muestra se ha calculado
correctamente, la aleatoriedad de la selección garantiza que todos
los elementos de la población han tenido la misma probabilidad
de pertenecer a la muestra. Los métodos para garantizar la
aleatoriedad de la selección son variados; entre los más utilizados
está la generación de números aleatorios para seleccionar a los
sujetos de una lista, o la de usar rutas aleatorias para localizar a los
sujetos por la calle.

2. Muestreo aleatorio sistemático. Es una variante del anterior y,


por lo tanto, también emplea únicamente control inespecífico. En
primer lugar se determina el tamaño muestral n. A continuación,
se asigna al azar un número de 1 a N a cada uno de los elementos
de la población, y a continuación se calcula una constante k=N/n.

73
Eulogio Real Deus

Finalmente, se van tomando los sujetos de la población de k en k


hasta obtener los n sujetos finales. Por ejemplo, si tenemos una
población de 100 sujetos, de la que queremos extraer una muestra
de 10 sujetos, calcularemos k =100/10=10. Por tanto, los sujetos que
formarán parte de nuestra muestra serán aquellos a los que se les
haya asignado aleatoriamente los valores 10, 20, 30, 40, 50, 60, 70,
80, 90,100.

3. Muestreo aleatorio estratificado. Es aquel en el que se realiza


un mayor control específico del muestreo. Se supone que la
población está dividida, en función de una serie de variables
clave, en varios grupos o estratos. Cada uno de esos estratos
muestra una distribución particular en función de una
característica determinada (sexo, edad, estado civil, etc.), y su
combinación muestra la estratificación de la población en cuanto
a esas características. La muestra final deberá mostrar la misma
composición por estratos que la población. Para la selección
final de las unidades que compondrán la muestra emplearemos
muestreo aleatorio simple o aleatorio sistemático, llevando a cabo
aquí, por tanto, un control inespecífico del muestreo.

i. Por ejemplo, consideremos la siguiente tabla, que


representa la estratificación de la población anciana de
una provincia española de acuerdo con su edad y su sexo.
Podemos apreciar en la parte inferior de la tabla que la
población consta de N = 272.436 sujetos, de los cuales el
42% (114.421) son hombres y el 58% restante (158.015) son
mujeres. En las filas de la tabla se muestra desglosada
por edades la estratificación de los sujetos por edad y
sexo, compuesta por 12 estratos (2 categorías de sexo x 6
categorías de edad). El porcentaje mostrado a la derecha
de cada dato poblacional indica qué porcentaje representa
ese dato del total de 272.436 sujetos. Así, por ejemplo, la
proporción que representan los hombres de entre 60 y 64
años de edad con respecto al total de la población es de:
26.092/272.436=0.09577, es decir, un 9,58% del total.

74
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

EDAD HOMBRES % MUJERES % N


60-64 26092 9,58% 29154 10,70% 55246
65-69 30707 11,27% 36688 13,47% 67395
70-74 24317 8,93% 31569 11,59% 55886
75-79 16662 6,12% 25293 9,28% 41955
80-84 9816 3,60% 18548 6,81% 28364
85 y + 6827 2,51% 16763 6,15% 23590
TOTAL 114421 42,00% 158015 58,00% 272436

ii. Si vamos a seleccionar de esta población una muestra


de tamaño n= 581, podemos calcular el tamaño de cada
uno de los 12 estratos multiplicando n por la proporción
correspondiente. Así, para el caso del estrato de hombres
entre 60 y 64 años de edad, mi muestra deberá incluir
581*0.09577= 55,64237, es decir, aproximadamente 56
sujetos. Puede apreciarse en la tabla siguiente que los
estratos de la muestra así creados representan exactamente
el mismo porcentaje del total que representaban los
estratos correspondientes de la población original. Así pues,
podemos garantizar que esta muestra es una réplica fiel de
la población original, al menos en cuanto a las dos variables
clave que hemos tenido en cuenta.

EDAD HOMBRES % MUJERES % N


60-64 56 9,58% 62 10,70% 118
65-69 65 11,27% 78 13,47% 144
70-74 52 8,93% 67 11,59% 119
75-79 36 6,12% 54 9,28% 89
80-84 21 3,60% 40 6,81% 60
85 y + 15 2,51% 36 6,15% 50
TOTAL 244 42,00% 337 58,00% 581

75
Eulogio Real Deus

4. Muestreo aleatorio por conglomerados. En muchas ocasiones,


existen agrupamientos de sujetos de un cierto tipo en lugares
geográficos que resultan fácilmente accesibles (por ejemplo,
trabajadores en sus empresas, estudiantes en sus centros de
estudio, amas de casa en centros comerciales, etc.). Cada uno de
estos agrupamientos constituye un conglomerado. La existencia
de conglomerados permite recoger la información con mayor
velocidad y a un menor coste de lo que supone un muestreo de
otro tipo: resulta mucho más fácil localizar a amas de casa en
centros comerciales que ir a buscarlas individualmente una a una
en sus domicilios. Para llevar a cabo el muestreo se seleccionan
aleatoriamente una serie de conglomerados, de los que se
obtendrán los sujetos de la muestra.
i. En muchas ocasiones, los conglomerados objeto de estudio
contienen, a su vez, otros conglomerados más pequeños,
y así sucesivamente. Es lo que se conoce como muestreo
por conglomerados polietápico. Por ejemplo, en el caso
de los conglomerados formados por centros educativos,
cada uno de estos centros educativos impartirá diferentes
cursos, cada uno de los cuales se impartirá, a su vez, en
diferentes aulas, en las que se impartirán diferentes
asignaturas, etc.). En este caso, la selección aleatoria de
un conglomerado irá seguida de la selección aleatoria del
siguiente conglomerado contenido dentro del primero, y
así sucesivamente hasta llegar al grupo final que quedará
incorporado a nuestra muestra.
Por supuesto, todos estos tipos de muestreo llevan el calificativo aleatorio
en su nomenclatura, indicando así que se garantiza que la selección final
de los elementos de la muestra se hace al azar. La garantía que proporciona
el uso del azar en el muestreo es que, como ya hemos comentado,
a medida que vamos recogiendo información, la distribución de las
diversas características de la muestra se va asemejando a la existente en la
población. Esto es así porque el azar garantiza que todos los elementos de
la población tendrán la misma probabilidad de pertenecer a la muestra
o, lo que es lo mismo, impide la presencia de sesgos en la selección de
los elementos de la muestra. Los tipos de muestreo anteriores, pues, se

76
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

recogen bajo la etiqueta de muestreo probabilístico, dado que es posible


conocer o calcular la probabilidad de que un sujeto determinado acabe
formando parte de nuestra muestra.
Por el contrario, existen otro tipo de muestreos donde no es posible
garantizar que la selección de los sujetos esté libre de sesgos. Hablamos,
en este caso, de muestreo no probabilístico, dado que no nos es posible
asegurar que todos los sujetos de la población hayan tenido la misma
probabilidad de ser incluidos en la muestra. Como puede imaginarse,
que un muestreo sea no probabilístico es sinónimo de que puede estar
sesgado, por lo que la posibilidad de hacer inferencias o suposiciones sobre
la población a partir de una muestra obtenida de esta forma es, como
poco, dudosa. Una segunda limitación de los datos obtenidos mediante
muestreo no probabilístico es que nuestro estudio, al no poder generalizar
a la población, será de tipo descriptivo8, puesto que todas las relaciones que
encontremos entre las variables involucradas no podrán generalizarse a la
población objetivo, sino que quedarán circunscritas a la muestra empleada.
No obstante, debemos tener en cuenta que existen casos en los que
no es necesario llevar a cabo un muestreo probabilístico para nuestro
estudio. Si queremos probar la efectividad de un programa para mejorar
los hábitos de estudio de estudiantes universitarios, no es necesario que
hagamos un muestreo aleatorio de todos los estudiantes universitarios
del país, puesto que podemos asumir que se trata de una población muy
homogénea y que, por tanto, tomando muestras de tamaño similar de
estudiantes de distintas ramas de conocimiento pertenecientes a una
misma universidad, obtendré una muestra que será adecuada para
evaluar la efectividad de dicho programa. Del mismo modo, si estoy
evaluando las estrategias educativas de maestros de preescolar, no será
necesario que seleccione aleatoriamente de entre todos los maestros
existentes en el país (o en el mundo), sino que bastará con que tenga en
cuenta recoger datos de una cantidad suficiente de guarderías, aunque
sean todas de la misma zona geográfica. Es decir, en ocasiones nuestra
población objetivo será muy homogénea, lo que facilitará garantizar la
representatividad del muestreo.

8 Para los conceptos de estudio descriptivo, correlacional y explicativo, ver el apartado 2.5.1. Tipos
de estudios

77
Eulogio Real Deus

En otros casos, el muestreo probabilístico no será necesario porque


cualquier sujeto de la población con determinadas características puede
pertenecer a la muestra. Por ejemplo, si estoy realizando un estudio sobre
tiempos de reacción a un estímulo en sujetos sanos de entre 18 y 45 años,
cualquier sujeto sano de entre 18 y 45 años podrá formar parte de mi
muestra, y los resultados serán extrapolables a la población de sujetos
sanos de entre 18 y 45 años.

En general, cuando el criterio geográfico no sea una variable clave de mi


estudio, el muestreo a realizar para el mismo se simplifica enormemente,
dado que los sujetos de la población diana son muy semejantes entre sí,
independientemente de dónde vivan, como es el caso de los estudiantes
universitarios, o de los sujetos sanos de entre 18 y 45 años. Eso sí, siempre
que mi muestra tenga un tamaño adecuado, aspecto en el que nos
detendremos a continuación.

2.8.2. Cálculo del tamaño muestral


Garantizar que la composición de mi muestra es similar a la de la población
no es el único requisito para obtener una muestra representativa;
también es necesario tener en cuenta el tamaño relativo de mi muestra
con respecto a la población. En general, el tamaño de la muestra deberá
ser mayor cuanto más heterogénea sea la población, y podrá ser menor
cuando la población sea muy homogénea. Si en la población hay sujetos
de ambos sexos, con diferentes edades y niveles educativos, tendré
muchas combinaciones diferentes de todas estas variables, algo que mi
muestra deberá reflejar, y para incrementar las probabilidades de que
todas esas combinaciones están presentes en mi muestra será necesario
contar con muchos más sujetos que si mi población consta de sujetos de
ambos sexos, pero de edades muy similares y un mismo nivel educativo.
En este último caso, el nivel educativo ya no es una variable, sino una
constante, por lo que no será necesario controlarlo, y la edad, aunque
continúa siendo una variable clave, tendrá ahora una baja variabilidad.

El tamaño muestral puede calcularse de forma precisa empleando las


fórmulas existentes para ello. Las fórmulas serán diferentes para el caso de
que la población sea finita o infinita, o de si nuestra variable fundamental

78
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

es una variable categórica (nominal u ordinal) o de escala (de intervalo o de


razón)9. Aunque, en propiedad, una población sólo es infinita si consta de
infinitos elementos, cuando la población tiene más de 100.000 elementos
podemos considerarla como infinita a efectos prácticos, aunque no lo sea
en realidad. En cualquiera de los casos, a la hora de estimar el tamaño
muestral debemos tener en cuenta tres criterios:

vv Nivel de confianza. Representa la probabilidad de obtener el


mismo resultado con diferentes muestras. Generalmente se asume
un valor del 95% de confianza o superior.

vv Error muestral. Se refiere al grado de precisión que necesitamos en


nuestros datos a la hora de generalizar los resultados obtenidos en
la muestra a la población. A menor error muestral, mayor precisión
de la medida, y viceversa.

vv Variabilidad. Indica el grado de dispersión de las puntuaciones


o de las categorías de la variable principal de nuestro estudio. Si
la variable es métrica o de escala, se empleará la varianza (Sx)
como estimador de la variabilidad poblacional. En el caso de que
la variable sea categórica, la variabilidad se entiende como el
producto pq, donde p es la probabilidad asociada a la categoría
de interés, y q es la probabilidad complementaria, asociada a la
ausencia de la categoría de interés. Es decir, se trata de una variable
dicotómica con sólo 2 posibles resultados (la categoría de interés
está o no está presente), por lo que p +q = 1, y q = 1-p.

Así, las fórmulas a aplicar para determinar el tamaño muestral en


función de las características de la población (finita o infinita), por
un lado, y del tipo de variable implicada (categórica o de escala),
son las siguientes:

9 Los diversos tipos de escalas de medida se abordan en el apartado 2.7.1. Escalas de medida.
79
Eulogio Real Deus

Población infinita
Población finita (<100.000)
( ≥100.000)

Variables categóricas

Variables de escala

donde:

n es el tamaño muestral.

z es el valor de la distribución normal tipificada correspondiente al


nivel de confianza elegido. Por ejemplo, para un nivel de confianza
del 95%, z = 1.96; para un nivel de confianza del 99%, z = 2.58.

e es el error muestral asumido para nuestra muestra y que suele


ser inferior al 5% (e < 0.05) para el caso de variables categóricas. En
el caso de variables métricas, e es el margen de error que podemos
cometer por encima y por debajo de la media, medido en la escala
original de la variable.

p, como ya se ha comentado es la probabilidad asociada a la


ocurrencia de una categoría concreta de la variable categórica, y q
= 1-p. En el caso de que el valor de p sea desconocido, se asume la
máxima varianza, es decir: p = q = 0,5.

σ es la desviación típica de las puntuaciones, o lo que es lo mismo,


σ2 es la varianza de las puntuaciones.

En caso de que desconozcamos el tamaño de la población, deberemos


emplear las fórmulas correspondientes a población infinita que es, por
otra parte, el caso habitual. Del mismo modo, si nuestra variable de
interés es de escala, pero no sabemos ni podemos estimar el valor de
σ, emplearemos la fórmula correspondiente a variables categóricas,
tomando p = q = 0.5.

80
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Veamos la aplicación de estas fórmulas con un par de ejemplos con ambos


tipos de variables para población infinita, que es el caso más habitual.
En primer lugar, imagine que deseamos estimar el tamaño muestral
necesario para llevar a cabo un estudio sobre rendimiento escolar en
estudiantes de secundaria, con un nivel de confianza del 99%, sabiendo
que la desviación típica de las notas en la población vale 2.9 (Sx=2.9), y que
necesitamos una precisión de medio punto por encima o por debajo de la
media (e = 0.5).

En este caso asumimos que la población de estudiantes de secundaria


es lo suficientemente grande como para considerarla infinita, por lo que
aplicamos la fórmula correspondiente. Por otra parte, dado que asumimos
un nivel de confianza del 99%, el valor de z correspondiente será 2.58. Así
las cosas, el tamaño muestral requerido para nuestro estudio será:

En segundo lugar, supongamos que queremos repetir la estimación


anterior, pero ahora no conocemos ni podemos estimar el valor de la
desviación típica de las notas en la población. Tendremos, pues, que
emplear la fórmula correspondiente a variables categóricas, igualando
los valores de p y q a 0.5, asumiendo la máxima varianza. En cuanto a
nuestro error muestral, si antes fijábamos una precisión de 0.5 puntos por
encima o por debajo de la media, y las notas se obtienen en una escala
de 10 puntos (de 0 a 10), este valor de precisión supone asumir un 5% de
error en la estimación (0.5/10= 0.05= 5% de error). De este modo, el tamaño
muestral se calculará de la siguiente forma:

Podemos apreciar que en este segundo caso, el desconocimiento de los


valores aplicados en el problema anterior nos obligará a recoger una
muestra casi 3 veces mayor.

81
Eulogio Real Deus

2.9. Recogida de datos


La recogida de datos constituye el momento culminante de cualquier
investigación. Los datos nos permitirán obtener información sobre el
problema que nos interesa, y contestar a las preguntas que nos habíamos
planteado responder con nuestro estudio. Como hemos visto en los
apartados precedentes, para llegar hasta aquí hemos tenido que recorrer
un largo camino, desde la revisión bibliográfica y la determinación del
marco teórico de nuestro trabajo, el planteamiento de objetivos y/o
hipótesis de trabajo, la elección del diseño de investigación, la selección
y/o elaboración de instrumentos, y la selección de nuestra muestra. No
obstante, ese esfuerzo se verá recompensado porque nos habrá permitido
llegar hasta aquí con la seguridad de que la información que vamos a
recoger será relevante y útil para nosotros y para el progreso científico en
general.

Este largo camino también nos servirá para darnos cuenta de por qué
no es conveniente recoger inmediatamente información para nuestro
estudio sin haber pasado por todas las fases anteriores. De haber
recogido los datos inmediatamente después de haber decidido cuál va a
ser nuestro tema de investigación, probablemente lo habríamos hecho
con un instrumento inadecuado o incompleto, con datos inadecuados
para nuestros propósitos y, lo que es más importante, sin haber realizado
una inmersión profunda en el tema de investigación que nos permita
conocerlo suficientemente. En cualquier caso, ahora es el momento de
recoger la ansiada información, y de llegar a la parte empírica de nuestro
trabajo: el trabajo de campo, la codificación y la depuración de los datos,
previas al análisis de los mismos.

2.9.1. Trabajo de campo


Podríamos definir de forma sencilla el trabajo de campo como el proceso
mediante el cual se recogen los datos, tomándolos directamente de
la fuente de estudio. Este es el momento en que salimos al mundo real
para recabar la información que necesitamos y, como ya hemos visto,
existen diferentes estrategias de investigación, así como distintos tipos
de estudios, de diseños de investigación, de escalas de medida, etc., a

82
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

nuestra disposición. Así pues, el trabajo de campo será muy diferente si


nuestra investigación es cualitativa que si es cuantitativa; si decidimos
adoptar un enfoque descriptivo, correlacional o explicativo; si vamos a
emplear la observación participante, un cuestionario de lápiz y papel, o
un experimento de laboratorio.

No obstante, sea cual sea la tarea a realizar durante nuestro trabajo


de campo, sabemos que una vez que éste haya finalizado habremos
obtenido una matriz de datos, que contiene los resultados obtenidos por
cada uno de los sujetos de nuestra muestra en cada una de las variables
de nuestro estudio. Así pues, en todos los casos, será necesario que
preparemos unas hojas de registro en las que anotar estos resultados,
que luego serán codificados para su depuración y posterior análisis. Si
nuestro instrumento de recogida de datos sea un cuestionario o una
escala, entonces ese mismo cuestionario o escala ya es nuestra hoja de
registro. En caso de que nuestro estudio sea cualitativo mediante grupos
de discusión o de enfoque (focus group), tendremos que preparar una
ficha en la que ir recogiendo de forma organizada la información que nos
proporcionen los sujetos. Si hemos decidido recurrir a la metodología
observacional, debemos preparar una hoja de registro en la que nuestros
observadores puedan dar cuenta de la información que van recopilando,
etc. Así pues, al terminar nuestro trabajo de campo contaremos con datos
almacenados en formato digital o en papel, en forma de fichas, escalas,
cuestionarios, hojas de registro, registros de audio o video, etc. El siguiente
paso consiste en transcribir esa información a un soporte informático
para poder procesarla.

2.9.2. Codificación de los datos


La codificación de nuestros datos nos permite someterlos a análisis
mediante el uso de programas informáticos, ya se trate de programas de
uso general, como Excel, o de programas específicos de análisis estadístico,
como SPSS o R. Como ya hemos comentado, el formato habitual en que se
dispondrán los datos es en forma de una matriz de datos bidimensional
donde, generalmente, los sujetos de la muestra ocuparán las filas de la
matriz, y las variables del estudio ocupan las columnas, de tal modo que
cada una de las casillas de la matriz contiene el resultado obtenido por un

83
Eulogio Real Deus

sujeto concreto en una variable concreta. Generalmente, este resultado


viene expresado en formato numérico, salvo que nuestra variable sea
cualitativa (por ejemplo, se trata de una pregunta de respuesta abierta), en
cuyo caso, el contenido será verbal y vendrá expresado en formato texto. Por
lo tanto, independientemente de la escala de medida de nuestros datos y
del tipo de respuesta proporcionado, las variables de nuestra base de datos
deben ir codificadas en formato numérico. Entre las muchas ventajas que
nos proporciona el uso de datos numéricos está el hecho de que es más
difícil cometer errores con éstos que con datos alfanuméricos; piénsese que,
por ejemplo, si codificamos el sexo empleando caracteres alfanuméricos,
respuestas como “hombre”, “Hombre” y “HOMBRE” se considerarían como
diferentes, lo que puede dar lugar a muchos errores de codificación. Para
ilustrar los distintos pasos correspondientes a esta fase de la recogida de
datos, emplearemos ejemplos tomados del uso del programa SPSS, por ser
uno de los más utilizados en Ciencias Sociales y de la Salud (Arce & Real,
2000; Visauta, 1998; Martín, Cabero, & de Paz, 2008). La imagen siguiente
recoge el aspecto de un archivo de datos en SPSS:

Lo que aparece en la ventana es la matriz de datos, de la que se muestran


las primeras 14 filas, junto con 10 de las columnas de la misma. Las filas
corresponden, como suele ser habitual, a sujetos, mientras que las
columnas representan variables. Así pues, esta ventana nos muestra los
resultados de los primeros 14 sujetos de la muestra en 10 variables (sexo,
edad, práctica del deporte, consumo diario de tabaco, salud percibida,
orientación política, orientación religiosa, y los 3 primeros ítems de la

84
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

escala de neuroticismo del test de personalidad NEO-PI-R (Costa & Costa,


1991). Como vemos, todos los valores mostrados son numéricos, incluso
para variables nominales como el sexo (0= Hombre; 1= Mujer), ordinales,
como la orientación política (1= Izquierda; 2= Izquierda moderada; 3=
Centro; 4= Derecha moderada; 5= Derecha), o de escala, como la edad (años
de edad) o el consumo de tabaco (número de cigarrillos consumidos).
Así pues, nuestra primera tarea será asignar códigos numéricos a las
categorías de respuesta en el caso de las variables nominales y ordinales;
en el caso de las variables de escala (de intervalo o de razón), simplemente
codificaremos el valor numérico de la puntuación obtenida por el sujeto.

Si nos fijamos en la parte inferior de la pantalla, veremos que nos


encontramos en una solapa llamada “Vista de datos”. Esta solapa
simplemente nos muestra los datos de nuestro archivo, pero no las
características de las variables que lo componen. Para editar o modificar
las características de las variables, debemos pasar a la siguiente solapa,
llamada “Vista de variables”. Este es su aspecto para el archivo de datos
anterior:

En la vista de variables se nos muestra una serie de información sobre cada


una de las variables de nuestro archivo de datos. Nuestra primera tarea,
previa a la introducción propiamente dicha de los datos, será generar en
esta solapa las variables de nuestro archivo, especificando cada uno de
los aspectos que las determinan. Veamos cada uno de estos aspectos por
separado:

85
Eulogio Real Deus

vv Nombre. Especificaremos aquí un nombre breve para la variable.


Es recomendable emplear una palabra corta o un código sencillo
para identificar la pregunta con facilidad. Por ejemplo, los ítems
de la escala de Neuroticismo llevan un código compuesto por la
letra “N” para identificar la escala, el número correspondiente al
ítem particular, y la letra “R” en caso de que el ítem vaya en escala
invertida, para que recordemos que es necesario cambiar el sentido
de las puntuaciones antes de calcular el total de la escala (por
ejemplo, N01R es el primer ítem de la escala de Neuroticismo, y
está redactado en forma invertida). Si no especificamos un nombre
para la variable, SPSS las irá numerando de forma consecutiva,
empleando los nombres VAR00001, VAR00002, etc.

vv Tipo. Indica el tipo de datos que contiene la variable. Estos datos


pueden ser numéricos, fechas, valor en moneda, o cadenas de
texto (caracteres alfanuméricos). El tipo de datos por defecto es
numérico. Asimismo, en caso de que nuestra variable sea numérica,
en este campo también podemos modificar los dos siguientes: la
anchura en caracteres de los datos (es decir, el número de dígitos
que ocupan los datos), y el número de decimales (cuántos de los
caracteres corresponden a decimales).

vv Etiqueta. Permite especificar una etiqueta de texto para la variable,


que permita facilitar la lectura de tablas y gráficos, que sería más
incómoda con el nombre breve de la variable. Así, podemos ver
que la etiqueta correspondiente a la variable N01R es “Soy bastante
estable emocionalmente”, o la correspondiente a la variable
Política es “¿Qué opción política representa mejor tus ideas?”.

vv Valores. Del mismo modo que podemos asignar una etiqueta a la


variable, también podemos asignarle etiquetas a las categorías de
esa variable. Recordemos que se asignaban valores numéricos a
todas las variables, independientemente de su escala de medida.
Esta columna permite relacionar los valores empleados para
la codificación con las etiquetas de las categorías de respuesta
correspondientes. Si pulsamos sobre esta casilla, nos aparecerá
un cuadro de diálogo como el que se muestra más abajo, que nos

86
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

permite relacionar cada valor (por ejemplo, 1) con una categoría


de respuesta (por ejemplo, “Izquierda”), e ir agregándolos a una
lista de etiquetas. Al igual que en el caso de las etiquetas para las
variables, las etiquetas para los valores nos permiten facilitar la
lectura de tablas y gráficas en las que se muestren resúmenes para
las categorías de variables nominales u ordinales.

vv Perdidos. En algunas ocasiones, existen opciones de respuesta


que no nos interesa analizar, y preferimos considerar el dato
correspondiente como perdido, lo que hará que no entre en el
análisis, igual que si la casilla correspondiente estuviese vacía.
Este es el caso, por ejemplo, de la respuesta “No sabe/No contesta”.
Cuando un sujeto elige esta opción, en realidad no ha contestado a
la pregunta, por lo que el código correspondiente a esta alternativa
de respuesta debería ser considerado como dato perdido en esta
columna.

vv Columnas. Anchura en caracteres que ocupa la variable en el


archivo de datos. Por defecto está fijado en 8 caracteres.

vv Alineación. Generalmente se usa la alineación izquierda para


datos alfanuméricos (texto), y la alineación derecha para datos
numéricos.

vv Medida. Escala de medida de la variable. SPSS considera sólo 3


tipos de escala de medida: Nominal, Ordinal y Escala (que incluye
las escalas de intervalo y de razón). Si no se especifica nada en esta

87
Eulogio Real Deus

columna, se considerará que el nivel de medida es desconocido, lo


que puede impedir la realización de algunos análisis hasta que se
haga dicha especificación.

vv Rol. Especifica el rol desempeñado en la variable cuando vamos


a realizar minería de datos para generar modelos predictivos con
nuestro archivo. Por defecto, el tipo seleccionado es Entrada. Este
campo no es relevante si no vamos a realizar minería de datos en
nuestro estudio.

2.9.3. Depuración de los datos


Un error muy común consiste en pasar directamente de la codificación de
los datos al análisis de los mismos, sin realizar una depuración previa ni
una inspección inicial. Es muy posible que nuestros datos brutos no sean
todavía adecuados para su análisis, por varias razones:

1. En primer lugar, es posible hayamos cometido algún error de


codificación, que puede resultar molesto descubrir cuando
nos encontramos analizando los resultados o, peor todavía,
puede pasar desapercibido pero alterar los resultados de forma
significativa. Si, en el caso de nuestro archivo de datos de ejemplo,
codificamos erróneamente el sexo de un sujeto con el valor “3”,
al analizar los resultados por sexo nos encontraremos con que
tenemos 3 categorías: Hombre, Mujer, y “3”. En el caso de variables
de escala, las consecuencias de los errores son todavía peores,
porque suelen pasar desapercibidas. Imaginemos a un sujeto que
contesta a una escala de 5 ítems, con 7 niveles de respuesta (de 1
a 7), y que sus respuestas a los 5 ítems son 3, 4, 1, 2, 5, por lo que
su puntuación media en la escala será 15/5= 3, lo que sitúa a este
sujeto bastante por debajo del punto central de la escala, que es 4.
Si codificamos erróneamente el tercer dato como “10” en lugar de
como “1”, la puntuación media del sujeto en la escala pasará a ser de
24/5= 4.8, lo que sitúa a este sujeto bastante por encima del punto
medio de la escala, por lo que la interpretación de su puntuación
será ahora muy diferente. Además, este error cometido con el
sujeto también afectará a los resultados de grupo, incrementando
artificialmente la media global de los sujetos.

88
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

2. En segundo lugar, es posible que algunos sujetos hayan


proporcionado respuestas sesgadas o contradictorias, bien
por falta de sinceridad, bien porque no han entendido las
preguntas, bien porque han respondido de forma estereotipada.
La depuración de los datos permitirá identificar a estos sujetos y
borrar las respuestas dudosas, o incluso eliminar al sujeto de la
muestra, mejorando así la calidad y la precisión de nuestros datos.

3. En tercer lugar, es posible que los datos estén correctamente


codificados y sin errores, pero que existan resultados inesperados
que afectan a nuestra investigación y pueden invalidarla.
Imaginemos que una de las variables relevantes de nuestro estudio
es la introversión/extraversión de los sujetos y que esperamos
encontrar bastante variabilidad en nuestra muestra en cuanto
a este rasgo, pero en realidad casi todos los sujetos de nuestra
muestra son muy extravertidos, por lo que el otro polo del rasgo no
queda adecuadamente representado. La detección del problema
en este momento nos permitiría ser conscientes del problema
y buscar una solución al mismo (por ejemplo, recogiendo una
muestra mayor, o asignando un peso más bajo a los extravertidos
que a los introvertidos, para compensar este efecto indeseado).

Es muy recomendable que numeremos las hojas de registro originales con


el número de fila correspondiente en nuestro archivo de datos para que,
en caso de que encontremos errores de transcripción, poder subsanarlos
de forma rápida y segura. Comentamos a continuación algunas acciones
sencillas a llevar a cabo en esta fase del trabajo.

Una forma rápida de comenzar la depuración de los datos, y que nos


permitirá realizar una inspección detallada de los resultados, es pedir los
estadísticos descriptivos de todas y cada una de las variables del archivo
de datos. Esta inspección se hará de forma diferente para variables
categóricas que para variables de escala. En el caso de las primeras,
seleccionaremos en el menú: Analizar → Estadísticos descriptivos →
Frecuencias. Nos aparecerá el siguiente cuadro de diálogo:

89
Eulogio Real Deus

Sólo tenemos que seleccionar todas aquellas variables que no sean de


escala en nuestro archivo de datos, y pasarlas a la casilla etiquetada como
Variables. El procedimiento nos permite solicitar un gran número de
opciones en los botones situados a la derecha, pero no serán necesarios
para nuestros propósitos. Una vez pulsada la tecla Aceptar, se abrirá un
archivo de resultados con tantas tablas de frecuencias como variables
contenga nuestra lista, tal y como se ve en la siguiente imagen:

Como ya sabemos, la ventana de resultados contiene 2 paneles. El situado


a la izquierda nos permite navegar entre los distintos resultados. El panel
de la derecha muestra estos resultados en forma de tablas o figuras. En
la imagen superior podemos ver que el procedimiento Frecuencias nos
proporciona primero una tabla-resumen, donde podemos ver que no

90
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

existen datos perdidos en ninguna de nuestras variables, por lo que los


110 sujetos de la muestra tienen datos válidos en éstas. A continuación,
se nos muestra una tabla de frecuencias para el sexo, que nos muestra
el número de categorías de respuesta de la variable en las filas, y una
serie de estadísticos como frecuencias y porcentajes en las columnas. En
caso de que existiesen categorías diferentes de las dos correspondientes
al sexo, o de que hubiese datos perdidos en esta variable, podríamos
apreciarlo en esta tabla fácilmente. En nuestro caso, sólo hay dos
categorías de respuesta (Hombre y Mujer), y no existen datos perdidos,
por lo que el porcentaje bruto y el porcentaje válido coinciden. En caso
de que existiesen, la columna Frecuencia nos informaría de cuántos son,
y la columna Porcentaje nos mostraría qué porcentaje de la muestra
representan, mientras que el Porcentaje válido se calculará sin tener en
cuenta estos casos perdidos.

Para llevar a cabo esta primera inspección con las variables de escala,
seleccionaremos en el menú: Analizar → Estadísticos descriptivos →
Descriptivos. Nos aparecerá el siguiente cuadro de diálogo:

Al igual que en casos anteriores, seleccionamos de la lista de la izquierda


las variables de escala que queremos inspeccionar (en nuestro caso, la
edad, la práctica deportiva, el consumo de tabaco y la salud percibida).
Por defecto se nos proporcionará, la media, la desviación típica, el mínimo
y el máximo de estas variables, pero hay otros estadísticos que también
podemos solicitar. En el botón Opciones podemos especificar qué
estadísticos descriptivos queremos que se nos proporcione para conocer

91
Eulogio Real Deus

más detalles de las variables. Las opciones que nos ofrece se muestran en
la siguiente imagen:

En muchas ocasiones será interesante comprobar también el índice de


asimetría y de curtosis de la variable. Una vez ejecutado el procedimiento,
el archivo de resultados tendrá este aspecto:

Como vemos, el panel de la izquierda ahora muestra que hemos realizado


dos análisis, el último de los cuales corresponde a la tabla que aparece en
el panel derecho. Podemos ver que no hay datos perdidos, pues el valor

92
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

de N es siempre 110. Los valores mínimo y máximo nos informan de que,


por ejemplo, la edad está entre 18 y 32 años, o que el número de horas
dedicadas al ejercicio semanal está entre 0 y 30. La media y la desviación
típica nos informan, respectivamente, de cuál es la tendencia central y la
dispersión de los datos para cada variable. Aquí podemos apreciar que, en
el caso de la edad, la media (18.91) está muy cerca del valor mínimo de la
variable, lo que indica que la gran mayoría de los sujetos está en torno a
los 18 años, y que el sujeto de 32 años es un caso atípico, también llamado
outlier 10. Del mismo modo, la media de horas dedicadas al ejercicio es
de sólo 3.54, mucho más cerca del mínimo que del máximo de la escala,
lo que viene a indicarnos que la mayoría de los sujetos dedica muy pocas
horas al ejercicio físico.

Las medidas de asimetría y curtosis nos indican hasta qué punto la


distribución de las puntuaciones de la variable se parece a la distribución
normal o campana de Gauss. Como es bien sabido, la distribución normal
tiene forma de campana, es simétrica y tiene un máximo central, a
partir del cual las frecuencias descienden rápidamente primero y más
lentamente después, hasta aproximarse asintóticamente a cero en
los extremos de la escala. Pues bien, la asimetría nos indica el grado
de simetría de la distribución de las puntuaciones de la variable. Si el
valor de asimetría es pequeño o cero, entonces la distribución puede
considerarse simétrica. Si es superior a cero, entonces la mayoría de los
sujetos se concentra en la parte inferior de la escala, y los sujetos atípicos
en la parte superior. Si observamos el valor de asimetría de la edad y del
número de horas dedicadas al deporte, veremos que es muy superior a
cero en ambos casos; esto se debe a que la mayoría de los sujetos tienen
18 años, mientras que los demás son atípicos, en el caso de la edad,
mientras que en caso del ejercicio físico, se debe a que la mayoría de los
sujetos dedica muy pocas horas al mismo, por lo que aquellos que dedican
hasta 30 horas semanales al mismo son casos atípicos. En el caso de la
asimetría negativa, se produce el efecto inverso, es decir, que la mayoría
de los sujetos se concentran en la zona alta de la escala, mientras que los
casos atípicos se sitúan en la zona baja. Esto es lo que ocurre en el caso del

10 Este tipo de casos también pueden detectarse en SPSS utilizando el procedimiento Identificar
casos atípicos en el menú Datos.

93
Eulogio Real Deus

nivel de salud física percibido que, como puede apreciarse, muestra una
asimetría ligeramente negativa (-.508). Esto se debe a que la mayoría de
los sujetos informó de un nivel de salud física medio-alto, con una media
de 6.98 sobre 10, y muy pocos informaron de valores muy bajos (de hecho,
nadie utilizó los valores de 0 y 1).

Asimetría positiva (As> 0) Simetría (As= 0) Asimetría negativa (As< 0)

Moda Mediana Media Media Media Mediana Moda


Mediana
Moda
Leptocúrtica (K> 0)
Mesocúrtica (K= 0)

Platicúrtica (K< 0)

En el caso de la curtosis, nos indica si el apuntamiento de la distribución


de la variable es similar al de la distribución normal (curva mesocúrtica:
valores próximos a 0), más apuntado que en la distribución normal (curva
leptocúrtica: valores superiores a 0), o más aplanado que en la distribución
normal (curva platicúrtica: valores inferiores a 0). En la figura superior
puede apreciarse la diferencia entre las distintas distribuciones según su
grado de asimetría y de curtosis, y cómo la asimetría afecta a los índices
de tendencia central: moda (valor más frecuente), mediana (valor que
deja por debajo y por encima el 50% de las observaciones) y media (valor
promedio de las observaciones), que en la distribución normal simétrica
coinciden en el centro de la escala.

Otras herramientas que nos pueden resultar de ayuda en esta fase


de depuración son los filtros. Un filtro es una variable dicotómica que
permite seleccionar a un grupo de sujetos (a los que se asignará un 1 en
la variable) y no seleccionar a otro grupo de sujetos (a los que se asignará
un 0 en la variable). Los sujetos no seleccionados pueden ser simplemente

94
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

marcados, o eliminados definitivamente del archivo de datos. Por ejemplo,


podría interesarnos examinar por separado los resultados obtenidos por
las mujeres de nuestra muestra en determinadas variables. Para ello,
seleccionaremos en el menú: Datos → Seleccionar casos. Aparecerá el
siguiente cuadro de diálogo:

Por defecto, todos los casos entrarán en el análisis, pero podemos filtrar
una submuestra aleatoria de casos, o fijar algún criterio de selección, o
emplear una variable de filtro dicotómica (1,0) creada ad-hoc. Los casos no
seleccionados pueden ser descartados o eliminados del archivo de datos.
Por su parte, los casos seleccionados pueden enviarse a un nuevo archivo
de datos para trabajar específicamente con ellos. Si deseamos filtrar a las
mujeres de nuestra muestra, seleccionaremos la opción Si se satisface la
condición, y pulsaremos el botón etiquetado como Si la opción, situado
debajo, para pasar al siguiente cuadro de diálogo y especificar dicha
condición:

95
Eulogio Real Deus

Aquí se nos muestra la lista de variables a la izquierda, una serie de


operadores lógicos (& significa “y”; | significa “o”; ~ significa “no”),
relacionales (= igual; =~ diferente; < menor; > mayor; < = menor o igual;
> = mayor o igual) y aritméticos (+ suma;–resta; * producto; / división;
** potencia) en el centro, y una serie de funciones a la derecha, que nos
permitirán especificar las condiciones que deben cumplir los sujetos de
nuestra muestra para ser seleccionados. En nuestro caso, dado que la única
condición es que sean mujeres, su código para el sexo deberá ser 1, que es
el valor que identifica a las mujeres en esta variable. Una vez efectuada la
selección, veremos que en nuestro archivo de datos aparecerá una nueva
variable creada por el sistema, llamada filter_$, que contiene el valor 0 (no
seleccionado) si el sujeto es hombre, y el valor 1 (seleccionado) si el sujeto
era mujer.

Los filtros también pueden sernos de utilidad cuando queremos depurar


nuestra base de datos de sujetos que han mostrado escasa consistencia
en sus respuestas, o patrones estereotipados de respuesta, o que parecen
no haber entendido las preguntas. La presencia de este tipo de casos en
nuestro archivo de datos reduce la calidad de los mismos, puesto que
sus respuestas introducen “ruido” en los datos, lo que, a su vez, provoca
distorsiones en los resultados que pueden ser de importancia si hay

96
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

muchos de estos sujetos en la muestra. Los sujetos que responden de


manera estereotipada suelen dar puntuaciones muy similares a todos
los ítems de una escala, lo que hace relativamente sencillo detectarlos,
incluso visualmente. Por su parte, los sujetos que no entienden las
preguntas suelen seleccionar siempre el punto medio de la escala, para
evitar tener que posicionarse en un polo u otro de la misma. En cuanto
a los sujetos poco consistentes, pueden ser detectados si previamente
hemos tomado medidas para ello. Una forma sencilla de identificarlos
consiste en repetir una misma pregunta, colocándola en una sección
diferente del cuestionario y modificando ligeramente el enunciado
para que no sea reconocible. Las discrepancias entre ambas respuestas
señalarán a los sujetos poco consistentes. Por ejemplo, supongamos que
nuestra investigación está interesada en la preocupación que sienten los
ciudadanos por el medio ambiente, y hemos diseñado un cuestionario a tal
efecto. Para garantizar que las respuestas de los sujetos son consistentes,
al principio del cuestionario les pedimos que seleccionen de entre una
lista de problemas los 3 que les parecen más graves. Imaginemos que la
lista de problemas es la siguiente:

1. Economía.
2. Empleo.
3. Terrorismo.
4. Medio ambiente.
5. Corrupción.
6. Inmigración.
7. Guerras.

Más adelante, en el mismo cuestionario les pedimos que respondan a la


siguiente pregunta:
1 Sí
¿Cree usted que el medio ambiente es uno de los problemas
más graves a los que se enfrenta el mundo actual?
0 No

97
Eulogio Real Deus

Si el sujeto es consistente, entonces ambas respuestas deberán ser


similares. Es decir, que si el sujeto afirma que cree que el medio ambiente
es uno de los problemas más graves a los que se enfrenta el mundo actual,
debería haber seleccionado el Medio ambiente entre los 3 problemas
que se le mostraban en la pregunta inicial, y viceversa. Aquellos sujetos
que no hayan seguido esta pauta estarán mostrando inconsistencia en
sus respuestas, por lo que es muy posible que sus respuestas no sean
fiables. Para detectar a estos sujetos, sólo tenemos que crear una variable
de filtro que los identifique. En nuestro archivo de datos, cada uno de
los 7 problemas de la lista inicial será una variable dicotómica, con dos
valores: 0 si el sujeto no seleccionó el problema, y 1 si el sujeto seleccionó
el problema. Por su parte, codificaremos la pregunta sobre la gravedad
del problema del medio ambiente también de forma dicotómica,
asignando un 0 si el sujeto no ve al medio ambiente como un problema
grave, y un 1 si cree que es uno de los problemas más graves a los que se
enfrenta el mundo actual. De este modo, si un sujeto consistente cree que
el medio ambiente es un problema grave, contestará con un 1 en ambas
variables, mientras que si no cree que es un problema grave contestará
con un 0 también en ambas variables. Así pues, si los valores de estas dos
variables son diferentes estarán indicando que estamos ante un sujeto
inconsistente en sus respuestas. Para detectar a estos sujetos crearé
una variable filtro dicotómica que los distinga del resto. En primer lugar,
seleccionaré en el menú: Transformar → Calcular variable. Me aparecerá el
siguiente cuadro de diálogo:

98
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Crearé la variable filtro dándole un nombre en la casilla Variable de


destino, y le asignaré un valor constante de 1. A continuación, pulsaré
el botón Aceptar para crear la variable filtro. Dado que le he asignado a
todos los sujetos de la muestra un valor constante de 1 en esta variable,
eso significa que este filtro seleccionará a todos los sujetos de la muestra.
Para localizar ahora a los sujetos que no han sido consistentes en cuanto
a la importancia asignada a los problemas medioambientales, volveré
a seleccionar el mismo cuadro de diálogo, pero cambiando el 1 por un
0. A continuación, especificaré las condiciones que deben cumplirse
para asignarles este último valor pulsando en el botón etiquetado Si la
opción… que aparece en la parte inferior del cuadro. Aparecerá este otro
cuadro de diálogo:

Como vemos, se especifica que los sujetos recibirán un 0 en la variable


filtro si la respuesta dada a la variable Problema4MA (que indica si este
problema es uno de los 3 más graves percibidos por el sujeto) es diferente
(~ =; es decir, no igual) a la respuesta dada a la pregunta MAimportante
(que indica si cree que el problema del medio ambiente es uno de los más
graves a los que se enfrenta el mundo actual). Dicho de otro modo, todos
los sujetos tendrán un valor de 1 en la variable filtro, excepto aquellos
que sean inconsistentes, que tendrán un 0 en la misma variable. Ahora
puedo emplear esta variable en el procedimiento Seleccionar casos
comentado anteriormente, para descartar o incluso eliminar a los sujetos
inconsistentes de mi muestra.

99
Eulogio Real Deus

Otro aspecto que nos puede interesar en esta fase de depuración de


datos es la recodificación de algunas variables para obtener una versión
simplificada de las mismas. Pensemos, por ejemplo en la variable de
escala “consumo diario de cigarrillos”. Es posible que me interese crear
una nueva variable a partir de ésta, que indique si el sujeto es o no
fumador. Será no fumador si su consumo diario de cigarrillos es de 0, y
será fumador en cualquier otro caso, puesto que fumará al menos 1
cigarrillo diario. Para crear esta variable dicotómica, seleccionaremos en
el menú: Transformar → Recodificar en distintas variables. Me aparecerá el
siguiente cuadro de diálogo:

En la lista de la izquierda seleccionaremos la variable de escala Tabaco,


que contiene el número de cigarrillos diarios que fuma el sujeto. La
variable dicotómica que recibirá los resultados recodificados se indica en
la zona de la derecha, y en nuestro caso le llamaremos Fuma. También
podemos asignarle una etiqueta que la describa. Una vez pulsado el
botón Cambiar, habremos especificado qué variable será la fuente, y qué
variable recibirá los resultados de nuestra recodificación. A continuación,
para especificar el modo en que se realizará la recodificación, pulsamos el
botón etiquetado como Valores antiguos y nuevos…, que nos llevará a un
nuevo cuadro de diálogo:

100
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

A la izquierda del cuadro de diálogo especificaremos los valores o conjuntos


de valores de la variable original, y a la derecha indicaremos el valor que se
asignará a estos valores en la nueva variable dicotómica. Podemos ver que
ya se ha especificado la condición correspondiente a no fumador: a cada
0 en la variable original se le asignará otro 0 en la variable dicotómica. La
segunda condición está ya especificada, pero todavía no ha sido añadida a
la lista: todos los demás valores que no sean 0 recibirán un 1 en la variable
dicotómica. Así pues, nuestra nueva variable dicotómica Fuma tendrá dos
valores posibles: 0 si el sujeto es no fumador, y 1 si el sujeto es fumador.
En otras ocasiones no se tratará de recodificar una variable ya existente,
sino de crear una nueva variable a partir de una combinación de otras
variables. El caso más habitual será calcular una puntuación total para
una prueba o una escala a partir de las respuestas de los sujetos a los
ítems correspondientes. Supongamos que tenemos las respuestas de
una muestra de sujetos a la escala de satisfacción con la vida de Diener
(Diener, 1980). Esta escala consta de 5 ítems, y la puntuación total es
simplemente el promedio de las puntuaciones en los ítems. Para obtener
esta puntuación total sólo tenemos que volver a seleccionar en el menú:
Transformar → Calcular variable. Las variables que contienen los ítems de
la escala de satisfacción con la vida son SV01, SV02, SV03, SV04 y SV05. Para
calcular su promedio, haremos uso de la función Mean 11 que proporciona
SPSS en el siguiente cuadro de diálogo:

11 Las funciones permiten realizar cálculos complejos, u obtener valores importantes, así como
realizar transformaciones en los datos, y pueden aplicarse a datos de distintos tipo (monetarios,
de fecha, probabilísticos, etc.).
101
Eulogio Real Deus

La función Mean se encuentra en la lista que aparece a la derecha en el


cuadro de diálogo, y en la zona central se da una breve explicación de su
uso y su finalidad. En el recuadro etiquetado como Expresión numérica se
encuentra la sintaxis correspondiente, que en este caso calcula la media
de las variables incluidas entre paréntesis, y separadas entre sí por comas.
Como es lógico, también es necesario asignarle un nombre a la variable
que recibirá las puntuaciones medias, a la que en este ejemplo hemos
denominado SatVida.

Finalmente, otra función que podríamos necesitar en esta fase de


depuración de los datos, es la de ponderar a los sujetos. La ponderación
permite corregir la sobrerrepresentación de un grupo sobre otros, lo que
puede ser de utilidad cuando los grupos son de tamaños muy desiguales,
o cuando hemos cometido algún pequeño error de estratificación en
la muestra. Por defecto, todos los sujetos de la muestra tienen un peso
unidad en los resultados; es decir, cada sujeto cuenta como 1 sujeto. Si
asignamos un peso de 0.5 a un sujeto, contará como medio sujeto; si le
asignamos un peso de 3, contará como 3 sujetos. El procedimiento para
ponderación de los casos se encuentra en el menú: Datos → Ponderar
casos. El cuadro de diálogo simplemente nos pide que introduzcamos
una variable que contenga los pesos a asignar a los sujetos:

102
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Por ejemplo, imaginemos que sea necesario que haya exista exactamente
la misma representación de hombres que de mujeres en nuestra muestra,
pero los porcentajes son del 40% y del 60%, respectivamente. Es decir,
los hombres están infrarrepresentados, mientras que las mujeres están
sobrerrepresentadas. Para corregir este error, puedo asignar un peso
mayor de 1 a los hombres, y menor de 1 a las mujeres. Concretamente,
este peso será de 50/40= 1.25 para los hombres, y de 50/60= 0.83 para las
mujeres. A continuación, sólo tengo que crear una variable cuyo valor sea
de 1.25 si el sujeto es hombre, y de 0.83 si el sujeto es mujer, y utilizarla
como variable de ponderación en SPSS. A partir de ese momento, todos
los análisis que haga asignarán pesos distintos a las puntuaciones de los
sujetos en función de su sexo.

El proceso de depuración debe durar el tiempo necesario hasta que


estemos seguros de que los datos están libres de errores y de sesgos, así
como de sujetos inconsistentes. Una vez superada esta fase, ya estamos
en condiciones de comenzar con el análisis de nuestros datos.

2.10. Análisis de datos


Una vez que hemos revisado y depurado nuestros datos, podemos pasar
a su análisis. Como ya se ha comentado anteriormente, es probable que
tengamos ya una idea clara de todos y cada uno de los análisis estadísticos
que vamos a llevar a cabo en nuestro estudio, puesto que al revisar la
literatura nos hemos ido familiarizando con las técnicas más empleadas.
Por otra parte, los objetivos e hipótesis de nuestra investigación

103
Eulogio Real Deus

plantearán preguntas sobre las relaciones que existen entre las variables,
lo que implica que dichas relaciones serán estudiadas mediante análisis
estadístico. Finalmente, las variables incluidas en nuestro estudio tendrán
una escala de medida que debe ser la adecuada para poder realizar
determinados análisis estadísticos.

No obstante, aunque tengamos una idea muy clara de qué análisis es


necesario realizar para contestar a las preguntas formuladas en nuestra
investigación, es recomendable proceder gradualmente en el análisis
de los datos, yendo de lo sencillo a lo complejo; de lo univariado a lo
bivariado, y de ahí a lo multivariado; de lo descriptivo a lo correlacional
y de ahí, si procede, a lo explicativo. Así pues, es recomendable empezar
por estudiar las variables individuales primero, a nivel descriptivo, para
luego ver relaciones entre pares de variables, a nivel correlacional, para
pasar a las relaciones entre más de dos variables. Esto nos permitirá
familiarizarnos con las características de la muestra, con los resultados
más sencillos, que nos facilitarán la comprobación de relaciones más
complejas y multivariadas. Así pues, este será también el esquema a seguir
en este manual, empezando desde las técnicas más básicas, univariadas y
bivariadas, tanto a nivel descriptivo como correlacional, pasando luego a
las técnicas multivariadas más complejas, para modelos estadísticos más
elaborados.

2.10.1. Descripción de la muestra


La información descriptiva más básica a nivel univariado la proporcionan
los procedimientos de Frecuencias y de Descriptivos, ya comentados en
el apartado de depuración de datos de la sección anterior. En ocasiones,
este tipo de información se presenta en forma gráfica para facilitar
la interpretación de los resultados, que suele resultar más sencilla en
un formato visual que en uno numérico. Estos procedimientos están
disponibles dentro del menú Gráficos, que contiene abundantes
opciones para la generación y edición de gráficos de muy diversos tipos.
Comentamos aquí los empleados más habitualmente, indicando el tipo
de datos para los que resultan más indicados.

104
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

A nivel univariado, los tipos de gráficos más empleados para variables


categóricas son los de Barras (más adecuados para variables de tipo
ordinal) y los de Sectores (más apropiados para variables de tipo nominal),
mientras que para variables de escala suele emplearse el Histograma.
Todos ellos muestran la distribución de los resultados en la muestra, pero
en el caso de los dos primeros tipos de gráfico, se hace representando
cada categoría de la variable como una barra o un sector, mientras que en
el caso de variables de escala se hace representando cada valor o intervalo
de valores con una barra. Mostramos a continuación un ejemplo de cada
uno de estos tipos de gráficos:

SectoresSectores Barras Barras Histograma


Histograma

A la izquierda se muestra un gráfico de sectores para la variable nominal


sexo, donde se aprecia que los hombres conforman menos del 25% de la
muestra. En el centro se muestra un gráfico de barras representando la
variable ordinal correspondiente a la orientación política de los sujetos,
donde puede apreciarse que las opciones de izquierda son preferidas a las
opciones de derecha en nuestra muestra, hasta el punto de que ningún
sujeto eligió la opción situada más a la derecha, mientras que las dos
opciones de izquierda juntas engloban a casi el 70% de los sujetos de la
muestra. Por último, a la derecha se muestra el histograma que representa
los resultados obtenidos por los sujetos en la escala de neuroticismo
del NEO PI-R, donde se aprecia que la distribución de los resultados no
coincide totalmente con la distribución normal (cuya curva se muestra
superpuesta), principalmente debido a que hay muchos sujetos con
niveles de neuroticismo medio-bajo, aunque la media de la muestra
(4.015) se corresponde casi exactamente con el centro de la escala, y de
que la desviación típica nos informe de que la mayoría de los sujetos se
encuentran aproximadamente un punto por encima o por debajo de la
media.

105
Eulogio Real Deus

Tanto los estadísticos univariados como los gráficos univariados tienen


como mayor limitación el que muestran a las variables aisladas, sin
relacionar unas con otras. Por ello, también es necesario cruzar pares
de variables para encontrar relaciones clave en nuestros datos, ya sea
mediante tablas (seleccionando en el menú: Analizar → Tablas → Tablas
personalizadas), ya mediante gráficos (seleccionando en el menú:
Gráficos).

La tabla siguiente muestra el caso de dos variables categóricas, Sexo y


Fuma, que nos muestra el porcentaje de hombres y mujeres que fuman/
no fuman. Los índices proporcionados son: el recuento, el porcentaje de
fila y el porcentaje de columna. El primero nos permite ver directamente
cuántos sujetos se encuentran en una casilla concreta de la tabla,
mientras que los porcentajes nos sitúan ese recuento en relación a la fila
o a la columna de la tabla. Así, el porcentaje de fila nos muestra que los
porcentajes que representan los hombres frente a las mujeres (21.8% y
78.2%) son muy similares, independientemente de que sean no fumadores
(21.6% y 78.4%) o no fumadores (25% y 75%), lo que parece indicar que
el hecho de ser hombre o mujer no afecta demasiado al consumo de
tabaco. De forma similar, los porcentajes de columna nos muestran que
la proporción de no fumadores y fumadores (92.7% y 7.3%) son también
muy similares, independientemente de que se trate de hombres (91.7% y
8.3%) o mujeres (93% y 7%).

Indica ahora tu sexo

Hombre Mujer Total

Recuento % fila % col. Recuento % fila % col. Recuento % fila % col.

No fuma 22 21,6% 91,7% 80 78,4% 93,0% 102 100,0% 92,7%


Fumador/No
fuma 2 25,0% 8,3% 6 75,0% 7,0% 8 100,0% 7,3%
fumador
Total 24 21,8% 100,0% 86 78,2% 100,0% 110 100,0% 100,0%

En el caso de que una de las variables de la tabla sea de escala, en lugar


de utilizar recuentos y porcentajes, emplearemos generalmente medias
y desviaciones típicas, para ver la tendencia central y la variabilidad en
esta variable para los distintos grupos. En la tabla siguiente se muestra
el cruce entre las variables sexo (nominal) y Neuroticismo (escala), lo
que nos permite apreciar que tanto la media como la desviación típica

106
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

en Neuroticismo son muy similares para hombres y para mujeres, lo que


sugiere que no existen diferencias entre estos dos grupos en este rasgo.

Indica ahora tu sexo

Hombre Mujer Total

Media Desviación típica Media Desviación típica Media Desviación típica

Media neuroticismo 3,94 ,87 4,03 1,05 4,02 1,01


 

Al igual que ocurría en el caso univariado, también existe la opción de


representar gráficamente las relaciones bivariadas, para facilitar la
interpretación de las relaciones encontradas. Los más utilizados son: el
diagrama de barras (2 variables categóricas), el gráfico de líneas o áreas
(1 variable categórica y 1 variable de escala), y el gráfico de dispersión (2
variables de escala). Mostramos a continuación un ejemplo de cada uno
de estos tipos de gráfico:

Barras Líneas Dispersión

A la izquierda se muestra un gráfico de barras donde se muestra el


porcentaje de fumadores y no fumadores en función del sexo donde, al
igual que ya comentábamos para la tabla correspondiente, se aprecia
que los porcentajes son muy similares para hombres y mujeres, lo que
vendría a indicar que no existen diferencias en hábito de fumar entre
los sujetos hombres y mujeres de nuestra muestra. El gráfico del centro
muestra el número de horas dedicadas al ejercicio físico por parte de
hombres y mujeres Se aprecia que se da una tendencia muy similar entre
ambos donde la mayoría de los sujetos dedica poco o ningún tiempo a la
práctica deportiva, frecuencia que desciende rápidamente a medida que
aumentamos el número de horas de ejercicio. Finalmente, a la derecha
se muestra el gráfico de dispersión que relaciona las puntuaciones en
Neuroticismo y en Autoestima obtenidas por nuestra muestra de sujetos.

107
Eulogio Real Deus

Aquí, cada punto representa el cruce de ambas puntuaciones para un


sujeto concreto, por lo que la nube de puntos nos informará sobre si
existe o no relación entre las variables, y en caso de que exista, de qué
tipo es. En este caso, podemos ver que se trata de una relación inversa,
ya que a medida que aumenta el neuroticismo disminuye la autoestima,
y viceversa; es decir, la nube de puntos va descendiendo de izquierda a
derecha (si la relación es directa, la nube de puntos asciende de izquierda
a derecha). Se ha incorporado una línea de ajuste al gráfico para que
pueda apreciarse más claramente esta relación inversa. Asimismo,
el gráfico también nos informa del grado de relación existente entre
Neuroticismo y Autoestima, proporcionándonos el valor del coeficiente
de determinación entre ambos: (R 2 = .312), que nos indica que ambas
variables comparten un 31.2% de su varianza.
A partir de estos tipos básicos de tablas y gráficos, existen formatos más
complejos para representar más de dos variables, anidar resultados de
una variable dentro de otras, etc.
2.10.2. Índices de posición: percentiles y puntuaciones estándar
Es posible que necesitemos posicionar a los sujetos de nuestra
investigación en algún continuo, ya sea con fines de comparación, o para
evaluar su rendimiento, o para comparar el resultado obtenido por un
mismo sujeto en dos pruebas, o el obtenido por dos sujetos diferentes
en una misma prueba. En el caso de la Psicología, los índices de posición
se emplean habitualmente para interpretar las puntuaciones obtenidas
por los sujetos en un test. Generalmente, la puntuación bruta obtenida
en un test no es fácilmente interpretable: se trata de un valor numérico
cuya magnitud, a primera vista, resulta desconocida. Para facilitar la
interpretabilidad de las puntuaciones obtenidas por los sujetos, los test
incorporan baremos, o tablas de conversión de los valores brutos en
índices de posición, tomando como referencia al total de la población.
Es decir, la puntuación bruta es transformada en un valor que nos indica
el nivel alcanzado por el sujeto con relación al grupo de referencia. Los
índices de posición más empleados son los percentiles (también llamados
centiles) y las puntuaciones estándar, o típicas.

108
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

vv Un percentil es el porcentaje acumulado de sujetos que obtienen


una puntuación dada. Es decir, el percentil nos indica qué
porcentaje de los sujetos del grupo de referencia han alcanzado
una puntuación dada, o cualquier otra inferior a ésta. Un ejemplo
sencillo de interpretación de un percentil nos la da la mediana.
Recordemos que la mediana es un índice de tendencia central
que indica el valor que separa al 50% inferior de la muestra del
50% superior, por lo que, en realidad, la mediana no es más que
el percentil 50. El percentil nos sirve para posicionar y poder
comparar a los sujetos en aquel aspecto evaluado por la escala:
si yo sé que las puntuaciones obtenidas por dos sujetos en una
prueba es de 18 y 59, sólo sé que el segundo sujeto ha sacado mejor
resultado que el primero, pero no cuánta diferencia les separa. Sin
embargo, si los baremos de la prueba me dicen que los percentiles
correspondientes son 30 y 85, entonces sí sabré que los sujetos son,
en realidad, muy diferentes en cuanto a la habilidad medida por el
test, puesto que la puntuación obtenida por el primero sólo superó
al 30% de los sujetos de la población, mientras que la obtenida
por el segundo supera al 85%. En SPSS es muy sencillo obtener los
percentiles correspondientes a las diversas puntuaciones de una
escala mediante el procedimiento Frecuencias que ya conocemos
(recordemos que los percentiles son porcentajes acumulados,
como los que nos muestra la tabla de frecuencias), así como
también es fácil pedir el valor correspondiente a determinados
percentiles que nos interesen. Los percentiles son aptos tanto para
datos métricos o de escala como para datos ordinales.
vv Las puntuaciones estándar, también llamadas puntuaciones
típicas, o simplemente, puntuaciones z, posicionan a la puntuación
obtenida por el sujeto tomando como referencia su distancia a
la media del grupo de referencia, y midiendo esta distancia en
función de la desviación típica:

109
Eulogio Real Deus

El numerador de esta expresión indicaría la distancia a la media, lo que


se conoce como puntuación diferencial; esta puntuación se divide por
la desviación típica de la muestra, por lo que podemos interpretar una
z como un valor que expresa la distancia de una puntuación a su media
en un formato estándar (unidades de desviación típica), que permite
hacer comparaciones entre los valores obtenidos por un mismo sujeto en
distintas pruebas, o distintos sujetos en una misma prueba. Cuando la z
es negativa es debido a que la puntuación bruta era menor que la media,
lo que da una puntuación diferencial negativa; del mismo modo, cuando
la z es positiva, se debe a que la puntuación bruta original era superior
a la media. En caso de que la puntuación del sujeto se encontrase justo
en la media, la z correspondiente valdrá cero. Así, por ejemplo, una
puntuación típica de 1.5 significa que la puntuación obtenida por el sujeto
se encuentra 1.5 desviaciones típicas por encima de la media del grupo,
mientras que una z de -0.5 significa que la puntuación original estaba
media desviación típica por debajo de la media del grupo. Resulta sencillo
obtener las puntuaciones típicas para una variable en SPSS utilizando
el procedimiento Descriptivos que ya conocemos. Para ello, sólo es
necesario seleccionar la variable de interés y marcar la casilla etiquetada
como Guardar valores tipificados como variables, lo que creará una nueva
variable que contiene los valores tipificados, y cuyo nombre es igual al de
la variable original, precedido de la letra “Z ”.

ŸŸ Además de proporcionar una medida de distancia a la media


estandarizada, también es posible obtener un porcentaje
acumulado a partir de una z, empleando una tabla de la
distribución normal tipificada. Así, si quisiésemos saber
qué percentil corresponde a una puntuación típica obtenida
a partir de una variable con distribución normal, basta
con buscar ese valor en la tabla, y obtener la probabilidad
acumulada (probabilidad de obtener un valor como
el obtenido, o cualquier otro inferior a éste), que al ser
multiplicada por 100 nos proporcionará el porcentaje
acumulado correspondiente. Así, si el sujeto obtuvo una z
de cero (es decir, se encontraba situado exactamente sobre
la media), la probabilidad acumulada correspondiente a su
puntuación será 0.5, lo que se corresponde con el percentil

110
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

50 (recordemos que, en la distribución normal la media y la


mediana coinciden en un mismo punto, junto con la moda).
Si obtiene una z de 0.70, la probabilidad acumulada será de
0.7580, es decir, el percentil 75.8.

ŸŸ Otra propiedad interesante de las puntuaciones típicas


es que, dado que la distribución normal estandarizada
es simétrica, el porcentaje acumulado para –z se obtiene
fácilmente como 100-z. Por ejemplo, si el porcentaje
acumulado correspondiente a una z de 0.70 es del 75.8%, el
correspondiente a una z de -0.70 es del 100-75.8= 24.2%.

2.10.3. Relaciones entre variables de escala


Todo lo visto hasta el momento sería suficiente material como para
llevar a cabo un estudio descriptivo de nuestros datos. Cuando nuestros
propósitos no van más allá de describir las características de nuestra
muestra, bastará con emplear algunas tablas y figuras. Sin embargo, es
habitual que este no sea el tipo de estudio apto para una investigación.
Cuando investigamos no será suficiente con la descripción de los hechos,
sino que, además, suele interesarnos encontrar relaciones o asociaciones
entre variables, o realizar predicciones sobre alguna variable de interés.
Cuando ocurre esto, nuestro estudio habrá pasado del nivel descriptivo
al nivel correlacional. Existen dos técnicas fundamentales a utilizar con
nuestros datos: el análisis de correlaciones (bivariado) y el análisis de
regresión (multivariado). El análisis de correlaciones nos informa de
la intensidad y forma de la relación existente entre pares de variables,
mientras que la regresión intenta establecer un modelo predictivo que
permita pronosticar las puntuaciones de los sujetos en una variable
(dependiente) como una combinación de sus puntuaciones en un
conjunto de variables (independientes).

Veamos primero el caso más sencillo de la correlación Recordemos el


diagrama de dispersión que mostraba la relación existente entre el
Neuroticismo y la Autoestima. Se puede apreciar en el diagrama una nube
de puntos, cada uno de los cuales representa el resultado obtenido por un
mismo sujeto en ambas pruebas. Se aprecia que la nube de puntos tiende

111
Eulogio Real Deus

a descender a medida que nos desplazamos a la derecha, tendencia que se


idealiza mediante una línea recta descendente. Lo que implica esta forma
descendente de la nube de puntos es que a mayor grado de Neuroticismo
en los sujetos, menor será su Autoestima, y viceversa. Es decir, que existe
una relación inversa entre ambas variables. El hecho de que la relación
pueda idealizarse mediante una línea recta implica que nos encontramos
ante una relación de tipo lineal. Existen formas de cuantificar otro tipo
de relaciones no lineales (Pérez, 2005; Martín, Cabero, & de Paz, 2008),
aunque no las abordaremos aquí.

Cuando dos variables están relacionadas, se dice que covarían; esto


es, que cuando una de ellas varía, la otra también lo hace. Si el cambio
se produce en la misma dirección en ambas, se dice que la relación es
directa, y si se produce en direcciones opuestas, se dice que la relación
es inversa, como nuestro ejemplo del Neuroticismo y la Autoestima. La
covarianza (COVx y ) es el índice que mide el grado en que dos variables
covarían, y se expresa como la media de los productos cruzados de las
puntuaciones diferenciales de ambas variables (que representaremos por
X e Y ). Formalmente:

112
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Sin embargo, la covarianza resulta más útil cuando, en lugar de utilizar


puntuaciones diferenciales empleamos puntuaciones típicas. La ventaja
es que, al estandarizar las puntuaciones de X e Y, la covarianza resultante
también queda estandarizada, de tal modo que se interpreta siempre
de la misma forma, y no depende de la escala de medida de las variables
originales. Esta covarianza estandarizada es lo que conocemos como
correlación de Pearson (rx y ). Formalmente:

La segunda fórmula no es más que un desarrollo de la primera para el


cálculo con puntuaciones directas, mientras que la primera fórmula es
para el cálculo con puntuaciones típicas. La ventaja de la correlación es
que, aunque se interpreta igual que la covarianza (los valores positivos
indican relación lineal directa; los valores negativos indican relación
lineal inversa; el valor cero indica ausencia de relación lineal), al estar
estandarizada, oscila entre unos valores mínimo y máximo fijos: -1 para
el caso de la relación lineal inversa, y +1 para el caso de la relación lineal
directa. Ambos valores indicarían una relación perfecta, y cualesquiera
valores intermedios indicarían grados de relación más débiles, siendo
cero, como ya hemos comentado, el valor correspondiente a la ausencia
de relación lineal.
Debido a esta estandarización, la interpretación del coeficiente de
correlación de Pearson es sencilla y directa: un valor de .80 indica una
relación lineal directa y fuerte. A su vez, un valor de -.80 indica igualmente
una relación lineal fuerte, pero inversa. Además, cuando se eleva al
cuadrado, el coeficiente de correlación se interpreta como la proporción
de varianza que comparten las variables X e Y; en este caso se le llama
coeficiente de determinación (R 2 ). Si volvemos al ejemplo de la relación
lineal inversa existente entre el Neuroticismo y la Autoestima, la
correlación entre ambas variables es de -.559, lo que viene a confirmar que
existe entre ambas una relación inversa, y el valor concreto del coeficiente
nos dice que esta relación es moderadamente fuerte. Además, si elevamos
al cuadrado este valor, obtenemos como resultado .312481, lo que indica
que el Neuroticismo y la Autoestima comparten algo más de un 31% de su
varianza. Si observa el gráfico de dispersión anterior, observará que este
es el valor que se muestra como valor de R 2.
113
Eulogio Real Deus

El coeficiente de correlación de Pearson sólo puede aplicarse si


ambas variables, X e Y, están medidas a nivel de escala, por lo que no
es adecuado para variables categóricas. No obstante, existen otros
coeficientes de correlación aptos para estas variables. En el caso de que
ambas variables sean ordinales, puede calcularse la correlación existente
entre ellas mediante el coeficiente de correlación rho de Spearman (ρx y),
el coeficiente tau de Kendall (τx y ) o el coeficiente gamma de Goodman
y Kruskal (γx y ). Si ambas variables son nominales politómicas, se puede
emplear el coeficiente de contingencia (Cx y ), mientras que si ambas son
nominales dicotómicas, puede calcularse la correlación empleando el
coeficiente Phi (φ x y ).

Por último, es necesario comentar algunos aspectos a tener en cuenta


cuando interpretemos el valor del coeficiente de correlación. Lo primero
que debemos recordar es que la correlación es una medida de asociación
entre dos variables, por lo que únicamente nos informa del grado en que
estas variables covarían. La existencia de correlación, por tanto, nunca
puede tomarse como evidencia para una relación causa-efecto. Así, el
hecho de haber encontrado una correlación negativa entre Neuroticismo
y Autoestima no sería un argumento suficiente como para plantear que el
Neuroticismo tiene un efecto negativo sobre la Autoestima.

En segundo lugar, hay que recordar también que la correlación se ve muy


afectada por la variabilidad de la muestra, de tal modo que se reduce o
desaparece si la muestra es muy homogénea. La razón por la que ocurre
esto se puede visualizar en el diagrama de dispersión que relacionaba
el Neuroticismo y la Autoestima: pensemos en qué aspecto tendría la
nube de puntos si sólo tuviésemos en cuenta a aquellos sujetos con
puntuaciones intermedias en la escala de Neuroticismo (3, 4 y 5), en lugar
de tomar el rango completo de puntuaciones, de 1 a 7. La nube de puntos
que se obtendría con este grupo más homogéneo tendrá una forma
mucho más irregular, por lo que sería difícil apreciar relación alguna
entre ambas variables. Este hecho puede comprobarse en la propia
gráfica, donde se puede apreciar que la recta de ajuste es casi horizontal,
lo que viene a indicar que no existe una relación directa ni inversa. Esta
impresión viene confirmada por el valor del coeficiente de determinación,
que muestra un valor de sólo .054, lo que viene a decir que ahora ambas

114
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

variables comparten únicamente el 5.4% de su varianza, mientras que


cuanto teníamos en cuenta el rango completo de valores, este porcentaje
era de más del 31%.

Aunque el coeficiente de correlación es una técnica bivariada, existen


versiones multivariadas del mismo. Estos coeficientes resultan de gran
interés en análisis más complejos, como el de regresión. Se trata de la
correlación parcial y la correlación múltiple.

La correlación parcial (rx y z ) proporciona el valor de la correlación existente


entre dos variables X e Y, controlando el efecto de una tercera variable Z.
Permite, por lo tanto, estimar la relación existente exclusivamente entre
X e Y excluyendo de la misma aquella parte compartida con Z. Volviendo
al caso de la relación entre el Neuroticismo y la Autoestima, habíamos
determinado que la correlación existente entre ambas era de -.559.
Ahora bien, cuando incluimos en nuestro análisis una tercera variable, la
Satisfacción con la vida, descubrimos que esta variable está relacionada
con las dos anteriores, de tal modo que tiene una relación moderada y
directa con la Autoestima (.506), y una relación débil e inversa con el
Neuroticismo (.-278). Así, es posible que parte de la covariación existente
entre el Neuroticismo y la Autoestima pudiera estar siendo compartido
simultáneamente con la Satisfacción con la vida, puesto que esta última
variable también covaría con las otras dos. La correlación parcial nos

115
Eulogio Real Deus

permitiría saber cuál es el valor de la correlación entre Neuroticismo y


Autoestima manteniendo constante el grado de Satisfacción con la vida
de los sujetos. En el caso de nuestros datos, la correlación parcial arroja un
valor de -.505, que se encuentra claramente por debajo de la correlación
bivariada de -.559 encontrada originalmente, lo que confirma que parte
de la varianza compartida entre estas variables era, a su vez, compartida
con una tercera variable.

La correlación múltiple (rx, y z ) proporciona la correlación existente entre


una variable X, y una combinación lineal de otras variables (Y, Z,…). La
correlación múltiple tiene un interés especial cuando consideramos a
la variable X como variable dependiente, y al resto de variables como
sus predictores, que es el planteamiento de partida de los modelos de
regresión lineal. En este caso, el coeficiente de correlación múltiple se
conoce como coeficiente de regresión, y constituye un indicador del grado
de ajuste del modelo. La correlación múltiple también puede concebirse
como un caso particular de la correlación canónica (rx y w z ) (Thompson,
1984), que indicaría el grado de correlación existente entre dos grupos de
variables (X, Y,… y W, Z,…).

El análisis de regresión, al igual que la correlación, parte de la existencia


de relaciones lineales entre un conjunto de variables, pero va un paso
más allá al plantearse la posibilidad de realizar predicciones (Lewis-Beck,
1990; Achen, 1982). Efectivamente, si dos variables están relacionadas
linealmente, ello implica que cuando una de ellas cambia (varía), la otra
también cambia (covaría), por lo que podríamos utilizar una de ellas
(que actuaría como variable independiente) como predictor de la otra
(que actuaría como variable dependiente). Este planteamiento puede
generalizarse a un mayor número de variables, lo que se conoce como el
modelo de regresión múltiple, donde la variable dependiente se predice
a partir de una combinación lineal de variables independientes. Antes
de continuar, debemos tener en cuenta que en la regresión, al igual
que en la correlación, la existencia de relaciones lineales nunca puede
interpretarse en términos de causa-efecto. El hecho de que podamos
predecir la puntuación de un sujeto en la variable dependiente Y a partir
de sus resultados en las variables independientes X1, X2, X3, etc., no
implica que estas variables causen los cambios que se producen en Y. Así

116
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

pues, debemos entender el término predicción, no como explicación, sino


como pronóstico.

El hecho de que la regresión intente realizar pronósticos, además de


cuantificar el grado de relación lineal entre variables, implica que debe
informar, no sólo de la intensidad de la relación, sino también de su forma.
Es decir, el modelo de regresión debe proporcionarnos una ecuación que
nos permita obtener los valores de la variable dependiente a partir de los
valores obtenidos en otra u otras variables. Dado que nos planteamos que
existe una relación lineal entre las variables implicadas12, esta ecuación se
conoce como ecuación de la recta de regresión y, para el caso más sencillo,
el bivariado, tiene esta forma:

donde:

Y ’ es el pronóstico establecido por el modelo para la variable


dependiente (Y ) a partir de la variable independiente (X ). Estos
pronósticos contienen error, por lo que los valores de Y’ no serán
exactamente iguales a los de Y. Formalmente, Y= (Y ’+error ).
(constante) es un valor que debe añadirse a los pronósticos para
adaptarlos a la escala de la variable dependiente Y. Dicho de otro
modo, representa la diferencia entre las escalas empleadas por la
variable dependiente e independiente; es el valor que adopta Y
cuando X vale cero.
b (pendiente) es un valor que indica la proporcionalidad o tasa
de cambio entre ambas variables, dependiente e independiente.
Dicho de otro modo, indica en cuántas unidades cambia la variable
dependiente Y cuando la variable independiente X aumenta en
una unidad.
X es el valor obtenido por el sujeto en la variable independiente o
predictor.

12 Existen también modelos de regresión para relaciones no lineales (Martín, Cabero, & de Paz,
2008) pero, dado que el modelo lineal es más sencillo y es, además, el más empleado en Ciencias
Sociales y de la Salud, no abordaremos estos modelos aquí.

117
Eulogio Real Deus

Podemos ilustrar el caso de la regresión simple o bivariada utilizando


de nuevo el ejemplo de la relación entre Neuroticismo y Autoestima
que, como ya hemos visto, mostraron una relación lineal inversa
moderadamente fuerte, con una correlación de -.559. A la vista de
este resultado, nos planteamos la posibilidad de predecir el grado de
Autoestima de los sujetos a partir de su puntuación en la escala de
Neuroticismo. Para ello, seleccionamos en el menú: Analizar → Regresión
→ Lineales. Aparecerá este cuadro de diálogo:

Hemos especificado como variable dependiente de nuestro modelo de


regresión a la variable que contiene la puntuación del sujeto en la escala
de Autoestima de Rosenberg (EARmedia), y como variable independiente
la puntuación del sujeto en la escala de Neuroticismo del NEO PI-R
(Nmedia). SPSS nos proporcionará varias tablas, la primera de las cuales
nos muestra el ajuste del modelo a los datos. Nos informa del valor del
coeficiente de regresión (R ) que es la correlación existente entre la variable
dependiente y los pronósticos efectuados por el modelo (Ryy ’ ). Dado que
esos pronósticos Y’ son generados por la ecuación de regresión, podemos
entender también el coeficiente de regresión como la correlación múltiple
existente entre la variable dependiente y las variables independientes.
Dado que en este caso sólo hay una variable independiente, el valor de
R es idéntico a la correlación entre Neuroticismo y Autoestima, aunque
positivo, por efecto de la transformación efectuada por la ecuación de

118
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

regresión (.559). El segundo índice de interés que nos proporciona la tabla


es el coeficiente de determinación (R cuadrado) que es el cuadrado del
coeficiente de regresión, y expresa la proporción de varianza de la variable
dependiente que es explicada por las variables independientes. Dado que
en este caso sólo tenemos una variable independiente, su valor también
será igual coeficiente de determinación entre Neuroticismo y Autoestima
(.312). Así pues, la puntuación en Neuroticismo de los sujetos sería
capaz de predecir su nivel de Autoestima, pero cometiendo importantes
errores, puesto que el Neuroticismo sólo predice el 31.2% de la varianza
en Autoestima, lo cual significa que queda un 68.8% de varianza en
Autoestima sin explicar por el modelo de regresión.

 
Resumen del modelo

Modelo R R cuadrado R cuadrado corregida Error típ. de la estimación


1 ,559a ,312 ,306 ,85472
a. Variables predictoras: (Constante), Media neuroticismo
 

Una segunda tabla que puede resultarnos de interés es la que contiene


los coeficientes de la recta de regresión. Los valores de a y b se muestran
en la columna B de la tabla. El primer valor (Constante) es el valor de
a, y el segundo es el valor de b. De este modo, la ecuación de regresión
que permite pronosticar la Autoestima de los sujetos (Y ) a partir de su
grado de Neuroticismo (X ) tiene la forma: Y ’= 7.237-.569X. Aplicando esta
ecuación a los valores de Neuroticismo obtendríamos unos pronósticos
cuya representación gráfica coincidiría sobre la recta que mostrábamos
en el gráfico de dispersión correspondiente a estas dos variables. El valor
de b también se nos muestra tipificado bajo la columna Beta, que sería el
valor que tendría la pendiente si todas las variables del modelo estuviesen
estandarizadas o tipificadas. Dado que está estandarizado (oscila entre
-1 y +1), beta se puede interpretar como el peso o la importancia que
tiene cada variable independiente en la ecuación, o también puede ser
interpretado de forma similar a un coeficiente de correlación. De hecho,
en este caso, dado que sólo hay una variable independiente, el valor de
beta es idéntico al valor del coeficiente de correlación bivariado entre
Neuroticismo y Autoestima (-.559). En la parte derecha de la tabla se
muestran dos contrastes de hipótesis basados en la prueba t de Sudent,

119
Eulogio Real Deus

junto con su significación estadística. Dado que el contraste de hipótesis


será abordado en el apartado siguiente, sólo comentaremos aquí que
se somete a comprobación (lo que llamamos nuestra hipótesis), es si
el verdadero valor de ambos coeficientes podría ser nulo, y se muestra
la probabilidad asociada a esta hipótesis (Significación). Dado que es
bajísima la probabilidad de que el verdadero valor de ambos coeficientes
fuese nulo, rechazaríamos esta hipótesis, y concluiríamos que los
valores de a y b no son nulos y que, en este último caso, significa que la
contribución de la variable independiente a la ecuación de regresión es
estadísticamente significativa.

Coeficientesa

Modelo Coeficientes no estandarizados Coeficientes tipificados t Sig.


B Error típ. Beta
(Constante) 7,237 ,336 21,519 ,000
1
Media neuroticismo -,569 ,081 -,559 -7,006 ,000
a. Variable dependiente: Media autoestima
 

Normalmente no nos plantearemos modelos tan simples como éste, sino


que intentaremos añadir más predictores a la ecuación de regresión, con
el fin de incrementar ese poder predictivo hasta unos valores aceptables
en cuanto a la precisión de los pronósticos. En este caso hablamos de
regresión múltiple o regresión multivariada, y la ecuación incluirá ahora
una combinación lineal de predictores:

El problema con el modelo de regresión múltiple es que resulta mucho


más complejo decidir qué predictores vamos a incluir o no en el
mismo. Afortunadamente, existen métodos de selección de variables
independientes en función de criterios estadísticos que permiten incluir
en la ecuación únicamente aquellos predictores realmente significativos
en términos de aportación a la varianza explicada por el modelo. Si
observa el recuadro correspondiente al Método en el cuadro de diálogo
del análisis de regresión anterior, verá que aparece seleccionado el
método Introducir, que significa que es el usuario el que decide qué
variables independientes incluir en el modelo. En el caso multivariado, es
recomendable emplear otro método, como el de pasos sucesivos, donde

120
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

los predictores son introducidos o eliminados de la ecuación en función


de su aportación a la varianza total explicada.

Para ejemplificar el uso del modelo de regresión múltiple, imaginemos


que queremos saber si es posible obtener una buena predicción del
nivel de satisfacción con la vida de un sujeto sin necesidad de pasarle
la escala completa de Diener de 5 ítems, sino simplemente haciéndole
un par de preguntas verbalmente. Para ello, utilizaremos los resultados
obtenidos por nuestra muestra de sujetos, utilizando sus respuestas
a los ítems originales como predictores de la puntuación media en la
escala. Sabemos que esta puntuación se ha calculado a partir de los 5
ítems originales, pero ahora queremos saber si un conjunto menor de
ítems podrían proporcionarnos un valor suficientemente parecido al
que obtendríamos empleando la escala completa. Para ello, volvemos a
seleccionar el procedimiento de regresión lineal en SPSS. Ahora, el cuadro
de diálogo tendrá este aspecto:

Hemos seleccionado la puntuación media de la escala como variable


dependiente, y las respuestas de los sujetos a los 5 ítems de la escala
como variables independientes. También hemos cambiado el Método
de selección, que ahora es pasos sucesivos, que nos permitirá obtener
una lista de predictores ordenados según su poder explicativo dentro del
modelo. Para la interpretación de la importancia relativa de cada ítem
como predictor de la puntuación total en la escala, podemos seleccionar,

121
Eulogio Real Deus

dentro del botón Estadísticos la opción de que se indique la contribución


individual de cada predictor a la ecuación de regresión. En caso de que
queramos obtener en una variable los pronósticos hechos por el modelo,
podemos hacerlo pulsando el botón Guardar.

Una precaución recomendable cuando hagamos un análisis de regresión


múltiple, es comprobar la existencia de colinealidad entre las variables
independientes. Entendemos por colinealidad el que una variable
independiente comparta casi toda su varianza con otra u otras variables
independientes; cuando ocurre esto, la variable independiente en
cuestión se vuelve irrelevante, puesto que puede ser reemplazada por
aquella o aquellas otras variables independientes sin merma del poder
predictivo del modelo. Esta posibilidad es especialmente preocupante
en nuestro caso, puesto que todos los ítems que hemos planteado como
predictores están relacionados con el mismo constructo, y es de esperar
que correlacionen mucho entre sí; es decir, que compartan bastante
varianza. El botón Estadísticos da acceso a estas opciones:

Además de las opciones que aparecen seleccionadas por defecto,


podemos seleccionar Cambio en R cuadrado para ver la contribución
que cada ítem hace a la varianza de la puntación total, y Diagnósticos de
colinealidad para comprobar la existencia de problemas de colinealidad
entre nuestras variables independientes.

122
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

La primera tabla de resultados muestra la lista de variables introducidas


o eliminadas del modelo por el método de pasos sucesivos, en función
de su significación estadística, Como puede verse, para que una
variable independiente sea incorporada al modelo es necesario que la
probabilidad de que su contribución sea nula debe ser igual o inferior a
.05, mientras que para eliminarla del modelo, esta probabilidad debe ser
igual o superior a .10. En cuanto a la lista de variables, vemos que todos
los ítems han entrado en la ecuación de regresión, y ninguno ha sido
eliminado. Así pues, nuestro modelo haría uso de los 5 ítems para realizar
sus pronósticos. Sin embargo, no todos los ítems son igual de buenos
como predictores de la puntuación total. El mejor predictor es el ítem
3, seguido por el ítem 5, el ítem 1, el ítem 4, y el ítem 2, que sería el peor
predictor de la puntuación global en satisfacción con la vida.

  Variables introducidas/eliminadasa
 
Variables introducidas/eliminadasa
Modelo Variables Variables Método
introducidas eliminadas
1 SV03 . Por pasos (criterio: Prob. de F para entrar <= ,050, Prob. de F para salir >= ,100).
2 SV05 . Por pasos (criterio: Prob. de F para entrar <= ,050, Prob. de F para salir >= ,100).
3 SV01 . Por pasos (criterio: Prob. de F para entrar <= ,050, Prob. de F para salir >= ,100).
4 SV04 . Por pasos (criterio: Prob. de F para entrar <= ,050, Prob. de F para salir >= ,100).
5 SV02 . Por pasos (criterio: Prob. de F para entrar <= ,050, Prob. de F para salir >= ,100).
a. Variable dependiente: Media satisfacción con la vida

 
La tabla de resumen del modelo nos muestra las contribuciones de cada
uno de estos ítems en forma de coeficientes de correlación múltiple y de
determinación. Puede verse que el ajuste del modelo ha ido mejorando
con cada uno de los cinco pasos del análisis, hasta llegar al máximo ajuste
en el paso 5, con una correlación perfecta (rx y ’= 1.00), y un coeficiente de
determinación (r 2x y ’= 1.00) que nos indica que el modelo con 5 predictores
explicaría el 100% de la varianza de la puntuación en la escala. Sin embargo,
estos predictores han sido seleccionados para el modelo en función de
su contribución decreciente a la varianza de la escala. Podemos ver esta
contribución en la columna Cambio en R cuadrado, que nos muestra
que el ítem 3, que fue seleccionado en el paso 1, explica casi el 64% de la
varianza de la puntuación total, mientras que el ítem 5, seleccionado en
el paso 2, contribuiría a explicar un 15.4% adicional. Entre estos dos ítems,
pues, explican casi el 80% de la varianza en satisfacción con la vida de

123
Eulogio Real Deus

los sujetos (.793), por lo que bastaría con dos preguntas para obtener una
estimación razonablemente precisa del grado de satisfacción con la vida de
un sujeto dado. Las columnas finales nos muestran el resultado del criterio
por pasos, que indican que en todos los pasos se cumplió el criterio de
entrada del predictor en la ecuación que ya se nos mostraba en la primera
tabla de resultados: que la probabilidad asociada al valor del estadístico de
contraste, basado en la F de Snedecor, sea igual o inferior a .05.

Resumen del modelo

Modelo R R R cuadrado Error típ. de la Estadísticos de cambio


cuadrado corregida estimación Cambio en Cambio en F gl1 gl2 Sig.
R cuadrado Cambio
en F
a
1 ,799 ,638 ,635 ,64073 ,638 190,727 1 108 ,000
b
2 ,890 ,793 ,789 ,48754 ,154 79,536 1 107 ,000
c
3 ,953 ,908 ,905 ,32620 ,115 133,012 1 106 ,000
d
4 ,980 ,960 ,959 ,21547 ,052 137,938 1 105 ,000
e
5 1,000 1,000 1,000 ,00000 ,040 12412287900404530,000 1 104 ,000
 

Finalmente, en la tabla de coeficientes podemos inspeccionar el aspecto


que tendría la ecuación de regresión planteada por el modelo. Los valores
B de la tabla nos indican que esta ecuación tendría la forma: Y’ = 0+.20X1
+.20X2+.20X3+.20X4+.20X5. Esta ecuación no es más que otra forma de
calcular la media:

𝑆𝑆𝑆𝑆01 + 𝑆𝑆𝑆𝑆02 + 𝑆𝑆𝑆𝑆03 + 𝑆𝑆𝑆𝑆04 + 𝑆𝑆𝑆𝑆05 1 1 1 1 1


= 𝑆𝑆𝑆𝑆01 + 𝑆𝑆𝑆𝑆02 + 𝑆𝑆𝑆𝑆03 + 𝑆𝑆𝑆𝑆04 + 𝑆𝑆𝑆𝑆05  
5 5 5 5 5 5

Se aprecia también que no existe ninguna clase de error en las predicciones


hechas por cada uno de los ítems: todos los errores típicos valen cero, y
todos los contrastes son significativos, salvo el de a que, en este caso, vale,
efectivamente, cero, por lo que la probabilidad de que su verdadero valor
sea nulo es ahora 1. Es decir, que en el caso del coeficiente a, la hipótesis
de que su valor podría ser nulo sería aceptada. En la parte derecha de la
tabla podemos inspeccionar los índices de colinealidad, para comprobar
que ninguno de los ítems está afectado por este problema. La columna
Tolerancia indica la proporción de varianza del ítem que es propia y no

124
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

puede ser explicada por el resto de variables independientes por lo que,


a mayor tolerancia, menor colinealidad. Cuando la tolerancia desciende
por debajo de .10, eso indicaría que más del 90% de la varianza de ese
predictor ya está explicado por otras variables independientes, por lo
que sería irrelevante en la ecuación y produciría inestabilidad en las
estimaciones del modelo. Podemos ver que en el caso de nuestros ítems
no aparecen problemas importantes de colinealidad.

Coeficientesa

Modelo Coeficientes no Coeficientes t Sig. Estadísticos de


estandarizados tipificados colinealidad
B Error típ. Beta Tolerancia FIV
(Constante) -3,109E-015 ,000 ,000 1,000
SV03 ,200 ,000 ,256 106203306,728 ,000 ,529 1,891
SV05 ,200 ,000 ,342 175020736,538 ,000 ,804 1,243
SV01 ,200 ,000 ,262 115059696,347 ,000 ,594 1,685
SV04 ,200 ,000 ,255 121432384,185 ,000 ,698 1,433
SV02 ,200 ,000 ,261 113806645,640 ,000 ,585 1,710
a. Variable dependiente: Media satisfacción con la vida
 

Aunque el análisis de regresión es una de las técnicas de análisis de


datos más empleadas, recientemente han aparecido otros modelos más
complejos que permiten establecer relaciones predictivas entre variables,
pero incluyendo tanto efectos predictivos directos como indirectos. En
el caso del análisis de regresión lineal, todos los efectos son directos, de
variable independiente a variable dependiente. Sin embargo, cuando el
efecto es indirecto, la variable independiente ejerce su efecto sobre la
dependiente a través de una tercera variable mediadora o interviniente.

Los modelos causales forman parte de la familia de modelos de


ecuaciones estructurales (SEM: Structural Equation Models), y permiten la
elaboración de modelos predictivos en forma confirmatoria. Es decir, que
se plantean sobre el modelo el tipo de relaciones que se espera encontrar
entre las variables independientes, mediadoras y dependientes, y este
modelo es sometido a contraste para comprobar su ajuste a los datos
(Asher, 1983). Esta situación puede apreciarse visualmente en la figura
siguiente, donde se plantea el efecto de dos variables independientes
(Presión social y Sistema de valores) sobre una variable intermediaria

125
Eulogio Real Deus

(Insatisfacción), que a su vez tiene un efecto causal sobre la variable


dependiente (Restricción de la conducta). Al igual que en el análisis de
regresión, existen coeficientes de regresión que indican el efecto que una
variable tiene sobre otra. Estos efectos se indican mediante flechas, sobre
las cuales podemos ver los pesos de regresión correspondientes, que nos
indican que la presión social tiene un efecto mayor sobre la insatisfacción
del sujeto que su propio sistema de valores, y que la combinación de los
efectos directos e indirectos de las tres variables tiene un peso importante
en el grado de restricción de la conducta manifestado por ese sujeto.
A su vez, el cuadrado de estos pesos de regresión nos proporciona
los coeficientes de correlación múltiple al cuadrado, que indican la
proporción de varianza de la variable intermediaria explicada por las dos
variables independientes (un 37%), así como la proporción de varianza de
la variable dependiente explicada por la combinación de las 3 variables
anteriores (un 44%).

2.10.4. El contraste de hipótesis


En el apartado anterior hemos visto contrastes de hipótesis cuya función
es plantear cuestiones acerca de si la contribución de un predictor a la
ecuación de regresión es nula, o si el verdadero valor de un coeficiente
de la ecuación es nulo. La respuesta se da en forma de probabilidad
(Significación) de que sea cierto aquello que se plantea (la hipótesis).

126
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Como es lógico, si esta probabilidad es muy pequeña, la hipótesis que


nos hemos planteado es seguramente falsa. En ese caso, decimos que hay
significación estadística, en el sentido de que el resultado no es nulo y,
por tanto, se ha detectado un efecto en los datos. Si la probabilidad no
es muy pequeña, la hipótesis podría ser cierta, por lo que tendríamos
que aceptarla. El método por pasos de la regresión nos mostró en
una de sus tablas el valor límite de esa probabilidad: .05 o, lo que es lo
mismo, una probabilidad de 5 entre 100. Cuando la probabilidad de
que la hipótesis sea cierta es menor del 5% (p <.05) se considera que es
lo suficientemente baja como para poder rechazar esa hipótesis. Sin
embargo, si esa probabilidad es mayor del 5%, entonces el resultado no es
lo suficientemente improbable, por lo que aceptaremos que la hipótesis
podría ser cierta.

Así pues, planteado en sus términos más generales, un contraste de


hipótesis es una comprobación en la que nos planteamos algo acerca del
verdadero valor de un resultado, y se nos proporciona la probabilidad
de que esto sea así. Cuando esta probabilidad p es muy baja (p <.05),
entonces consideramos que podemos rechazar la hipótesis planteada. En
caso contrario, la hipótesis deberá ser aceptada. Dado que el contraste de
hipótesis se lleva a cabo a partir de los datos, el resultado del contraste
también puede interpretarse como hasta qué punto los datos respaldan
(en caso de aceptación) o no (en caso de rechazo) la hipótesis planteada.

En cuanto a la hipótesis propiamente dicha, se trata de una hipótesis


estadística, no de una hipótesis de investigación. Esto quiere decir que
no está planteada en términos verbales, sino en términos de resultados
concretos, y de sus valores asociados. En cualquier contraste siempre se
plantean dos hipótesis estadísticas:

vv Hipótesis nula (H0). Plantea que el resultado es nulo; de ahí su


nombre. Es la hipótesis más importante para nosotros, porque es
la que vamos a aceptar o rechazar; esto es, el valor de Significación
proporcionado por el contraste de hipótesis será la probabilidad
asociada a esta hipótesis. Dado que esta hipótesis plantea siempre
un resultado nulo, está asociada a la ausencia de efectos en los
datos. Por ejemplo, en el caso de una comparación entre medias,

127
Eulogio Real Deus

la hipótesis nula dirá que la diferencia entre ellas es nula o, lo que


es lo mismo, que ambas medias son iguales. En el caso de una
correlación, la hipótesis nula planteará que el verdadero valor de
la misma es nulo, es decir, que en realidad la correlación vale cero.

vv Hipótesis alternativa (H1). Incluye todos los resultados no


contemplados por la hipótesis nula, es decir, todos los resultados
no nulos, por lo que el rechazo de aquella implica la aceptación
de ésta y, por tanto, la existencia de efectos en los datos. En el
caso de los ejemplos anteriores, la hipótesis alternativa incluye
todos los resultados en los que las medias sean diferentes, o en
que la correlación no sea cero. La hipótesis alternativa, por tanto,
está planteando que existen efectos en los datos (las medias han
cambiado; existe correlación entre las variables).

En muchos contrastes, las hipótesis nula y alternativa se refieren al valor


poblacional de un dato, o parámetro. En este caso, la hipótesis nula
correspondiente planteará valores nulos para la diferencia entre el valor
del estadístico, y el valor del parámetro poblacional correspondiente.
Dicho de otra forma, en este tipo de contraste, la hipótesis nula plantea
que los resultados encontrados en la muestra se corresponden con la
ausencia de efectos en la población. Este tipo de contrastes se denominan
paramétricos y son los más empleados, sobre todo cuando queremos
extender los efectos detectados con nuestra muestra a la población
general, es decir, queremos hacer inferencias sobre la población a partir
de la muestra (Amón, 1986).

En otro tipo de contrastes, las hipótesis no se plantean en términos de


parámetros poblacionales, sino en función de otro tipo de consideraciones,
por lo que se las denomina pruebas no paramétricas. Es un conjunto
mucho más heterogéneo que el anterior, e incluye, entre otras, pruebas
de bondad de ajuste, y los contrastes de hipótesis para datos de tipo
categórico, o en las que el número de requisitos a cumplir para poder
realizar el contraste es menor.

Aunque existen multitud de contrastes de hipótesis, todos ellos están


basados en el uso de estadísticos de contraste y sus distribuciones

128
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

de probabilidad, o distribuciones muestrales. Los estadísticos de


contraste se obtienen a partir de los resultados de la muestra y varían
en función de la discrepancia existente entre los resultados obtenidos
en la muestra y lo planteado por la hipótesis. Cada uno de los posibles
valores del estadístico de contraste tiene asociada una probabilidad por
su distribución muestral, lo que nos permite asignar una probabilidad
determinada al valor propuesto por nuestra hipótesis y, en función de esta
probabilidad, aceptar o rechazar la hipótesis. Generalmente se identifica
a los estadísticos de contraste por su distribución de probabilidad, de
modo que los estadísticos pueden ser z (si su distribución es normal), t (si
su distribución es t de Student), χ2 (si su distribución es chi-cuadrado), F
(si su distribución es la F de Snedecor), etc.

Si tomamos el caso de la z, por ser muy habitual, la figura siguiente


muestra la distribución normal tipificada de los posibles valores de este
estadístico de contraste. El valor más probable es 0, es decir, un resultado
nulo. A medida que nos alejamos de este resultado, los valores van siendo
cada vez más improbables, hasta llegar a valores muy próximos a cero
en las colas de la distribución. Por tanto, aquellos resultados nulos o
próximos al valor nulo son los más probables, y aquellos que muestren
valores positivos o negativos más extremos son los menos probables. En
este contexto, tomaremos la decisión de rechazar la hipótesis nula cuando
los resultados estén tan alejados del valor nulo que su probabilidad sea
inferior a un valor que denominamos alfa (α), y que suele corresponder al
5% (α = 0.05). Como los resultados pueden alejarse del valor central en dos
direcciones diferentes, el valor de α se dividirá entre los dos extremos de la
distribución (contraste bilateral). El resto de la distribución corresponde
a los valores del estadístico de contraste que se consideran compatibles
con la hipótesis nula, cuya probabilidad vale 1- α. Por tanto, aquellos
valores del estadístico de contraste situados en la zona central de la
distribución nos llevarán a aceptar la hipótesis nula, y concluir que no
hay efectos. Por el contrario, aquellos valores del estadístico de contraste
que se encuentren en las zonas sombreadas son muy improbables, y nos
llevarían a concluir que la hipótesis nula es falsa.

129
Eulogio Real Deus

1-­‐α

α/2 α/2

zα/2 0 z1-­‐α/2
 
Es importante recordar que α es una probabilidad, por lo que cualquier
decisión basada en su valor está sujeta al error; podemos identificar α
como el nivel de riesgo que asumimos al rechazar la hipótesis nula, y a
1- α como el nivel de confianza. Así, si α = .05 (asumo un riesgo del 5%),
1- α =.95 (asumo un nivel de confianza del 95%). Por tanto, para estar
seguros de que rechazamos correctamente una hipótesis, es importante
que la Significación del resultado muestre una probabilidad lo más
baja posible: menor del 5% ( p <.05), menor del 1% (p <.01), o menor del
1‰ ( p <.001). En este último caso, por ejemplo, estoy diciendo que mi
resultado se corresponde con la existencia de un efecto en 999 de cada
1000 muestras, por lo que es muy difícil que mi muestra corresponda al
único caso excepcional.

No obstante, también hay otro riesgo cuando realizamos un contraste de


hipótesis, y está asociado no al rechazo, sino a la aceptación de la hipótesis.
Es decir, es la probabilidad de equivocarnos al aceptar la hipótesis nula, y
se representa por β. Este tipo de error implica, por tanto, que hemos sido
incapaces de detectar el efecto, y la probabilidad que expresa sería la
probabilidad de que ese efecto se nos pasase por alto. Por consiguiente,
la probabilidad complementaria, o 1- β, nos indicará la capacidad del
contraste para detectar efectos, y se conoce como potencia del contraste.
Lógicamente, nos interesará siempre minimizar ambas probabilidades
de error, aunque esto es más sencillo de comprobar en el caso de α,
mientras que la potencia del contraste depende de varios factores, entre

130
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

ellos el tamaño de la muestra, que tiene un efecto positivo sobre la misma


(Pardo & San Martín, Análisis de datos en Psicología II, 1998). En general,
se identifica a α como la probabilidad de cometer un error tipo I (rechazar
una hipótesis nula, cuando en realidad es cierta), mientras que β sería la
probabilidad de cometer un error tipo II (aceptar la hipótesis nula cuando
en realidad es falsa). Veamos a continuación algunos de los contrastes de
hipótesis más sencillos a nivel univariado y bivariado.

vv Contraste de hipótesis para una media. Este contraste paramétrico


nos permite comprobar si la muestra procede de una población
con una media determinada. Por ejemplo, podríamos querer
comprobar si podemos asumir un nivel medio de Neuroticismo
en nuestros sujetos a partir de sus resultados en la escala
correspondiente. Dado que las puntuaciones en Neuroticismo
oscilan entre 1 y 7, el valor intermedio correspondería a 4, por lo
que esa será nuestra hipótesis en el contraste. Para comprobarla,
seleccionamos en el menú: Analizar → Comparar medias → Prueba
T para una muestra. Obtenemos el cuadro de diálogo siguiente:

Hemos solicitado un contraste de hipótesis sobre la media


de la variable Nmedia, que contiene la puntuación media en
Neuroticismo, planteando como valor poblacional de la misma
el valor 4. El análisis nos proporciona dos tablas. La primera de
ellas contiene simplemente los estadísticos correspondientes a
la variable. Podemos ver que el valor de la media (4.015) es muy
similar al planteado por la hipótesis nula (4.00):

131
Eulogio Real Deus

Estadísticos para una muestra

N Media Desviación típ. Error típ. de la media


Media neuroticismo 110 4,0152 1,00750 ,09606
 

En la segunda tabla se muestra el contraste de hipótesis. El


estadístico de contraste se distribuye según la t de Student, de
ahí que la prueba se llame en SPSS prueba T para una muestra.
La probabilidad asociada al estadístico es muy alta (.875), lo
que indica que los datos muestrales encajan muy bien con esta
hipótesis. Dado que es muy probable que la hipótesis nula sea
cierta, la aceptamos.

Prueba para una muestra

Valor de prueba = 4
t gl Sig. Diferencia de 95% Intervalo de confianza para
(bilateral) medias la diferencia
Inferior Superior
Media neuroticismo ,158 109 ,875 ,01515 -,1752 ,2055
 

Contraste de hipótesis para dos medias con muestras


independientes. Este contraste paramétrico nos permite comparar
las medias obtenidas por dos grupos independientes de sujetos.
La hipótesis nula del contraste plantea que ambas medias son
iguales en la población. Volviendo al ejemplo del Neuroticismo,
ahora que sabemos que los sujetos de nuestra muestra tienen un
nivel medio de Neuroticismo, podría interesarnos comprobar si
existen diferencias en este rasgo entre hombres y mujeres. Para
ello, seleccionamos en el menú: Analizar → Comparar medias →
Prueba T para muestras independientes. Obtenemos este cuadro
de diálogo:

132
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Hemos solicitado un contraste de hipótesis sobre la media en


Neuroticismo de hombres y mujeres. Previamente habremos
especificado los valores que identifican a hombres y mujeres (0, 1)
en el botón Definir grupos. El análisis nos proporciona una primera
tabla con los estadísticos descriptivos para ambos grupos, donde
podemos apreciar que las medias son muy similares, siendo sólo
un poco menor la de los hombres que la de las mujeres:

Estadísticos de grupo

Indica ahora tu sexo N Media Desviación típ. Error típ. de


la media
Hombre 24 3,9444 ,87182 ,17796
Media neuroticismo
Mujer 86 4,0349 1,04604 ,11280
 

En la segunda tabla se muestra el contraste de hipótesis, dividido


en dos partes. En el caso de muestras independientes, es necesario
hacer una comprobación de igualdad de varianzas, previa a la
comprobación de igualdad de medias; por ello la tabla está dividida
en dos partes: una prueba de igualdad de varianzas, y la prueba
T de igualdad de medias. El estadístico de contraste vuelve a ser
una t, pero ahora se nos muestran dos valores: uno para el caso de
varianzas iguales (es decir, aceptando la hipótesis nula del primer
contraste), y otro para el caso de varianzas desiguales (en caso de
que hayamos rechazado la hipótesis nula en el primer contraste).

133
Eulogio Real Deus

Por ello, es necesario examinar primero el contraste de igualdad de


varianzas para saber en qué caso nos encontramos. El estadístico
de contraste para la igualdad de varianzas se distribuye según la
F de Snedecor, y podemos ver que su probabilidad asociada es de
.486. Dado que este valor no es inferior a .05, aceptamos la hipótesis
de igualdad de varianzas, y examinamos el valor t correspondiente
a este caso. La significación de este estadístico es de .699, lo que está
muy por encima de .05, por lo que aceptamos también la hipótesis
de igualdad de medias, y concluimos que no hay diferencias
significativas entre hombres y mujeres en cuanto a este rasgo.

Prueba de muestras independientes

Prueba de Levene Prueba T para la igualdad de medias


para la igualdad de
varianzas
F Sig. t gl Sig. Diferencia de Error típ. de la 95% Intervalo de
(bilateral) medias diferencia confianza para la
diferencia
Inferior Superior
Se han asumido varianzas
,490 ,486 -,387 108 ,699 -,09044 ,23350 -,55328 ,37240
iguales
neuroticismo
No se han asumido
-,429 43,302 ,670 -,09044 ,21070 -,51526 ,33438
varianzas iguales
 

vv Contraste de hipótesis para dos medias con muestras relacionadas.


Este contraste paramétrico también nos permite comparar las
medias obtenidas por dos grupos, sólo que en este caso ambos
grupos están relacionados, bien porque hayamos emparejado a
los sujetos de ambos grupos, bien porque se trate de los mismos
sujetos medidos en dos momentos diferentes (como, por ejemplo,
antes y después de recibir un tratamiento). Como siempre, la
hipótesis nula propondrá que ambas medias son iguales en la
población o, lo que es lo mismo, que no hay diferencias entre
ambos grupos. Para llevar a cabo el análisis en SPSS, seleccionamos
en el menú: Analizar → Comparar medias → Prueba T para muestras
relacionadas. Sólo tendremos que especificar el par de variables
que contienen los datos emparejados. El estadístico de contraste
será también una t que se interpreta igual que en los casos
anteriores.

134
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

vv Contraste de hipótesis no paramétrico para muestras


independientes. En algunos casos no es posible emplear los
contrastes paramétricos para el caso de dos muestras. Ello puede
deberse a que el nivel de medida de la variable que queremos
contrastar no es de escala, sino ordinal (nivel de medida para
el que la media no es un estadístico adecuado), o bien porque
la distribución de la variable es muy asimétrica (las pruebas
paramétricas asumen distribuciones normales). En cualquiera de
estos casos es posible realizar el contraste empleando técnicas no
paramétricas. En el caso de muestras independientes, la prueba
U de Mann-Whitney nos permite comprobar si la distribución de
los rangos ordinales es igual en ambos grupos. Supongamos que
queremos saber si hay diferencias de género en nuestra muestra
en cuanto a la ideología política, que medíamos empleando una
escala ordinal de 5 puntos, que iba de Izquierda (1) a Derecha
(5). Para ello, seleccionamos en el menú: Analizar → Pruebas
no paramétricas → Cuadros de diálogo antiguos → 2 muestras
independientes. Obtenemos este cuadro de diálogo:

Hemos especificado la opción política como variable a contrastar,


y el sexo como variable de agrupación, de un modo muy similar a
como lo hicimos en el caso paramétrico. El análisis nos proporciona

135
Eulogio Real Deus

una primera tabla que muestra que los rangos ordinales13 se


distribuyen de forma muy similar entre ambos grupos, de tal modo
que el rango promedio es muy parecido para hombres y mujeres.

Rangos

Indica ahora tu sexo N Rango promedio Suma de


rangos
¿Qué opción política Hombre 24 53,73 1289,50
representa mejor tus Mujer 86 55,99 4815,50
ideas? Total 110
 

La segunda tabla nos muestra el contraste de hipótesis, cuyo


estadístico es una z que se calcula a partir del valor U, que indica
cuántas veces han superado los sujetos con mayor rango promedio
(mujeres) a los sujetos con menor rango promedio (hombres). El
número total de comparaciones posible es igual al producto de
los tamaños de ambos grupos (en este caso, 24x86= 2064). El valor
obtenido (989.5) es casi la mitad, lo que indica que los hombres
superan a las mujeres más o menos tantas veces como las mujeres
superan a los hombres. Por esta razón, el estadístico de contraste
proporciona un valor muy bajo (-.322), cuya significación (.748) es
demasiado alta como para rechazar la hipótesis nula, por lo que
tendremos que concluir que no existen diferencias en orientación
política entre hombres y mujeres.

Estadísticos de contrastea

¿Qué opción política representa mejor tus ideas?


U de Mann-Whitney 989,500
W de Wilcoxon 1289,500
Z -,322
Sig. asintót. (bilateral) ,748
 

13 Un rango es una puntuación ordinal, que asigna un valor de 1 a n para una muestra de n sujetos,
de tal modo que al sujeto con la puntuación más baja se le asigna el rango 1, al siguiente el 2, y
así sucesivamente hasta llegar al sujeto con la puntuación más alta, al que se le asigna el rango
n. En caso de empates, se asigna a los sujetos empatados el rango promedio correspondiente.

136
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

vv Contraste de hipótesis no paramétrico para muestras relacionadas.


La aplicación de este contraste es análoga a la que ya vimos para el
caso paramétrico, sólo que en este caso la prueba está basada en
las diferencias entre los rangos de las puntuaciones obtenidas por
los grupos relacionados. La hipótesis nula planteará que la mitad
de las diferencias se dará en un sentido negativo, y la otra mitad se
dará en sentido positivo, por lo que el efecto total será nulo, es decir,
no habrá diferencias significativas entre los grupos relacionados
en cuanto a sus rangos. El estadístico de contraste será también
una z que se interpreta del mismo modo que en el caso anterior.

vv Contraste de hipótesis para comprobación de normalidad de


la distribución. Como ya hemos comentado, muchas pruebas
diseñadas para variables medidas a nivel de escala asumen que
la distribución de estas variables es normal. Si bien la falta de
normalidad de la distribución puede ser obviada cuando nuestra
muestra es suficientemente grande (más de 100 sujetos), es
recomendable comprobar este supuesto. Para ello se utiliza una
prueba de bondad de ajuste, la prueba de Kolmogorov-Smirnov. La
prueba compara la distribución empírica de nuestra variable con la
distribución teórica que tendría si fuese estrictamente normal. La
hipótesis nula plantea que la diferencia entre ambas distribuciones
es nula, por lo que si la aceptamos estamos asumiendo normalidad
de la distribución para la variable. Para realizar esta comprobación
en el caso de la variable Neuroticismo, seleccionamos en el menú:
Analizar → Pruebas no paramétricas → Cuadros de diálogo antiguos
→ K-S de 1 muestra. Aparecerá el siguiente cuadro de diálogo:

137
Eulogio Real Deus

Especificamos la variable Nmedia como variable cuya normalidad


vamos a comprobar. El análisis nos mostrará una tabla como la
siguiente:

Prueba de Kolmogorov-Smirnov para una muestra

Media neuroticismo
N 110
a,b Media 4,0152
Parámetros normales
Desviación típica 1,00750
Absoluta ,069
Diferencias más extremas Positiva ,069
Negativa -,040
Z de Kolmogorov-Smirnov ,723
Sig. asintót. (bilateral) ,673
a. La distribución de contraste es la Normal.
b. Se han calculado a partir de los datos.
 

Junto a la media y la desviación típica de la escala, que ya


conocíamos de análisis anteriores, se nos muestran las diferencias
más extremas (negativa y positiva) encontradas entre la
distribución de nuestros datos y la distribución normal. La más
extrema en términos absolutos (sin tener en cuenta el signo) vale
.069, y es muy pequeña. Debido a ello, obtendremos un estadístico

138
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

de contraste z muy pequeño (.723), cuya significación se encuentra


claramente por encima de .05, por lo que la hipótesis nula debe ser
aceptada, lo que implica que podemos asumir normalidad de la
distribución para nuestra variable.

vv Contraste de hipótesis para una proporción. Esta es una prueba


apropiada para variables dicotómicas, con sólo dos resultados
posibles, que llamaremos éxito y fracaso, y nos permite comprobar
una hipótesis acerca de la proporción de éxitos en la población.
Supongamos que se desea comprobar si nuestra muestra podría
haber sido extraída de la población general en cuanto al género.
Dado que en la población general hay aproximadamente un 50%
de hombres y de mujeres, la proporción de éxitos que planteo
será de .50. En SPSS, se considerará como éxito aquel resultado
codificado con el valor 1 (en el caso de nuestra variable sexo, ser
mujer). Para comprobar esta hipótesis en SPSS, seleccionamos en
el menú: Analizar → Pruebas no paramétricas → Cuadros de diálogo
antiguos → Binomial. Aparecerá el siguiente cuadro de diálogo:

Incluimos la variable dicotómica Sexo, y planteamos que la


proporción de éxitos en la población será de .50. En caso de que
la variable no fuese dicotómica, podemos establecer un punto de
corte que divida en dos las puntuaciones de la misma. El resultado
del contraste se ofrece en la siguiente tabla:

139
Eulogio Real Deus

Prueba binomial

Categoría N Proporción observada Prop. de prueba Sig. exacta (bilateral)


Grupo 1 Mujer 86 ,78 ,50 ,000
Indica ahora tu sexo Grupo 2 Hombre 24 ,22
Total 110 1,00
 

Nuestra muestra está muy descompensada en cuanto al género:


el 78% de los sujetos son mujeres, y sólo el 22% son jóvenes.
La diferencia entre la proporción de éxitos existente (.78) y la
planteada por la hipótesis nula (.50) es, por tanto, muy grande.
Por ello, la probabilidad de que nuestra muestra proceda de una
población con un reparto equilibrado por género es muy baja,
menor de .001 (p <.001), por lo que podemos rechazar la hipótesis
nula y concluir que nuestra muestra no procede de la población
general.

vv Contraste de hipótesis para variables politómicas. Cuando la


variable es categórica, pero contiene más de dos categorías, es
posible comprobar si el reparto de sujetos entre las distintas
categorías se corresponde con lo esperado. El contraste, en
este caso, es una prueba de bondad de ajuste, que compara las
frecuencias para cada categoría encontradas en los datos con
las frecuencias que teóricamente se esperaría que hubiese para
esas categorías. Veamos un ejemplo con la variable ordinal de
tendencia política, que ya conocemos. Nos planteamos si la
tendencia política de nuestros sujetos se ajusta a la encontrada
en los resultados de participación electoral, donde los partidos
de izquierda suelen obtener un 20% de los votos, los de izquierda
moderada un 30%, los de centro un 15%, y los de derecha moderada
un 35%. Para comprobar si las opciones políticas de los sujetos de
nuestra muestra siguen un patrón similar, seleccionamos en el
menú: Analizar → Pruebas no paramétricas → Cuadros de diálogo
antiguos → Chi-cuadrado. Aparecerá el siguiente cuadro de diálogo:

140
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Seleccionaré la variable ordinal Política como variable a contrastar,


y cambiaré la opción por defecto para los valores esperados,
para poder indicar las proporciones esperadas correspondientes
a cada una de las opciones políticas, a partir de los resultados
electorales. Estas proporciones deben ir en el mismo orden que
las categorías originales de la variable. El análisis me proporciona
una primera tabla de resultados donde puedo comparar las
frecuencias observadas en mis datos con las esperadas en función
de las proporciones que he especificado. Como puede apreciarse,
existen grandes diferencias entre lo observado y lo esperado,
especialmente en los extremos del espectro político, donde hay
una presencia mucho mayor de la esperada de sujetos de izquierda
(residuo positivo), y una presencia mucho menor de la esperada en
sujetos de derecha moderada (residuo negativo).
¿Qué opción política representa mejor tus ideas?

N observado N esperado Residual


Izquierda 36 22,0 14,0
Izquierda moderada 38 33,0 5,0
Centro 19 16,5 2,5
Derecha moderada 17 38,5 -21,5
Total 110

141
Eulogio Real Deus

La segunda tabla confirma la disparidad entre nuestros datos y


las frecuencias esperadas para la variable. El valor del estadístico
de contraste chi-cuadrado (χ2) aumenta a medida que aumentan
las discrepancias entre ambas frecuencias. En este caso, las
discrepancias son tan grandes que la hipótesis nula debe rechazarse
( p <.001), por lo que la afinidad política de nuestros sujetos no se
corresponde con la expresada en votos en las elecciones.

Estadísticos de contraste

¿Qué opción política representa mejor tus ideas?


Chi-cuadrado 22,052a
gl 3
Sig. asintót. ,000
a. 0 casillas (0,0%) tienen frecuencias esperadas menores que 5. La frecuencia de
casilla esperada mínima es 16,5.
Contraste
 
 
de hipótesis para tablas de contingencia. La prueba de
bondad de ajuste basada en chi-cuadrado también puede aplicarse
para el caso bivariado. En este contexto, el contraste compara la
distribución de las frecuencias empíricas en las casillas de la tabla
de contingencia correspondiente al cruce de estas dos variables,
con las frecuencias que debería contener la tabla de contingencia
si no hubiese ninguna relación entre ambas variables. Así pues,
la prueba se basa de nuevo en la comparación entre frecuencias
esperadas y observadas para comprobar una hipótesis de
independencia. Por ejemplo, podríamos estar interesados en saber
si el género de una persona es independiente o no de su orientación
religiosa. Para comprobarlo, realizamos un contraste de hipótesis
para la tabla de contingencia que cruza las categorías de género
con las de religiosidad. Seleccionamos en el menú: Analizar →
Estadísticos descriptivos → Tablas de contingencia. Aparecerá el
siguiente cuadro de diálogo:

142
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Colocamos una de las variables en las filas de la tabla, y la otra en


las columnas. Para realizar el contraste es necesario seleccionar,
en el botón Estadísticos, la opción Chi-cuadrado. También
es recomendable seleccionar, en el botón Casillas, la opción
Recuento esperado, para poder apreciar la discrepancia entre las
frecuencias empíricas (observadas) y las teóricas planteadas por la
hipótesis nula (esperadas). Se nos proporciona primero la tabla de
contingencia que cruza las categorías de ambas variables, donde
apreciamos una frecuencia de hombres no religiosos ligeramente
mayor de la esperada (23 frente a 20.3), y un efecto opuesto en
el caso de las mujeres: una frecuencia de mujeres religiosas
ligeramente superior a la esperada (16 frente a 13.3). Estos
resultados parecen indicar que los hombres tienden a declararse
no religiosos en mayor medida que las mujeres. Sin embargo,
si observamos las frecuencias detenidamente, vemos que tanto
hombres como mujeres se declararon mayoritariamente no
religiosos (23 frente a 1, en el caso de los hombres; 70 frente a 16,
en el caso de las mujeres), por lo que esta aparente diferencia en
función del género no lo es tanto.

143
Eulogio Real Deus

Tabla de contingencia Indica ahora tu sexo * ¿Te consideras una


persona religiosa?

¿Te consideras una persona Total


religiosa?
No Sí
Recuento 23 1 24
Hombre
Frecuencia esperada 20,3 3,7 24,0
Indica ahora tu sexo
Recuento 70 16 86
Mujer
Frecuencia esperada 72,7 13,3 86,0
Recuento 93 17 110
Total
Frecuencia esperada 93,0 17,0 110,0
 

En una segunda tabla se nos muestran los resultados del contraste,


donde podemos apreciar que la probabilidad de que las variables
sean independientes, tal y como plantea la hipótesis nula, es
muy baja (.084). No obstante, aunque baja, esta probabilidad no
es inferior a .05, por lo que tendríamos que aceptar la hipótesis
nula por falta de significación del contraste. No obstante, este
no es el valor que debemos mirar en esta tabla, sino el situado
inmediatamente debajo, y etiquetado como Corrección por
continuidad. Cuando la tabla de contingencia es para dos variables
dicotómicas, es necesario corregir el valor de chi-cuadrado para
evitar cometer un error Tipo I. Este valor es más conservador que
el anterior, por lo que su significación será mayor (.158), lo que nos
ratifica en nuestra decisión de aceptar la hipótesis nula. Así pues, el
resultado del contraste nos dice que no existe relación significativa
entre el género del sujeto y su religiosidad, por lo que ambas
variables son independientes una de la otra.

144
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Pruebas de chi-cuadrado

Valor gl Sig. asintótica (bilateral) Sig. exacta (bilateral) Sig. exacta (unilateral)
Chi-cuadrado de Pearson 2,994a 1 ,084
Corrección por continuidadb 1,991 1 ,158
Razón de verosimilitudes 3,764 1 ,052
Estadístico exacto de Fisher ,113 ,070
Asociación lineal por lineal 2,966 1 ,085
N de casos válidos 110
a. 1 casillas (25,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 3,71.
b. Calculado sólo para una tabla de 2x2.
 

vv Contraste de hipótesis para el coeficiente de correlación. También


es posible realizar un contraste de hipótesis paramétrico sobre el
valor poblacional del coeficiente de correlación. La hipótesis nula,
como ya hemos comentado, afirmará que el valor del coeficiente
en la población será nulo; esto es, que la correlación en la población
valdrá cero. El resultado de este contraste de hipótesis se muestra
siempre que pedimos un análisis de correlación en SPSS. Por
ejemplo, si pedimos la matriz de correlaciones entre las escalas de
Autoestima, Satisfacción con la vida y Neuroticismo, obtendremos
la siguiente tabla:
Correlaciones

satisfacción con la vida autoestima neuroticismo


Correlación de Pearson 1 ,506** -,278**
satisfacción con la vida Sig. (bilateral) ,000 ,003
N 110 110 110
Correlación de Pearson ,506** 1 -,559**
autoestima Sig. (bilateral) ,000 ,000
N 110 110 110
Correlación de Pearson -,278** -,559** 1
neuroticismo Sig. (bilateral) ,003 ,000
N 110 110 110
**. La correlación es significativa al nivel 0,01 (bilateral).
 

La diagonal de la matriz contiene las correlaciones de cada variable


consigo misma, por lo que su valor será 1. Como vemos, bajo cada
correlación se nos muestra su nivel de significación, proporcionada
por un estadístico de contraste basado en la t de Student. En
este caso, podemos apreciar que todas las correlaciones son
significativas, puesto que en todos los casos la probabilidad
mostrada es inferior a .05. Además, SPSS resalta estas correlaciones

145
Eulogio Real Deus

negativas añadiendo asteriscos a su derecha. Un asterisco indica


que la correlación es significativa al nivel .05, mientras que dos
asteriscos indican que la correlación es significativa al nivel .01, tal
y como se informa en la propia tabla.

2.10.5. Otros tipos de relaciones


En el apartado anterior hablamos de las relaciones entre variables de
escala, y de la posibilidad de analizarlas mediante el coeficiente de
correlación y la técnica del análisis de regresión, pero no hemos hablado
de los coeficientes y las técnicas existentes para analizar las relaciones
existentes entre variables categóricas, a las que se va a dedicar el presente
apartado. Comenzaremos con el caso bivariado, para pasar luego a
análisis multivariados más complejos.
En el apartado anterior, correspondiente al contraste de hipótesis,
ya hemos visto una prueba que permite saber si existe o no relación
significativa entre dos variables categóricas: la prueba chi-cuadrado para
tablas de contingencia. Efectivamente, chi-cuadrado realiza un contraste
cuya hipótesis nula plantea que las dos variables cuyas frecuencias se
cruzan en la tabla de contingencia son independientes. Por ello, en caso
de rechazo estaremos planteando que existen relaciones entre ambas
variables. Sin embargo, chi-cuadrado es únicamente un contraste de
hipótesis, por lo que no proporciona ningún índice que permita cuantificar
el grado de relación existente entre las variables. Además, chi-cuadrado
es un índice muy sensible al tamaño muestral (n), por lo que tiende a
resultar significativo cuando el tamaño muestral es muy grande. Por ello,
existen coeficientes basados en chi-cuadrado que son más adecuados
para cuantificar el grado y la dirección de las relaciones, así como someter
a contraste de hipótesis el valor obtenido sin verse afectadas por el
tamaño muestral, y que, además, pueden interpretarse de modo análogo
al coeficiente de correlación de Pearson.
Vamos a utilizar como ejemplo de relación bivariada entre variables
categóricas la existente entre la categoría laboral de una muestra de
sujetos y su sexo14. Tenemos una muestra de 474 sujetos (258 hombres y

14 Esta muestra se encuentra en uno de los ficheros de ejemplo de SPSS, que contiene los datos de

146
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

216 mujeres) pertenecientes a una empresa, y queremos saber si existe


relación entre el sexo de los sujetos y su categoría laboral (Administrativo,
Seguridad, o Directivo). Seleccionamos en el menú: Analizar → Estadísticos
descriptivos → Tablas de contingencia:

En el cuadro de diálogo hemos incluido las dos variables cuya relación


deseamos estudiar: la categoría laboral y el sexo. En el botón Casillas
podemos solicitar ver las frecuencias esperadas para la tabla, al igual
que hicimos cuando analizamos la relación entre sexo y religión en el
ejemplo del apartado anterior. En el botón Estadísticos vamos ahora a
solicitar más índices, además de chi-cuadrado. Seleccionaremos también
el coeficiente de contingencia, el coeficiente Phi, y la V de Cramer:

los empleados de una compañía ficticia: empleados.sav.

147
Eulogio Real Deus

El análisis nos proporcionará primero la tabla de contingencia


correspondiente, donde podemos apreciar que las mujeres están
mayoritariamente asociadas a puestos administrativos, mientras que
ninguna de ellas trabaja en seguridad, y sólo 10 son directivos. Los
hombres se encuentran repartidos por todas las categorías laborales,
pero son mayoría entre los directivos (74 de 84) y los únicos que trabajan
en seguridad (27 de 27). Así pues, los datos nos dicen que hay más mujeres
de las esperadas en puestos administrativos, y más hombres de los
esperados en puestos de seguridad y directivos, lo que parece indicar que
la categoría laboral y el sexo de los empleados están relacionados.

Tabla de contingencia Categoría laboral * Sexo

Sexo Total
Hombre Mujer
Recuento 157 206 363
Administrativo
Frecuencia esperada 197,6 165,4 363,0
Recuento 27 0 27
Categoría laboral Seguridad
Frecuencia esperada 14,7 12,3 27,0
Recuento 74 10 84
Directivo
Frecuencia esperada 45,7 38,3 84,0
Recuento 258 216 474
Total
Frecuencia esperada 258,0 216,0 474,0

148
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

La prueba chi-cuadrado nos confirma la significación de esta relación, por


lo que podemos rechazar la hipótesis nula de independencia entre ambas
variables, y afirmar que éstas están relacionadas, aunque no sabemos con
qué intensidad.

Pruebas de chi-cuadrado

Valor gl Sig. asintótica (bilateral)


Chi-cuadrado de Pearson 79,277a 2 ,000
Razón de verosimilitudes 95,463 2 ,000
N de casos válidos 474
a. 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima
esperada es 12,30.
 

Sin embargo, los coeficientes que se muestran en la tabla siguiente sí nos


permiten cuantificar el grado de relación que existe entre las variables.
Todos ellos oscilan entre 0 y 1 y se interpretan como una correlación. El
coeficiente Phi (ϕ) está basado en chi-cuadrado (ϕ= ( χ2/n) 1/2, donde n es
el tamaño muestral), y es más apropiado para dos variables dicotómicas,
por lo que nos fijaremos en los otros dos coeficientes. La V de Cramer
también está basada en chi-cuadrado (V= ( χ2/(n(k-1))) 1/2, donde k es el
valor más bajo entre el número de filas y el de columnas de la tabla). Su
valor es de .409, lo que viene a indicar una relación estrecha y significativa
(p <.001) entre ambas variables. Por su parte, el coeficiente de contingencia
(C ) también está basado en chi-cuadrado (C= ( χ2/( χ2+n)1/2 ), y su valor
(.379) es algo más bajo que el ofrecido por la V de Cramer, aunque
también es significativo ( p <.001). Así pues, queda confirmado que existe
una relación estrecha y significativa entre la categoría laboral de los
empleados y su sexo, de tal modo que las mujeres se asocian claramente
con la categoría administrativa, mientras que los hombres se asocian más
con las categorías directiva y de seguridad.

149
Eulogio Real Deus

Medidas simétricas

Valor Sig. aproximada


Phi ,409 ,000
Nominal por nominal V de Cramer ,409 ,000
Coeficiente de contingencia ,379 ,000
N de casos válidos 474
a. Asumiendo la hipótesis alternativa.
b. Empleando el error típico asintótico basado en la hipótesis nula.
 

Otro tipo de índices, más complejos, permiten abordar la relación


bivariada entre variables categóricas en forma predictiva. Es decir, se
plantean como una medida del grado en que mejora la clasificación del
sujeto en una de las variables (que actúa como dependiente) cuando se
conoce su clasificación en la otra (que actúa como independiente). Estos
índices se conocen como lambda (λy|x), tau de Goodman y Kruskal (τy|x),
y el coeficiente de incertidumbre. Si solicitamos estos estadísticos para
el ejemplo anterior obtenemos la tabla que se muestra a continuación.
Lambda se basa en la categoría más probable y, al igual que el coeficiente
de incertidumbre, tiene una versión simétrica y dos asimétricas. Como
vemos, todos los índices son significativos, pero los resultados varían
dependiendo del índice.
Medidas direccionales
Valor Error típ. T Sig.
asint.a aproximadab aproximada
Simétrica ,150 ,054 2,590 ,010
Categoría laboral c
Lambda ,000 ,000 . .c
dependiente
Sexo dependiente ,227 ,078 2,590 ,010
Categoría laboral
Nominal por Tau de Goodman y ,123 ,021 ,000d
dependiente
nominal Kruskal
Sexo dependiente ,167 ,024 ,000d
Simétrica ,148 ,022 6,237 ,000e
Coeficiente de Categoría laboral
,149 ,022 6,237 ,000e
incertidumbre dependiente
Sexo dependiente ,146 ,023 6,237 ,000e
a. Asumiendo la hipótesis alternativa.
b. Empleando el error típico asintótico basado en la hipótesis nula.
c. No se puede efectuar el cálculo porque el error típico asintótico es igual a cero.
d. Basado en la aproximación chi-cuadrado.
e. Probabilidad del chi-cuadrado de la razón de verosimilitudes.

150
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

En el caso de lambda, no resulta posible predecir la categoría profesional


a partir del sexo de los sujetos (debido a que se basa en la categoría más
probable, donde la predicción, en el caso de nuestros datos, no contiene
error), pero sí al revés. En el caso de tau, aunque ambas predicciones
son posibles, es mayor el poder predictivo si la variable dependiente es
el sexo. Finalmente, el coeficiente de incertidumbre no muestra grandes
diferencias entre ninguna de las tres medidas proporcionadas (simétrica
y asimétricas).

Para el caso de que ambas variables sean ordinales, podemos recurrir a


la correlación de Spearman, o también a otros índices que nos permiten
cuantificar este tipo de relaciones, como el coeficiente gamma (γ), la d
de Sommers, y los coeficientes tau-b (τb) y tau-c (τc ). Vamos a examinar
estos coeficientes haciendo uso de la misma base de datos de empleados
del ejemplo anterior. Ahora queremos ver si existe relación entre el nivel de
estudios y el nivel de ingresos de estos empleados, una vez establecidas las
categorías correspondientes a cada una de estas variables. Para efectuar
el análisis, seleccionamos en el menú: Analizar → Estadísticos descriptivos
→ Tablas de contingencia, y especificamos ambas variables para las filas
y columnas de la tabla. En el botón Estadísticos, seleccionaremos ahora
los correspondientes a relaciones entre variables ordinales, situados en
la parte derecha del cuadro de diálogo. La tabla de contingencia tiene el
siguiente aspecto:

Tabla de contingencia Nivel de ingresos * Nivel de estudios

Nivel de estudios Total


Primarios Medios Superiores
Recuento 29 95 19 143
Hasta 25000$
Frecuencia esperada 16,0 57,3 69,7 143,0
Recuento 24 94 142 260
25000$-50000$
Frecuencia esperada 29,1 104,2 126,7 260,0
Nivel de ingresos
Recuento 0 1 53 54
50000$-75000$
Frecuencia esperada 6,0 21,6 26,3 54,0
Recuento 0 0 17 17
Más de 75000$
Frecuencia esperada 1,9 6,8 8,3 17,0
Recuento 53 190 231 474
Total
Frecuencia esperada 53,0 190,0 231,0 474,0

151
Eulogio Real Deus

Podemos observar que ambas variables están relacionadas de forma


directa: a medida que aumenta el nivel de estudios, aumenta también
el de ingresos, de tal modo que en los niveles más altos de ingresos
prácticamente sólo hay sujetos con estudios superiores, mientras que en
los niveles medios-bajos son algo más de la mitad, y en los niveles más
bajos de ingresos son muy minoritarios, predominando aquí los sujetos
con estudios primarios y medios. Las siguientes tablas nos cuantifica la
relación ordinal existente entre ambas variables. La primera de ellas
muestra los valores de la d de Sommers que posee una versión simétrica
y dos asimétricas. Todas ellas muestran una relación directa, clara y
significativa entre ambas variables.

Medidas direccionales
Valor Error típ. T Sig.
asint.a aproximadab aproximada
Simétrica ,491 ,028 15,809 ,000
Nivel de ingresos
Ordinal por d de ,493 ,032 15,809 ,000
dependiente
ordinal Somers
Nivel de estudios
,490 ,026 15,809 ,000
dependiente
a. Asumiendo la hipótesis alternativa.
b. Empleando el error típico asintótico basado en la hipótesis nula.
 

La siguiente tabla muestra los valores de tau-b, tau-c y gamma. Al


igual que la d de Sommers, todos ellos muestran una relación directa y
moderadamente fuerte entre las dos variables. Las relaciones encontradas
son, en todos los casos, estadísticamente significativas.

Medidas simétricas

Valor Error típ. asint.a T aproximadab Sig. aproximada


Tau-b de Kendall ,491 ,028 15,809 ,000
Ordinal por ordinal Tau-c de Kendall ,436 ,028 15,809 ,000
Gamma ,777 ,035 15,809 ,000
N de casos válidos 474
a. Asumiendo la hipótesis alternativa.
b. Empleando el error típico asintótico basado en la hipótesis nula.
 

152
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Otro tipo de relaciones entre variables categóricas que puede interesarnos


estudiar son los índices de acuerdo. Estos índices nos permiten comparar
las clasificaciones hechas por dos jueces, y cuantificar el grado de acuerdo
existente entre ellas. Los índices de acuerdo se emplean a menudo en
estudios observacionales, para comprobar la consistencia entre los juicios
emitidos por distintos observadores sobre un mismo acontecimiento
o conducta. Un índice de acuerdo muy empleado es kappa (κ), que
cuantifica el grado de acuerdo entre las asignaciones hechas por dos
jueces a una serie de categorías. Kappa se calcula a partir de la proporción
de acuerdo encontrada entre jueces (πo), la proporción de acuerdo
esperable suponiendo independencia (πe), y la proporción de acuerdo
máximo posible, descartando el azar (1-πe). Así, κ = (πo- πe)/ (1-πe). Por
ejemplo, podríamos emplear kappa para ver si la asignación de sujetos a
distintos trastornos neuróticos hecha por dos psicólogos es coincidente
(Pardo, 2002):

Tabla de contingencia juez1 * juez2

juez2 Total
fóbica histérica obsesiva depresiva
Recuento 20 8 6 1 35
fóbica
Frecuencia esperada 5,3 10,1 11,7 7,9 35,0
Recuento 7 36 14 4 61
histérica
Frecuencia esperada 9,2 17,7 20,4 13,7 61,0
juez1
Recuento 1 8 43 7 59
obsesiva
Frecuencia esperada 8,9 17,1 19,8 13,3 59,0
Recuento 2 6 4 33 45
depresiva
Frecuencia esperada 6,8 13,1 15,1 10,1 45,0
Recuento 30 58 67 45 200
Total
Frecuencia esperada 30,0 58,0 67,0 45,0 200,0

La diagonal de esta tabla contendría los acuerdos entre ambos


profesionales, mientras que las frecuencias fuera de la misma
corresponderían a desacuerdos. El valor de kappa se muestra en la tabla
siguiente. El valor de kappa indica un grado de acuerdo moderado (.538),
y el valor obtenido es significativo. No obstante, dado que se trata de
un caso de diagnóstico de un problema mental, el grado de acuerdo
obtenido es claramente insuficiente, y revela un escaso grado de acuerdo
diagnóstico entre los dos profesionales.

153
Eulogio Real Deus

Medidas simétricas

Valor Error típ. asint.a T aproximadab Sig. aproximada


Medida de acuerdo Kappa ,538 ,046 12,921 ,000
N de casos válidos 200
a. Asumiendo la hipótesis alternativa.
b. Empleando el error típico asintótico basado en la hipótesis nula.

Hay un caso particular de relaciones entre variables categóricas, y es la


que se da entre variables dicotómicas, o binarias. Este tipo de variables
son muy comunes en Ciencias de la salud, y suelen emplearse para indicar
la presencia/ausencia de una característica dada en el sujeto. En muchos
casos se emplean variables de este tipo para indicar si el sujeto padece
un determinado problema mental o de salud. Para conocer más sobre la
prevención de este tipo de problemas es frecuente investigar sobre cuáles
pueden ser los factores de riesgo a la hora de padecerlo. Estos factores de
riesgo también serán dicotómicos.

Los índices de riesgo se basan en el concepto de ventaja y de razón de


ventaja. Una ventaja es la razón entre el número de casos favorables y
desfavorables para un grupo de riesgo determinado, de un modo similar
a cómo funcionan las apuestas: un valor de 1 indica idéntica ventaja para
ambos grupos, por lo que este resultado correspondería a la ausencia de
mayor riesgo para un grupo que para el otro. Por su parte, valores inferiores
a 1 indicarían un riesgo menor para el grupo correspondiente (por
ejemplo, un valor de 0.5 indicaría que ese grupo corre la mitad de riesgo de
padecer el problema que el otro grupo), mientras que valores superiores
a 1 indicarían un riesgo mayor (por ejemplo, un valor de 5 indicaría un
riesgo 5 veces superior para el grupo de riesgo correspondiente, frente al
otro grupo).

Supongamos que volvemos a emplear uno de los archivos de ejemplo


de SPSS15, en el que tenemos una muestra de 10000 pacientes, y hemos
registrado, entre otras cosas, si fuman (1) o no (2), y si tienen historial
de infarto de miocardio (1) o no (2). Al solicitar la tabla de contingencia
debemos colocar siempre al grupo de riesgo (en este caso, fumadores/

15 El archivo empleado es el llamado patient_los.sav.

154
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

no fumadores) en las filas, y la variable que indica la presencia o no del


problema en las columnas. La tabla de contingencia correspondiente
tendría este aspecto:

Tabla de contingencia Fuma * Historial de infarto de miocardio

Recuento
Historial de infarto de miocardio Total
Sí No
Sí 1593 682 2275
Fuma
No 3312 4413 7725
Total 4905 5095 10000

Se aprecia que entre los fumadores es más frecuente la presencia de


historial de infarto, mientras que entre los no fumadores ocurre lo
contrario, lo que vendría a indicar que, efectivamente, los primeros corren
más riesgo de infarto que los segundos. La tabla con los índices de riesgo
correspondiente nos proporcionaría la siguiente información:

Estimación de riesgo

Valor Intervalo de confianza al 95%


Inferior Superior
Razón de las ventajas para Fuma (Sí / No) 3,112 2,815 3,441
Para la cohorte Historial de infarto de miocardio = Sí 1,633 1,574 1,695
Para la cohorte Historial de infarto de miocardio = No ,525 ,491 ,560
N de casos válidos 10000

El primer dato nos muestra la razón de ventajas para ambas cohortes


(fumadores frente a no fumadores). El valor obtenido indica un riesgo
de padecer el problema tres veces mayor para la cohorte de fumadores
frente a la cohorte de no fumadores. A la derecha se nos proporciona
una estimación de los valores de esa razón de ventajas. Si el intervalo
no incluye el 1, entonces hay un riesgo significativamente mayor para
el grupo de riesgo, para un nivel de significación de .05. Como puede
apreciarse, el riesgo está entre 2.815 y 3.441, por lo que el intervalo no
incluye el 1, y se confirma un riesgo significativamente mayor para los
fumadores. Los dos datos siguientes muestran una estimación del riesgo

155
Eulogio Real Deus

por separado para cada cohorte. En el caso de los fumadores, el riesgo es,
de nuevo, significativamente mayor de 1, mientras que en el caso de los
no fumadores ocurre lo contrario, siendo su ventaja significativamente
menor de 1.

Es posible aumentar la complejidad de nuestro diseño añadiendo


una variable de interacción al mismo. Esto permitiría comprobar la
existencia de ventajas entre los grupos de riesgo a la hora de padecer el
problema, controlando el efecto de una tercera variable. Por ejemplo, en
el caso anterior, una vez establecido que, efectivamente, el riesgo de tener
historial de infarto era mayor para la cohorte de fumadores que para la
de no fumadores, podría interesarnos comprobar si este efecto varía en
función del sexo de los pacientes. Para ello, repetimos el procedimiento
de tablas de contingencia, pero incluyendo ahora la variable sexo como
variable de capa, lo que indica a SPSS que queremos comprobar el efecto
de interacción de esta variable en la relación entre las otras dos:

Una vez especificadas las variables, en el botón Estadísticos, solicitamos


los estadísticos de Cochran y de Mantel-Haenszel. Aparecerá la tabla de
contingencia, que ahora separa los resultados por sexo. La tabla muestra
una ventaja similar para la cohorte no fumadora en ambos sexos (para
hombres: 1662/2230= 0.75; para mujeres: 1650/2183= 0.76), pero mayor
para la cohorte fumadora cuando los sujetos son mujeres (823/315= 2.61)
que cuando son hombres (770/367= 2.11).

156
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Tabla de contingencia Fuma * Historial de infarto de miocardio *


Género
Recuento
Género Historial de infarto de miocardio Total
Sí No
Sí 770 367 1137
Fuma
Hombre No 1662 2230 3892
Total 2432 2597 5029
Sí 823 315 1138
Fuma
Mujer No 1650 2183 3833
Total 2473 2498 4971
Sí 1593 682 2275
Fuma
Total No 3312 4413 7725
Total 4905 5095 10000

La siguiente tabla muestra el contraste que comprueba la homogeneidad


de la razón de ventajas; es decir, que no existe un efecto de interacción
entre sexo, tabaquismo e historial de infarto. Ambos estadísticos, basados
en chi-cuadrado, resultan ser significativos, lo que indica que sí existe esta
interacción, por lo que el riesgo que representa el tabaquismo para tener
un historial de infarto no se da por igual para hombres que para mujeres.

Pruebas de homogeneidad de la razón de las ventajas

Chi-cuadrado gl Sig. asintótica (bilateral)


Breslow-Day 4,006 1 ,045
De Tarone 4,006 1 ,045
 

A continuación se nos proporciona otra tabla que comprueba la existencia


de un efecto del tabaquismo sobre el historial de infarto, controlando
el efecto del sexo. El hecho de que ambos estadísticos, Cochran y
Mantel-Haenszel sean altamente significativos indica que existe un
efecto del tabaquismo sobre el historial de infarto, y que este efecto es
independiente del sexo del paciente. Si tenemos en cuenta el resultado
anterior, concluiríamos que existe un efecto significativo del tabaquismo,
que se da tanto para hombres como para mujeres, pero que afecta en
mayor medida a estas últimas.

157
Eulogio Real Deus

Pruebas de independencia condicional

Chi- gl Sig. asintótica (bilateral)


cuadrado
De Cochran 518,187 1 ,000
Mantel-Haenszel 516,998 1 ,000
Bajo el supuesto de independencia condicional, el estadístico de Cochran se distribuye
asintóticamente según una distribución de chi-cuadrado con 1 gl, sólo si el número de estratos es
fijo, mientras que el estadístico de Mantel-Haenszel se distribuye siempre asintóticamente según
una distribución de chi-cuadrado con 1 gl. Tenga presente que se suprime la corrección por
continuidad del estadístico de Mantel-Haenszel cuando la suma de las diferencias entre lo
observado y lo esperado es igual a 0.

Por último, se nos da una estimación de la ventaja asociada a la cohorte


de fumadores frente a la de no fumadores. Al igual que en el análisis
anterior, se estima que el riesgo de tener un historial de infarto es algo
más del triple para los fumadores que para los no fumadores. Dado que
el verdadero valor de esta ventaja se estima que estará entre 2.815 y 3.441
con un nivel de significación del 5% (α = 0.05), podemos concluir que esta
ventaja es significativamente superior a 1.

Estimación de la razón de las ventajas común de Mantel-Haenszel

Estimación 3,112
ln(estimación) 1,135
Error típ. de ln(estimación) ,051
Sig. asintótica (bilateral) ,000
Límite inferior 2,815
Razón de ventajas común
Límite superior 3,441
Intervalo de confianza asintótico al 95%
Límite inferior 1,035
ln(Razón de ventajas común)
Límite superior 1,236
La estimación de la razón de las ventajas común de Mantel-Haenszel se distribuye de manera
asintóticamente normal bajo el supuesto de razón de las ventajas común igual a 1,000. Lo mismo
ocurre con el log natural de la estimación.
 
Este tipo de comparaciones entre variables dicotómicas también se
pueden hacer para datos relacionados, como es el caso de los diseños de
investigación con pretest y posttest. En este caso, se pretende comprobar
si la proporción de éxitos es la misma en ambas variables. El estadístico
empleado en estos casos es la prueba de McNemar. Para el caso de más
de una medida relacionada, puede emplearse el estadístico de Cochran.

158
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

2.10.6. Relaciones entre variables categóricas y de escala


En apartados anteriores vimos cómo el modelo de regresión permite
establecer relaciones predictivas entre una variable dependiente y una
o varias variables independientes, elaborando un modelo que permita
explicar la mayor cantidad posible de la varianza contenida en la variable
dependiente. Por otro lado, al hablar de los contrastes de hipótesis para dos
muestras independientes o relacionadas, también vimos cómo pueden
emplearse estos contrastes para comprobar si existen diferencias entre
grupos en cuanto a su puntuación media en una variable. En este contexto,
estamos planteando que existe un efecto de una variable independiente
de tipo categórico (el grupo) sobre una variable dependiente de escala, en
la cual esperamos encontrar medias significativamente diferentes para
los dos grupos.

El análisis de varianza (ANOVA) está relacionado con los planteamientos


anteriores. Al igual que el modelo de regresión, nos permite observar
el efecto de una o varias variables independientes sobre una variable
dependiente, con la salvedad de que aquí las variables independientes
son categóricas, aunque también es posible incluir variables de escala
(o, en terminología del análisis de varianza, covariables), empleando el
llamado análisis de covarianza (ANCOVA). Además, puede aumentarse
la complejidad del análisis incluyendo más de una variable dependiente
(análisis multivariado de la varianza – MANOVA, o análisis multivariado
de la covarianza–MANCOVA). El análisis de varianza, de hecho, parte
del mismo modelo de origen que la regresión múltiple, el conocido
como modelo lineal general, que plantea que el resultado obtenido por
un sujeto en una variable dependiente Y depende de una combinación
lineal de efectos producidos por una serie de variables independientes
(X1, X2,…), más un efecto constante (a), más un término de error (e).
La diferencia estriba en que ahora las variables independientes son
categóricas. Formalmente:

159
Eulogio Real Deus

Por otro lado, el análisis de varianza es una prueba estadística que nos
permite comprobar una hipótesis de igualdad de medias entre grupos,
a partir de la descomposición de la varianza de la variable dependiente
en dos partes: una parte debida a las diferencias existentes entre los
grupos (varianza intergrupos), y otra parte debida a las fluctuaciones
aleatorias existentes dentro de los grupos (varianza intragrupos). Dado
que la primera de las varianzas se debe a las diferencias entre grupos,
corresponde al efecto de la variable independiente, mientras que la
segunda se considerará como varianza de error. Además, al considerar los
grupos generados por la variable independiente, podremos considerar
dos casos diferentes: cuando el efecto de la variable independiente da
lugar a diferencias entre las medidas obtenidas por grupos diferentes
en un mismo momento (muestras independientes), o cuando su efecto
da lugar a diferencias entre las medidas obtenidas por un mismo grupo
en diferentes momentos (muestras relacionadas). También es posible
combinar ambas situaciones en los llamados modelos mixtos, donde al
menos una variable independiente ha dado lugar a diferentes grupos
independientes en la muestra (efecto intergrupo), y al menos otra ha
dado lugar a diferencias entre distintas medidas relacionadas tomadas
en un mismo grupo (efecto intragrupo).

Así pues, como podemos ver, el análisis de varianza es una técnica que nos
permite comprobar el efecto de una o varias variables independientes
categóricas (que dan lugar a una serie de grupos, independientes o
relacionados) sobre una o varias variables dependientes de escala,
con la posibilidad añadida de incluir también en el modelo variables
independientes de escala. Si la variable independiente es de escala, se la
denomina covariable, mientras que si es categórica, se la denomina factor.
Por su parte, a cada una de las categorías de la variable independiente o
factor se las denomina niveles. Por ejemplo, el sexo sería un factor con
dos niveles: hombre y mujer. Dependiendo del número de variables
independientes categóricas incluidas en el análisis hablaremos de análisis
de varianza de un factor, de dos factores, etc.

Debido a la sencillez y aplicabilidad del modelo lineal general, y a la gran


cantidad de opciones y posibilidades disponibles, el análisis de varianza
es una de las técnicas más utilizadas en Ciencias Sociales y de la Salud,

160
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

pero también es una de las más complejas. Por ello, la ilustraremos


empleando un par de ejemplos de diseños sencillos y habituales en
la investigación (Lubin, Maciá, & Rubio, 2005). Estos ejemplos serán
experimentos hipotéticos, dado que existe una íntima relación entre los
fundamentos del análisis de varianza y el diseño de experimentos (Winer,
Brown, & Michels, 1991; Kirk, 1995). Aunque esta técnica puede aplicarse
en el contexto de una investigación correlacional, sus fundamentos se
entienden mejor en un contexto experimental, donde se garantiza en
mayor medida el cumplimiento de los supuestos de la técnica:

1. Independencia. El análisis de varianza asume que los sujetos


han sido seleccionados aleatoriamente de la población y/o han
asignados también aleatoriamente a los distintos grupos. Es
decir, la puntuación obtenida por un sujeto determinado es
independiente de las obtenidas por el resto de sujetos.

2. Normalidad. Se asume que las poblaciones de referencia de la


que se han extraído las diferentes muestras son normales, y la
distribución de los errores también será normal. Afortunadamente,
el análisis de varianza es una técnica que se ha probado robusta
frente a la violación de este supuesto.

3. Homocedasticidad. Finalmente, se asume que la varianza de las


poblaciones de referencia es la misma para todas estas poblaciones.
Este supuesto de homocedasticidad, u homogeneidad de
varianzas es similar al que ya vimos para el caso de la prueba T
para muestras independientes, y también en este caso el análisis
de varianza se ha mostrado como una técnica robusta frente a este
tipo de violaciones.

Nuestro primer ejemplo trata de un experimento de aprendizaje con


ratas. Queremos saber si el número de días que pasan privadas de comida
influye en la capacidad de las ratas para encontrar una recompensa en
un laberinto. Por otro lado, sospechamos que existen diferencias entre
distintas cepas de ratas en cuanto a esta capacidad. Para comprobar
el efecto de ambas variables (grado de privación de comida y cepa),
tomamos una muestra aleatoria de 12 ratas de una cepa (raza A) y otras 12

161
Eulogio Real Deus

ratas de otra cepa (raza B), dividimos cada muestra en 3 grupos aleatorios
de 4 ratas cada uno, a los que someteremos a distintos grados de privación
de comida (1 día, 2 días o 3 días). Todas las ratas son sometidas a la misma
tarea del laberinto, y se registra el tiempo que tardan en completar dicha
tarea. Los resultados obtenidos fueron los siguientes:

Rata Cepa Días de privación Tiempo empleado en recorrer el laberinto


1 Raza A 1 7
2 Raza A 1 8
3 Raza A 1 9
4 Raza A 1 4
5 Raza A 2 6
6 Raza A 2 7
7 Raza A 2 8
8 Raza A 2 5
9 Raza A 3 13
10 Raza A 3 15
11 Raza A 3 16
12 Raza A 3 18
13 Raza B 1 6
14 Raza B 1 5
15 Raza B 1 4
16 Raza B 1 3
17 Raza B 2 5
18 Raza B 2 4
19 Raza B 2 3
20 Raza B 2 2
21 Raza B 3 9
22 Raza B 3 10
23 Raza B 3 11
24 Raza B 3 12

162
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Nuestro archivo de datos contendrá tres variables. Las dos primeras son
nuestras variables independientes o factores: la cepa, con dos niveles
((1) raza A y (2) raza B), y el número de días de privación de alimento ((1)
1 día; (2) 2 días; (3) 3 días). La tercera variable, sobre la que planteamos
que las dos anteriores tienen efecto, es el tiempo invertido en la tarea
de aprendizaje y que, por tanto, será nuestra variable dependiente.
Dado que sólo tenemos una variable dependiente, nuestro análisis
será univariante; en caso de que nos planteásemos que el efecto de las
variables independientes se da sobre más de una variable dependiente
(por ejemplo, nos planteamos que las variables independientes afectan
no sólo al tiempo, sino también al número de errores cometidos en la
tarea), nuestro modelo sería multivariante. Para llevar a cabo el análisis,
seleccionamos en el menú: Analizar → Modelo lineal general → Univariante.
Aparecerá el siguiente cuadro de diálogo:

En el cuadro podemos especificar nuestra variable dependiente (tiempo),


así como los factores o variables independientes (raza y días). Como
podemos ver, una de las variables (raza) aparece como un factor fijo, y la
otra (días) como un factor aleatorio. Cuando un factor es fijo, se considera
que contiene un número fijo de niveles (sólo existen dos cepas), o bien el
investigador sólo está interesado en esos niveles (sólo nos interesan las
cepas A y B). En cambio, cuando un factor es aleatorio, los niveles de ese

163
Eulogio Real Deus

factor son sólo una muestra de la población de niveles posible (también se


podría haber sometido a privación a las ratas durante 4 días, o 5 días, etc.).
Cuando un factor es fijo, la hipótesis nula del contraste planteará que la
media de los distintos grupos en la variable dependiente será la misma
(en el caso de nuestros datos, que el tiempo medio invertido por las ratas
de ambas razas será el mismo). Cuando un factor es aleatorio, la hipótesis
nula del contraste plantea que la media en la variable dependiente será la
misma independientemente de los niveles del factor que consideremos;
dicho de otro modo, la hipótesis nula plantea que la varianza de todas
estas medias será cero.

En caso de que queramos hacer un análisis de covarianza (ANCOVA); es


decir, que nos planteemos también el efecto de una variable independiente
de escala (por ejemplo, la edad de la rata), podemos incluirla en la casilla
covariables. Por último, la casilla ponderación MCP nos permite cambiar
los pesos de los sujetos en el análisis (por defecto, todos los sujetos tienen
el mismo peso: 1).

A la derecha del cuadro de diálogo aparecen una serie de botones que nos
permiten modificar las opciones del análisis. El botón Modelo nos permite
especificar los efectos que deseamos comprobar. Por defecto, el análisis
asume que queremos un modelo factorial completo, lo que implica que
deseamos comprobar todos los efectos posibles del modelo. Existen dos
tipos de efectos. Los llamados efectos principales son los debidos a cada
uno de los factores incluidos como variables independientes, mientras
que los efectos de interacción son los debidos a la combinación entre los
niveles de dos o más variables. En el caso de nuestros datos, el modelo
factorial completo incluirá 3 efectos: 2 efectos principales (raza y días de
privación), y un efecto de interacción (raza x días de privación).

El botón Contrastes nos permite realizar comparaciones a priori entre


los niveles de los factores. Por defecto, el análisis realiza un contraste de
desviación, en el que todos los niveles del factor, excepto el último, se
comparan con la media total en la variable dependiente.

El botón Gráficos nos permite representar gráficamente las medias de los


distintos grupos en la variable dependiente, y resulta especialmente útil

164
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

para visualizar los efectos de interacción. Por ejemplo, para ver el tiempo
medio empleado por cada cepa en cada nivel de privación de comida,
podemos solicitar un gráfico que muestre los dos niveles de raza en el eje
horizontal, y una línea por nivel de la variable días de privación de comida:

El botón Post hoc nos permite realizar comparaciones a posteriori


entre los niveles de un factor de efectos fijos, cuando existen más de
dos niveles; estas comparaciones someten a contraste la existencia de
diferencias significativas entre todos los pares de niveles posibles, y nos
permiten saber entre qué niveles existen diferencias significativas. Dado
que nuestro factor de efectos fijos (raza) sólo tiene dos niveles, no será
necesario realizar comparaciones a posteriori, puesto que si se encuentran
diferencias significativas, serán entre los dos niveles existentes.

El botón Guardar tiene una utilidad similar a su equivalente en el análisis


de regresión: nos permite guardar tanto los valores pronosticados por el
modelo para la variable dependiente (es decir, los pronósticos: Y’ ) como
los residuos (es decir, la porción de la variable dependiente no explicada
por el modelo: Y-Y’ ).

Finalmente, el botón Opciones nos permite solicitar información adicional


en el análisis. Nos muestra el siguiente cuadro de diálogo:

165
Eulogio Real Deus

En la parte superior del cuadro de diálogo podemos solicitar que se nos


muestre la media general, las medias para cada uno de los niveles de las
variables independientes, así como las medias de las combinaciones de
niveles de las dos variables independientes. Estas medias nos permitirán
comprobar, en caso de encontrar un efecto determinado, cómo el efecto
se refleja en las medias obtenidas en la variable dependiente. En la parte
inferior del cuadro de diálogo podemos solicitar información adicional.
Entre las opciones más interesantes podemos marcar las siguientes:

vv Estimaciones del tamaño del efecto. Nos permiten estimar la


importancia de un efecto determinado, y se calculan como la razón
entre la varianza de Y debida a ese efecto, y la varianza total de Y.
Dicho de otro modo, nos indican la proporción de la varianza de la
variable dependiente debida al efecto que estamos considerando,
por lo que se interpretan de forma análoga al coeficiente de
determinación del modelo de regresión lineal.

vv Potencia observada. Nos permite evaluar la capacidad del contraste


para detectar efectos. Como vimos en el apartado sobre contrastes
de hipótesis, la potencia de un contraste es la probabilidad de

166
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

no cometer un error tipo II (aceptar la hipótesis nula cuando


en realidad es falsa), por lo que indica mayor sensibilidad del
contraste cuanto mayor sea la probabilidad asociada.

vv Pruebas de homogeneidad. Permiten comprobar el supuesto de


homogeneidad de varianzas del análisis. Aunque, como ya se ha
comentado, el análisis de varianza es una técnica muy robusta
frente a las violaciones de los supuestos, es importante comprobar
si nuestros datos cumplen los mismos.

Comentamos a continuación las principales tablas de resultados que nos


proporciona el análisis de varianza. La primera de ellas nos muestra los
factores junto con sus niveles (2 en el caso de la cepa, y 3 en el caso de los
días de privación de alimento). Dado que cada rata sólo pertenece a una
cepa y sólo pasa por un nivel de privación, los grupos son independientes,
y los factores, por tanto, serán inter-sujetos.

Factores inter-sujetos

Etiqueta del valor N


1 Raza A 12
Raza
2 Raza B 12
1 8
Días de deprivación 2 8
3 8

La siguiente tabla nos permite comprobar la hipótesis de homogeneidad


de varianzas (homocedasticidad), mediante la prueba de Levene. Dado
que el estadístico de contraste no es significativo, concluiremos que
podemos asumir igualdad de varianzas para nuestro modelo, por lo que
no estaríamos violando este supuesto.

167
Eulogio Real Deus

Contraste de Levene sobre la igualdad de las varianzas errora

Variable dependiente: Tiempo


F gl1 gl2 Sig.
,369 5 18 ,863
Contrasta la hipótesis nula de que la varianza error de la variable dependiente es igual a lo
largo de todos los grupos.
a. Diseño: Intersección + raza + dias + raza * dias
 

La siguiente tabla permite comprobar la significación e importancia de


los efectos planteados en el modelo, o lo que es lo mismo, la existencia
de diferencias significativas entre grupos. El modelo contiene cuatro
efectos: un efecto general, que es constante para todos los grupos
(Intersección) y que, por tanto, no es generalmente de interés para
nosotros; dos efectos principales de los dos factores considerados (raza
y días), y un efecto de interacción entre los niveles de estos dos factores
(raza x días). El estadístico de contraste F se obtiene como la razón entre
la media cuadrática correspondiente al efecto (Hipótesis) y la media
cuadrática correspondiente al error. A su vez, ambas medias cuadráticas
se obtienen a partir de sendas sumas de cuadrados para cada uno de los
componentes de la varianza (hipótesis y error), ponderados por sus grados
de libertad. Podemos observar que en el caso de los efectos principales, la
probabilidad asociada al estadístico de contraste es menor de .05, por lo
que podríamos rechazar la hipótesis nula y concluir que ambos factores
tienen un efecto sobre el tiempo invertido por las ratas en la tarea. En el
caso de la interacción, sin embargo, la significación es mayor de .05, por lo
que concluiríamos que no se da un efecto combinado de ambos factores
sobre el tiempo de ejecución de la tarea. La columna etiquetada como Eta
al cuadrado parcial nos proporciona una indicación del tamaño del efecto
para cada componente del modelo, donde podemos comprobar que
este efecto es muy grande para el caso de los dos factores considerados.
Finalmente, en la última columna se nos muestra la potencia del
contraste, donde podemos apreciar que ésta es especialmente pequeña
para el caso de la interacción, lo que podría indicar que no hemos sido
capaces de detectar este efecto por falta de sensibilidad del contraste para
el mismo. Una forma sencilla de incrementar la potencia para remediar
este problema podría ser incrementar el tamaño de nuestra muestra.

168
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Pruebas de los efectos inter-sujetos

Variable dependiente: Tiempo


Origen Suma de gl Media F Sig. Eta al Parámetro de no Potencia
cuadrados tipo cuadrática cuadrado centralidad observadad
III parcial Parámetro
Hipótesis 1504,167 1 1504,167 9,632 ,090 ,828 9,632 ,406
Intersección
Error 312,333 2 156,167a
Hipótesis 73,500 1 73,500 21,000 ,044 ,913 21,000 ,659
raza
Error 7,000 2 3,500b
Hipótesis 312,333 2 156,167 44,619 ,022 ,978 89,238 ,898
dias
Error 7,000 2 3,500b
Hipótesis 7,000 2 3,500 1,340 ,287 ,130 2,681 ,252
raza * dias
Error 47,000 18 2,611c
a. MS(dias)
b. MS(raza * dias)
c. MS(Error)
d. Calculado con alfa = ,05

Las tablas de medias marginales nos permitirán interpretar los efectos


principales encontrados en la tabla anterior. En el caso del factor raza,
la tabla de medias correspondiente nos indica que las ratas de la raza A
invierten significativamente más tiempo que las ratas de la raza B (9.67
frente a 6.17):

1. Raza

Variable dependiente: Tiempo


Raza Media Error típ. Intervalo de confianza 95%
Límite inferior Límite superior
Raza A 9,667 ,466 8,687 10,647
Raza B 6,167 ,466 5,187 7,147

En el caso del factor días, podemos observar que el mejor tiempo se da


tras dos días de privación (5), y el peor, tras tres días (13):

2. Días de deprivación
Variable dependiente: Tiempo
Días de deprivación Media Error típ. Intervalo de confianza 95%
Límite inferior Límite superior
1 5,750 ,571 4,550 6,950
2 5,000 ,571 3,800 6,200
3 13,000 ,571 11,800 14,200

169
Eulogio Real Deus

sí pues, el tiempo invertido se ve afectado por dos factores: (a) la cepa de la


rata, con peores resultados para las ratas de la cepa A, y (b) el número de
días de privación, con peores resultados tras tres días. El gráfico solicitado
previamente nos permite apreciar por qué el efecto de interacción no
resultó significativo. En primer lugar, los resultados de las ratas de la cepa A
son siempre peores que los de la cepa B, independientemente del número
de días de privación de alimento. En segundo lugar, el resultado siempre
es mejor cuando han transcurrido dos días de privación de alimento, y
peor cuando han transcurrido tres, independientemente de la cepa que
consideremos. Esta falta de interacción se aprecia visualmente en que las
líneas correspondientes a los tres niveles de privación son casi paralelas,
lo que implica que las diferencias entre estos niveles son constantes
para ambas cepas, así como que las diferencias entre cepas también son
constantes para cada uno de esos mismos niveles. No obstante, se aprecia
una ligera tendencia a que la desventaja de la cepa A tiende a aumentar
conforme aumenta el número de días de privación (la pendiente de las
rectas es cada vez más empinada). Es posible que hubiésemos encontrado
este efecto de haber dispuesto de mayor potencia para el contraste.

Nuestro segundo ejemplo está relacionado con la ansiedad y el


rendimiento en tareas que exigen distintos niveles de creatividad. La ley
de Yerkes-Dodson (Yerkes & Dodson, 1908) establece que el rendimiento
en tareas es mejor con niveles intermedios de activación, y que disminuye

170
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

con niveles bajos y altos de la misma; es decir, que existe un nivel óptimo de
activación, por debajo y por encima del cual el rendimiento decae. Por otro
lado, se plantea que este rendimiento tampoco será igual dependiendo
del nivel de creatividad exigido por la tarea. Para comprobar la existencia
de tales efectos, así como su interacción, se aplica una prueba de ansiedad
a una muestra de sujetos, y los resultados se clasifican en 3 niveles (bajo,
medio y alto), dependiendo del grado de ansiedad diagnosticado por la
prueba. A continuación, se seleccionan al azar 4 sujetos de cada uno de
estos 3 niveles, y se les pide que completen 3 tareas que requieren distintos
niveles de creatividad (baja, media y alta). Los resultados obtenidos por
los sujetos de los 3 grupos en las 3 pruebas fueron los siguientes:

Creatividad Creatividad Creatividad


Sujeto Ansiedad
baja media alta
1 Baja 4 4 5
2 Baja 5 2 4
3 Baja 4 3 3
4 Baja 2 4 5
5 Media 8 10 8
6 Media 9 10 9
7 Media 7 9 9
8 Media 8 10 10
9 Alta 6 3 5
10 Alta 5 4 6
11 Alta 4 2 5
12 Alta 4 2 4

Nuestro archivo de datos contendrá 4 variables. La primera corresponde


a uno de nuestros factores (ansiedad), con tres niveles ((1) baja; (2)
media; (3) alta), y las otras 3 contienen los resultados del sujeto con
cada una de las tres pruebas. Tenemos, por tanto, 3 medidas diferentes
de rendimiento, cada una de las cuales corresponde a un nivel diferente
del factor creatividad ((1) baja; (2) media; (3) alta). En el caso del factor
ansiedad, cada sujeto pertenece a un nivel diferente del mismo, por lo que

171
Eulogio Real Deus

los grupos generados por este factor son independientes; dicho de otra
forma, se trata de un factor inter-grupo. Sin embargo, en el caso del factor
creatividad, cada sujeto pasa por todos los niveles del factor (es decir,
cada sujeto completa las pruebas correspondientes a cada uno de los
diferentes niveles de creatividad). En este caso, los grupos generados no
son independientes, sino que están relacionados: se trata de los mismos
12 sujetos evaluados en tres condiciones diferentes. El factor creatividad,
por tanto, no es un factor inter-grupos, sino un factor intra-grupo; es decir,
las diferencias entre los niveles del factor se dan para un mismo grupo.

Así pues, en este contraste, uno de los efectos es inter-grupos, mientras


que el otro es intra-grupos, por lo que nos encontramos ante un modelo
mixto. Cuando nuestro modelo incluye al menos un factor intra-grupo,
debemos emplear un modelo de análisis de la varianza diferente. Para
acceder al mismo, seleccionamos en el menú: Analizar → Modelo lineal
general → Medidas repetidas. Aparecerá el siguiente cuadro de diálogo:

En este cuadro de diálogo debemos especificar todos los factores intra-


sujetos que vamos a incluir en nuestro modelo. Nosotros hemos incluido el
factor creatividad, con 3 niveles. El botón Definir nos permitirá especificar
el resto de variables del modelo en el siguiente cuadro de diálogo:

172
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Al haber especificado previamente un factor intra-sujetos con 3 niveles,


este cuadro de diálogo nos solicitará automáticamente las 3 variables
que contienen las puntuaciones relacionadas que, en nuestro caso
son las variables c 1, c 2 y c 3. Adicionalmente, hemos añadido el factor
ansiedad como factor inter-sujetos. A continuación, haremos algunas
especificaciones adicionales. En primer lugar, y al igual que en el caso
anterior, solicitaremos un gráfico que nos permita comparar las medias
en rendimiento de forma combinada en función del nivel de ansiedad y
del nivel de creatividad:

173
Eulogio Real Deus

En segundo lugar, en el botón etiquetado Post-hoc solicitaremos


comparaciones múltiples entre los niveles del factor inter-sujetos
(ansiedad), lo que nos permitirá saber entre qué niveles se dan diferencias
significativas en rendimiento. En la parte inferior se nos permite elegir
entre distintos estadísticos, algunos adecuados para el caso de que
se cumpla el supuesto de homogeneidad de varianzas, y otros más
apropiados para aquellos casos en que se violen dichos supuestos. Uno
de los estadísticos más empleados para este tipo de comparaciones es
el de Tukey, pero también se utiliza a menudo el estadístico de Scheffé,
que resulta más conservador (es decir, es menos propenso a encontrar
diferencias significativas). Otro procedimiento muy utilizado y sencillo
es el de Bonferroni, que consiste en reducir el nivel de significación α en
función del número de comparaciones k a realizar (α= α/k).

Las comparaciones post-hoc no son posibles en el caso de los factores


intra-sujetos, pero es posible comparar los niveles de estos factores dos
a dos mediante la comparación de los efectos principales de este factor.
Para llevar a cabo esta comprobación, debemos ir al botón Opciones
y, una vez solicitadas las medias para los dos efectos principales y su
interacción, seleccionaremos el botón Comparar los efectos principales.
En cuanto al ajuste de los errores en el intervalo de confianza, dejaremos
activa la opción por defecto (DMS), que no realiza ningún ajuste.

174
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

También realizaremos algunas especificaciones más en este cuadro


de diálogo. Al igual que en el caso anterior, también solicitaremos las
estimaciones del tamaño del efecto, la potencia observada, y las pruebas
de homogeneidad de varianzas.

Las tablas de resultados que nos proporcionará SPSS en este caso son más
numerosas que en el caso anterior. En el caso del factor intra-sujetos, a
la izquierda, tenemos 3 medidas de rendimiento con diferentes niveles
de creatividad. En el caso del factor inter-sujetos, a la derecha, tenemos 3
grupos independientes con 3 niveles de ansiedad.

    Factores intra-sujetos Factores inter-sujetos


   
Medida:Medida: creatividad
creatividad    
creatividad VariableVariable
creatividad dependiente
dependiente Etiqueta del valor del
Etiqueta N valor N
1 1 c1 c1 1 Baja 1 Baja 4 4
2 2 c2 c2 Nivel de Nivel
ansiedad 2 Media 2 Media
de ansiedad 4 4
3 3 c3 c3 3 Alta 4
 

 
 
3 Alta 4
 
 

 
   

175
Eulogio Real Deus

La siguiente tabla nos permite comprobar el supuesto de igualdad de


varianzas, esta vez mediante la prueba M de Box. Dado que el resultado
no es significativo, podemos aceptar la hipótesis de homogeneidad de
varianzas, por lo que nuestro contraste no viola este supuesto.

Prueba de Box sobre la igualdad de las matrices de covarianzasa

M de Box 11,485
F ,467
gl1 12
gl2 392,538
Sig. ,933
Contrasta la hipótesis nula de que las matrices de covarianza observadas de las variables
dependientes son iguales en todos los grupos.
a. Diseño: Intersección + ansiedad
Diseño intra-sujetos: creatividad

Diseño intra-sujetos: creatividadLa siguiente tabla nos muestra


los contrastes multivariados para aquellos efectos en los que está
involucrada la variable intra-sujetos; es decir, el efecto principal
creatividad, y la interacción entre creatividad x ansiedad. Los contrastes
multivariados son más conservadores que los univariados, y no requieren
del cumplimiento del supuesto de circularidad o esfericidad16, por lo que
son más adecuados cuando se ha violado este supuesto, mientras que
los contrastes univariados tienen mayor potencia y son preferibles en
aquellas ocasiones en que el supuesto no se ha violado. Podemos apreciar
que todos los índices multivariados (Traza de Pillai, Lambda de Wilks,
Traza de Hotelling y Raíz mayor de Roy) muestran un efecto significativo
tanto del efecto principal como de la interaccióºn, por lo que estarían
indicando un efecto significativo del nivel de creatividad exigido en la
tarea sobre el rendimiento en la misma, así como un efecto combinado
de este nivel de creatividad con el nivel de ansiedad del sujeto también
sobre el rendimiento. También podemos apreciar que el tamaño de
ambos efectos es importante (Eta al cuadrado parcial), y que la potencia
del contraste para ambos efectos también es la adecuada (Potencia
observada).

16 El supuesto de esfericidad plantea que las varianzas de las diferencias existentes entre todos
los pares de niveles del factor intra-sujetos son iguales, o lo que es lo mismo, que la matriz de
varianzas-covarianzas es circular o esférica (Winer, Brown, & Michels, 1991; Kirk, 1995).

176
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Contrastes multivariadosa

Efecto Valor F Gl de la Gl del Sig. Eta al cuadrado Parámetro de Potencia


d
hipótesis error parcial no centralidad observada
b
Traza de Pillai ,602 6,061 2,000 8,000 ,025 ,602 12,123 ,727
creatividad

b
Lambda de Wilks ,398 6,061 2,000 8,000 ,025 ,602 12,123 ,727
b
Traza de Hotelling 1,515 6,061 2,000 8,000 ,025 ,602 12,123 ,727
b
Raíz mayor de Roy 1,515 6,061 2,000 8,000 ,025 ,602 12,123 ,727

Traza de Pillai ,813 3,085 4,000 18,000 ,042 ,407 12,341 ,692
creatividad * ansiedad

b
Lambda de Wilks ,187 5,251 4,000 16,000 ,007 ,568 21,006 ,904

Traza de Hotelling 4,347 7,607 4,000 14,000 ,002 ,685 30,429 ,975

c
Raíz mayor de Roy 4,347 19,559 2,000 9,000 ,001 ,813 39,119 ,998

a. Diseño: Intersección + ansiedad

Diseño intra-sujetos: creatividad

b. Estadístico exacto
c. El estadístico es un límite superior para la F el cual ofrece un límite inferior para el nivel de significación.

d. Calculado con alfa = ,05

La siguiente tabla comprueba el efecto de esfericidad. Dado que el


resultado no es significativo, concluimos que no se viola el supuesto y
que, por tanto, es más apropiado tomar una decisión en base a la tabla de
efectos univariados, en lugar de basarse en los efectos multivariados de la
tabla anterior. Nos olvidaremos, por tanto, de los resultados encontrados
en la tabla anterior, y tomaremos las decisiones correspondientes al
contraste a partir de los resultados univariados.

Prueba de esfericidad de Mauchly

Medida: creatividad
Efecto intra-sujetos W de Chi-cuadrado gl Sig. Epsilonb
Mauchly aprox. Greenhouse- Huynh- Límite-
Geisser Feldt inferior
creatividad ,659 3,333 2 ,189 ,746 1,000 ,500
Contrasta la hipótesis nula de que la matriz de covarianza error de las variables dependientes
transformadas es proporcional a una matriz identidad.
a. Diseño: Intersección + ansiedad
Diseño intra-sujetos: creatividad
b. Puede usarse para corregir los grados de libertad en las pruebas de significación promediadas. Las
pruebas corregidas se muestran en la tabla Pruebas de los efectos inter-sujetos.
 

177
Eulogio Real Deus

La tabla de efectos univariados, que se muestra más abajo, nos vuelve a


mostrar los efectos (principal y de interacción) en los que está implicada
la variable intra-sujetos. Dado que podemos asumir esfericidad en
función de los resultados de la comprobación anterior, el primer índice
(Esfericidad asumida) es adecuado para interpretar los resultados del
modelo, que nos indica que el efecto intra-sujetos no es significativo y
que, por tanto, el rendimiento es independiente del grado de creatividad
exigido por la tarea. Sin embargo, la misma tabla nos vuelve a mostrar un
efecto de interacción muy significativo (p <.01) entre los factores intra e
inter-sujetos, lo que indicaría que la creatividad sí tiene un efecto sobre
el rendimiento cuando la combinamos con la ansiedad. Finalmente,
también apreciamos que los valores de Eta cuadrado parcial muestran un
tamaño del efecto de interacción importante, y los de Potencia observada
nos indican que ahora sí disponemos de suficiente sensibilidad en el
contraste para detectar este efecto de interacción.

Pruebas de efectos intra-sujetos.

Medida: creatividad
Origen Suma de gl Media F Sig. Eta al Parámetro Potencia
cuadrado cuadrática cuadrado de no observadaa
s tipo III parcial centralidad
Parámetro
Esfericidad
4,389 2 2,194 3,038 ,073 ,252 6,077 ,515
asumida
Greenhouse-
4,389 1,492 2,942 3,038 ,092 ,252 4,533 ,434
creatividad

Geisser
Huynh-Feldt 4,389 2,000 2,194 3,038 ,073 ,252 6,077 ,515
Límite-inferior 4,389 1,000 4,389 3,038 ,115 ,252 3,038 ,344
Esfericidad
15,944 4 3,986 5,519 ,004 ,551 22,077 ,928
asumida
creatividad *

Greenhouse-
15,944 2,983 5,344 5,519 ,011 ,551 16,466 ,849
ansiedad

Geisser
Huynh-Feldt 15,944 4,000 3,986 5,519 ,004 ,551 22,077 ,928
Límite-inferior 15,944 2,000 7,972 5,519 ,027 ,551 11,038 ,706
Esfericidad
13,000 18 ,722
Error(creatividad)

asumida
Greenhouse-
13,000 13,426 ,968
Geisser
Huynh-Feldt 13,000 18,000 ,722
Límite-inferior 13,000 9,000 1,444
a. Calculado con alfa = ,05

178
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Una vez comprobados los efectos que involucran a la variable intra-


sujetos, falta por comprobar el efecto principal del factor inter-sujetos,
que se muestra en la tabla siguiente. Podemos apreciar que en este caso
sí se da el efecto principal (p <.001), por lo que podemos afirmar que el
nivel de ansiedad de los sujetos sí tiene un efecto sobre el rendimiento en
la tarea. Los valores de Eta al cuadrado parcial y de la Potencia observada
nos informan de un tamaño del efecto muy importante para este factor,
y de una sensibilidad perfecta por parte del modelo para detectar dicho
efecto.

Pruebas de los efectos inter-sujetos

Medida: creatividad
Variable transformada: Promedio
Origen Suma de cuadrados gl Media F Sig. Eta al cuadrado Parámetro de no Potencia
tipo III cuadrática parcial centralidad Parámetro observadaa
Intersección 1133,444 1 1133,444 1073,789 ,000 ,992 1073,789 1,000
ansiedad 197,722 2 98,861 93,658 ,000 ,954 187,316 1,000
Error 9,500 9 1,056
a. Calculado con alfa = ,05
 

La tabla siguiente nos muestra las medias para cada uno de los distintos
niveles de ansiedad, que muestran un rendimiento claramente superior
en sujetos con ansiedad media, frente a los otros dos grupos, con medias
sensiblemente inferiores.

Estimaciones

Medida: creatividad
Nivel de ansiedad Media Error típ. Intervalo de confianza 95%
Límite inferior Límite superior
Baja 3,750 ,297 3,079 4,421
Media 8,917 ,297 8,246 9,588
Alta 4,167 ,297 3,496 4,838

Las comparaciones post-hoc nos confirman este resultado, mostrando


diferencias significativas entre el nivel de ansiedad medio y los otros dos,
mientras que en ningún caso se encontraron diferencias significativas
entre los niveles de ansiedad medio y alto. Este resultado vendría a

179
Eulogio Real Deus

confirmar la existencia de la ley Yerkes-Dodson en el caso de nuestros


sujetos, con resultados significativamente mejores para niveles medios
de ansiedad, frente a los niveles bajos y altos de la misma.

Comparaciones por pares


Medida: creatividad
(I)Nivel de (J)Nivel de Diferencia Error Sig.b Intervalo de confianza al 95 %
ansiedad ansiedad de medias típ. para la diferenciab
(I-J) Límite inferior Límite superior
Media -5,167* ,419 ,000 -6,115 -4,218
Baja
Alta -,417 ,419 ,346 -1,365 ,532
Baja 5,167* ,419 ,000 4,218 6,115
Media
Alta 4,750* ,419 ,000 3,801 5,699
Baja ,417 ,419 ,346 -,532 1,365
Alta
Media -4,750* ,419 ,000 -5,699 -3,801
Basadas en las medias marginales estimadas.
*. La diferencia de medias es significativa al nivel ,05.
b. Ajuste para comparaciones múltiples: Diferencia menos significativa (equivalente a la
ausencia de ajuste).

Queda por saber qué tipo de interacción se da entre el nivel de ansiedad


y el nivel de creatividad de la tarea. La tabla siguiente muestra las medias
en rendimiento para las distintas combinaciones de los niveles de ambos
factores.

3. Nivel de ansiedad * creatividad


3. Nivel de ansiedad * creatividad
Medida: creatividad
Nivel de ansiedad creatividad Media Error típ. Intervalo de confianza 95%
Límite inferior Límite superior
1 3,750 ,514 2,588 4,912
Baja 2 3,250 ,417 2,307 4,193
3 4,250 ,433 3,270 5,230
1 8,000 ,514 6,838 9,162
Media 2 9,750 ,417 8,807 10,693
3 9,000 ,433 8,020 9,980
1 4,750 ,514 3,588 5,912
Alta 2 2,750 ,417 1,807 3,693
3 5,000 ,433 4,020 5,980

180
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Las medias nos muestran que los resultados son muy similares para los
diferentes niveles de creatividad: las medias siempre son inferiores con
baja y alta ansiedad, y más altas con nivel de ansiedad media. Sin embargo,
este efecto es más marcado para el nivel medio de creatividad que para los
otros dos niveles: los sujetos con baja o alta ansiedad obtienen sus peores
resultados cuando la prueba exige un nivel de creatividad medio, mientras
que los sujetos con ansiedad media consiguen su mejor resultado cuando
la prueba exige este mismo nivel de creatividad. El gráfico de interacción
nos permite apreciar visualmente este efecto. Aunque las 3 rectas tienen
forma de “U” invertida, en el caso del nivel de creatividad medio (2), esta
forma es más apuntada, lo que indica que las diferencias en rendimiento
por causa de la ansiedad son máximas para este nivel de creatividad: las
diferencias entre los sujetos con mejor y peor rendimiento (ansiedad
media frente a baja y –especialmente- alta) son máximas para ese nivel
de creatividad.

Desgraciadamente, SPSS incluye pruebas post-hoc para cada uno de los


efectos principales del modelo, pero no proporciona automáticamente
pruebas similares comparar las combinaciones de niveles de los factores
implicados en un efecto de interacción, pruebas que podrían proporcionar

181
Eulogio Real Deus

soporte estadístico a nuestra interpretación del efecto de interacción


entre los distintos niveles de ansiedad y creatividad. Para poder obtener
este tipo de contraste es necesario realizar comparaciones múltiples
entre factores y añadir manualmente las instrucciones correspondientes
para las comparaciones post-hoc, por lo que no comentaremos el largo
procedimiento necesario para obtener esta información.

Así pues, como hemos visto, el análisis de varianza nos permite estudiar el
efecto que una serie de variables categóricas independientes tienen sobre
una variable dependiente medida a nivel de escala. La pregunta que
surge inmediatamente es si existen modelos estadísticos que permitan
también establecer relaciones predictivas, pero ahora en el caso inverso
de que la variable de tipo categórico sea la variable dependiente, y las
variables independientes sean de escala. Es decir, un modelo similar al
de la regresión múltiple, pero en el cual la variable dependiente sea
categórica.

Lo cierto es que no sólo existe un modelo para realizar este tipo de


predicciones, sino que existen varios, de los cuales los dos más empleados
son el análisis discriminante y la regresión logística.

2.10.7. Técnicas de reducción de datos: el análisis factorial


A veces nos interesa estudiar las correlaciones existentes entre conjuntos
de variables para emplearlas en modelos predictivos, como el modelo
de regresión múltiple. Como ya sabemos, en este caso nos planteamos
predecir una de estas variables (nuestra variable dependiente o criterio)
a partir de una combinación lineal de otras variables (nuestras variables
independientes o predictores). En otras ocasiones, las correlaciones
existentes entre estas variables son la manifestación de que todas ellas
están relacionadas con un mismo constructo, una variable latente (o
factor) que se manifiesta de forma indirecta a partir de su relación con
estas otras variables, pero que no se puede observar directamente.
Es decir, estaríamos en el caso de un modelo predictivo similar al de la
regresión, pero en este caso la variable dependiente no es observada,
sino latente (Nunnally & Bernstein, 1995). El caso más simple que ilustra
este planteamiento es el de una escala: la escala consta de un número

182
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

de ítems que, una vez combinados, proporcionan una puntuación que


indica el grado en que un sujeto posee una característica latente (su
neuroticismo, su grado de satisfacción con la vida, su grado de autoestima,
etc.). Podemos concebir cada uno de estos ítems como un predictor que
comparte varianza con el constructo al que predice; si lo combinamos
con otros ítems que también actúan como predictores, conseguiremos
explicar gran parte de la varianza del constructo correspondiente, de
tal modo que la puntuación total en la escala sea un predictor fiable del
mismo.

Otra manera de considerar al análisis factorial es como una técnica


de reducción de datos: si una serie de variables comparten una parte
importante de su varianza con una variable latente, podríamos emplear
esta variable latente en nuestros análisis, reduciendo de este modo el
número de variables a considerar. El ejemplo de la escala también es
adecuado para esta interpretación. Si hemos obtenido la puntuación
total de la escala, que es un indicador suficiente del grado en que el sujeto
posee la característica medida por esa escala, los resultados de los ítems
originales que la componen ya no son necesarios para nuestros análisis.
Hemos reducido las n variables originales (los ítems de la escala) a una
única variable (la puntuación total).

El hecho de que el análisis factorial permita identificar la presencia de


variables latentes en conjuntos de variables más amplios lo hace muy
interesante para comprobar la validez de constructo de una escala. En
efecto, si suponemos que los ítems de una escala miden un determinado
constructo, y sólo uno, el análisis factorial debería poner de manifiesto la
presencia de este único factor, y ninguno más. En caso de que la escala
midiese más de un solo constructo, el análisis factorial debería identificar
y separar del resto a aquellos ítems que estén relacionados con un mismo
constructo. Esta utilidad del análisis factorial como técnica confirmatoria
ha llevado al desarrollo de dos técnicas diferentes, aunque relacionadas
para llevar a cabo un análisis factorial: el análisis factorial exploratorio
(AFE) y el análisis factorial confirmatorio (AFC).

En el AFE, se emplea un procedimiento estadístico para la extracción los


factores a partir de las relaciones existentes entre las variables observadas,

183
Eulogio Real Deus

y un método de rotación para representar los diferentes factores de la


forma más conveniente. El investigador no puede determinar a priori
qué ítems van a qué factores, aunque sí puede fijar el número máximo
de factores para la solución. En el AFC, el investigador plantea las
relaciones existentes entre ítems y factores, así como también entre los
propios factores, en un modelo que se somete a comprobación, y emplea
el análisis con la finalidad de evaluar el grado de ajuste de los datos a
dicho modelo (Long, 1983). Si el ajuste es adecuado, la estructura factorial
planteada es un modelo adecuado de los datos. En caso de que el ajuste
no sea bueno, es posible modificar el modelo para mejorarlo y someterlo
de nuevo a comprobación. Ambos tipos de análisis serán abordados aquí,
pero nos detendremos más en el AFE, por ser la técnica más empleada.

Como ejemplo, nos plantearemos evaluar la estructura del cuestionario


de Neuroticismo del NEO PI-R. Para ello, seleccionamos en el menú:
Analizar → Reducción de dimensiones → Factor. Aparecerá el siguiente
cuadro de diálogo:

Hemos introducido las variables que contienen los 6 ítems de la escala de


Neuroticismo como variables a analizar. Existen diferentes opciones para
realizar el análisis que se muestran en los botones del cuadro de diálogo.
Comentaremos las más empleadas habitualmente, dada la cantidad de
posibilidades existente. El primer botón, etiquetado como Descriptivos,
nos permite, entre otras cosas, obtener los estadísticos descriptivos de

184
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

los ítems, la matriz de correlaciones entre los ítems. El botón Extracción


permite seleccionar el método de extracción de los factores, de los cuales
el más empleado, y que representa la opción por defecto, es el método
de componentes principales, que intenta maximizar la varianza de
las variables originales que es explicada por el factor o variable latente
(Dunteman, 1989). En el botón Rotación podemos especificar el modo
en que se van a representar los factores para facilitar su interpretación;
si no se proporciona ninguno, la solución quedará sin rotar. Dos serán los
métodos de rotación que nos pueden interesar más:

vv Varimax. En este tipo de rotación se obtienen factores que serán


independientes entre sí (ortogonales), es decir, que no habrá
correlación entre ellos. El hecho de que este método proporcione
factores independientes significa que los constructos o variables
latentes puestos de manifiesto mediante esta rotación son
estrictamente diferentes, no están relacionados. Esto facilita la
obtención de estructuras factoriales simples, donde cada variable
observada está relacionada con un factor, y sólo uno, por lo que la
emplearemos en nuestro ejemplo.

vv Oblimin. En este otro tipo de rotación se permite que exista


correlación entre los factores, por lo que no serán independientes,
sino que estarán relacionados entre sí (oblicuos). En este caso, los
constructos o variables latentes no sólo comparten varianza con las
variables observadas, sino que también comparten varianza entre
sí. Dado que se permite que existan correlaciones entre los factores,
este tipo de rotación es susceptible de análisis suplementarios
para buscar factores de orden superior a partir de los obtenidos
para un análisis factorial, lo que se conoce como análisis factorial
de segundo orden.

Un cuarto botón, etiquetado como Puntuaciones nos permitirá guardar


los valores de las variables latentes como variables de nuestro archivo
de datos. Esto puede ser útil si decidimos emplear en nuestros análisis
los factores seleccionados por el modelo de análisis factorial o, si hemos
realizado una rotación oblicua, para realizar un análisis de segundo orden
sobre los factores encontrados. Finalmente, un quinto botón, Opciones,

185
Eulogio Real Deus

nos permitirá, entre otras cosas, ordenar los coeficientes por tamaño, y
suprimir coeficientes menores de un valor determinado, lo que simplifica
y facilita la interpretación de la solución. En nuestro caso, suprimiremos
los coeficientes cuyo valor sea inferior a .30, dado que es un valor que
indicaría escasa relación entre la variable y el factor.

La primera tabla del análisis nos muestra las comunalidades, o varianzas


comunes de los ítems de la escala. El valor inicial para todas ellas es 1, por lo
que la varianza total será 6. En la columna de la derecha se muestran esas
mismas varianzas, pero para la solución factorial. La suma de estos valores
nos dará la varianza total explicada por el modelo, que es de 3.143. La razón
entre ambas varianzas nos da la varianza explicada por el modelo de
análisis factorial: 3.143/6=.524. Es decir, los factores encontrados explicarían
el 52.4% de la varianza original contenida en los ítems de la escala.

Comunalidades
Inicial Extracción
Soy bastante estable emocionalmente 1,000 ,396
Rara vez me siento con miedo o ansioso 1,000 ,259
A veces hago las cosas impulsivamente y luego me arrepiento 1,000 ,494
Cuando estoy bajo un fuerte estrés, a veces siento que me voy a desmoronar 1,000 ,665
A veces las cosas me parecen demasiado sombrías y sin esperanza 1,000 ,587
Es difícil que yo pierda los estribos 1,000 ,742
Método de extracción: Análisis de Componentes principales.

La segunda tabla nos muestra la varianza total explicada por los factores
del modelo de análisis factorial. Observamos que aparecen 6 factores,
que explican el 100% de la varianza. No obstante, no todos los factores
explican la misma cantidad de varianza, por lo que si queremos que
nuestra solución sea parsimoniosa, debemos elegir un punto de equilibrio
entre encontrar una estructura lo más sencilla posible, pero que también
explique la mayor proporción de varianza posible. El criterio utilizado
habitualmente en AFE es el de Kaiser, que selecciona únicamente
aquellos factores con autovalores superiores a 1. En nuestro caso, sólo
2 factores cumplen este criterio, y por eso han sido seleccionados por el
análisis. El primero es mucho más importante, pues explica el 31.4% de
la varianza, mientras que el segundo explica un 21.26%. Conjuntamente,
ambos factores explicarían el 52.4% de la varianza total contenida en los 6
ítems de la escala, tal y como vimos en la comprobación anterior.

186
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Varianza total explicada

Componente Autovalores iniciales Sumas de las saturaciones al Suma de las saturaciones al


cuadrado de la extracción cuadrado de la rotación
Total % de la % Total % de la varianza % Total % de la varianza %
varianza acumulado acumulado acumulado
1 2,003 33,391 33,391 2,003 33,391 33,391 1,868 31,140 31,140
2 1,140 19,007 52,398 1,140 19,007 52,398 1,275 21,258 52,398
3 ,883 14,717 67,115
4 ,832 13,870 80,985
5 ,700 11,661 92,646
6 ,441 7,354 100,000
Método de extracción: Análisis de Componentes principales.

Las dos siguientes tablas muestran la solución factorial sin rotar (Matriz
de componentes) y rotada (Matriz de componentes rotados). Dado que
la solución rotada es más interpretable, examinaremos esta última.
Los coeficientes de los ítems en los factores están ordenados por su
importancia, y se han suprimido los que se encuentran por debajo de
.30. Podemos apreciar en la tabla que 4 de los ítems están claramente
relacionados con el factor I, mientras que otros dos están relacionados
con el factor II. En todos los ítems, el coeficiente correspondiente al factor
con el que no están relacionados es menor de .30, por lo que la estructura
factorial que se muestra es muy clara y sencilla. Los coeficientes que
se muestran, o cargas factoriales, se interpretan de modo similar a
un coeficiente de correlación, y su cuadrado expresa la proporción de
varianza que comparten el ítem y el factor. Tres de los coeficientes son
negativos, lo que indicaría que la relación del ítem con el factor es, en este
caso, inversa.

Matriz de componentes rotadosa

Componente
1 2
Cuando estoy bajo un fuerte estrés, a veces siento que me voy a desmoronar ,812
A veces las cosas me parecen demasiado sombrías y sin esperanza ,760
Soy bastante estable emocionalmente -,557
Rara vez me siento con miedo o ansioso -,503
Es difícil que yo pierda los estribos ,858
A veces hago las cosas impulsivamente y luego me arrepiento -,657
Método de extracción: Análisis de componentes principales.
Método de rotación: Normalización Varimax con Kaiser.
a. La rotación ha convergido en 3 iteraciones.

187
Eulogio Real Deus

Pasemos, a continuación, a identificar esos componentes. El primero


de ellos incluye 4 ítems relacionados con la inestabilidad emocional,
los dos primeros ítems de forma directa, y los otros dos de forma
inversa. El segundo incluye 2 ítems relacionados con el control, uno
directamente, y otro inversamente. Así pues, podríamos concluir que
existen dos componentes o variables latentes subyacentes a la escala
de Neuroticismo, el más importante de los cuales estría relacionado con
la inestabilidad emocional, que es elevada en los sujetos neuróticos,
mientras que el segundo lo estaría con el control, que suele ser bajo en
estos sujetos. Asimismo, dado que hemos realizado una rotación Varimax,
sabemos que estos dos componentes o factores son independientes, no
están relacionados entre sí.

Como vemos, en el caso de AFE, la selección de factores se hace


enteramente en función de criterios estadísticos de ajuste, sin que
tengamos posibilidad de plantear una solución propia. En el caso del AFC,
esto sí es posible, de tal modo que seremos nosotros los que plantearemos
en un modelo la estructura factorial esperada, y el análisis nos informará
del grado de ajuste del modelo, y de los coeficientes asociados a dicho
modelo, entre otros. La siguiente figura muestra un modelo confirmatorio
para una escala de afecto, dividido en dos subescalas de Afecto Negativo
(AN) y de Afecto Positivo (AP), cada una de las cuales vendrá determinada
por 9 ítems, cuyas etiquetas pueden verse en los recuadros de la izquierda.

188
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

En este esquema, cada recuadro identifica a una variable observada, cada


elipse identifica a un factor o variable latente, y cada círculo identifica al
error, o varianza no compartida entre ítem y factor. Las flechas permiten
indicar con qué factor estará relacionado cada ítem, así como mostrar
la correlación existente entre factores. En el caso de la correlación
entre factores (.31) se emplea una flecha doble, que indica covariancia,
mientras que los pesos de regresión (flechas simples) indican el grado
de relación del factor con el ítem correspondiente. El cuadrado de estos
pesos indica la proporción de varianza compartida entre ítem y factor, que
se muestra sobre cada ítem. Como vemos, algunos de los ítems muestran

189
Eulogio Real Deus

una escasa relación con el factor correspondiente, sobre todo en el caso


de la subescala de Afecto Negativo, donde muchos ítems comparten muy
poca varianza con el factor, por lo que el ajuste de este modelo a los datos
no será bueno.

El ajuste suele medirse con más de un índice en este tipo de modelos. Uno
de los más empleados es chi-cuadrado, que nos informa de la bondad
de ajuste entre modelo y datos. Un valor significativo indicará que el
modelo no ajusta correctamente, como es el caso de nuestro modelo
(chi-cuadrado=287.585; g.l.= 134; p <.001). Otros índices de ajuste que se
emplean son el Goodness of fit index o (GFI=.656), o el Adjusted goodness
of fit index (AGFI= .561), o el Comparative fit index (CFI=.629). Todos ellos
indican mejor ajuste cuanto más próximos se encuentren a 1, siendo
recomendable obtener valores en torno a .90 o .95. Dados los valores
encontrados en el caso de estas dos subescalas, el ajuste encontrado para
nuestro modelo no es aceptable.

El análisis factorial confirmatorio, al igual que el análisis causal, es un


caso particular de los modelos de ecuaciones estructurales (Byrne, 2010).
El AFC y el análisis causal pueden ser combinados en un mismo modelo,
lo que permitiría no sólo especificar la existencia de variables latentes,
sino también establecer relaciones predictivas entre variables latentes, o
entre variables latentes y observadas.

2.10.8. Otras técnicas de reducción de datos


En el caso de que nos encontremos trabajando con variables categóricas,
tenemos otros tipos de análisis adecuados para examinar la relación entre
este tipo de variables de un modo análogo al caso del análisis factorial
exploratorio con variables de escala; es decir, también existen técnicas de
reducción de datos apropiadas para variables categóricas, conocidas como
análisis de correspondencias simple (bivariado) y múltiple (multivariado).
Su finalidad es la misma que la del AFE: reducir un conjunto inicial de
variables a un conjunto menor de variables latentes que explican la mayor
parte de la información contenida en las variables originales. En el caso
del AFE, llamábamos factores o componentes a estas variables latentes.
En el caso del análisis de correspondencias, las llamaremos dimensiones.

190
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Estas dimensiones son independientes entre sí, al igual que los factores
obtenidos mediante rotación Varimax y, al igual que éstos, están medidas
en una escala de intervalo normalizada (z), por lo que el análisis de
correspondencias puede ser contemplado también como una técnica
para obtener valores de escala a partir de variables categóricas. Además,
estas técnicas proporcionan una representación gráfica de la solución
en el espacio definido por las dimensiones, por lo que éstas pueden ser
interpretadas de forma visual mediante un diagrama de dispersión.

Dado que el caso del análisis de correspondencias simple o bivariado es


más sencillo, comenzaremos mostrando un ejemplo del mismo, tomado
a partir de la relación que habíamos encontrado en un análisis anterior
entre el nivel de estudios y el nivel de ingresos de los empleados de una
empresa. Habíamos visto que existía una relación clara y significativa
entre ambas variables ordinales, medida a través de distintos índices, y
que esa relación era directa; es decir, a mayor nivel de estudios, mayor
nivel de ingresos. Esta relación puede visualizarse mediante análisis de
correspondencias simple. Para llevar a cabo el análisis, seleccionamos
en el menú: Analizar → Reducción de dimensiones → Análisis de
correspondencias. Aparecerá el siguiente cuadro de diálogo:

En este cuadro introduciremos las dos variables cuya asociación queremos


analizar, indicando para cada una de ellas el rango de valores que
adoptan sus categorías (4 categorías en el caso del salario; 3 categorías en
el caso del nivel educativo). Los botones Modelo, Estadísticos y Gráficos

191
Eulogio Real Deus

nos permiten solicitar más dimensiones (2 por defecto), o información


adicional, o hacer cambios sobre la forma en que se va a estimar la solución
o a presentar los resultados. El análisis nos muestra en primer lugar la
tabla de contingencia correspondiente al cruce de ambas variables:

Tabla de correspondencias

Nivel de ingresos Nivel de estudios


Primarios Medios Superiores Margen activo
Hasta 25000$ 29 95 19 143
25000$-50000$ 24 94 142 260
50000$-75000$ 0 1 53 54
Más de 75000$ 0 0 17 17
Margen activo 53 190 231 474

La segunda tabla nos muestra un resumen del proceso de reducción de


datos.

Resumen

Dimensión Valor propio Inercia Chi-cuadrado Sig. Proporción de inercia Confianza para el Valor propio
Explicada Acumulada Desviación típica Correlación
2
1 ,556 ,309 ,999 ,999 ,028 ,051
2 ,020 ,000 ,001 1,000 ,039
a
Total ,309 146,626 ,000 1,000 1,000
a. 6 grados de libertad

Del mismo modo que el AFE se basa en los autovalores obtenidos y


en la proporción de varianza explicada por cada factor, el análisis de
correspondencias se basa en esos mismos autovalores y el porcentaje de
inercia explicada por cada uno. La inercia es el equivalente de la varianza
de los datos categóricos, y se calcula como χ2/n (en el caso de nuestros
datos, 146.626/474= 0.309). Podemos ver que toda la inercia quedaría
explicada por la dimensión 1, mientras que la dimensión 2 no añadiría
prácticamente ninguna información al modelo. Esto nos indica que las
dos variables originales, nivel de ingresos y nivel de estudios, podrían ser
reemplazadas por una única dimensión: la dimensión 1, que explica el
99.9% de la inercia total contenida en los datos.

192
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Las siguientes dos tablas nos muestran los resultados en detalle para cada
una de las dos variables, la situada en las filas y la situada en las columnas
de la tabla.

Examen de los puntos de filaa

Nivel de Masa Puntuación en Inercia Contribución


ingresos la dimensión
1 2 De los puntos De la dimensión
a la inercia de a la inercia del
la dimensión punto
1 2 1 2 Total
Hasta 25000$ ,302 -,953 ,116 ,152 ,493 ,203 ,999 ,001 1,000
25000$-50000$ ,549 ,159 -,124 ,008 ,025 ,420 ,978 ,022 1,000
50000$-75000$ ,114 1,326 ,195 ,111 ,360 ,215 ,999 ,001 1,000
Más de 75000$ ,036 1,375 ,302 ,038 ,122 ,162 ,998 ,002 1,000
Total activo 1,000 ,309 1,000 1,000
a. Normalización Simétrica

Examen de los puntos columnaa

Nivel de Masa Puntuación en Inercia Contribución


estudios la dimensión
1 2 De los puntos a la De la dimensión a la
inercia de la inercia del punto
dimensión
1 2 1 2 Total
Primarios ,112 -,809 ,369 ,041 ,132 ,757 ,992 ,008 1,000
Medios ,401 -,703 -,110 ,110 ,357 ,242 ,999 ,001 1,000
Superiores ,487 ,764 ,006 ,158 ,512 ,001 1,000 ,000 1,000
Total activo 1,000 ,309 1,000 1,000
a. Normalización Simétrica

Cada una de las categorías de las dos variables explica una proporción de
inercia que expresa su importancia en la solución, proporción conocida
como masa. Del mismo modo, cada una de estas categorías contribuye

193
Eulogio Real Deus

a explicar una proporción de la inercia contenida en cada una de las


dimensiones de la solución y, recíprocamente, cada dimensión de la
solución contribuye a explicar una proporción de la inercia contenida
en la categoría. Ambos tipos de contribuciones permiten asociar
categorías a dimensiones, lo que también facilita luego la interpretación
de estas últimas. Podemos apreciar, por ejemplo, que la contribución
de la dimensión 2 a la inercia de las categorías de ambas variables
es prácticamente nula, por lo que el modelo más parsimonioso sería
unidimensional, compuesto únicamente por la dimensión 1. Finalmente,
ambas tablas muestran también las puntuaciones asignadas por el
modelo a cada una de las categorías de las dos variables en cada una de
las dimensiones de la solución. Estas puntuaciones están estandarizadas
y constituyen las coordenadas en las que se posicionará cada una de las
categorías en el espacio delimitado por las dos dimensiones del modelo.

Las puntuaciones o coordenadas de las categorías en las dimensiones


permiten visualizar la relación existente entre las dos variables. En el
gráfico siguiente podemos ver el diagrama de dispersión correspondiente
a la solución bidimensional conformada por las dimensiones 1
(horizontal) y 2 (vertical), y mostrada mediante normalización simétrica,
que permite comparar las posiciones en el espacio de las categorías de
las dos variables. Se aprecia que las categorías de ambas variables se
disponen horizontalmente a lo largo de la dimensión 1, mientras que
muestran escasas diferencias en cuanto a su disposición vertical. Tanto
los niveles educativos como los de ingresos se disponen de izquierda a
derecha, pasando de menores niveles educativos y de ingresos (izquierda),
a mayores niveles educativos y de ingresos (derecha).

194
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

En el caso del análisis de correspondencias múltiple es posible incluir


más de dos variables en el modelo, con lo que la reducción de datos
puede realmente hacerse de un modo similar a como se hace en el AFE.
No obstante, existen diferencias importantes entre la versión simple y la
múltiple del análisis de correspondencias. En primer lugar, este último no
procede de forma analítica, sino iterativa; esto es, la solución se obtiene por
aproximaciones sucesivas que van mejorando el ajuste del modelo hasta
que se alcanza un criterio de parada. En segundo lugar, las dimensiones
obtenidas por el análisis de correspondencias múltiple no están
anidadas, tal y como lo están en el análisis de correspondencias simple
y en el AFE. Cuando las dimensiones están anidadas, puede obtenerse
el ajuste total del modelo a partir de la suma de las contribuciones
hechas por los distintos factores o dimensiones. La interpretación de las
dimensiones debe, por tanto, hacerse por separado en este caso. Una
tercera diferencia que separa ambas técnicas es que en el caso del análisis
de correspondencias múltiple es posible obtener no sólo las posiciones de
las categorías de las variables en el espacio definido por las dimensiones,
sino que también puede situarse a los sujetos de la muestra en este
mismo espacio, lo que facilita la localización de subgrupos de sujetos en
la solución.

195
Eulogio Real Deus

Veamos ahora cómo podríamos averiguar si la relación encontrada


anteriormente podría implicar a más variables categóricas. Seleccionamos
en el menú: Analizar → Reducción de dimensiones → Escalamiento óptimo.
Aparecerá el siguiente cuadro de diálogo:

Existen varios modelos de escalamiento óptimo accesibles en SPSS, en


función del tipo de variables incluidas en el mismo, y del número de
conjuntos de datos. El análisis de correspondencias múltiple es el caso
por defecto, incluyendo únicamente un conjunto de datos y empleando
únicamente variables categóricas. Si pulsamos el botón Definir pasamos
al cuadro de diálogo del procedimiento propiamente dicho:

196
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

En el cuadro incluimos, además del nivel educativo y salarial de los


sujetos, su sexo y su categoría laboral. Todas las variables reciben la
misma ponderación en el modelo: 1. Al igual que en el caso anterior, se
solicita una solución en dos dimensiones. A la derecha existen una serie
de botones que permiten añadir opciones y cambios al modelo, de los
cuales sólo comentaremos los más relevantes. En el botón Resultado
puede resultar interesante pedir el historial de las iteraciones, con el fin
de comprobar que el proceso termina con un ajuste adecuado. El botón
Guardar permite guardar las puntuaciones de los sujetos (objetos, en la
terminología del análisis de correspondencias múltiple) en la solución,
creando tantas variables como dimensiones tenga la solución. Estas
puntuaciones nos permitirán luego identificar subgrupos de sujetos
en esa solución. Finalmente, en el botón Variable podemos especificar
el modo en que vamos a representar visualmente las categorías de las
variables incluidas en el análisis; bien por separado para cada variable,
bien conjuntamente para todas las variables. Nosotros seleccionaremos
esta última opción.
La primera de las tablas de resultados nos muestra el ajuste del modelo
generado por el análisis de correspondencias múltiple; recordemos
que aquí el ajuste se muestra por separado para cada dimensión, por lo
que el porcentaje de varianza explicado por cada dimensión no puede
ser simplemente sumado para conocer el ajuste total. Dado que cada
dimensión puede interpretarse como una escala métrica obtenida a partir
de información categórica, la tabla nos muestra la consistencia interna
de cada una de las dimensiones utilizando para ello el alfa de Cronbach.
Todos los valores de ajuste muestran un muy buen ajuste de la dimensión
1, y un ajuste menor de la dimensión 2. La primera dimensión será la más
importante de la solución, pero no la única.
Resumen del modelo

Dimensión Alfa de Cronbach Varianza explicada


Total (Autovalores) Inercia % de la varianza
1 ,803 2,516 ,629 62,903
2 ,429 1,475 ,369 36,877
Total 3,991 ,998
Media ,665a 1,996 ,499 49,890
a. El Alfa de Cronbach Promedio está basado en los autovalores promedio.

197
Eulogio Real Deus

A continuación se nos muestra la posición de las categorías de las cuatro


variables en el espacio bidimensional de la solución:

Se aprecia una clara relación entre el nivel de estudios, el nivel de ingresos


y la categoría laboral, con los niveles de ingresos y estudios más elevados
asociados a los directivos, y los niveles de ingresos más bajos asociados
a los administrativos y los estudios medios. Finalmente, los niveles de
ingresos intermedios se sitúan a medio camino de todas las categorías
laborales, y el nivel de estudios primario. En cuanto al sexo, puede verse
que las mujeres se encuentran más próximas a los niveles de ingresos más
bajos, y a la categoría administrativo, mientras que los hombres se sitúan
de forma más equidistante de todos los niveles. Así pues, la solución
bidimensional planteada parece reflejar adecuadamente las relaciones
entre los distintos subgrupos de empleados en función de estos cuatro
aspectos.

La siguiente tabla muestra las correlaciones existentes entre las variables


transformadas por el modelo de correspondencias múltiples. Puede
apreciarse que las correlaciones entre todas las variables son entre
moderadas y fuertes:

198
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Correlaciones de las Variables transformadas

Dimensión: 1
Nivel de estudios Nivel de ingresos Sexo Categoría laboral
Nivel de estudios 1,000 ,544 ,403 ,444
Nivel de ingresos ,544 1,000 ,509 ,750
Sexo ,403 ,509 1,000 ,341
Categoría laboral ,444 ,750 ,341 1,000
Dimensión 1 2 3 4
Autovalores 2,516 ,694 ,570 ,219
 

Finalmente, una última tabla nos muestra las medidas de discriminación,


que se interpretan de forma análoga a las contribuciones de cada
dimensión a la inercia de la variable correspondiente. Puede apreciarse
que estas medidas son más elevadas en la dimensión 1 que en la
dimensión 2 para todas las variables, aunque el nivel de ingresos y la
categoría laboral también muestran cierta relación con la dimensión 2,
mientras que el sexo y el nivel de estudios están mucho más relacionados
con la dimensión 1 que con la dimensión 2.

Medidas de discriminación

Dimensión Media
1 2
Nivel de estudios ,557 ,140 ,348
Nivel de ingresos ,817 ,504 ,660
Sexo ,470 ,216 ,343
Categoría laboral ,672 ,615 ,644
Total activo 2,516 1,475 1,996
% de la varianza 62,903 36,877 49,890

Como vimos, existe la opción de guardar las puntuaciones de los sujetos


(que el análisis llama objetos) como variables de nuestro archivo de
datos, y es posible emplear esas variables luego como las puntuaciones
de los sujetos en las dimensiones encontradas, o como sus coordenadas
en esas mismas dimensiones. En este último caso, es posible representar
diversos grupos o categorías en un diagrama de dispersión para ver su

199
Eulogio Real Deus

posición en la solución proporcionada por el análisis. La representación


gráfica en función del sexo de los empleados proporciona el gráfico que
se muestra a continuación.

El gráfico muestra la concentración de sujetos de cada uno de los grupos en


función del diámetro del marcador: a mayor diámetro, mayor número de
sujetos se concentran en esa zona del gráfico, y viceversa. Puede apreciarse
que las mujeres (que se muestran en color gris) se concentran en la zona
superior derecha del gráfico, la correspondiente a los sueldos más bajos
y los puestos administrativos, mientras que los hombres se concentran
en la zona central y superior izquierda del mismo, correspondiente a
los niveles de salarios intermedios y altos, y a los puestos de seguridad
(situados en la zona central hacia abajo) o directivos (situados en la zona
superior izquierda).

Así pues, como vemos, y a diferencia del análisis de correspondencias


simple, el análisis de correspondencias múltiple nos permite representar
en un mismo espacio a las categorías de las variables y a los sujetos de la
muestra, lo que permite obtener cuantificaciones de las variables latentes
o dimensiones que permiten resumir variables categóricas, por un lado,
así como asignar puntuaciones a los sujetos en esas dimensiones.

200
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

También existe otro tipo de técnicas que permiten reducir un conjunto de


variables a un número menor de dimensiones en el espacio, de un modo
análogo a como lo hace el análisis de correspondencias, pero que aceptan
datos en formato muy diverso, como datos en escala ordinal, datos
binarios, datos agregados de frecuencias, o datos de escala. Además,
estas técnicas no requieren del cumplimiento de supuestos, y permiten
analizar diferencias entre grupos, o representar conjuntamente a sujetos
y atributos en un mismo espacio. La aproximación empleada en el caso
de estas técnicas, englobadas bajo el nombre genérico de escalamiento
multidimensional (Kruskal & Wish, 1988; Arce C. , 1993; Real, 2001), consiste
en representar las similaridades entre los elementos analizados como
distancias en un espacio de varias dimensiones, que son ortogonales e
independientes entre sí, al igual que los factores sometidos a rotación
Varimax. Los elementos se relacionan con los factores en función de sus
coordenadas en los mismos, que indican su posición dentro de los polos
definidos por la misma. Análogamente, estas técnicas también pueden ser
empleadas con fines de clasificación, puesto que representarán próximos
en el espacio a aquellos elementos que sean similares, y alejados entre sí
a aquellos que sean disimilares, lo que permite interpretar visualmente la
presencia de agrupamientos y sus posiciones relativas.

Nosotros vamos a utilizar como ejemplo uno de los modelos de


escalamiento más utilizado: el modelo métrico de escalamiento de
diferencias individuales (que cuenta con una versión no métrica, para
datos en escala ordinal). Este modelo de escalamiento toma como entrada
las proximidades existentes entre un grupo de variables, calculadas a
partir de las puntuaciones de los sujetos en esas mismas variables, y las
representa como distancias en un espacio de varias dimensiones, de tal
modo que el ajuste entre las proximidades originales y las distancias del
modelo sea máximo. Además, el modelo permite incluir una variable
categórica de ponderación, que permite obtener soluciones diferentes
para distintos grupos. Las ponderaciones implican que cada grupo puede
otorgar un peso diferente a cada dimensión, en función de la diferente
importancia que otorgan a cada una de ellas.

Nuestro ejemplo se basa en la teoría de la orientación vocacional


(Holland, 1997), que establece la existencia de seis perfiles vocacionales

201
Eulogio Real Deus

diferentes existentes entre aquellos que aspiran a ejercer una profesión,


de tal modo que cada persona busca un trabajo lo más ajustado posible
a su perfil vocacional. Hemos aplicado el cuestionario SDS (Holland,
1994) a una muestra de alumnos de secundaria, y hemos obtenido sus
puntuaciones en seis perfiles vocacionales diferentes:

1. Realista. Correspondiente a profesiones manuales y que operan en


contacto con objetos, como carpinteros o mecánicos, pero también
ingenieros y arquitectos.
2. Investigador. Correspondiente a tareas de corte académico e
investigador.
3. Artístico. Vinculado a las artes escénicas, pintura, fotografía, etc.
4. Social. Relacionado con profesiones que implican contacto con la
gente: médicos, profesores, asistentes, etc.
5. Emprendedor. Asociado al mundo empresarial y al trabajo
autónomo.
6. Convencional. Propio de trabajos de oficina y papeleo, control de
balances y gastos, gestión de documentación, etc.

Nos planteamos qué relación existe entre los distintos perfiles


vocacionales, y si existen diferencias de género en las preferencias
por los diferentes perfiles. Mediante escalamiento multidimensional
podremos visualizar las relaciones existentes entre los seis perfiles, y el
peso que tiene cada dimensión para hombres y mujeres. Para realizar
el análisis, seleccionamos en el menú: Analizar → Escala → Escalamiento
multidimensional (ALSCAL). Aparecerá el siguiente cuadro de diálogo:

202
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Incluiremos en la lista de variables las puntuaciones de los sujetos en los


seis perfiles vocacionales, y seleccionaremos la opción Crear distancias a
partir de los datos, para que las proximidades entre perfiles se calculen
a partir de las puntuaciones de sujetos. Por defecto, la medida es la
de distancia euclídea, que es la apropiada para datos de escala, pero
también existen medidas para datos binarios y para datos agregados en
frecuencias.

También es posible utilizar como archivo de datos una matriz cuadrada


o rectangular de preferencias o de proximidades. En el recuadro Matrices
individuales para incluiremos la variable de diferencias individuales
(sexo). A la derecha tenemos dos botones. El botón etiquetado Modelo
nos permite especificar el modelo de escalamiento que queremos aplicar:

203
Eulogio Real Deus

Aquí podemos especificar el nivel de medida de nuestros datos (si éste es


ordinal, se estará utilizando el modelo de escalamiento no-métrico). La
condicionalidad se refiere a cómo se presentan las fuentes de datos. En
nuestro caso, tendremos una matriz de proximidades por sexo, por lo que
la condicionalidad es por matriz. En el caso de matrices rectangulares de
preferencias, la condicionalidad es por cada fila de la matriz. Por defecto,
el análisis presenta una solución en 2 dimensiones, aunque podemos
solicitar un rango de soluciones si deseamos probar distintos modelos.
Finalmente, podemos elegir entre el modelo de distancia euclídea o
simple, o el modelo de distancia euclídea de diferencias individuales,
que añade al anterior la posibilidad de comprobar si los distintos grupos
perciben el espacio de la solución de forma diferente.

204
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Finalmente, en el botón Opciones podemos solicitar los gráficos de la


solución, así como el resumen del modelo y las opciones, para comprobar
que está correctamente especificado, y que la solución alcanzada es
óptima. En caso de que no se alcanzase una solución óptima es posible
aumentar el número de iteraciones para que el procedimiento pueda
ajustarse durante más ciclos.

El listado del programa se presenta en formato texto. La primera


información que se nos proporciona es la referente al ajuste del modelo:
 
 
Stress and squared correlation (RSQ) in distances

RSQ values are the proportion of variance of the scaled data (disparities)
in the partition (row, matrix, or entire data) which
is accounted for by their corresponding distances.
Stress values are Kruskal's stress formula 1.

Matrix Stress RSQ Matrix Stress RSQ


1 ,249 ,462 2 ,250 ,677

Averaged (rms) over matrices


Stress = ,24935 RSQ = ,56977
 
 

Se proporcionan los valores de Stress y RSQ para las matrices de


proximidades de ambos grupos, hombres (1) y mujeres (2). Los valores de

205
Eulogio Real Deus

Stress indican el grado de desajuste entre las proximidades originales y


las distancias derivadas por el modelo, por lo que indica un mejor ajuste
cuanto más próximo a cero. Por su parte, la RSQ indica la proporción
de varianza común a disparidades (una forma de proximidades) y
distancias, por lo que se interpreta de modo similar a un coeficiente de
determinación. Los valores obtenidos para hombres y mujeres, así como
los valores promedio de ambos índices no muestran un ajuste muy bueno,
por lo que cabría plantearse cambios en el modelo.

El resto del listado proporciona las coordenadas de los perfiles


vocacionales en las dos dimensiones de la solución, junto con los pesos
asignados por cada uno de los grupos a cada una de las dimensiones, y
que constituyen el indicador de diferencias entre los distintos grupos. Sin
embargo, resulta mucho más cómodo examinar las coordenadas en el
diagrama de dispersión que se proporciona:

Las dimensiones 1 (horizontal) y 2 (vertical) conforman un plano sobre el


que se sitúan los perfiles vocacionales, al modo de un mapa. Se aprecia
que la dimensión 1 discrimina entre los perfiles Realista y Convencional (a
la izquierda) y Social y Artístico (a la derecha), mientras que la dimensión
2 discrimina entre los perfiles Investigador y Emprendedor (arriba) y
los perfiles Convencional y Artístico (abajo).Estas posiciones coinciden

206
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

perfectamente con las preferencias manifestadas por mujeres y hombres,


respectivamente. Los perfiles Social y Artístico son los preferidos de las
mujeres, y los perfiles Realista y Convencional, los que menos les gustan.
En el caso de los hombres, los perfiles preferidos son el Investigador y
el Emprendedor, y los menos apetecidos, el Convencional y el Artístico.
Así pues, los resultados muestran claras diferencias de género, excepto
en cuanto al perfil Convencional, que es el menos apreciado tanto por
hombres como por mujeres.

El gráfico también permite apreciar tres agrupamientos en los perfiles:


un grupo formado por los perfiles Social y Artístico, preferidos por las
mujeres; un segundo grupo formado por los perfiles Investigador y
Emprendedor, preferidos por los hombres; y un tercer grupo formado
por los perfiles Realista y Convencional, de preferencia media-baja para
ambos grupos.

El gráfico de pesos permite apreciar la importancia que hombres y


mujeres conceden a cada dimensión. Puede apreciarse que el vector
correspondiente a los hombres es casi vertical, indicando que asignan un
peso muy superior a la dimensión 2 frente a la 1, mientras que el vector
correspondiente a las mujeres es casi horizontal, indicando que aquí se da
mucha más importancia a la dimensión 1 que a la 2.

207
Eulogio Real Deus

Finalmente, el gráfico de ajuste lineal nos muestra el grado de ajuste entre


las proximidades originales generadas a partir de los datos (Disparidades)
y las distancias existentes entre los perfiles a partir de sus coordenadas
en las dimensiones. Como puede apreciarse, existe una relación lineal
bastante clara entre ambas variables, aunque no perfecta:

2.10.9. Técnicas de clasificación


Este tipo de técnicas, entre las que se encuentra el análisis de conglomerados
y el análisis discriminante (Klecka, 1990), permiten realizar agrupamientos
de sujetos o de variables en función de su similaridad, por lo que resultan
de utilidad cuando pretendemos encontrar agrupaciones de sujetos con
características similares, o agrupar aquellas variables cuyas medidas
están relacionadas. En el primer sentido, el análisis de conglomerados
nos permitirá encontrar agrupamientos de sujetos que son semejantes
en un conjunto de características, mientras que en el caso del análisis
discriminante estos agrupamientos ya se conocen previamente, y lo que se
pretende con el análisis es predecir la pertenencia a un grupo determinado
en función de las características de los sujetos. En el segundo sentido, el
análisis de conglomerados puede emplearse como si fuese una técnica de
reducción de datos, proporcionándonos agrupamientos de las variables en
función de su similaridad, pero sin asumir ningún tipo de supuesto sobre

208
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

los datos, por lo que representa una buena alternativa al análisis factorial
cuando no se cumplen los requisitos que éste precisa.
Empezaremos comentando primero el caso del análisis de
conglomerados, también conocido como análisis de clusters. Este tipo
de análisis no requiere de ningún supuesto sobre los datos, además
de admitir no sólo datos de escala (donde las variables contienen la
puntuación de los sujetos en una característica determinada), sino
también dicotómicos (donde las variables contienen valores binarios que
indican la presencia o ausencia de la característica), así como también
datos de recuento (donde las variables contienen la frecuencia con que
se da una determinada característica para los distintos sujetos, o bien
contienen datos agregados, donde se registra el número de sujetos que
han asignado una característica dada a un objeto determinado). De
entre los distintos modelos de análisis de conglomerados disponibles
en SPSS, nos centraremos en el más utilizado de ellos: el análisis de
conglomerados jerárquico, que clasifica tanto sujetos como variables
adoptando una estructura ramificada jerárquica, que parte de un único
grupo y va dividiéndose progresivamente en subgrupos menores.
Veamos una aplicación del análisis de conglomerados con los mismos
datos del ejemplo de orientación vocacional que empleamos con el
escalamiento multidimensional, pero lo que nos interesa ahora es ver
cómo se agrupan los distintos perfiles en función de su similaridad. Para
ello, seleccionamos en el menú: Analizar → Clasificar → Conglomerados
jerárquicos. Aparecerá el siguiente cuadro de diálogo:

209
Eulogio Real Deus

En el cuadro de diálogo seleccionaremos las puntuaciones proporcionadas


por el SDS para cada uno de los seis perfiles vocacionales existentes:
Realista, Investigador, Artístico, Social, Emprendedor, Convencional. Es
posible conglomerar tanto casos (sujetos) como variables. Si elegimos
la primera opción, es posible utilizar el botón Guardar para guardar
el conglomerado de pertenencia de cada sujeto, lo que nos permitiría
analizar posteriormente las características de los agrupamientos
generados. Nosotros elegiremos la segunda opción, que agrupará a
las 6 variables en función de su semejanza. El botón Estadísticos nos
permite, entre otras cosas, especificar el número de conglomerados que
debe tener la solución, o permitir que el análisis decida por nosotros. En
el botón Gráficos podremos especificar cómo queremos visualizar los
conglomerados. Elegiremos el Dendograma, que representa gráficamente
de forma clara el proceso de aglomeración. En el botón Método podremos
especificar el método de aglomeración a utilizar, así como el tipo de datos
a partir de los cuales calcular las similaridades:

Existen varios métodos para determinar los agrupamientos. Algunos de


ellos son aglomerativos (se parte de los elementos individuales y se los va
aglomerando hasta que sólo existe un conglomerado), mientras que otros
son divisivos (se parte de un único conglomerado, y se lo va fragmentando
progresivamente hasta llegar a los elementos individuales). La estrategia

210
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

habitual es probar varios de ellos y comprobar si las soluciones son


similares, o si alguna resulta más clara o ajustada que otras. Por lo que se
refiere a la medida de los datos, el análisis admite datos de escala, pero
también datos binarios y frecuencias.

La primera tabla nos informa del proceso de aglomeración, que se ha


llevado a cabo en 5 pasos y que ha generado, por tanto, 5 conglomerados.
En el primer paso, se unen los perfiles Realista y Convencional (1 y 6), a
los que se une el perfil Emprendedor (5) en el paso 2. En el tercer paso se
juntan los perfiles Artístico y Social (3 y 4), y así sucesivamente.

Historial de conglomeración

Etapa Conglomerado que se combina Coeficientes Etapa en la que el conglomerado aparece Próxima etapa
por primera vez
Conglomerado Conglomerado Conglomerado 1 Conglomerado 2
1 2
1 1 6 13489,000 0 0 2
2 1 5 16342,500 1 0 4
3 3 4 16820,000 0 0 5
4 1 2 20769,667 2 0 5
5 1 3 23058,500 4 3 0

El dendograma permite apreciar visualmente el proceso de aglomeración,


y facilita la interpretación del mismo. Se aprecia que los perfiles
Realista y Convencional son los más parecidos entre sí, seguidos del
perfil Emprendedor, que se les une posteriormente, seguido del perfil
Investigador, a bastante distancia de los tres anteriores. Finalmente, se
unen a este conglomerado los otros dos perfiles, Artístico y Social, que
son los más diferentes al resto.

211
Eulogio Real Deus

En el caso del análisis discriminante, a diferencia del análisis de


conglomerados, tenemos un modelo predictivo, donde la variable
dependiente es una variable categórica con dos o más categorías indicando
el grupo de pertenencia del sujeto, y las variables independientes son
un conjunto de variables de escala. Es decir, que las clasificaciones de
los sujetos son ya conocidas, y lo que se pretende es predecirlas a partir
de la combinación lineal de un conjunto de variables, que deben ser
de escala. En caso de que entre las variables independientes existan
variables categóricas mezcladas con variables de escala resultan más
adecuados otros procedimientos, como la regresión logística (binomial y
multinomial).

Así pues, el análisis discriminante guarda un gran parecido con la


regresión lineal. De hecho, el modelo predictivo es muy similar, en el
que las variables independientes se combinan de forma aditiva en las
llamadas funciones discriminantes, que cumplen un papel análogo al
de la ecuación de regresión. Además, el análisis discriminante se basa en
los mismos supuestos que la regresión, por lo que las comprobaciones a
realizar serán muy similares.

212
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Vamos a realizar un análisis de ejemplo con los mismos datos de perfiles


vocacionales empleados para el caso del análisis de conglomerados. Es
bien conocido el problema de la llamada “brecha laboral” entre hombres
y mujeres, del que se derivan desigualdades salariales y de otros tipos.
Una de las razones para esta brecha es que las preferencias vocacionales
de hombres y mujeres son muy diferentes. Vamos a aplicar este problema
a nuestros datos, utilizando las puntuaciones en las seis escalas del SDS
(Realista, Investigador, Artístico, Social, Emprendedor y Convencional)
como variables independientes, y el sexo como variable dependiente.
La pregunta que pretendemos responder es: ¿hasta qué punto el perfil
vocacional de una persona permite identificar su género?

Para llevar a cabo el análisis, selecionamos en el menú: Analizar →


Clasificar → Discriminante. Aparecerá el siguiente cuadro de diálogo:

Especificamos nuestra variable dependiente (o de agrupación), indicando


los valores entre los cuales están las categorías de las variables (por
ejemplo, si los valores van de 1 a 4, el análisis asume que hay 4 grupos).
En nuestro caso, las categorías están entre 0 (hombre) y 1 (mujer). En
la lista de variables independientes introducimos las puntuaciones
obtenidas por los sujetos en las seis escalas correspondientes a los
diferentes perfiles vocacionales. Para la selección de las variables del
modelo es aconsejable elegir un método por pasos, que emplea medios
estadísticos para seleccionar los predictores más adecuados para el
modelo. Existen distintos métodos (accesibles en el botón Método)

213
Eulogio Real Deus

apoyados en diferentes estrategias, pero el empleado por defecto se basa


en el grado en que una variable independiente produce un cambio en el
valor de la lambda de Wilks (λ), que expresa la proporción de variabilidad
no debida a las diferencias entre grupos. Así pues, los métodos por pasos
seleccionarán a las variables independientes en función del grado en
que hagan descender el valor de la lambda de Wilks, hasta que ésta
valga cero, o hasta que ninguna variable independiente pueda reducirla
significativamente.

En el botón Estadísticos podemos especificar alguna información


adicional, o la comprobación de supuestos, mediante pruebas estadísticas
como la M de Box, que se interpreta de forma análoga a como se hacía
en el análisis de varianza. En el botón Clasificación podemos cambiar
las probabilidades previas asignadas a los grupos. En caso de que no
estemos ante grupos de tamaños similares, seleccionaremos la opción
Calcular según tamaños de los grupos. Es recomendable pedir también la
Tabla resumen, que nos permite evaluar la precisión de las clasificaciones
realizadas por las funciones discriminantes del modelo. También
podemos visualizar gráficamente la clasificación llevada a cabo por el
análisis:

Entre las tablas que más nos interesan de las que proporciona el análisis,
una es la lista de variables introducidas por el método de pasos sucesivos
en el modelo, junto con los valores de la lambda de Wilks, y la significación

214
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

del cambio experimentado en ésta con la inclusión de cada predictor en


cada paso. Como puede verse, se han seleccionado cuatro de los cinco
perfiles como predictores. A la derecha de cada uno se muestra la lambda
de Wilks asociada al modelo, y a la derecha de ésta se muestran los valores
F y su significación que comprueban la significación del cambio en el
valor de lambda a medida que se introducen predictores en el modelo.
Podemos ver que el valor de varianza no explicada es del 52.5%, por lo que
nuestro modelo explicaría un 47,5% de varianza.

Variables introducidas/excluidas a,b,c,d

Paso Introducidas Lambda de Wilks


Estadístico gl1 gl2 gl3 F exacta
Estadístico gl1 gl2 Sig.
1 Puntuación total Realista ,810 1 1 82,000 19,284 1 82,000 ,000
2 Puntuación total Artístico ,622 2 1 82,000 24,567 2 81,000 ,000
3 Puntuación total Emprendedor ,560 3 1 82,000 20,924 3 80,000 ,000
4 Puntuación total Convencional ,525 4 1 82,000 17,888 4 79,000 ,000
En cada paso se introduce la variable que minimiza la lambda de Wilks global.
a. El número máximo de pasos es 12.
b. La F parcial mínima para entrar es 3.84.
c. La F parcial máxima para salir es 2.71
d. El nivel de F, la tolerancia o el VIN son insuficientes para continuar los cálculos.

La siguiente tabla nos muestra los autovalores asociados a las funciones


discriminantes. En nuestro caso, dado que sólo tenemos 2 grupos
(hombres y mujeres), sólo existe una función discriminante. Aunque
el autovalor es de difícil interpretación, la tabla proporciona un índice
más informativo, la correlación canónica, que expresa la correlación
entre la función discriminante y las variables binarias indicadoras de
la pertenencia a los distintos grupos, por lo que puede ser interpretada
como un índice de ajuste del modelo a los datos.

Autovalores

Función Autovalor % de varianza % acumulado Correlación canónica


a
1 ,906 100,0 100,0 ,689
a. Se han empleado las 1 primeras funciones discriminantes canónicas en el análisis.

215
Eulogio Real Deus

A continuación se nos muestra el valor de la lambda de Wilks, junto con


su significación. Dado que este índice expresa la razón entre la suma de
cuadrados intragrupos y la suma de cuadrados total, puede interpretarse
como un índice que indica mayor parecido entre los grupos cuanto más
próximo a 1, y mayor separación entre los mismos cuanto más próximo
a cero.

Lambda de Wilks

Contraste de las funciones Lambda de Wilks Chi-cuadrado gl Sig.


1 ,525 51,589 4 ,000

La siguiente tabla nos muestra los coeficientes estandarizados de la


función discriminante para cada una de las variables independientes.
Dado que están estandarizados son de fácil interpretación. Podemos
observar que los perfiles Realista y Emprendedor tienen coeficientes
positivos, mientras que los perfiles Artístico y Convencional tienen valores
negativos, por los que tienen efectos opuestos al asignar los sujetos a cada
uno de los grupos.

Coeficientes estandarizados de las funciones discriminantes canónicas

Función
1
Puntuación total Realista ,773
Puntuación total Artístico -,919
Puntuación total Emprendedor ,741
Puntuación total Convencional -,459
 

A continuación se presenta la matriz de estructura, que muestra la


correlación existente entre cada variable independiente y la función
discriminante, ordenadas de mayor a menor correlación. La tabla nos
muestra que los perfiles Realista y Artístico son los que tienen mayor
peso en la función discriminante, seguidos de los perfiles Emprendedor,
Investigador (excluido del modelo), Social (excluido del modelo), y
Convencional, con pesos mucho menores.

216
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Matriz de estructura

Función
1
Puntuación total Realista ,510
Puntuación total Artístico -,458
Puntuación total Emprendedor ,291
Puntuación total Investigadora ,168
Puntuación total Sociala -,076
Puntuación total Convencional ,064
Correlaciones intra-grupo combinadas entre las variables discriminantes y las funciones
discriminantes canónicas tipificadas
Variables ordenadas por el tamaño de la correlación con la función.
a. Esta variable no se emplea en el análisis.

La siguiente matriz muestra la posición de los centroides de los grupos


en la función discriminante. Como puede apreciarse, los hombres se
encuentran en el polo positivo de la función, mientras que las mujeres se
encuentran en el polo negativo. Dado que los coeficientes correspondientes
a las variables independientes, examinados más arriba, fueron positivos
en el caso de los perfiles Realista y Emprendedor, y negativos en el caso de
los perfiles Artístico y Convencional, lo que relaciona a los primeros con
los hombres, y a los segundos con las mujeres.

Funciones en los centroides de los grupos

Sexo Función
1
Hombre ,986
Mujer -,897
Funciones discriminantes canónicas no tipificadas evaluadas en las medias de los grupos

Por último, se nos proporciona una tabla resumen que nos muestra el cruce
entre la verdadera clasificación de los sujetos (en las filas), y la asignación
hecha por el análisis discriminante (en las columnas). Podemos apreciar
que sólo se clasifican incorrectamente 8 de los 40 hombres, y 7 de las 44
mujeres, lo que representa un 82.1% de casos clasificados correctamente.
Dado que esto implica un grado de precisión en la predicción del género
de los sujetos, podemos considerar que este resultado confirma que
existe un efecto de género en las preferencias vocacionales de los sujetos,

217
Eulogio Real Deus

estando asociadas a los hombres las puntuaciones en los perfiles Realista


y Emprendedor (propios de personas que aprecian los trabajos manuales
y el emprendimiento empresarial), mientras que los perfiles Artístico y
Convencional (propios de personas que aprecian los trabajos de tipo
artístico o de oficina) se asocian a las mujeres.

Resultados de la clasificacióna

Sexo Grupo de pertenencia pronosticado Total


Hombre Mujer
Hombre 32 8 40
Recuento
Mujer 7 37 44
Original
Hombre 80,0 20,0 100,0
%
Mujer 15,9 84,1 100,0
a. Clasificados correctamente el 82,1% de los casos agrupados originales.

2.11. Integración de resultados


Cada una de las preguntas que nos hemos hecho durante la investigación
debe haber sido respondida por al menos un resultado. En ocasiones es
conveniente emplear más de una técnica para evaluar una determinada
asociación entre variables, con el fin de poder confirmar la existencia de
una relación entre variables, o un efecto de una variable sobre otra. En
el caso de muchas pruebas estadísticas, será necesario comprobar si se
cumplen los supuestos de la prueba antes de interpretar los resultados
obtenidos por la misma. En caso de violación de algún supuesto,
debemos comprobar si nuestra técnica y las características de nuestro
estudio permiten asumir fortaleza frente a esta violación; en caso de que
no podamos asumirla, será necesario tomar las medidas necesarias para
sortear el problema, bien sea mediante transformaciones en los datos,
bien sea empleando otra técnica que no requiera de estos supuestos.

El proceso de integración de resultados se lleva a cabo de forma paralela


al de análisis de datos. Si nuestra estrategia es empezar desde los análisis
más sencillos univariados y bivariados hacia los multivariados, debemos
ir anotando los resultados preliminares y ver su consistencia con los

218
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

análisis más complejos elaborados posteriormente. De la acumulación


de resultados deberá emerger un todo coherente que no sólo nos
permitirá contestar a las preguntas del estudio, sino que debe ser un
punto de partida para preparar la discusión de resultados y elaborar las
conclusiones del estudio.

En algunas ocasiones, el resultado buscado es simplemente el valor de un


coeficiente concreto, solo o acompañado de su significación estadística.
En muchas otras ocasiones, los resultados serán de tipo más complejo,
por los que se podrán apreciar mejor con la ayuda de tablas y gráficos.
El análisis de estos datos debe continuar hasta que consideremos que
tenemos toda la información que necesitamos, y que todas las preguntas
que nos habíamos planteado han quedado contestadas.

2.12. Redacción de la memoria


El informe de investigación es el vehículo a través del cual se van a
comunicar a la comunidad científica los antecedentes, los resultados y
las implicaciones de nuestro estudio. Debe integrar de forma coherente
el trabajo de documentación bibliográfica realizado, las características
del marco teórico, las variables de interés, el diseño de investigación
empleado, los análisis estadísticos realizados, la interpretación de los
resultados obtenidos y las repercusiones que dichos resultados tienen en
el estado actual del campo de investigación. La memoria de investigación
debe, por tanto, integrar de forma coherente una gran cantidad de
información compleja y comunicarla de forma clara y sin ambigüedades.
Es por ello que la elaboración de esta memoria es un proceso muy
estructurado en cuya redacción deberemos tener en cuenta una serie de
principios básicos:

vv Accesibilidad. Toda la información necesaria para comprender


la memoria debe estar accesible en la misma, o a través de una
referencia o un enlace. Si hemos desarrollado una herramienta
nueva deberemos incluirla en un apéndice, para que pueda ser
examinada por los lectores. Si hemos empleado un instrumento
desarrollado por otros, deberemos referenciarlos para que el
potencial lector pueda informarse más en detalle acerca de sus

219
Eulogio Real Deus

características. Toda la información que podamos considerar


relevante para los lectores debe estar accesible en el documento,
bien en el cuerpo del mismo, bien en apéndices al final, bien
referenciando a la fuente de la que se puede obtener esta
información.

vv Brevedad. La memoria de investigación es un documento que


presenta una relación resumida del proceso llevado a cabo en
una investigación, por lo que supone un gran esfuerzo de síntesis
por parte de quien la escribe. En aras de esta simplificación es
necesario emplear la forma más breve posible a la hora de redactar
las frases, evitando ser demasiado prolijos o emplear expresiones
innecesarias, que no añaden contenido al mensaje.

vv Claridad. Un problema habitual en los informes de investigación


consiste en que están escritos en un lenguaje poco accesible, o
redactados de forma confusa, lo que hace complicado seguir los
argumentos y las explicaciones que se proporcionan en el texto.
Si bien la falta de claridad es un defecto en cualquier documento
escrito, en el caso de la memoria de investigación se convierte
en un verdadero problema: resulta muy difícil entender algo tan
complicado como una investigación si su lectura no se ve facilitada
por el uso de un lenguaje claro y sin ambigüedades.

vv Coherencia. La memoria de investigación es un documento muy


estructurado, y con unas secciones fijas. Esto no es un capricho, sino
que resulta necesario para organizar de forma clara y ordenada la
información. Es necesario adherirse a las normas correspondientes
para que la memoria forme un todo coherente, cuyas partes
remiten unas a otras, de tal modo que la sección teórica facilite la
interpretación de los objetivos e hipótesis que, a su vez, facilitarán
la comprensión de la sección metodológica, etc.

vv Escrupulosidad. Este aspecto no se refiere únicamente al aspecto


visual de la presentación del trabajo, en el sentido de que no debe
apreciarse descuido en la elaboración de las tablas y gráficos, en
la tipografía y el uso de encabezados, sino también al cuidado de

220
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

aspectos que reflejan de forma sutil el grado en que se ha sido


cuidadoso en la elaboración de la memoria, tales como referenciar
correctamente la bibliografía, organizar correctamente los
apartados y sub-apartados del trabajo, comprobar la consistencia
de la terminología empleada, etc.

vv Exhaustividad. Es necesario incorporar a la memoria toda la


información que sea necesaria para la comprensión del proceso
investigador. Nunca deben dejarse hilos sueltos ni puede faltar
información relevante para la comprensión del informe.

vv Legibilidad. Ocurre en muchas ocasiones que una vez redactado


el documento o la memoria a nuestro gusto, cuando se lo damos
a leer a una tercera persona empieza a encontrar problemas en
su lectura. Estos problemas pueden ser de muchos tipos: de no
entender la estructura del documento, o los términos manejados,
o los análisis, o las conclusiones. En cualquier caso, estos problemas
son una manifestación de que no hemos preparado la memoria
pensando en el potencial lector de la misma, sino en nosotros
mismos, por lo que no resulta sorprendente que sólo nosotros
podamos entenderla cabalmente. Es importante tener en mente
al lector de nuestra memoria cuando la redactemos, como si le
estuviésemos contando a alguien nuestra investigación y nos
interesase que la entendiese perfectamente.

vv Objetividad. La objetividad es uno de los requisitos indispensables


del trabajo científico. Una memoria de investigación debe estar
libre de subjetividad por parte del investigador. Esto implica
que sus opiniones, creencias o prejuicios no pueden influenciar
ninguna de las fases del proceso investigador, ni deben utilizarse
como guía para interpretar los resultados obtenidos.

vv Rigor. Debemos ser especialmente rigurosos en este tipo de


trabajos. Por ejemplo, las citas textuales deben incluirse como
tales, entrecomilladas y en cursiva, y debe referenciarse la página
de la que se extrajo la cita. La bibliografía es uno de los apartados
donde debemos ser más rigurosos, tanto en la selección de los
trabajos, como en su referencia en la memoria, asegurándonos

221
Eulogio Real Deus

de que éstas son correctas, y de que ningún trabajo queda sin


referenciar. En otro orden de cosas, el documento también debe
reflejar el grado en que hemos sido rigurosos durante el proceso
investigador. En el caso de que deseemos publicar nuestro trabajo
como un artículo en una revista científica, encontraremos que las
revistas suelen exigir la presentación en un formato determinado,
con unas normas muy estrictas; la falta de rigor en estos aspectos
puede llevar al rechazo del artículo.

vv Sencillez. El trabajo científico y metodológico obliga a tratar con


términos complejos, modelos matemáticos y jerga especializada,
que hace la lectura más difícil que la de otro tipo de textos. Es
imprescindible, ser lo más sencillo posible en el empleo de
terminología, giros y expresiones, para no añadir más complejidad
a la lectura. La sencillez también se aplica a la presentación
visual del documento, evitando el uso caprichoso de tipografías,
el cuidado en la selección de los colores de los gráficos, o la
presentación de diagramas o esquemas.

En cuanto a las distintas secciones del documento, comentamos a


continuación los aspectos más importantes a tener en cuenta a la hora
de redactarlas:

vv Título. No sólo sirve para darle un nombre al trabajo, sino mucho


más. El título es uno de los criterios habituales de búsqueda de
información, por lo que debemos hacer que sea lo más informativo
posible, para que pueda indicar de un vistazo el tipo de trabajo de
que se trata y cualquier detalle relevante por el que este trabajo
destaque, ya sea por la muestra, la metodología o el propósito del
mismo.

vv Índice. Refleja la estructura del trabajo y facilita la comprensión


de los distintos aspectos implicados en el mismo, por lo que debe
estar bien organizado en apartados y sub-apartados.

vv Resumen o Abstract. Como su propio nombre indica, debemos


hacer aquí un breve resumen (200-300 palabras) de nuestro trabajo
de investigación, mencionando todos los aspectos relevantes

222
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

sobre el marco teórico, los objetivos, la metodología empleada y


los resultados más relevantes obtenidos, junto con las principales
conclusiones. Debe ser comprensible para alguien que no se ha
leído el informe completo, y es muy importante esforzarse al
máximo para que resulte informativo, puesto que muchos lectores
de artículos científicos basan su juicio sobre el trabajo en el
resumen y, en función de la información proporcionada por éste,
deciden si es útil para ellos o no. En publicaciones internacionales
es necesario incluir una versión en inglés del resumen (Abstract),
por lo que también deberemos poner especial cuidado en la
calidad de la traducción.

vv Palabras clave. Este es otro de los criterios más empleados para


localizar información en búsquedas bibliográficas, por lo que
incluiremos en esta sección todos los términos que describen
nuestro marco teórico y empírico, procurando que sean entre
cuatro y seis. En el caso de campos de investigación especializados
existen términos de búsqueda que son ampliamente utilizados y
que deben ser incluidos para situar el trabajo dentro de una línea
de investigación concreta.

vv Introducción. Esta sección describe el marco en el que se sitúa la


investigación, así como la documentación en la que nos hemos
basado. De hecho, la gran mayoría de nuestras referencias
bibliográficas se sitúan aquí, lo que hace que debamos manejar
ambas secciones al redactar la introducción, añadiendo a la
bibliografía cada una de las citas que vamos incluyendo para ilustrar
nuestro marco teórico. La sección debe estar bien estructurada;
lo habitual es que se organice la información de lo más general
a lo más particular y específico del trabajo que se presenta. Así,
generalmente comenzaremos delimitando el marco teórico en el
que se inscribe la investigación, su estado actual, y los aspectos
en los que todavía existen cuestiones no resueltas, para proponer
una investigación que aborde las mismas. En la parte final de la
introducción, se propondrán una serie de objetivos o hipótesis que
el trabajo pretende plantear y responder, con el fin de contestar a
estas cuestiones. Es muy importante asegurarse de que nuestro

223
Eulogio Real Deus

marco teórico está bien explicado y documentado, y de que la


lectura de este apartado deja preparado al lector para entender
las secciones siguientes. Una vez que haya leído la introducción,
debemos esperar que haya entendido el marco teórico de la misma
y haya comprendido la importancia de los aspectos investigados.

vv Método. Esta sección describe el procedimiento llevado a cabo


para obtener la información necesaria para la investigación, así
como su análisis. Es importante aclarar todo lo relacionado con los
distintos aspectos que se abordan en esta sección, y que suelen ser
los siguientes:

ŸŸ Variables e instrumentos. Se comentan las variables


que van a ser utilizadas en la investigación, así como los
instrumentos empleados para medirlas, proporcionando
toda la información técnica necesaria sobre el instrumento,
ya se trate éste de un aparato de laboratorio o de una escala.
La información más relevante que debe proporcionarse
sobre los instrumentos es la relacionada con la idoneidad
y precisión de sus medidas, indicando las características
técnicas de los aparatos empleados en el laboratorio, en el
caso de un experimento, o la fiabilidad y validez del test, en
el caso de una escala. En este último caso, además, podemos
añadir a la descripción del instrumento los resultados
obtenidos con el instrumento en nuestra muestra, como
por ejemplo su consistencia interna, sus relaciones con
otras escalas empleadas, etc.

ŸŸ Participantes. Se describirá la muestra empleada, así como


sus principales características sociodemográficas (edad,
sexo, etc.), o su distribución en cualquier variable que
pueda ser relevante para la investigación (por ejemplo,
en una investigación sobre patologías clínicas, porcentaje
de sujetos afectados por cada patología). En caso de
que la cantidad de información a proporcionar sea muy
abundante, es posible presentar una tabla resumen de las
principales características de la muestra.

224
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

ŸŸ Procedimiento. Se detalla el modo en que se contactó con


los sujetos, durante cuánto tiempo se extendió la recogida
de datos, en qué condiciones se realizó dicha recogida, qué
instrucciones se dio a los colaboradores en la investigación,
y qué instrucciones se dio a los participantes, cómo se
presentaron los instrumentos, cuánto tiempo duró en
promedio la sesión, etc. Debe presentarse de forma que
fuese posible replicar el estudio siguiendo exactamente los
mismos pasos que se detallan en esta sección.

vv Resultados. En esta sección iremos presentando de forma


ordenada los resultados de nuestra investigación. La secuencia
de presentación vendrá dada por los objetivos y/o hipótesis que
nos hayamos planteado en la sección introductoria. A medida
que vayamos presentando los distintos objetivos, indicaremos el
resultado de los análisis realizados al respecto, y la interpretación
que cabe hacer de estos resultados en cuanto al objetivo
propuesto. En caso de que nuestros objetivos estuviesen anidados,
empezaríamos por contestar primero cada objetivo general,
para pasar luego a contestar los objetivos específicos derivados
de éste. En esta sección no es necesario realizar la discusión de
los resultados, sino simplemente presentarlos aunque, eso sí,
intentando relacionarlos unos con otros para ir aclarando las
implicaciones que estos resultados tienen para los objetivos
propuestos.

vv Discusión. Aquí retomaremos los resultados obtenidos, pero


centrándonos ahora en las implicaciones que tienen para los
objetivos del estudio. También deberemos recurrir aquí a la
literatura para encontrar apoyo o resultados discrepantes a los
nuestros, y plantear posibles razones para las discrepancias
encontradas. En esta sección no se incluyen generalmente datos
numéricos (niveles de significación, valores de estadísticos, etc.),
sino que la integración debe ser abstracta, en términos verbales. No
debe quedar sin comentar ninguno de los aspectos encontrados en
la sección de resultados. Aquellos aspectos que no hayan quedado
claros o que hayan ofrecido resultados contradictorios deben ser
mencionados aquí, y referenciados en la sección siguiente.

225
Eulogio Real Deus

vv Conclusiones. A partir de los resultados y la discusión de los


mismos procede ahora elaborar unas conclusiones que resuman
los principales hallazgos del estudio. Aquellas cuestiones que
hayan surgido a partir de la investigación o que no hayan quedado
aclaradas por la misma deben recogerse también en esta sección de
la memoria. Normalmente, en la parte final se suelen incluir un par
de apartados sobre limitaciones encontradas en nuestro trabajo
de investigación, así como recomendaciones para investigaciones
futuras. En el primero de ellos incluiremos todos aquellos aspectos
que no hayan podido ser abordados o contestados correctamente
en nuestra investigación, o a los fallos detectados durante el
desarrollo de la misma, y tienen por finalidad situar unos límites al
alcance que tienen nuestros resultados o de nuestras conclusiones,
con el fin de que otros puedan evitar o paliar estos inconvenientes.
En el caso de las recomendaciones, se pretende ayudar a los
investigadores en la misma línea a continuar en el conocimiento
del fenómeno objeto de estudio, indicando los caminos a seguir
que marcan nuestros resultados.

vv Referencias bibliográficas. Se indicarán aquí las fuentes


bibliográficas consultadas para la elaboración de la investigación,
colocadas en orden alfabético y siguiendo la normativa APA (http://
www.apa.org) para la cita de libros, capítulos de libros, artículos,
monografías, etc. Hoy en día existen muchas formas de mantener
organizadas nuestras referencias bibliográficas en bases de datos
que nos permitan incluir estas referencias. Además, muchos
procesadores de texto comerciales permiten la inclusión de citas
bibliográficas de forma automática, lo que permite mantener
organizada esta sección a medida que se redacta el documento.

vv Anexos. Esta sección es opcional, y en ella se incluyen todos


aquellos documentos, cuestionarios, tablas, gráficos, imágenes
o esquemas que puedan ser necesarios para que el lector pueda
consultarlos, pero que no pueden ser incluidos en el cuerpo
principal del documento, bien porque su examen es opcional, bien
porque ocupan demasiado espacio.

226
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Es importante recalcar que la memoria de investigación es un documento


altamente estructurado y complejo, por lo que es muy importante
revisarla una y otra vez en busca de mejoras que puedan introducirse
en el texto, bien mediante aclaraciones que puedan ser necesarias, bien
abreviando o simplificando expresiones, bien cambiando expresiones
complejas y ambiguas por otras que resulten más precisas y sencillas.

227
Eulogio Real Deus

3. Bibliografía
Achen, C. (1982). Interpreting and using regression. Beverly Hills and
London: Sage publications.

Amón, J. (1982). Estadística para psicólogos (1). Estadística descriptiva.


Madrid: Pirámide.

Amón, J. (1986). Estadística para psicólogos (2). Probabilidad. Estadística


inferencial. Madrid: Pirámide.

Arce, C. (1993). Escalamiento multidimensional. Una técnica multivariante


para el análisis de datos de proximidad y preferencia. Barcelona: PPU.

Arce, C., & Real, E. (2000). Introducción al análisis estadístico con SPSS
para Windows. Barcelona: PPU.

Asher, H. (1983). Causal modeling. Beverly Hills and London: Sage


publications.

Bell, J., & Waters, S. (2014). Doing your Research Project. A Guide for First-
time Researchers. Berkshire, UK: Open University Press.

Byrne, B. (2010). Structural equation modeling with AMOS. New York:


Routledge.

Costa, P., & Costa, S. (1991). Inventario de personalidad NEO revisado


(NEO PI-R). Inventario NEO reducido de cinco factores (NEO-FFI). Madrid:
TEA Ediciones.

Delgado, C. (2014). Viajando a Ítaca por mares cuantitativos. Manual de


ruta para investigar en grado y postgrado. Salamanca: Amarú Ediciones.

Denscombe, M. (2014). The Good Research Guide: For Small-Scale Social


Research Projects. Berkshire, UK: Open University Press.

Diener, E. (1980). Subjective well-being. Psychological Bulletin, 95, 542-575.

228
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Dunteman, G. (1989). Principal components analysis. Beverly Hills and


London: Sage publications.

Foddy, W. (1993). Constructing questions for interviews and questionnaires.


Theory and practice in social research. Cambridge: Cambridge University
Press.

Holland, J. (1994). The Self Directed Search (4th edition). Odessa, FL:
Psychological Assessment Resources.

Holland, J. (1997). Making vocational choices: a theory of vocational


personalities and work environments. Odessa, FL: Psychological
Assessment Resources.

Kirk, R. (1995). Experimental design: procedures for the behavioral


sciences. Belmont, CA: Brooks/Cole.

Klecka, W. (1990). Discriminant analysis. Beverly Hills and London: Sage


Publications.

Kruskal, J., & Wish, M. (1988). Multidimensional scaling. Beverly Hills and
London: Sage Publicatios.

Lewis-Beck, M. (1990). Applied regression. An introduction. Beverly Hills


and London: Sage publications.

Long, J. (1983). Confirmatory factor analysis. Beverly Hills and London:


Sage publications.

Lubin, P., Maciá, A., & Rubio, P. (2005). Psicología Matemática II. Madrid:
UNED.

Manzano, V., & Braña, T. (2003). Análisis de datos y técnicas de muestreo.


In J.-P. Lévy, & J. Varela, Análisis multivariable para las ciencias sociales
(pp. 91-143). Madrid: Pearson Educación.

Martín, Q., Cabero, M., & de Paz, Y. (2008). Tratamiento estadístico de


datos con SPSS. Madrid: Thomson Paraninfo.

229
Eulogio Real Deus

Muñiz, J. (1992). Teoría clásica de los tests. Madrid: Pirámide.

Muñiz, J., Elosúa, P., & Hambleton, R. K. (2013). Directrices para la


traducción y adaptación de los tests: segunda edición. Psicothema, 25(2),
151-157.

Nunnally, J., & Bernstein, I. (1995). Teoría psicométrica. México: Trillas.

Pardo, A. (2002). Análisis de datos categóricos. Madrid: UNED.

Pardo, A., & San Martín, R. (1998). Análisis de datos en Psicología II.
Madrid: Pirámide.

Pérez, C. (2005). Métodos estadísticos avanzados con SPSS. Madrid:


Thomson Paraninfo.

Prat, R., & Doval, E. (2003). Construcción y análisis de escalas. In J.-P. Lévy,
& J. Varela, Análisis multivariable para las ciencias sociales (pp. 43-89).
Madrid: Pearson Educación.

Real, E. (2001). Escalamiento multidimensional. Madrid: La Muralla


Ediciones.

Rodenes, M., Chismol, R., & Arango, M. D. (2000). Un enfoque sistemático


para realizar la tesis doctoral. Psicothema, 12(2), 474-478.

Rosenberg, M. (1989). Society and the adolescent self-image. Middletown,


CT: Wesleyan University Press.

Schweigert, W. A. (1994). Research methods and statistics for Psychology.


Pacific Grove, CA: Brooks Cole.

Stevens, S. S. (1957). On the psychophysical law. Psychological Review, 64,


153-181.

Thompson, B. (1984). Canonical correlation analysis. Uses and


interpretation. Beverly Hills and London: Sage publications.

230
MANUAL DE INVESTIGACIÓN PARA CIENCIAS SOCIALES Y DE LA SALUD EN GRADO Y POSGRADO

Visauta, B. (1998). Análisis estadístico con SPSS para Windows. Madrid:


McGraw-Hill.

Winer, B., Brown, D., & Michels, K. (1991). Statistical principles in


experimental design. New York: McGraw-Hill.

Yerkes, R., & Dodson, J. (1908). The relation of the strength of the stimulus
to rapidity of habit-formation. Journal of comparative Neurology and
Psychology(18), 459-482.

231

View publication stats