Wuolah-free-Analisis de Datos

DISEÑO Y ANÁLISIS DE DATOS.
Elena García Candau

UNIVERSIDAD LOYOLA ANDALUCÍA
Apuntes descargados de wuolah.com

BLOQUE 1. Fundamentos metodológicos y diseños de investigación
en Psicología.
Tema 1. Consideraciones generales sobre investigación y medición.

- 1.1Tipos de variables.
- 1.2. Calidad de la investigación: validez.
- 1.3. Criterios para la recogida de datos.
- 1.4. Representatividad y muestreo.
- 1.5. No confusión y control.
Tema 2. Diseños y Métodos de investigación.

- 2.1. Métodos cualitativos.
- 2.2. Método observacional.
- 2.3. Método de encuesta.
- 2.4. Método experimental.
- 2.5. Método cuasi-experimental.
- 2.6. Otros métodos.
Tema 3. Introducción a la estadística descriptiva.
- 3.1. Definición de Estadística.

- 3.2. Escalas de medición.
- 3.3. Codificación de datos en SPSS.
- 3.4. Transformación de los datos.
Tema 4. Organización y representación de datos.
- 4.1. Distribución de frecuencias

- 4.2. Representación gráfica de los datos
- 4.3. Exploración de datos (Diagrama de tallo y hojas; Datos atípicos, extremos y
Perdidos)
Tema 5. Medidas de posición.
- 5.1. Percentiles
- 5.2 Deciles
- 5.3 Cuartiles
MasterSevilla - Máster en Dirección y Gestión de Recursos Humanos

- 5.4 Equivalencia entre cuantiles
BLOQUE 2. Introducción al análisis de datos
Tema 6. Medidas de tendencia central y de variación.
- 6.1. Definición de tendencia central

- 6.2 Índices de tendencia central (La media aritmética, La mediana, La moda).
- 6.3. Concepto de variabilidad
- 6.4. Índices de variación (Varianza y desviación típica; Otros índices de variación)
- 6.5 Representación gráfica.
Tema 7. Medidas de asimetría y apuntamiento.
- 7.1. Introducción
- 7.2 Índices de asimetría
- 7.3 Índices de apuntamiento
Tema 8. Tipos de puntuaciones.

- 8.1 Introducción: puntuaciones directas, diferenciales y típicas
- 8.2 Características de las puntuaciones típicas
- 8.3 Escalas derivadas. Transformación de datos.
- 8.4 Combinación lineal de variables
- 8.5 Puntuaciones diferencia
- 8.6 Suma de variables.
- 8.7 Combinación lineal de variables.
Tema 9. Introducción a la inferencia estadística.
- 9.1. Modelos probabilísticos de distribución de datos más utilizados en psicología.

- 9.2. Problemas que estudia la Inferencia Estadística: estimación de parámetros y
contraste de hipótesis estadísticas.
- 9.3. Estadístico y estimador.
- 9.4. Estimación puntual. Estimación por intervalos de confianza.
- 9.5. Elementos básicos de un contraste de hipótesis.
- 9.6. Hipótesis de investigación e hipótesis estadísticas.
- 9.7. Errores, potencia y tamaño de efecto en un contraste de hipótesis.
Sácate el carnet de conducir por 185€. AUTOESCUELA CIUDAD JARDIN.

- 9.8. Significación estadística. Intervalo confidencial. Cálculo de intervalos de
confianza
- 9.9. Correlación y regresión. Modelos probabilísticos de distribución de datos más
utilizados en psicología.
3
BLOQUE 1. CIENCIA Y MÉTODO CIENTÍFICO.
FUNDAMENTOS METODOLÓGICOS PARA LA
INVESTIGACIÓN.
Tema 1. PLANTEAMIENTO VÁLIDO DE PREGUNTAS.
• El análisis de datos es tan solo una parte del proceso de investigar.
• Pero… ¿Qué es investigar?
• Investigar: plantear preguntas de forma válida.
1.1 El proceso de investigación.
MÉTODO:
INTRODUCCIÓN MUESTRA,
OBJETIVOS RESULTADOS DISCUSIÓN
JUSTIFICACIÓN INSTRUMENTOS,
PROCEDIMIENTO
1.2 Planificación de la investigación.
ELEMENTOS BÁSICOS CONTENIDOS

Introducción/ Justificación Antecedente; estudios previos.
Planteamiento del problema.
Formulación de objetivos e hipótesis.
Método (diseño, muestra, instrumentos, Elección metodología
procedimiento, análisis de datos) Definición operativa de variables
Elección instrumentos de medida
Selección muestra de sujetos
Recogida y grabación de datos
Análisis de datos
Resultados Interpretación de los resultados
Discusión y conclusiones Cumplimiento de objetivos
Coherencia con estudios previos
Limitaciones Estudios futuros
Referencias bibliográficas Normas APA edición 6th

 La investigación científica arranca de problemas: sin problemas no hay investigación.
 Los problemas surgen de lagunas en resultados de investigación, o resultados
contradictorios en distintas investigaciones o cuando no existe información previa.
 Un problema de investigación es el inicio de la investigación científica. Siendo cualquier
proposición acerca de una situación que requiere más o mejor conocimiento del que se
tiene en el instante presente, es decir, cualquier duda o pregunta que se pretende
responder a través de la investigación.
 Tipos de problemas:
o Teóricos.
o Prácticos.
o Teórico-prácticos.
 Para valorar el problema, el investigador puede formularse preguntas como:
o ¿El problema es real?
o ¿El problema es de interés?
o ¿El problema es relevante?
o ¿El problema es factible?
o ¿El problema es innovador?
 Criterios para formular correctamente el problema de investigación.
1) El problema debe expresar una relación entre dos o más variables (si bien en los
estudios cualitativos o descriptivos éste no es un requisito).
2) El problema debe estar formulado claramente y sin ambigüedad mediante una
pregunta o varias que orientan hacia las respuestas que se buscan en la
investigación.
3) El planteamiento del problema debe implicar la posibilidad de realizar una prueba
empírica que confirme o no las hipótesis.
 ¿Cómo se formula un objetivo de investigación?
Los objetivos de investigación contienen dos elementos estructurales que son:
o Las unidades de análisis o de observación. A saber, individuos, instituciones,
conglomerados.
o Las variables. Son los atributos, características, o propiedades cualitativas
o cuantitativas que manifiestan en las unidades de observación.

1.2.2 tipos de objetivos.
 Objetivos generales: Son los propósitos o metas que conforman el marco de referencia
del proyecto. Por su formulación pueden admitir varias interpretaciones y no hacen
referencia a conductas concretas.
Como ejemplo podemos indicar que para formular objetivos generales se suelen utilizar
verbos del estilo de: conocer, comprender, analizar, evaluar, etc., es evidente que estos
verbos admiten varias interpretaciones y no son directamente observables.
 Objetivos específicos: son especificaciones más concretas y pormenorizadas de los
objetivos generales. Identifican de forma más clara y precisa lo que se pretende alcanzar
con el proyecto. Estos objetivos restringen el significado de los generales. Sólo admiten
una interpretación, facilitan la mejor estructuración del proyecto y pueden desglosarse
para su análisis.
Para formular objetivos específicos es necesario utilizar verbos de acción, tales como:
diseñar, enumerar, resolver, clasificar, calcular, comprobar, repetir, ordenar,
diferenciar, juzgar críticamente, comparar, decidir, etc.
 Primarios: estos objetivos suelen establecerse como los principales del estudio.
 Secundarios: estos ayudan a alcanzar y complementan los alcances de los objetivos
primarios.
 Existen otros tipos de clasificación de los objetivos: corto, medio y largo plazo; teóricos
y prácticos; individuales y colectivos; etc.
¿CÓMO SE FORMULA UN OBJETIVO DE INVESTIGACIÓN?
En la redacción se deben tomar en cuenta las siguientes recomendaciones para considerar los
aspectos más relevantes en su formulación:
→ Deben ser concretos, es decir no redundar en frases largas y poco claras

→ Ser factibles es decir tomar en cuenta todos los aspectos involucrados dentro de la
investigación: tiempo, dinero, personal, perspectivas y capacidad.
→ Identificar el abordaje del tema, el destino de dicha investigación y el uso de los
recursos, en otras palabras el diseño cualitativo o cuantitativo del proyecto.
→ El uso de los verbos en infinitivo, para identificar de forma clara los resultados
esperados.
Ejemplos.
 Conocer que efectos perjudiciales produce la delincuencia en la ciudad de Sevilla.

o Determinar el porcentaje de delincuencia que existe en la ciudad de Sevilla en
2015.
o Establecer las posibles causas de la delincuencia en la ciudad de Sevilla en 2015.
o Analizar posibles soluciones.
 Analizar el analfabetismo a través de la tecnología para buscar soluciones.
o Implementar aulas virtuales en las zonas rurales y urbanas.
o Capacitar a las escuelas ante el analfabetismo.
o Hacer que la población presente interés en solucionar este problema social.
1.2.3 ¿Qué es una hipótesis?
La hipótesis científica es aquella formulación que se apoya en un sistema de conocimientos

organizados y que establece una relación entre dos o más variables para explicar y predecir, en
la medida de lo posible, los fenómenos que le interesan en caso de que se compruebe la relación
establecida.
Características de las hipótesis:
1. Deben referirse a un ámbito determinado de la realidad social.

2. Las variables tienen que ser comprensibles, precisas y lo más concretas posibles.
3. La relación entre las variables debe ser lógica y verosímil.
4. Las variables y sus relaciones deben tener indicadores empíricos u observables.
5. El planteamiento de la hipótesis debe prever las técnicas para probarla.
Requisitos:
 Deben referirse a un ámbito determinado de la realidad social.

 Las variables tienen que ser comprensibles, precisas y lo más concretas posibles.
 La relación entre las variables debe ser lógica y verosímil.
 Las variables y sus relaciones deben tener indicadores empíricos u observables.
 El planteamiento de la hipótesis debe prever las técnicas para probarla
Tipos de hipótesis:
→ Las descriptivas (de una sola variable), señalan la presencia de ciertos hechos o
fenómenos en la población objeto de estudio. Son simples afirmaciones, no permiten
explicar los hechos o fenómenos, posibilitan probar la existencia de una característica o
cualidad en un grupo determinado.
7
→ Las correlacionales especifican las relaciones entre dos o más variables. Las relaciones
entre las variables son de covariancia, no de causalidad. Ninguna variable es la causa de
la otra. Las hipótesis correlacionales pueden establecer la relación entre dos variables
(o más) o señalar además, cómo están asociadas.
→ Las causales son aquellas que establecen relaciones de causa-efecto entre dos o más
variables. Pueden ser bivariadas o multivariadas. Las bivariadas establecen la relación
entre dos variables. Las multivariadas establecen una correlación entre varias variables.
¿Cómo se formula una hipótesis?
Las hipótesis contienen tres elementos estructurales que son:
 Las unidades de análisis o de observación. A saber, individuos, instituciones,

conglomerados.
 Las variables. Son los atributos, características, o propiedades cualitativas o
cuantitativas que manifiestan en las unidades de observación.
 El enlace lógico o término de relación. Que describe la relación existente entre las
unidades de análisis con las variables y de éstas entre sí.
Ejemplo.
 Las empresas industriales tienen una organización jerárquica.

 El tipo de empresa está relacionada con la tasa de desempleo.
 El aumento de las empresas jerárquicas en España entre 1930-1950, produjo un
aumento en la tasa de desempleo.
 Realidad problemática: Mortalidad infantil.
 Enunciado del problema: ¿En qué medida el alcoholismo de los padres determina la
mortalidad infantil?
 Hipótesis: El alcoholismo en los padres determina alta mortalidad infantil.
 ¿Cuál es el objetivo?
1.2.4 identificación de conceptos planteados.
Funciones de objeto de estudio y su contexto.
• En los objetivos e hipótesis debemos identificar el objeto de estudio:

o Es el núcleo de un planteamiento.
o ¿Qué se quiere estudiar?, ¿Cuál es la temática que tiene el interés principal?
o Ejemplo. Se pretende observar las conductas inadaptadas de un grupo de
menores ingresados en un centro de internamiento.

• Así como el contexto del objeto de estudio:
o Todo aquello que no recibe el foco central de estudio; incluye a las personas de
las que se toma el objeto de estudio, las circunstancias y elementos de tipo
espaciotemporal, personal y los procedimientos que se utilizan para su estudio,
etc.
o ¿A quién se pretende estudiar?, ¿en qué momentos y lugares?, ¿con qué
instrumentos?
o Ejemplo. Se pretende observar las conductas inadaptadas de un grupo de
menores ingresados en un centro de internamiento.
• Errores comunes:
o Identificar como objeto de estudio a la persona o colectivo de la que se extrae
el objeto de estudio que realmente interesa.
o Entender que en las expresiones verbales siempre aparece señalado en primer
lugar el objeto de estudio y después el contexto.
• Consideraciones:
o Adquieren función de contexto los conceptos que no reciban la atención central.
o La delimitación que se haya hecho del contexto nunca puede ser completa, ya
que siempre se podrán añadir aspectos no tenidos en cuenta o mantenidos
implícitos.
o La identificación de conceptos como objeto de estudio y contexto no es
invariable

 ¿Qué es una variable?
Una variable es el concepto o expresión de

alguna característica objeto de estudio
tomada como unidad y susceptible de
adoptar diversos valores, es decir, puede
medirse.
Una variable sería una característica de

algo que se está estudiando y que puede medirse.
El concepto es la idea general que tenemos y podemos operacionalizarlo en variables.

A partir de esas variables que tiene una serie de valores vamos a poder comprobar si se
cumple la hipótesis.
Las preguntas que tenemos en un cuestionario, por ejemplo, son variables. Esto quiere
decir que una variable puede expresarse tanto en forma de pregunta como en solo una
palabra.
Ej:
Concepto: Lesión
Definición operacional: condición que requiere atención médica documentada por

visitas ambulatorias al hospital.
Variable: ¿Cuántas veces ha tenido algún tipo de lesión para la que ha necesitado
asistencia de algún profesional médico o de enfermería en los últimos 12 meses?
Variable por tanto es el concepto más especificado, cómo lo vamos a medir.
VALOR
Es un código específico, palabra o número que refleja la situación de un individuo en

una variable
10

Si la variable es la pregunta que usted hizo, entonces un VALOR es la respuesta a esa
pregunta.
Ej:
Variable: ¿Cuántas veces ha tenido algún tipo de lesión para la que ha necesitado
asistencia de algún profesional médico o de enfermería en los últimos 12 meses?
Valor: Ninguna vez / 1 vez / 2 veces / 3 veces / 4 veces o más.
CONDICIONES INDISPENSABLES:
Exhaustividad: todos los sujetos deben poder asignarse a algún valor de la variable.
Ej. Puntuación mínima en presión sanguínea:
a) Por debajo de 5
b) Entre 6 y 9
c) Por encima de 10
Error: ¿qué contestan los sujetos con una puntuación de 10? No pueden contestar en ninguna
opción.
IMPORTANTE: cuidado con el valor “otros”, no hay que abusar.
Exclusividad: cada sujeto únicamente puede ser asignado a un valor de respuesta de la

variable.
Ej. Puntuación mínima en presión sanguínea:
a) por debajo de 5
b) entre 5 y 10
c) por encima de 10
Error: ¿qué contestan los sujetos con una puntuación de 5? tienes dos opciones para contestar
a y b.
11
A) tipos de variables en función del tipo de medida (valores).
 Los valores son las distintas posibilidades en que puede ocurrir una variable.
 Se entenderá por medición al proceso de asignar el valor a una variable de un elemento
en observación.
Las variables cuantitativas dan más juego para obtener más información que las ordinales. Las
de texto, son más complejas.
CATEGÓRICAS O NOMINALES:
VARIABLES NOMINALES:
→ La escala nominal sólo permite asignar un nombre al elemento medido. Esto la convierte
en la menos informativa de las escalas de medición.
- Nacionalidad.
- Uso de Gafas.
- Número de camiseta de equipo de fútbol.
- Número de Cédula Nacional de Identidad.
→ A pesar de que algunos valores son formalmente numéricos, sólo están siendo usados
para identificar a los individuos medidos. No se pueden ordenar sin los valores de la
variable (no puede decir que ser Francés sea más que ser español). No implica contar.
→ Los valores de estas variables son categorías, por lo que no admiten un orden natural
de los datos.
VARIABLES ORDINALES:
 La escala ordinal, además de las propiedades de la escala nominal, permite establecer

un orden entre los elementos medidos.
- Preferencia a productos de consumo. (cuando se pone en una escala, como por
ejemplo: responda del 1 al 5 cuanto te gusta el chocolate siendo 1 NADA y 5
MUCHO. El valor no es un número en sí sino que representa a un valor):
12

- Etapa de desarrollo de un ser vivo.
- Clasificación de películas por una comisión especializada.
- Madurez de una fruta al momento de comprarla.
 Los valores de respuesta están ordenadas (por eso, el nombre ordinal)
VARIABLES CUANTITATIVAS:
Son números.
ESCALA DE INTERVALO: además de todas las propiedades de la escala ordinal, hace que tenga
sentido calcular diferencias entre las mediciones. La cuantitativas lo que te preguntan es por el
mismo número, por lo que a este no se le puede dar un valor categórico. Aquí no se dan
opciones, por lo que el individuo debe dar un valor suyo. Aquí el valor del cero es relativo.
- Temperatura de una persona.

- Ubicación en una carretera respecto de un punto de referencia (Kilómetro 85 Ruta
5).
- Sobrepeso respecto de un patrón de comparación.
- Nivel de aceite en el motor de un automóvil medido con una vara graduada.
 La respuesta se trata de un número que se puede utilizar para realizar operaciones
matemáticas.
ESCALA DE RAZÓN: permite, además de lo de las otras escalas, comparar mediciones mediante
un cociente. El cero tiene un valor fijo en el que no existe otra escala de medida.
- Altura de personas.
- Cantidad de litros de agua consumido por una persona en un día.
- Velocidad de un auto en la carretera.
- Número de goles marcados por un jugador de básquetbol en un partido.
 La escala de intervalo tiene un cero que se establece por convención y puede tener
variaciones. Es arbitrario. Por otra parte, la escala de razón tiene un cero real, fijo, no
sujeto a variaciones; es propio de la medición hecha.
 En contraste a las anteriores variables, los valores de las variables cuantitativas SÍ refleja
algo real sobre un individuo, presentando un orden natural y un valor numérico. Por lo
tanto, los valores de una variable cuantitativa no son categorías, son los valores actuales
obtenidos por el que responde.
Con las variables que son nominales y ordinales existe una clasificación según el número de
valores en el concepto.
13

 Además del tipo, es necesario analizar el número de valores de cada concepto.
 Las variables o conceptos cualitativos y ordinales pueden tener 2 o más valores,
llamándose dicotómicas o politómicas, respectivamente.
- Sexo.
- Tipos de deporte de contacto.
 Los valores cuantitativos se diferencian en función de si entre dos valores cualquiera
caben o no teóricamente infinitos valores, llamándose continuos (cuando dentro
existen infinito número de valores intermedios) o discretos (cuando no existe este
número de valores intermedios), respectivamente.
- Edad en años.
- Número de correos recibidos.
14

VARIABLES DE TEXTO: Son preguntas “abiertas” y su valor de respuesta corresponde a las
palabras que escribe el sujeto. Valiosas porque capturan las respuestas en las propias palabras
del entrevistado, pero desafortunadamente son muy difíciles de analizar, ya que las respuestas
son no estandarizadas.
o Ejemplo: Normalmente las variables de texto se colocan emparejadas con variables

cualitativas, para ayudar a recolectar más información.
(Categórica) “¿Estuvo usted satisfecho con su visita de hoy al doctor?”1=Sí; 2=No
(Texto) “Si responde no, explique por qué:”
B) TIPOS DE VARIABLES DEL ORIGEN/ FUENTE DE LA INFORMACIÓN:
 DEL SUJETO: sexo, edad, prensión sanguínea, ansiedad por el trabajo, etc. Hace
referencia a los sujetos de estudio, es el más común.
 DEL MEDIO: hábitat de residencia, comunidad autónoma, época de año, tipo de trabajo,
etc. Se refiere al contexto que envuelve a la persona y que interaccionan con esta pero
no son propiamente del sijeto.
 DE LOS FACTORES DE ESTUDIO: grado de precisión del instrumento (tensiómetro,
peso…), idioma del cuestionario, lugar de recogida de datos, encuestadores (para
controlarlo se entrenan en un curso), etc. Relacionada con los instrumentos y
procedimiento utilizados durante la investigación.
C) TIPOS DE VARIABLES EN FUNCIÓN DEL PAPEL QUE JUEGAN EN LA RELACIÓN:
15
D) TIPOS DE RELACIÓN EN FUNCIÓN DE LA ESTRUCTURA.
El análisis de las estructuras de los conceptos puede hacerse tanto si son objetos de estudio
como si son del contexto. Se estudia a partir de los conceptos unitarios los cuales serían
Aprendizaje, emoción, personalidad, etc. Serían conceptos unitarios si se les concede sentido
por sí mismo y no necesariamente completados con otros elementos. Por otra parte, sería una
variable con distintos valores si, por ejemplo, en el caso de la personalidad tenemos subtipos.
Es decir, son conceptos que se pueden estudiar por separado, son aquellas cosas que aparecen
en la investigación sin necesidad de ser el foco central de la investigación. Si quiero ver
personalidad según patrones ya sería una variable. El concepto unitario es un punto de
especificación menor que la variable.
Relaciones entre variables: Además de identificar las variables y el número de ellas, debe
identificarse si hay planteada una relación o asociación entre diversos conceptos. Según la
estructura de las relaciones puede ser:
- Relación univariable: Solo existe una variable en cada término. No están

completados con otros elementos.
→ Influencia de las horas de estudio sobre el rendimiento.
- Relación multivariable: Existen más de una variable en cada uno de los dos términos.
→ ¿determinan las horas de estudio y la motivación el rendimiento escolar?
→ El entrenamiento en pensamiento positivo mejora tanto la habilidad social
como la satisfacción laboral de los sujetos.
→ Efectos de la terapia farmacológica y de la terapia psicológica sobre el
estado de ánimo y sobre la concentración
- Relación de interacción: el nivel educativo del paciente determina los efectos de
una terapia sobre su ansiedad.
(Variable extraña) (Variable dependiente) (Variable independiente)
16

E) LA COVARIACIÓN.
Evaluar si al variar la VI varía la VD.
Recordamos: variable independiente: referente para estudiar si al variar él varía la variable

dependiente.
EJ: Influencia de una determinada terapia (VI) psicológica sobre el hábito de tabaquismo (VD)
de un paciente.
La VI debe tener al menos 2 valores. (En el ejemplo anterior sería por ejemplo dos tipos de
terapia). Para evaluar las variaciones conjuntas de ambos términos es preciso identificar
también los valores de la VD que aparecen ante cada valor del primero.
- Qué ocurre en el hábito tabáquico ante cada valor de la terapia.

- Qué ocurre con la atención ante cada valor de la complejidad de la tarea.
- Estudiar la relación entre la atención de los sujetos y la complejidad de la tarea
cuando la tarea es manual y cuando es intelectual.
La comparación entre los distintos valores de la VD ante cada valor de la VI es lo que va a permitir
evaluar la posible covariación entre los valores de uno y otro término.
17

- En la relación entre la terapia y el tabaquismo se trata de valorar los posibles
cambios en el hábito de fumar en función de los cambios establecidos en la terapia;
es decir, comparar el hábito de fumar cuando no se aplica la terapia con el hábito
de fumar cuando sí se aplica dicha terapia.
Se defenderá la covariación entre ambos términos en la medida que haya diferencias en esa
comparación entre valores del segundo ante cada valor del primero. Solo hay covariación
cuando hay VD Y VI y la VI tiene al menos dos valores
- La relación entre complejidad y atención se defenderá en la medida en que los

valores de atención sean diferentes ante los distintos valores de la complejidad.
18

TENER EN CUENTA:
 Los conceptos unitarios no tienen que corresponder a una sola palabra.

o Veces que uno se equivoca y corrige para expresar aprendizaje.
 Las relaciones pueden expresarse de muchas maneras: efectos, influencia, covariación,
dependencia, etc. La clave es identificar la expresión utilizada para la conexión entre
términos. Si no se encuentra, no indicar el concepto como relación. Cuando se
encuentre, identificar además la estructura de cada término.
 Las diferentes estructuras señaladas se complementan entre sí. Cada estructura resulta
formarse a partir de las estructuras previas o más básicas, incluyéndolas y añadiéndoles
alguna variable o relación. Es decir, que se puede tener una relación univariable dentro
de una variación de relación.
 En la medida que en un campo de estudio se incrementan las variables y las relaciones
entre ellas y dicha estructura alcanza una cierta complejidad o riqueza, tiende a hablarse
de una teoría o modelo sobre el tema en cuestión. Es decir, cuando tenemos esa
estructura de variación que se ha puesto a prueba y se ha demostrado que sirve, se va
construyendo a medida se va haciendo compleja, así finalmente es como se ponen a
prueba las teorías.
 Es posible encontrar cualquier estructura tanto en el objeto de estudio como en el
contexto.
1.3 validez y causalidad.
La validez permite distinguir entre relaciones causales y no causales. Aunque todas las relaciones
se definen en términos de covariaciones, no todas pueden considerarse causales.
Considerar causalidad implica suponer ajuste de la relación objeto de estudio al referente (debo
saber que estoy estudiando lo que quiero estudiar y debo tener claro que realmente es así), así
como diferenciación de ocurrencias de cada variable de contexto respecto a la independiente.
(Tengo que tener claro cuáles son mis variables objeto de estudio y cuales son aquellas otras
que están en el contexto pero que no son mi objeto de estudio, por ello pueda tenerlas en
cuenta y controlarlas)Además, ambas propiedades pueden ser consideradas en la medida en
que todas las variables estén delimitadas con precisión. (Tengo que tener muy bien definidas
mis variables, cuanto mejor definida esté más claro tengo que mido lo que quiero medir)Una
relación en que una variable explica la otra (la flecha solo va en una dirección).
Causalidad y validez de las relaciones son términos equivalentes.
19
- Cuando se está considerando la causalidad de una relación, se está valorando la
validez de ésta.
Relaciones NO causales son aquellas en las que haya insuficiencia de al menos 1 de las 3
propiedades definitorias de la validez. Relaciones no causales por insuficiente diferenciación
entre 2 o más variables (sean VI, de contexto, o entre ambas). Para identificar una relación como
no causal deberá detectarse que la posible covariación entre las VI y VD no se debe a que la
primera produzca los cambios en la segunda, sino que los de ambas son consecuencia de una
tercera (sea de contexto u otra VI). Relación espuria.
- La alta covariación entre la altura de las personas trabajadoras por cuenta ajena y
su salario en determinados países no refleja una influencia de una sobre la otra, sino
que ambas son consecuencia de la variable sexo, que hace que los hombres sean
más altos en general y que en determinados países reciban un salario mayor que las
mujeres.
Otras veces, la covariación entre una VI y una VD se debe a alguna variable de contexto que
conecta ambas. La relación entre ambos desaparecería si se eliminara el elemento intermedio o
la variación de sus valores; es una relación mediada.
Falta de causalidad puede deberse también a un inadecuado ajuste y también a una insuficiente
precisión de los términos del objeto de estudio y de su contexto, lo que puede ocultar variables
de las que dependan las de la relación planteada, dando apariencia de causal a una relación que
no lo es.
Tema 2. DISEÑOS DE LA RECOGIDA DE DATOS.

2.1 introducción: el diseño de la recogida de datos en el planteamiento de la investigación.
El sentido de la recogida de datos es obtener evidencias con las que responder a las preguntas
planteada. Puede realizarse de distintos modos, mediante diferentes diseños, métodos y
técnicas (depende de qué queramos obtener). Además de obtener información tiene otro
sentido, interpretar la realidad.
20

2.2 Carácter exploratorio o confirmatorio de la recogida de datos.
 Carácter confirmatorio: En la medida en que el objeto de estudio y el contexto estén

suficientemente cerrados pueden dar lugar a recogidas de datos planificadas de
antemano. el contexto y las características esté perfectamente planificado y claro, por
tanto se puede planificar el estudio sin problema y de forma muy fácil. Suele ser cuando
el tema ya ha sido estudiado previamente.
 Carácter exploratorio: Cuando el objeto de estudio y contexto estén abiertos, sin
especificar suficientemente. Pueden ser descritas con posterioridad, una vez llevadas a
cabo. Cuando es la primera vez que se estudia un tema, por lo que los datos son más
cualitativas y menos precisas. Aquí todavía no hay una hipótesis.
 Interactivas: Los procedimientos de recogida de datos y la especificación del objeto de
estudio van modificándose mutuamente de manera sucesiva. Se complementan, tal vez
empiece como exploratorio pero se pueda convertir en confirmatorio.
2.3 Concepto de diseño de la recogida de datos.
Es la organización de las recogidas de datos planificadas de antemano o la descripción de las ya

realizadas o que se estén realizando. A través de un diseño cuidadoso puede minimizar el sesgo
y reducir el error aleatorio.
2.4 Aspectos del diseño de la recogida de datos.
→ Estructura unitaria o relacional:

 Según sea unitaria (o descriptivo) o relacional la estructura de los
correspondientes objetos de estudio.
 Para los D. Relacionales se añaden las denominaciones de diseños explicativos
o predictivos, según se consideren causales o no las relaciones objeto de
estudio.
21

 La denominación de D. descriptivos se usa como sinónimo de no relacionales y
para indicar el carácter no causal de las relaciones objeto de estudio.
 Un equipo psicopedagógico seguiría un diseño unitario o descriptivo cuando
pretendiese medir una serie de aspectos de los estudiantes a su cargo, como
la inteligencia, motivación y actitudes.
 Un diseño relacional sería comprobar si una determinada acción educativa
disminuye los problemas de conducta de un grupo de alumnos.
(Descriptivo o unitario) (relacional)
Cuando es un diseño unitario o descriptivo no hay variable dependiente ni independiente. Las

variables se llaman variables de prueba empírica.
 La estructura del objeto de estudio permite en muchos casos especificar los D.

Relacionales atendiendo también al número de VIs(Variables Independientes).
 Vis llamadas variables explicativas o factores.
 1 VI: diseños relacionales unifactoriales. Cuando solo hay una variable
independiente.
 Estudio sobre la influencia de hacer ejercicio sobre el estado de ánimo.
 1 VI: diseños factoriales, multifactoriales. Cuando hay más de una variable
independiente.
 Edad y sexo como VIs adicionales a la de hacer ejercicio.
 Hay relaciones en las que no se diferencia a sus variables por su papel de
dependientes e independientes: correlacionales o afactoriales. Dentro de la
realización del diseño también están estos dos. Las variables de estas se asocian
y correlacionan sin ser ninguna de ellas causa o efecto.
 Relaciones asumidas como como simples covariaciones no causales
entre sus términos, como la edad y el sexo entre los miembros de una
localidad.
Número de condiciones de las VIs
 Con 1 VI, el diseño puede presentar 2 o más variables/condiciones: bi o

multicondicional.
 Cada condición es un valor de la VI
 Bicondicional: estudiar la efectividad de la terapia (VI con dos valores)
sobre un problema de comportamiento (VD). La variable independiente
22

tiene solo dos condiciones. Cuando sabes que la variable independiente
tiene solo dos valores se sabe que es bicondicional.
 Multicondicional con cuatro condiciones: estudiar el efecto de la
duración de una terapia (VI) sobre una determinada psicopatología
(VD), comparando la evolución de un grupo de pacientes al transcurrir
una, dos, tres y cuatro (condiciones de VI) semanas de tratamiento.
Tiene más de dos condiciones.
 Los diseños factoriales son siempre multicondicionales, al tener como mínimo
4 valores resultantes de 2 Vis con 2 valores cada una.
 Para diferenciarlas entre ellas y entre sus posibles efectos, las
condiciones de cada VI deben combinarse con las del resto.
 Por esto, el total de condiciones del diseño se especifica tal que M x N…
x Z, en las que cada letra se sustituye en cada caso por el número de
valores que aporta cada VI.
 Diseño factorial 2x2, con un total de 4 condiciones: Analizar los efectos
de una terapia psicológica y de otra farmacológica sobre el hábito de
fumar, considerando para cada tipo de terapia su aplicación o no.
 La indicación de factorial 2x4x5 (cada número indica una variable y el
número que haya representa el número de condiciones que esta tiene)
implica la consideración de 3 VI que deberían tener en total 40
condiciones.
 No se especifica el número de condiciones cuando las Vis presentan un alto
número de valores ni en los diseños correlacionales.
Combinación completa de condiciones en los Diseños factoriales.
→ D. Factorial completo: cuando se combinan todos los valores de las distintas Vis. Todos
los valores de las variables independientes son combinados.
→ D. Anidado: determinados valores de una VI están combinados únicamente con algunos

de los valores de otra de las Vis.
23
 Considerando como Vis a profesores de secundaria y asignaturas impartidas,
uno de los profesores solo diera una de las asignaturas elegidas.
Esto se suele diseñar una vez los datos ya están recogidos.
→ A pesar de planificar la combinación completa de condiciones, a veces no se logra

recoger datos de todas ellas; por esto, el calificativo de completo o anidado solo debe
aplicarse una vez comprobado los datos recogidos.
→ Variables de prueba empírica.

 Aquellas cuyos datos es necesario recoger para responder al objeto de estudio
planteado (variables de medida, observadas o de respuesta).
 En investigaciones no relacionales, son todas las variables constitutivas de sus
objetos de estudio unitarios. Las variables no están correlacionadas entre ellas,
por tanto no se conjuntan y hay que medirlas por separado. Cada variable es
una variable de prueba empírica. Ninguna influye sobre la otra. No son
investigaciones de causa-efecto y aquí todas las variables son de prueba
empírica.
 En las investigaciones relacionales:
 En las que no se distingue entre VI y VD, todas las variables objeto de
estudio son de prueba.
 Las VDs son siempre de prueba empírica al estudiarse si sus valores
varían cuando lo hagan los de la VI. Por esto se llaman también variables
de salida, output, de resultado, explicada o de criterio.
 En todos los casos, según el número de variables de prueba, hablamos de
diseños:
 Unitario univariado: estudio para medir el CI de los escolares de un
determinado colegio.
 Unitario multivariado: si además se pretendiese registrar el
rendimiento, y sus motivaciones e intereses.
24

 Relacional univariado: estudio sobre el rendimiento (VD o de prueba
empírica) que produciría un determinado programa de incentivos
aplicado a un grupo de estudiantes.
 Relacional multivariado: si se quisiera estudiar los efectos de ese
programa sobre dos variables como el rendimiento y la motivación.
Número de datos de las variables de prueba en cada unidad de estudio.
El número de datos a obtener de cada variable de prueba en cada unidad de estudio es lo que
define la estrategia del diseño.
 Transversal: un dato por unidad. Todo se mide en un único momento temporal

y solo se obtienen un dato por sujeto. Las personas que están en un grupo, no
lo están en el otro.
 Longitudinal: más de un dato por unidad a lo largo del tiempo. Se obtienen
varios resultados por sujetos en distintos periodos de tiempo. Aquí todos los
sujetos están en un mismo grupo.
- Estudio de la opinión de un conjunto de sujetos sería transversal si a cada uno se le
tomara un solo dato; pero sería longitudinal si se le tomara más de un dato a lo largo
del tiempo.
Con estas dos estrategias de diseños se miden cada una de las variables dependientes. Para
saber si es longitudinal o trasversal hay que fijarse en la variable independiente.
 Mixtos: en los diseños no relacionales con más de una variable objeto de

estudio, al menos 1 es estudiada de forma transversal y al menos otra de forma
longitudinal. En los diseños relacionales, son mixtos los diseños factoriales en
los que al menos existe una VI con cada estrategia.
- Diseño mixto no relacional si se estudiara una sola vez la inteligencia de los sujetos
al comienzo del estudio y varias veces su opinión sobre un tema a lo largo de
distintos momentos.
 El número de datos que define a una u otra estrategia no corresponde
necesariamente con el número de registros realizados, si no lo que se considere
finalmente como dato a partir de dichos registros
25

En los D. relacionales, la estrategia conlleva una determinada organización de las unidades de
estudio.
Número de grupos y momentos de la recogida de datos: Estrategia de diseño.
 Si es transversal, implica que los sujetos que estén en una condición no están en otra,
por lo que habrán de formarse distintos grupos de esas unidades, tantos como
condiciones.
- D. de medida única/multigrupos o intergrupos (control - experimental): la
comparación se realiza entre datos de distintos grupos de sujetos.
 Si es longitudinal, implica que todos los sujetos forman un único grupo aportando más
de un dato de la VD en distintos momentos de la investigación, tantos como
condiciones.
- D. de medida repetida/intragrupo o intrasujeto (prestest - postest).
D. de series temporales, cuando se obtienen varios datos de cada sujeto por cada condición
(podría decirse que estos diseños son longitudinales no solo en su conjunto si no también en
cada una de sus condiciones).
26

D. de caso único, diseños de series temporales que se aplican a un único sujeto de estudio.
En los D. relacionales mixtos, el número de condiciones corresponde a determinados números

de grupos y momentos, dependiendo el de grupos de las VI transversales y el de momentos de
las longitudinales.
- Si en un diseño 2 x 4 x 5 la primera VI es transversal y las otras dos longitudinales, el

total de 40 condiciones corresponderán a 2 grupos que pasarán por un total de 20
momentos distintos resultantes de la combinación entre los 4 y los 5 valores de las
VI longitudinales
- El mismo ejemplo, ¿cómo sería si 8 grupos pasaran por 5 momentos distintos?
Tema 3. MÉTODOS Y TÉCTNICAS DE RECOGIDA DE DATOS.

Es la forma en que se recogen los datos y está influenciada por las acciones y características de
quienes realizan los estudios y de los instrumentos que utilizan. Puede aplicarse cualquier
recogida de datos, ya sea exploratoria o planificada; propias o ajenas.
Para delimitar el método, hay que delimitar los aspectos:
• Si ha habido intervención en las Vis.
o Intervenir en una VI implica que quien investiga decide y aplica qué valor o valores
de dicha variable va a recibir cada unidad de estudio, y en qué momentos lo va a
recibir.
→ Hay intervención en una VI cuando el contacto de los valores de dicha variable
con los sujetos depende de quien investiga, ya sea que lo decida directamente
o a través del azar.
→ No hay manipulación o intervención en la VI cuando el contacto de los valores
de la variable con los sujetos viene dado de modo previo al estudio.
o VI activa: aquella que es manipulada.
27
o VI asignada: aquella que NO es manipulada, sino que se asigna.
o Ej. Siendo la cafeína la VI de una relación, habría intervención cuando fuera la
persona que investiga quien decidiera qué sujetos o en qué momentos van a recibir
las dosis elegidas como valores de la citada variable. La no intervención supondría
que quien investiga selecciona a los sujetos según el valor de cafeína que hayan
consumido de manera natural.
o Importante: no todas las variables admiten manipulación cuando son planteadas
como VI.
o La edad y el sexo no pueden ser manipuladas.
o La intervención no tiene sentido en las variables de prueba.
• Si ha habido intervención en el contexto.
o Hay intervención en el contexto cuando la persona que realiza el estudio o los

instrumentos que utiliza afectan a una o más variables de contexto, sean de sujeto
o de medio. Es estudiar qué aspectos del contexto puede influir sobre el resultado
del estudio.
o Ej. Si una investigadora pide permiso para entrar y grabar en vídeo una clase en la
que participan los sujetos que quiere estudiar o si les hace preguntas, ello supone
que dichos sujetos saben que están siendo estudiados, lo que puede alterar
aspectos de su comportamiento y también que se modifiquen variables de medio
que conforman el contexto.
• Especificar el método de estudio. Métodos, en función del mayor o menor grado de

control que el investigador tiene sobre la variables implicadas en la investigación:
o Natural. Ausencia de intervención tantos en las VIs como en las de contexto; por lo
que permanecen inalteradas las características de los sujeto y medio que forman el
contexto. A este tipo de intervenciones algunos autores la llaman metodología
cualitativa.
28

→ Ej. Un investigador desea observar las conductas verbales del público de una
determinada grada en un partido de futbol. Se hace pasar por un espectador
situado en la grada en enfrente.
o No hay VI. No hay intervención en el contexto.
→ Ej. El observador compara las conductas verbales del público cuando el
equipo que juega como local va ganando y cuando va perdiendo.
o Hay VI (resultado que va dándose en los partidos). No hay intervención
en el contexto.
o Selectivo o ex post facto. falta de intervención en las VIs (por no existir o ser
asignadas), pero intervención en al menos una variable de contexto de sujeto o de
medio cualquiera que sea su grado.
→ Puede ser la mayor o menor presencia explícita de quien investiga o de

alguno de sus instrumentos en un contexto que por lo demás permanece
inalterado. O la modificación de un mayor o menos número de elementos
de dicho contexto de medio (como un laboratorio).
→ En los casos relacionales, el investigador selecciona a las unidades que
presenten los valores que interesen de la VI.
→ Ej. Registrar la participación de los estudiantes de una clase preguntándoles
directamente.
o Experimental de campo o en contexto no modificado: Intervención en al menos

una VI pero en un contexto no alterado, ni en sus contenidos de sujeto ni de medio
(no se interviene en el contexto).
→ Ej. Estudiar la relación entre el método de enseñanza y la participación de

los estudiantes en clase. Se le diría el profesor que en unas clases utilizara
una modalidad activa y en otras expositiva, observando posteriormente las
intervenciones de los estudiantes pero sin informarles del estudio ni que
percibieran el registro de datos.
o Experimental: Intervención en al menos una VI y también en el contexto. Es la que
tiene mayor grado de intervención.
→ Ej. Igual que el ejemplo anterior pero informando a los estudiantes del
estudio.
29

o Cuasi-experimental: igual que un experimento, pero la asignación de los sujetos a
los grupos no se basa en ninguna técnica basada en el azar. Es una pequeña
variación respecto al experimental. El objetivo que es sea parecido a un
experimento pero la asignación del os grupos no es al azar. Por el hecho de no
realizar la división al azar ya no se puede asegurar que la causa-efecto sea esa.
→ Ej. calidad de vida en personas que viven solas frente a personas que viven
en pareja o con amigos.
3.1 técnica de recogida de datos.
Son los procedimientos específicos de obtención de datos, en el marco de un diseño y método

determinado.
Puede aplicarse cualquier recogida de datos, ya sea exploratoria o planificada; presentes o

futuras.
30

¿Implica intervención?
• Observación: obtener datos sin que esa tarea implique intervención significa que se
logran esperando a que aparezcan para apreciar cuales son.
- Ej. Se pretende registrar la participación de los estudiantes en clase. Una

investigadora sentada entre ellos haría observación al anotar cada vez que los
alumnos plantean una pregunta o responden a las expresiones de otros estudiantes
o del profesorado.
• Observación participante y no participante: diferenciando si quien observa lo hace sin
entrar en contacto con los sujetos o participando de alguna manera en la vida de estos.
- Ej. Observación participante sería quien estando en un aula observa a un grupo de
alumnos sin ser uno de estos ni tampoco de su profesorado. Sería observación no
participante al observar mediante una cámara oculta, tras un cristal unidireccional
colocado en una de las paredes del aula que le permitiera ver sin ser visto, o
mediante cualquier otro procedimiento que supusiera no intervenir ni en las
características de los sujetos ni en su medio.
• Encuesta: Implica obtener datos con intervención en dicha tarea. Significa que la
persona que investiga provoca, directamente o a través de sus instrumentos, la
aparición de datos. Puede lograrse preguntando a los sujetos o poniéndoles tareas que
deban hacer.
- Ej. Siendo el objeto de estudio la participación de los estudiantes en clase, se
recogerían datos con encuesta si al finalizar la clase se pidiera a cada estudiante que
señalara cuántas veces ha intervenido en clase.
- Ej. Proponerle a los sujetos problemas lógicos a resolver.
No confundir la intervención que suponen las encuestas con la intervención que define a la
manipulación de VIs.
- La acción por parte de quien investiga o de sus instrumentos tiene objetivos

distintos: que aparezcan datos de las variables de prueba, y que lo sujetos reciban
uno o más valores de la VI manipulada.
- Pueden darse ambas intervenciones en algunas investigaciones y en otras no.
- Ej. Con el objetivo de estudiar de modo experimental los posibles efectos del
procedimiento docente sobre la actitud del alumnado hacia las matemáticas, se
manipula la VI al aplicar a los sujetos 2 o más tipos de procedimientos. Y esto podría
hacerse obteniendo los datos de la VI “actitud” observando a los sujetos en las
clases o preguntándoles al respecto.
31
Tema 4. PROCEDIMIENTOS DE SELECCIÓN DE LA MUESTRA.
4.1 Población y muestra.

 Población: Conjunto de todos los elementos que cumplen una o varias características.
Colectivo de referencia.
El primer aspecto que influye en el logro de ajuste o

representatividad de las recogidas de datos es el
TAMAÑO de las poblaciones, entendido como el
número de sus respectivas unidades. Lo primero a tener
en cuenta cuando preguntan por el tipo de muestra hay
que estar pendiente por qué me preguntan exactamente.
Ej. El número de alumnos/as que interese estudiar constituirá el tamaño de esa población. El
número de días de un curso escolar en el que se quiera conocer el comportamiento de ese
alumnado determinará el tamaño de esa población de tiempo; y la cantidad de espacios de la
32

escuela donde dicho alumnado pasa la jornada escolar constituirá el tamaño de esa población
de espacios.
Identificar el tamaño de una población no es siempre posible, bien porque sea desconocido o
porque pueda considerarse infinito.
Ej. Poblaciones de personas con el virus del sida en países en los que no se lleve tal control.
Cuando sea conocido y no excesivo el número de unidades, las poblaciones pueden ser
estudiadas en su totalidad, lo que facilita la representatividad de la recogida de datos.
Ej. Se quiere estudiar si la ocurrencia de la conducta de llanto de un bebé a la hora de acostarse

por las noches varía en función de la presencia del padre (presencia/ausencia); y ello en tres días
en los que el padre va a estar fuera por motivos de trabajo. En este caso, la población está
compuesta por un único sujeto, 2 valores en cada variable de la relación estudiada y en un
contexto temporal de 3 días.
Otras veces ocurre que el tamaño de algunas poblaciones es excesivamente grande, lo que
impide o dificulta su estudio.
Ej. Si en relación al ejemplo anterior se planteara estudiar todas las noches de un año, a lo largo
de toda la infancia o a un conjunto muy numeroso de niños residentes en todas las localidades
de un país.
 Muestra: Subconjunto de los elementos de una población. Debe ser representativa de

su correspondiente población. Colectivo de trabajo. Es realmente el grupo de personas
o elementos con los que de verdad se va a trabajar, de los que de verdad se van a recoger
datos.
Cuando el tamaño de las poblaciones es considerable o no conocido, éstas no pueden ser

estudiadas en su totalidad. Existen dos alternativas:
1- Renunciar a la población planteada y sustituirla por otra de menor tamaño.

- Ej. Si no se tienen recursos para estudiar un determinado comportamiento en la
población española, podría estudiarse solo en los habitantes de una determinada
localidad de pequeño tamaño, o en estudiantes de una facultad universitaria.
2- Si al margen de que se reduzcan o no las poblaciones, estas continúan implicando
poblaciones excesivamente amplias para las posibilidades de quien hace el estudio,
entonces la alternativa que queda es estudiar porciones o muestras que faciliten su
representatividad respecto a determinadas poblaciones delimitadas.
33

Importante para que la muestra sea representativa, la muestra tiene que tener unas
características proporcionadas a las características que tiene la población.
Inferencia estadística: consiste en poder extrapolar las características de la muestra a la

población real. Cuando se han extrapolado (porque se ha seguido un procedimiento adecuado)
es la estadística inferencial.
4.2 tipos de muestreo.
Muestreo: procedimiento de extracción de la muestra procedente de una población.
El tipo de muestreo dependerá del objetivo de la investigación. Dependerá de si se quiere

generalizar o no el objetivo del muestreo para sacar conclusiones a nivel general.
 Muestreo probabilístico: El muestreo probabilístico es una técnica de muestreo en

virtud de la cual las muestras son recogidas en un proceso que brinda a todos los
individuos de la población las mismas oportunidades de ser seleccionados. Es decir, se
utiliza el azar. Existen distintos procedimientos para usarlo pero al fin y al cabo es azar.
- El investigador debe garantizar que cada individuo tenga las mismas oportunidades
de ser seleccionado y esto se puede lograr si el investigador utiliza la aleatorización.
- Se conoce la probabilidad de que un individuo sea elegido para la muestra. Siempre
que se conozca esta probabilidad se puede realizar un muestreo aleatorio.
34

- Si la selección aleatoria se hace correctamente, la muestra será representativa de
toda la población.
 Muestreo no probabilístico: El muestreo no probabilístico es una técnica de muestreo
donde las muestras se recogen en un proceso que no brinda a todos los individuos de la
población iguales oportunidades de ser seleccionados. Aquí no se utiliza nunca el azar.
- La mayoría de los investigadores tienen limitaciones (temporales, monetarias y de
mano de obra), que hace casi imposible tomar una muestra aleatoria de toda la
población.
- Se eligen muestras simplemente con el criterio de que pueda accederse a ellas, de
que estén disponibles.
- En principio no se pueden extrapolar o generalizar los resultados a la población.
No son representativas de ninguna población salvo de ellas mismas.
- Son muestreos que seguramente esconden sesgos.
Ej. Se hace así cuando se estudia una muestra de personas que se ofrecen
voluntariamente como sujetos de la recogida de datos a realizar, cuando se estudia
a esos sujetos en una muestra de días en los que están disponibles, o cuando se
eligen los valores de la VI que resulten más asequibles. Por ej., si hacemos una
encuesta telefónica por la mañana, las personas que no tienen teléfono o que están
trabajando, no podrán formar parte de la muestra.
4.2.1 muestreo probabilístico.

 Muestreo probabilístico simple:
- Se eligen individuos de la población de estudio, de manera que todos tienen la
misma probabilidad de ser seleccionados, hasta alcanzar el tamaño muestral
deseado.
- La selección de la muestra puede realizarse a través de cualquier mecanismo
probabilístico en el que todos los elementos tengan las mismas opciones de salir.
- Por ejemplo, se puede realizar partiendo de listas de individuos de la población
(censos) y eligiendo individuos aleatoriamente con un ordenador.
- Normalmente, su aplicación tiene un coste bastante alto.
Ej: Un colegio tiene 120 alumnos de bachillerato, y se quiere extraer una muestra
de 30 alumnos. Sería aleatorio si:
→ se numeran los alumnos de 1 al 120;
→ y posteriormente se sortean 30 números de entre los 120.
35
 muestreo aleatorio sistemático.
- Lo elementos se seleccionan cuin un patrón que se inician con una selección
aleatoria.
- Es un tipo de muestreo aleatorio simple en el que los elementos se seleccionan
según un patrón que se inicia con una elección aleatoria. Es decir, se elige la
primera unidad al azar y el resto mediante una regla intencional fijada de antemano.
- Se tiene una lista de los individuos de la población de estudio. Si queremos una
muestra de un tamaño dado, elegimos individuos igualmente espaciados de la lista,
donde el primero ha sido elegido al azar.
- CUIDADO: Si en la lista existen periodicidades, obtendremos una muestra sesgada.
Ej: Un caso real: Se eligió una de cada cinco casas para un estudio de salud pública
en una ciudad donde las casas se distribuyen en manzanas de cinco casas. Salieron
con mucha frecuencia las de las esquinas, que reciben más sol, están mejor
ventiladas,…
Ej: Un colegio tiene 120 alumnos de bachillerato, y se quiere extraer una muestra
de 30 alumnos. Sería aleatorio sistemático si:
→ se numeran los alumnos de 1 al 120;
→ y posteriormente se calcula un intervalo constante entre cada individuo
(población/muestra=120/30=4).
→ Sorteamos un número del 1 al 4; supongamos que sale el 3.
→ El primer alumno seleccionado para la muestra sería el número 3; los
siguientes alumnos se obtendrían sumando 3 hasta llegar a tener 30
alumnos.
→ Los alumnos seleccionados serían: 3, 6, 9, 12, 15, 21, etc.
36

 Muestreo aleatorio estratificado.
- Se aplica cuando sabemos que hay ciertos factores (variables, subpoblaciones o
estratos) que pueden influir en el estudio y queremos asegurarnos de tener cierta
cantidad mínima de individuos de cada tipo:
– Hábitat rural y urbano – Hombres y mujeres, – Jóvenes, adultos y ancianos…
- Se realiza entonces una m.a.s. de los individuos de cada uno de los estratos:
- Al extrapolar los resultados a la población hay que tener en cuenta el tamaño
relativo del estrato con respecto al total de la población:
El muestreo estratificado es una técnica de muestreo probabilístico en donde el investigador

divide a toda la población en diferentes subgrupos o estratos. Luego, selecciona aleatoriamente
a los sujetos finales de los diferentes estratos en forma proporcional.
Imaginemos que queremos extraer una muestra de una población en la que sabemos que existe
un 60% de hombres, y 40% de mujeres. Podríamos, para estar seguros que respetamos las
proporciones, coger en nuestra muestra al 60% de hombres y el 40% de mujeres.
37

Supongamos que estamos haciendo un estudio de la vista de la población de una ciudad.
Suponemos que el 30% de la población lleva gafas y el 70% no. Mediante este método se
escogería el 30% de la muestra de personas que lleven gafas y el 70% de los que no.
 Muestreo por conglomerados.

- Se aplica cuando es difícil tener una lista de todos los individuos que forman parte
de la población de estudio, pero sin embargo sabemos que se encuentran
agrupados naturalmente en grupos.
- Se realiza eligiendo varios de esos grupos al azar, y ya elegidos algunos podemos
estudiar a todos los individuos de los grupos seleccionados o bien seguir aplicando
dentro de ellos más muestreos por grupos, por estratos, aleatorios simples,…
Ej: Para estudiar a los enfermos de cáncer en Andalucía, ¿tenemos un listado de enfermos de
cáncer en Andalucía? No, entonces podemos elegir varios hospitales de Andalucía y
seleccionarlos dentro de esos hospitales.
- Al extrapolar los resultados a la población hay que tener en cuenta el tamaño

relativo de unos grupos con respecto a otros:
Ej. Se desea estudiar el rendimiento académico de los estudiantes de secundaria de España.
→ Se divide a toda la población (población de España) en diferentes conglomerados

(ciudades).
→ Luego, el investigador selecciona una serie de conglomerados en función de su
investigación, a través de un muestreo aleatorio simple o sistemático.
→ Luego, de los conglomerados seleccionados (ciudades seleccionadas al azar) el
investigador puede incluir a todos los estudiantes como sujetos o seleccionar un número
38

de sujetos de cada conglomerado a través de un muestreo aleatorio simple o
sistemático.
→ Lo importante sobre esta técnica de muestreo es dar a todos los conglomerados iguales
posibilidades de ser seleccionados.
El muestreo puede ser monoetápico (solo una etapa) o polietápico (más de una etapa), pueden
hacerse en una o más etapas, quedando conformada cada etapa por la delimitación de estratos.
o Muestra por conglomerados en una etapa:

 Cuando el investigador incluye como muestra a todos los estudiantes de
todos los conglomerados seleccionados al azar.
o Muestra por conglomerados en dos etapas:
 Cuando el investigador sólo selecciona un número de estudiantes de cada
conglomerado mediante muestreo aleatorio simple o sistemático.
Ej: Imaginemos que queremos trabajar con los colegios públicos de Madrid. El problema es que
no podemos coger todos los colegios, por lo que decidimos dividir Madrid en distritos
(conglomerados), y elegir aleatoriamente algunos de ellos, centrándonos únicamente en los
colegios de los distritos elegidos. Si optamos por un muestreo polietápico, dividiríamos esos
distritos en manzanas, por ejemplo, y escogeríamos sólo algunas manzanas para centrarnos en
los colegios de dichas manzanas.
Diferencias entre muestreo estratificado y por conglomerados.
La diferencia principal es la inclusión de conglomerados o estratos.
En el muestreo aleatorio estratificado, se realiza el muestreo en todos los estratos de la

población, mientras que en el muestreo por conglomerados el investigador sólo selecciona
aleatoriamente un número de conglomerados de la colección de conglomerados de toda la
39
población. Por lo tanto, sólo se realiza una muestra sobre una cantidad de conglomerados. Los
demás quedan sin representación.
4.2.2 muestreo no probabilístico.
A nivel práctico se utilizan más estos pero los otros son más recomendables.
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras

"representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es
muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones
han marcado tendencias de voto
En este caso, los elementos son escogidos en base a criterios o juicios preestablecidos por el
investigador.
Los elementos escogidos se hacen en base a criterios o juicios que el investigador ha

determinado.
Ej: En un estudio sobre calidad de la educación, previamente se establecen como criterios de

selección de la muestra los siguientes:
→ Mínimo de 20 años de experiencia en el campo educativo.

→ Poseer título de posgrado.
→ Haber ocupado un cargo directivo.
2.2.1 muestreo no probabilístico o incidental.
Los sujetos de una investigación específica, son seleccionados para el estudio sólo porque son
más fáciles de reclutar y el investigador no está considerando las características de inclusión de
los sujetos que los hace representativos de toda la población. No existen criterios previos
Es más fácil y barato, por ello es el que más se utiliza.
40

En todas las formas de investigación, sería ideal generalizar los resultados a la totalidad de la
población, pero en la mayoría de los casos, la población es demasiado grande y resulta imposible
incluir cada individuo.
Esta es la razón por la cual la mayoría de los investigadores utilizan técnicas de muestreo, como
el muestreo de conveniencia, la más común de todas las técnicas de muestreo. Muchos
investigadores prefieren esta técnica de muestreo, ya que es rápida, barata, fácil y sobre todo,
los sujetos están disponibles.
Uno de los ejemplos más comunes de muestreo de conveniencia se realiza utilizando

estudiantes voluntarios como sujetos de la investigación. Otro ejemplo es el uso de sujetos que
se han seleccionado de una clínica, una clase o
una institución ya que para el investigador es de
fácil el acceso a estas instituciones. Un ejemplo
más concreto es la selección de cinco personas de
una clase o incluso la selección de los cinco
primeros nombres de la lista de pacientes de una lista en una institución médica.
2.2.2. Muestreo accidental o por cuotas.
Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población

y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación.
Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el
carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas“, que consisten en un número de individuos que
reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo
femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que se
encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de
opinión.
Por ejemplo, si la base de la cuota es el

curso en la universidad y el investigador
necesita una representación igual, con un
tamaño de muestra de 100, debe
seleccionar 25 estudiantes de 1º año, 25
de 2° año, 25 de 3º año y 25 de 4º año. Las
bases de la cuota generalmente son la
41

edad, el género, la educación, la etnia, la religión y el nivel socioeconómico.
Se diferencia del muestreo estratificado en que una vez determinada la cuota, el investigador
es libre de elegir a los sujetos de la muestra dentro de cada estrato (los elige intencionalmente,
sin azar).
2.2.3 muestreo bola de nieve.
Suele utilizarse en estudios en donde los sujetos son difíciles de encontrar.
Consiste en identificar sujetos que se incluirán en la muestra a partir de los propios

entrevistados. Partiendo de una pequeña cantidad de individuos que cumplen los requisitos
necesarios, servirán como localizadores de otros con características análogas (funciona en
cadena). Luego, el investigador observa a los sujetos designados y sigue de la misma manera
hasta obtener el número suficiente de sujetos.
En la medida que sus datos se asemejen suficientemente entre sí, o saturen en el sentido de no
aportar novedades, serán cada vez más amplias las poblaciones a las que pueda generalizarse lo
encontrado en dichas replicaciones.
Por ejemplo, para obtener sujetos para un estudio que quiere analizar una enfermedad rara, el
investigador puede elegir utilizar el muestreo de bola de nieve, ya que será difícil obtener
sujetos. También es posible
que los pacientes con la
misma enfermedad tengan
un grupo de apoyo, y si uno
de sus miembros es tu primer
sujeto, lo más probable es
que allí encuentres más
sujetos para el estudio.
42

Tema 5. TÉCNICAS DE CONTROL DE CARIABLES EXTRAÑAS.
5.1. Concepto y control de Variables extrañas.
Las variables extrañas (VVEE) son aquellas que no son objeto de nuestra investigación pero están
influyendo en ella. En los experimentos actúan adicionalmente a la V.I.
Puede afectar a la V.D., por ello son relevantes, pero en ese momento no interesa determinar si
afecta o no. Puede dar lugar a problema si no se tiene en cuenta la variable extraña.
En la realización de un experimento, el científico debe considerar todas las variables que podrían
contaminar el experimento; debe intentar evaluar las variables extrañas que pudieran afectar a
su V.D. y cuyos efectos no desea conocer.
La contaminación ocurre cuando una variable extraña está sistemáticamente relacionada con la
V.I., y puede afectar diferencialmente a la V.D.
Debemos poder afirmar que el efecto producido sobre la V.D. es debido sólo a la manipulación
de la V.I. Las variables extrañas deben ser controlada se intentar aislar el efecto de las VVII sobre
la dependiente.
Las variables extrañas (VVEE) suponen amenazas a la diferenciación en las recogidas de datos
(tengo que poder asegurar que cada cambio se debe a las variables que yo quiero impartir), por
2 motivos:
- Porque cualquier covariación de alguna de ellas con una VI supone una confusión,
impidiendo que distinguir si los cambios de la VD se deben a los cambios en la VI o
a los de la extraña
- Porque al definirse las VVEE como ajenas al objeto de estudio su número es
ilimitado. Ello conlleva la imposibilidad de controlar la diferenciación de todas las
extrañas, ya que siempre puede quedar sin considerar alguna que covaríe con las
VVII.
Por estos motivos, tenemos que numerar de forma exhaustiva qué VVEE son relevantes como
fuentes de posibles confusiones.
Es importante por ello hacer una buena revisión sobre la temática.
43
5.2 mecanismos de control de VVEE
5.2.1 Variables extrañas con un valor.
Son aquellas VVEE presentes en la investigación que tienen 1 único valor, lo que supone que no
varían; y si no varían no pueden hacerlo conjuntamente con ninguna VI, por lo que podría
afirmarse que no están confundidas y sí controladas.
a) Eliminación: La manera más deseable (siempre preferibles) de controlar las

variables extrañas es eliminándolas de la situación experimental, esto es,
asignarles el valor cero. En el laboratorio psicológico, un ejemplo de eliminación
es la utilización de cuartos a prueba de ruido. Desafortunadamente, la mayoría
de las variables extrañas no pueden ser eliminadas, P.ej. experiencia de los
sujetos, edad, sexo, inteligencia, etc.
b) Constancia: Cuando no pueden eliminarse ciertas variables extrañas, podemos
intentar mantenerlas constantes durante el transcurso del experimento. En
esta técnica el control supone, esencialmente, que sea cual sea la variable
extraña, se presente un mismo valor de ella para todos los sujetos. Por ejemplo,
mantener las mismas condiciones de sujeto constante; el sexo (todos varones o
mujeres), o la edad (todos deben tener 20 años); “modo” y “momento” de
recoger los datos en una investigación en la que todos estos se recogieran con
la misma técnica, aplicada de la misma manera y en un mismo momento; leer
el mismo tipo de instrucciones para todos los sujetos (excepto cuando éstas
constituyen condiciones experimentales diferentes); tratara todos los sujetos
experimentales de mismo modo.
44

Ej. La variable ruido ambiental sería eliminada al evitar el sonido exterior en un
laboratorio, y controlada por constancia al instalar un ruido continuo de una
misma intensidad que ocultase otros posibles.
Cuando se aplica la eliminación al conocimiento del sujeto, del investigador o de ambos sobre
los grupos o condiciones a los que ha sido asignado se denominan técnicas de
enmascaramiento.
- Las técnicas de enmascaramiento más comunes son el simple ciego (el paciente,
pero no el investigador/médico, desconoce el grupo al que ha sido asignado, es
decir, ignora cuál de los posibles tratamientos recibe), el doble ciego
(investigador/médico y paciente desconocen el grupo de asignación de este último)
y triple ciego (cuando también el análisis y evaluación de los datos se hace sin
conocer la identidad de los grupos).
5.2.2 Variables extrañas con más de un valor.
Analizar el control (considerar si ambas variables covarían) de las VVEE presentes con más de un
valor respecto a cada VI, supone considerar si ambas covarían, es decir si existe asociación en la
forma en qué varían ambas variables.
Lo primero es considerar la estrategia transversal o longitudinal de cada VI. A efectos de

control, cada estrategia tiene consecuencias diferentes.
5.2.2.2 Variables extrañas con más de un valor: Estrategia Transversal.
En este caso, los grupos de sujetos diferentes en valores de la VI no deben serlo también en
valores de VVEE; ya que esto supondría una falta de diferenciación entre estas y la VI (confusión
de variables).
Por ejemplo supongamos que queremos analizar el rendimiento en un deporte en función del
sexo de los deportistas que lo practican y consideramos que la altura es una VE que puede influir
pero no se registra. Podría ser que siempre los hombres fueran más altos que los mujeres y por
tanto el efecto de la VE se puede confundir con el de la VI. Esto tendría sentido siempre que la
altura pudiera influir en la VD. En estos casos tendríamos que controlar la VE intentando
diferenciar el efecto de ambas.
Para ello es necesario asignar o repartir de manera homogénea los sujetos a los diferentes
grupos (que en todos los grupos haya de todo).
Existen tres formas de hacerlo: aleatorización, bloqueo y equiparación.
45

a) Aleatorización: Consiste en evitar seguir un sesgo de selección a la hora de escoger la
muestra, distribuyendo al azar (aleatoriamente) a los sujetos en los grupos. A través de
esta técnica, se pretende que el azar distribuya de manera similar a los grupos y se
eliminen las grandes diferencias en las variables desconocidas, dando lugar a grupos
homogéneos en ese aspecto.
- Se parte del postulado de que si la selección y distribución de sujetos en grupos fue
realizada al azar, se puede inferir que las variables extrañas, desconocidas por el
investigador, se habrán repartido también al azar en ambos grupos, y así quedarán
igualadas.
Ej de aleatorización: En el estudio de la relación entre 3 programas de animación social aplicados

a personas de la tercera edad y su estado de ánimo, puede decidirse de modo aleatorio las
personas que formarán cada uno de los tres grupos correspondientes a las 3 condiciones, y
también a qué grupo se le aplica cada valor de la VI.
Se evita así que los investigadores apliquen criterios que determinen dichas
asignaciones. Si las asignaciones aleatorias se realizan en una muestra elegida
aleatoriamente, se está facilitando que cada condición quede conformada por un
número semejante de hombres y mujeres y, por tanto, también por otras VE de esas
personas.
Ejemplo: si tenemos una investigación para ver la influencia del método de enseñanza
(tradicional vs novedoso) sobre el aprendizaje y no podemos medir la inteligencia de los
alumnos, como esta es una variable que tiene influencia sobre el aprendizaje, sería una variable
extraña.
46

La controlamos asignando al azar a los niños a cada una de las condiciones de la VI, método de
enseñanza. Así, en los dos grupos (método tradicional vs novedoso) estarán incluidos alumnos
con las distintas aptitudes intelectuales
b) Bloqueo: La técnica de bloque consiste en agrupar a los sujetos en bloques en función

de los valores que toman en una variable extraña. Es decir, los sujetos de un bloque
son todos similares entre sí y diferentes a los sujetos de otro bloque (estratos). El
investigador crea sus diferentes estratos y de ahí asigna los grupos al azar.
- Una vez formados los bloques, aleatoriamente se asigna el mismo número de
sujetos, o una proporción similar, de cada bloque a los diferentes grupos o
condiciones de la VI.
- Esta técnica suele realizarse cuando existe un tamaño amplio de la población o falta
de conocimiento o de acceso a ella, lo que dificulta el muestreo aleatorio previo a
la asignación.
- El asignar de forma aleatoria los sujetos de cada bloque a los grupos tiene como
objetivo que el resto de las variables extrañas del sujeto que no han sido bloqueadas
se repartan por igual en todos los grupos y de esta manera no contaminen los
resultados del experimento.
Ej bloqueo: Al estudiar la relación entre agresividad de los programas de televisión (VI) y la

agresividad de los comportamientos de los niños que vean tales programas (VD), la variable tipo
agresivo o no de los padres/madres (VE) quedaría controlada por bloqueo si: a) se elige un
bloque de sujetos con familias agresivas y otro con familias no agresivas, y b) se asigna al azar
una porción similar de sujetos de cada bloque a cada valor de la VI.
Ej Al estudiar la relación entre 3 programas de animación social aplicados a personas de la

tercera edad y su estado de ánimo, el control por bloqueo de la VE género consistiría en: a)
47
formar un bloque de 12 hombres y otro de 12 mujeres, y b) asignar aleatoriamente a cada
persona componente de cada bloque a uno de los 3 valores de la VI. De este modo, cada una de
las 3 condiciones estará formada por 4 hombres y 4 mujeres.
c) Equiparación o balanceo: se parte también de una muestra dividida en estratos pero se

asigna intencionalmente las unidades de cada uno a los distintos grupos.
- Ej. En el caso de los 3 grupos de programas de animación para personas de la tercera
edad, supongamos que hay dos variables que no se están considerando pero
afectarán a los resultados del programa: si las personas conviven con sus familiares
o están en una residencia y su estado de salud. En este caso podemos asignar los
sujetos a cada programa de manera que el investigador seleccione a personas que
vivan con familiares o en residencia y con distintos estados de salud para cada
grupo. La asignación no sería al azar, sino intencionada, el investigador o la persona
que realiza la selección los elige específicamente.
5.2.2.2 Variables extrañas con más de un valor: Estrategia Longitudinal.
En este caso, el control de las VVEE consiste en asemejar sus valores en los distintos
momentos, con el fin de que no varíen a la vez que lo hacen los valores de la VI.
a) Sujetos como propio control: se consigue cuando a lo largo de todos los momentos, el
grupo de sujetos analizado es semejante a sí mismo (normalmente son los mismos
sujetos) en lo que se refiere a los valores de las VVEE.
Ej. Al investigar de modo longitudinal los efectos del alcohol en la atención a una tarea, se
estudia la atención del único grupo de sujetos en las sucesivas condiciones de alcohol. En todas
estas, los valores de las diferentes VVEE relevantes deberían aparecer con valores semejantes
para evitar su confusión con los cambios de la VI. Así, si hay 20 hombres y 7 mujeres en la primera
48

condición, todos ellos deberán estar presentes en las restantes para que la variable sexo
permanezca controlada.
Ej. Al estudiar la relación entre la contemplación de programas violentos por parte de niños y la
agresividad que manifiestan posteriormente, podría hacerse que todos los niños visualizaran
primero un programa no violento y después otros violentos, estudiando su agresividad después
de cada programa. Las características personales y familiares de los niños quedarían controladas
si se mantuviera semejantes en las dos condiciones (lo cual se conseguiría siendo los mismos
niños).
En casos como el anterior y como consecuencia de utilizar distintos valores de VI (o de alguna

VE) a unas mismas unidades, aparece otra VE que es el orden en que se presenta cada uno de
esos valores, y que suele llamarse efectos de orden o acumulativos (fatiga, aprendizaje). El
orden puede afectar a los sujetos por ser una investigación longitudinal, produciendo efectos
como fatiga o aprendizaje.
Consiste en que cada ocurrencia de las variables repetidas acumula sus efectos a los de
ocurrencias previas, por lo que sus valores van cambiando a la vez que los de las VVII,
confundiéndose con estas.
b) Contrabalanceo. Consiste en presentar esa VI en distintos órdenes, de manera que se

iguale el posible error progresivo en todas las posibilidades y no influya en los datos
recogidos.
Se emplea, por tanto, cuando se supone que el orden de presentación de cualquier
variable afecta el resultado sobre la V.D. Algunos experimentos se diseñan de manera
tal que los sujetos pasan por dos o más condiciones experimentales.
Ej: En el ejemplo anterior sería si la mitad de los sujetos contemplasen primero el programa no
violento y la otra mitad el violento y, tras estudiar qué agresividad manifiestan, se hiciese que
cada grupo contemplase el programa que no hubiera visto.
Ej. a un experimentador le interesa saber si una señal de “alto” debería pintarse de amarillo o
rojo, su problema sería determinar el color de la señal a la que responde más rápido un sujeto.
Para responder esta pregunta podrá medir primero el tiempo de reacción (T.R.) de un sujeto a
la señal amarilla y luego a la señal roja. Repitiendo cierto número de veces el procedimiento,
quizá llegara a la conclusión de que el T.R. a la señal roja es el más corto. Sin embargo, como a
los sujetos se les mostró primero la señal amarilla, su T.R. a la señal roja dependerá parcialmente
de su aprendizaje para manejar los aparatos experimentales así como de su adaptación a la
49

situación experimental. Para evitar este efecto se alternará el orden entre amarillas y rojas. En
eso consiste el contrabalanceo.
50

BLOQUE 2. INTRODUCCIÓN AL ANÁLISIS DE
DATOS EN PSICOLOGÍA.
Tema 6. INTRODUCCIÓN AL ANÁLISIS DE DATOS EN PSICOLOGÍA.
6.1 introducción al análisis de datos: utilidad y rol dentro de la investigación.
PLANIFICACIÓN DE LA INVESTIGACIÓN:
¿QUÉ HACE UNA ASIGNATURA COMO ESTA EN UNA CARRERA COMO ESTA?
Un buen psicólogo/a no puede ejercer su profesión debidamente sin el auxilio de los

conocimientos necesarios para fabricar investigaciones o para consumir con fundamento las que
han realizado otros.
No importa a qué nos dediquemos como psicólogos/as en un futuro. Si llevamos nuestra labor
con profesionalidad, nos encontraremos casi continuamente recogiendo datos, analizándolos y
obteniendo conclusiones.
51
6.2 conceptos básicos:
Población (N): Conjunto de todos los elementos (personas, animales, cosas…) que tienen una o
varias características o propiedades en común (la población es el grupo de referencia que se
usará en el estudio):
- Estudiantes de 1º de Psicología del curso 2009/10.

→ Cada estudiante sería un elemento de la población.
→ Se podría estudiar: estatura, edad, CI, etc.
- Perros acogidos en hogares en Sevilla capital.
- Pisos disponibles para venta en Murcia capital.
Cada elemento de la población: individuo, sujeto o caso.
Población finita o infinita.
- Lo usual es trabajar con poblaciones finitas, pero si el nº de elementos es grande se

considerarán como infinitas.
Muestra estadística (n): Subconjunto de los elementos de una población.
Requisitos de una muestra para poder extraer conclusiones (hacer inferencias) en la población:
- Representativa de la población (fiel reflejo).

→ Procedimiento adecuado de selección de elementos (que todos los
elementos hayan podido ser elegidos como elementos de la muestra).
→ Nº suficiente de elementos.
- Muestras grandes (n ≥ 30) y pequeñas (n < 30) a efectos didácticos. Esto determina
que se haya un tipo de análisis u otro.
Parámetro poblacional: Son valores que determinan las propiedades descriptivas de una
población. (Se llama así a los típicos datos y elementos de la población).
No se suelen conocer:
- N normalmente es muy numerosa: no rentable trabajar con ella (excepc. CI).

- Son cambiantes (peso medio de españoles).
- Hacen referencia a cualquier función matemática (media, proporción, etc.) definida
sobre los valores de la variable en la población.
Utilización de muestras para, a través de sus propiedades, estimar las de la población. Se

denominan con letras del alfabeto griego: Proporción (π) -pi-, desviación típica (σ) -sigma-,
media (μ) -mu-, etc.
52

Estadísticos: Propiedades descriptivas de una muestra. Se corresponden con cualquier función
matemática (media, varianza, proporción…etc.) definida sobre los valores de la muestra, los
cuales sí son conocidos y muchas veces se utilizan para estimar los valores desconocidos de los
parámetros.
Aunque estas estimaciones están sujetas a errores de diferente tipo, se utilizan para averiguar
el valor aproximado de los parámetros. Se utiliza nuestro alfabeto para su denominación.
Sujetos: Constituyen las unidades de análisis que poseen la/s característica/s que se pretenden
estudiar. Elementos que forman la muestra.
No presentan las mismas características ni del mismo modo ni en la misma cantidad.
Estatura:1’50, 1’85, 1’63, etc.
Variables: La variable es la característica que pretendemos analizar (renta, motivación, sexo,

edad, compulsividad, etc.)
53

Puede tomar un conjunto de valores diversos. Si la variable de estudio tiene un único valor no
es una variable, es una constante. Ej: si cojo solo chicos, la variable sexo es constante.
La información que recoge una variable a través del conjunto de valores que presenta, puede
ser tratada y resumida mediante técnicas estadísticas.
Existe una clasificación de las variables en función del tipo de operaciones matemáticas que nos
está permitido realizar con los números asignados (clasificación de Stevens).
- Clasificación de Stevens:
6.3 tipología de análisis de datos.
Según número de variables analizado:
6.4 presentación de las variables.
Tablas:
Como se presenta en el SPSS:
54

como realmente lo entendemos en nuestra cabeza:
Cada sujeto es siempre una fila. Cada variable estudiada es siempre una columna.
Tema 7: DISTRIBUCIONES DE FRECUENCIAS Y REPRESENTACIONES

GRÁFICAS.
Introducción:
¿Cómo podemos representar los datos y ofrecer información sobre ellos de la forma más
conveniente?
- Esto dependerá de su nº. Para trabajar con un nº de datos grande (que no podamos
obtener toda la información con un simple vistazo) utilizaremos dos estrategias
descriptivas básicas:
→ Tablas de frecuencias.
→ Representaciones gráficas.
55
Picado de datos:
Pero antes de obtener información sobre los datos, lo primero que debemos hacer es introducir
los datos en el programa estadístico.
Comenzaremos tomando contacto con el programa SPSS.
¿Cómo introduzco y categorizo mis variables?
Para crear y dar nombre a una nueva variable debemos completar los datos en Vista de
Variables.
Para introducir directamente los datos deberán completarse, para cada variable los siguientes
pasos:
56

Detalles a tener en cuenta:
Asignar un nombre y una etiqueta a la variable.
- El nombre ha de ser breve como un código y la etiqueta es la descripción de esa

variable (NOTA: como definamos la variable por su etiqueta, así saldrá en los
resultados).
- **IMPORTANTE** Incluir siempre el código del sujeto.
Respecto al NOMBRE:
- Debe comenzar por una letra.

- No pueden terminar en punto.
- La longitud del nombre no debe exceder los 64 caracteres.
- No se utilizan espacios en blanco ni caracteres especiales (por ej. !, ?, ‘, *).
- Cada nombre de variable es único. No se distingue entre EDAD, Edad y edad.
Identificare el tipo de variable:
- Normalmente, los más usados son numérico y cadena.
Anchura y decimales:
- Los valores de la variable Turno son 1-”Mañana” y 2-”Tarde”. Ocupan 1 sola

columna y no tienen decimales. Decimales = 0; Anchura = 1.
- Cuando se quiere reducir la anchura de la variable, primero se reducen los decimales
y luego la anchura.
- Cuando se quiere aumentar la anchura de la variable, primero se aumenta la
anchura y luego los decimales.
57

- El número de decimales debe ser menor que el número de anchura.
- Ej. La variable “Sueldo”, con un valor de 750.95 tiene 2 decimales + 3 dígitos enteros
+ el punto del decimal = 6 columnas. Por tanto, se pondrá Decimales = 2; Anchura =
6.
Definir sus posibles valores y las etiquetas de los mismos.
Definir el o los valores perdidos. Generalmente se usa el valor 99 o 999.
Definir la medida de la variable. Escala/ ordinal/ nominal
58

Estructura de una distribución de frecuencias.
Una vez que tengo los datos introducidos en el programa estadístico, quiero obtener la
distribución de las frecuencias de cada una de las variables.
Distribución de frecuencias: tablas de datos en las que, como mínimo, se representan:
- Los valores que toma la variable (Xi). En la primera columna.

- Las frecuencias de dichos valores (fi)
Tablas de frecuencias:
59
a) Frecuencia absoluta: fi
La muestra total es la suma de la frecuencia. Solo se obtiene la suma de los que sí han
respondido.
b) Frecuencia relativa o proporción: fri
La frecuencia relativa es el cociente entre la frecuencia absoluta y la n. con esto se obtiene una
proporción.
Informa sobre la importancia que posee un valor dentro del conjunto al que pertenece:
Ej:
Propiedades:
c) Porcentajes
El porcentaje es igual a la frecuencia relativa multiplicada por 100.
60

Propiedades:
d) Frecuencia acumulada: Fi
Además de la fi, fr y %i, podemos obtener

los mismos de forma acumulada: son la Fi,
Fr y %ai
Nos permiten determinar, para cada valor

de la variable Xi el número de veces o la
proporción (%) con la que la variable
toma un valor igual o inferior a él.
Permite considerar cada valor no aislado de los demás, sino puesto en relación con ellos.
e) Frecuencia relativa acumulada (o proporción acumulada): Fri
Cociente entre la frecuencia acumulada de un valor Xi y la frecuencia total
f) Porcentajes acumulados = %ai
61

TABLA DE FRECUENCIAS COMPLETA.
7.1 representaciones gráficas.
¿Cómo podemos representar los datos y ofrecer información sobre ellos de la forma más
conveniente?
- Dependiendo del tipo de variable: cualitativa o cuantitativa son más apropiado unos
u otros.
- Los más comunes son los gráficos de barras, sectores, líneas.
Diagrama de barras (Bar Chart).
62

Diagrama de sectores o tarta (Pea Chart)
Gráfico de líneas
63
Para variables agrupadas.
PARA LLEVARLO A LA PRÁCTICA:
- Introduce los datos en el programa (SPSS) de forma adecuada.

- Obtén las tablas de frecuencias y las gráficas correspondientes de las variables.
- Ten en cuente el tipo de variable de que se trate.
Tema 8. ESTADÍSTICOS UNIVARIADOS: TENDENCIA CENTRAL,

VARIABILIDAD, ASIMETRÍA Y CURTOSIS.
8.1 características estadísticas fundamentales.
64

8.1.1 índices de tendencia central.
Para describir la distribución de datos necesitamos, por lo menos, dos estadísticos:
1. Uno que refleje la tendencia central: valor que se represente al conjunto. Valor
alrededor del cual se encuentre la mayoría de los datos.
2. Otro que refleje la dispersión alrededor de este valor: si los datos están alejado o muy
juntos respecto al valor central.
La medida de tendencia centras es una descripción de una masa de datos, obtenidos

generalmente a partir de una muestra. Sirve para describir, indirectamente, la población de la
que se ha extraído la muestra.
El promedio de los valores de la muestra representativa dirá mucho del promedio que
obtendríamos en la población que representan.
La moda:
El valor que más se repite o el valor más frecuente observado en una muestra o población.
Aunque se mire la frecuencia absoluta, se dice la categoría.
“El valor de la variable con mayor frecuencia absoluta”. Se simboliza por Mo (Fechner y Pearson).
Cuando hay un único valor con la máxima frecuencia se llama distribución unimodal. Si tiene dos
sería bimodal. Cuando hay más de 2 que se repiten sería multimodal. Cuando no hay ninguna
que tenga una frecuencia mayor que otra se llama distribución amodal.
65

Se usa cuando las variables son cualitativas o nominales y cuando el intervalo abierto conocida
con la mediana.
La media:
Es el índice tendencia central más utilizado. Suma de todos los valores dividido por el número
total de ellos.
En conjuntos pequeños de datos:
En conjuntos grandes de datos:
Debería elaborarse una tabla de frecuencias.
66

Cuando hay un conjunto grande de datos se multiplica la frecuencia absoluta de cada valor por
cada valor y después se divide entre n (media aritmética).
Se usa, en principio siempre, a no ser que encuentra variables que no lo permitan, pues es el
valor en que se basan la mayoría de los estadísticos. Es la medida en la que se basan la mayoría
de los estadísticos y el mejor estimador de su parámetro.
La mediana:
Valor superado por la mitad de los sujetos. Justo el punto que la divide en dos partes iguales. Se
define como un punto o valor pero no como un dato. No tiene por qué aparecer entre los valores
de la variable.
• Es el valor que tiene la propiedad de que el número de observaciones menores que él

es igual al número de observaciones mayores que él.
• Es el valor que ocupa el punto central de una serie ordenada de datos.
• Es el punto tal que, ordenados los valores, la mitad son inferiores o iguales a él y la otra
mitad, iguales o superiores a él.
• El 50% de los valores está por encima y el otro 50% está por debajo de dicho valor
central.
Se usa cuando la variable sea ordinal, haya valores muy extremos o intervalos abiertos.
En la representación gráfica se define como un punto (un valor), y no como un dato o medida
particular. Es un punto cuyo valor no tiene por qué coincidir con ninguno de los valores
observados.
67
8.2 medidas de posición.
Los índices de tendencia central son utilizados para indicar sobre qué valor en particular ronda
un determinado conjunto de datos.
Las medidas de posición se utilizan para dar información acerca de la posición relativa en la que
se encuentra un caso, con respecto al conjunto al que pertenece. Son utilizados para interpretar
datos concretos, y aportan información que puede ser reutilizada para evaluar al conjunto.
Si nos informan que una persona ha obtenido la puntuación 84 en el cuestionario de fallos

cognitivos (CFC) y no sabemos nada más sobre el test, ese valor no nos resultará de utilidad.
Necesitamos saber algo más para poder hacer una valoración de esa puntuación, dado que
una valoración útil solo se puede hacer en términos relativos y con respecto a un marco de
referencia.
- Por ejemplo, decimos que una persona que mide 1,98 es alta, puesto que las
estaturas de la especie humana ésta sería superada por muy pocos individuos. Por
el contrario, la información de que un habitante de otro planeta mide 1,47 no nos
dice nada, en términos relativos, acerca de si esta es una estatura normal en su
grupo de referencia o no.
8.2.1 Los cuantiles.
Mediana (Mdn): divide a la distribución en 2 partes:
Cuartiles (QK): dividen a la distribución en 4 partes: Q1, Q2, Q3: i/k = ¼
Deciles (Qk): dividen a la distribución en 10 partes: D1, D2, ... , D9: i/k = 1/10
Percentiles (Pk): dividen a la distribución en 100 partes: P1, P2, ... , P99: i/k = 1/100
Dividen a la distribución en k partes con misma cantidad de datos.
Sirven para saber en qué valor particular ronda un conjunto de datos
Es lo mismo decir Decil 2 que percentil 20
68

El percentil no tiene por qué coincidir con un valor concreto de la variable. El percentil refleja el
porcentaje acumulado que haya por debajo. Se coge el valor que sea ese porcentaje y se coge
Xi (si el 75% de la población tiene 4 hijos o menos el percentil Q3 sería 4) siempre que se busque
percentiles, centiles… se busca la frecuencia acumulada.
UN EJEMPLO MUY COTIDIANO:
En el caso de los bebés, el percentil se utiliza para hacer una valoración del crecimiento del
recién nacido. Los más utilizados son para el peso y la talla del bebé.
Imaginemos el caso de Paula, nuestra sobrina.
¿Qué significa que Paula esté en el percentil 25 de peso?
- Significa que de cada 100 bebés, 75 pesan más que ellas (24 pesarían menos).
¿y si estuviera en el percentil 80 de altura?
- Que de cada 100 bebés, solo hay 20 que midan más que ella (luego 79 medirían
menos).
En muchas ocasiones, lo que nos interesa no es determinar el percentil correspondiente a una

determinada puntuación, sino lo contrario, qué puntuación es aquella a la que le corresponde
un determinado percentil.
Por ejemplo, supongamos que hemos administrado un test de ansiedad a una muestra de 200
personas. Determinar. A) Los percentiles que le corresponde a las puntuaciones 9 y 13; y B) las
puntuaciones correspondientes a los percentiles 6 y 48.
69

C=centil (centil y percentil es lo mismo)
8.3 índices de dispersión o variabilidad.
Son índices grupales que dicen cómo se distribuyen y dispersan los datos. Es decir, la distancia
que hay. Entre los distintos datos de la muestra.
70

índices de
variabilidad o de
dispersión
At (Amplitud C.V. (Coeficiente Q (amplitud S (desviación

S2 (varianza)
total) de variación) semiintercuartil) típica)
EJEMPLO:
Las medidas de dispersión y variabilidad entran en juego aquí. Aunque la media sea distinta de
la A y la C la dispersión es igual.
Cuantificadores de la variabilidad.
71
Variabilidad 0 es cuando todos los dos son iguales.
La amplitud total (rango o recorrido).
Es la diferencia entre los dos extremos; la diferencia entre el valor máximo y el mínimo.
Es la distancia entre el valor máximo y el valor mínimo de un conjunto de datos.
- Ventaja: es sencilla de calcular.

- Desventajas:
• Solo utiliza datos de la muestra, por lo que es muy sensible a los valores
extremos y nada sensible a los valores medios. No es estable.
• No es independiente de los tamaños de las muestras (AT obtenidas en
muestras de tamaños diferentes no son directamente comparables).
Cálculo de la amplitud total:
72

La amplitud total no nos permite saber qué
ocurre en los datos centrales.
La amplitud semiintercuartil.
Es la semidistancia entre el cuartil 3 y el cuartil 1. Se suele calcular cuando solo quieren tener en
cuenta las puntuaciones centrales de distribución o cuando la media no es utilizable.
Se evita el efecto de los extremos. Nos centramos en los valores intermedios.
Se resta al valor del cuartil 3 el valor del cuartil 1 y se divide entre

2. Se hace una media de las distribuciones que rodean la
distribución.
EJEMPLO:
Análisis de datos.
A) Desequilibra al estudiante de Psicología.

B) Es un instrumento imprescindible para la Psicología.
Hay que saber cuántos participantes
tenemos; hay que saber cuánto es el 25% y
cuanto es el 75% y una vez se conoce eso
hay que hacer la frecuencia acumulada para
adivinar a qué valores de la frecuencia
corresponden estos participantes.
73

La varianza y la desviación tipo.
¿Hasta qué punto se encuentra la gente del representante en su

población?
Nos interesa conocer cuál es el promedio aproximado de las distancias de

todos los sujetos al representante.
S2= Al cuadrado es la varianza y sin el cuadrado es la desviación típica.
Σ = sumatorio
La varianza de expresa en unidades al cuadrado, y esto no solemos utilizarlo (dos cebollas sí; 2
cebollas al cuadrado???).
Para que la dispersión se exprese también en

las mismas unidades que la variable en su
origen se hace la raíz cuadrada (obteniendo
la desviación tipo).
74

Propiedades de la varianza y de la desviación típica.
1. Tanto la S2 como la S tienen valores esencialmente NO negativos, es decir:
2. No serán calculables o no serán recomendables cuando no sea calculable o

recomendable la medida de tendencia central.
3. La desviación tipo viene expresada en las mismas unidades en las que vienen
expresados los datos.
4. Tanto la Varianza (S2) como la Desviación típica (S) de la muestra son inferiores a la
varianza (2) y la desviación típica ( ) de la población:
Coeficiente de variación de Pearson.
Ej: edad.
Una diferencia de 2 años de edad puede ser mucho o poco:
- 78-80 años.
- 1-3 años.
- ¿esta diferencia de dos años, implica lo mismo?
Hay una diferencia psicológica que los números no pueden detectar. Nosotros, como psicólogos
(en un futuro próximo) tenemos que interpretarlo.
También llamado coeficiente de variabilidad relativa.
Simbólicamente:
Es preferible utilizar el CV antes que la S cuando quieran compararse las dispersiones de dos o
más distribuciones de datos. Las unidades grandes provocan diferencias más grandes, lo cual
se refleja en la media.
Cuando las medias sean parecidas, será más simple e igualmente válida la comparación en
términos de S (calcular el CV no aportaría nada nuevo).
¿Qué opináis sobre el grado de

variabilidad de estos grupos?
75
Cuando las medias son iguales, CV no añade nada (mismas conclusiones).
EJEMPLO:
Se realiza un experimento sobre tiempos de reacción ante dos estímulos A y B en una muestra
de sujetos. Los resultados han sido los siguientes:
8.4 medidas de forma.
¿Cómo están dispuestos unos datos con respecto al resto?
76

Indica cómo se sitúan los datos en cuanto
a agrupación.
Dice si la distribución está aplanada o

apuntada
Sesgo o asimetría.
Dos distribuciones con la misma media y con la misma dispersión pueden ser, en cuanto a su
forma, totalmente distintas. Estas medidas nos indican en qué lado de la distribución existe
mayor dispersión.
g1= Valor del índice.
Como apunta de derecha o izquierda.
Apuntamiento o curtosis.
Se refiere al grado de apuntamiento o de esbeltez de las distribuciones. El apuntamiento indica

un marcado contraste entre las elevadas frecuencias centrales y el resto.
77

Como apunta hacia abajo o hacia arriba.
Dos distribuciones con medias y desviaciones típicas iguales no tienen por qué tener la misma
forma.
Si es simétrica media y mediana

coincide en el mismo valor. Pero
no siempre que media y mediana
sean iguales la distribución es
simétrica.
EJEMPLO:
78

Tema 9. TIPOS DE PUNTUACIONES.
1) X: es la puntuación atribuida a cada sujeto al ser sometido a cualquier prueba.
2) x: es la puntuación directa menos la media.
3) Z: es la puntuación diferencial dividida por la desviación típica.
9.1 comparación de puntuaciones.
1) la comparación de puntuaciones directas (Xi) puede llevarnos a conclusiones engañosas.
2) La solución basada en distancias a la media (xi) no es una solución del todo satisfactoria.
3) la solución es utilizar puntuaciones típicas, tipificadas o estandarizadas.
9.2 Interpretación de las puntuaciones directas: Xi
CASO 1: un sujeto obtiene una puntuación en un test de inteligencia: X=25
1 sujeto= 1 variable.
¿Cómo interpretar la puntuación X= 25?
Una puntuación directa como 25 no aporta más que una cantidad. Pero, 25 ¿es mucho? ¿Es
poco? La respuesta es: DEPENDE.
¿De qué dependen las puntuaciones X?
- De la media del grupo y de su variabilidad.
Luego, las puntuaciones directas no son AUTOSUFICIENTES.
79
CASO 2: 1 sujeto = 2 variables (no comparables).
Juan pesa 75 kg, y mide 1,80 m. Su peso ¿es mayor o menor que su altura?
La respuesta es que no son directamente comparables.
CASO 3: 1 sujeto = 2 variables (supuestamente comparables)
Un alumno X se ha examinado recientemente de Psicofisiología y de Diseños y Análisis de Datos.

Si las puntuaciones hubieran sido respectivamente 30 y 15, ¿Podríamos decir que lo ha hecho
mejor en Psicofisiología que en Datos?
9.3 interpretación de las puntuaciones diferenciales: x1.
Las puntuaciones diferenciales, son la diferencia entre la distancia y la media.
Las puntuaciones diferenciales: xi nos indican si una

puntuación directa es superior, inferior o igual que la
media. Esta información se deduce del signo de la
puntuación diferencial. Existen puntuaciones
diferenciales positivas y negativas. Nos dice la
distancia que tiene el dato con la media que representa al grupo. Permite ver como se relaciona
cada una de las puntuaciones con la media.
80

Convertir una puntuación directa en una diferencial.
3= Distancia entre esquinas y media.
1=Distancia Cada valor y la media.
CONCLUSIONES:
EJEMPLO:
CONCLUSIONES:
Como puede observarse, las puntuaciones del grupo A son bastante más homogéneas (menos
dispersas, menos variables) que las del grupo B. esto hace que, mientras que la puntuación 117
en el grupo A represente a un valor extremo (pues es la puntuación máxima) esa misma
puntuación en el grupo B no es tan extrema; hay otra puntuación por encima de ella (122).
81

9.4 Interpretación de las puntuaciones típicas: Zi.
La solución a esta situación es:
Es lo mismo la desviación típica que la estandarizada.
Definición: “La puntuación típica, tipificada o estandarizada indica el número de desviaciones

típicas que una determinada puntuación directa se separa de su media”.
Tipificación o estandarización.
Al proceso de obtención de las puntuaciones típicas se le conoce como: Tipificación o

Estandarización.
Las puntuaciones típicas se conocen también como puntuaciones: Tipificadas o Estandarizadas.
Calculo de las puntuaciones Zi
Gráficamente se produce un desplazamiento hacia el lado izquierdo del eje de abscisas cuando
convertimos las puntuaciones directas en diferenciales.
82

Propiedades de las Zs.
1. La suma de las puntuaciones típicas es 0.
Demostración.
2. La media de las puntuaciones típicas es 0.
Demostración.
3. la suma de los cuadrados de las puntuaciones típicas es igual a n:
Demostración.
4. La desviación tipo y la varianza de las puntuaciones típicas es igual a 1.
Las puntuaciones típicas permiten, por tanto, hacer comparaciones entre unidades de distintos
grupos, entre variables medidas de distintas formas o incluso entre variables diferentes.
9.5 Las puntuaciones típicas y la curva normal.
- El límite del diagrama de barras: al aumentar

indefinidamente el número de barras, disminuye
su amplitud y las barras se adelgazan más y más.
En el límite, la línea quebrada se identificará con
la curva normal (normal o Campana de Gauss).
83
Entre todas las distribuciones de probabilidad de las variables
aleatorias absolutamente continuas, esta es la más
importante. Estas distribuciones son conocidas como
distribuciones de
Laplace-Gauss, aunque fueron utilizadas por primera vez
por De Moivre.
1) El tamaño de la muestra crece.

2) El tamaño de la barra disminuye. Cuanto más muestra tenemos más se parece la parte
derecha de la izquierda.
3) La función de probabilidad es:
Para cada par de valores de  y  tendremos una curva normal.
Características de la Curva Normal.
Esta distribución depende de 2 parámetros:  (media de población)

y  (desviación típica de población).
La curva normal tiene un único máximo.
La curva normal tiene dos puntos de inflexión (punto en el que la

curvatura se invierte).
La curva normar es asintótica al eje de abscisas (asíntota horizontal).
Es una distribución simétrica (g1=0).
84

Es una distribución mesocúrtica (g2=0).
El parámetro  proporciona el centro de la

distribución y el parámetro , la dispersión,
verificándose las siguientes igualdades:
CASO 1:
Aplicaciones a la curva normal tipificada.
Las características de la distribución normal las presentan muchas distribuciones, todas con sus
medias y desviaciones típicas.
- Implica la existencia de infinitas distribuciones normales.
Solución: convertir las puntuaciones directas en típicas.
- Implica transformar la distribución normal en una distribución normal tipificada o

estandarizada.
→ Siempre tendrá media 0 y desviación típica 1.
Por lo general. No suelen interesarnos las distancias estandarizadas en sí mismas, sino como un
producto intermedio entre puntuaciones directas y proporciones.
Traducción de puntuaciones directas a proporciones.
85

Traducción de proporciones a puntuaciones directas.
Ej. En una distribución normal con media 100 y desviación tipo 15, ¿Qué proporción de datos
tiene valores comprendidos entre 70 y 130?
Ej. En una distribución normal con media 100 y desviación tipo 15, ¿Qué puntuación delimita el
10% superior de los datos?
86

Wuolah-free-Analisis de Datos

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Wuolah-free-Analisis de Datos

Diunggah oleh

Hak Cipta:

Format Tersedia

DISEÑO Y ANÁLISIS DE DATOS.

Elena García Candau

Apuntes descargados de wuolah.com

Tema 1. Consideraciones generales sobre investigación y medición.

Tema 2. Diseños y Métodos de investigación.

Tema 3. Introducción a la estadística descriptiva.

- 3.1. Definición de Estadística.

Tema 4. Organización y representación de datos.

- 4.1. Distribución de frecuencias

Tema 5. Medidas de posición.

MasterSevilla - Máster en Dirección y Gestión de Recursos Humanos

BLOQUE 2. Introducción al análisis de datos

Tema 6. Medidas de tendencia central y de variación.

- 6.1. Definición de tendencia central

Tema 7. Medidas de asimetría y apuntamiento.

Tema 8. Tipos de puntuaciones.

Tema 9. Introducción a la inferencia estadística.

- 9.1. Modelos probabilísticos de distribución de datos más utilizados en psicología.

Sácate el carnet de conducir por 185€. AUTOESCUELA CIUDAD JARDIN.

• Pero… ¿Qué es investigar?

• Investigar: plantear preguntas de forma válida.

1.1 El proceso de investigación.

1.2 Planificación de la investigación.

ELEMENTOS BÁSICOS CONTENIDOS

MasterSevilla - Máster en Dirección y Gestión de Recursos Humanos

Sácate el carnet de conducir por 185€. AUTOESCUELA CIUDAD JARDIN.

¿CÓMO SE FORMULA UN OBJETIVO DE INVESTIGACIÓN?

→ Deben ser concretos, es decir no redundar en frases largas y poco claras

 Conocer que efectos perjudiciales produce la delincuencia en la ciudad de Sevilla.

MasterSevilla - Máster en Dirección y Gestión de Recursos Humanos

1.2.3 ¿Qué es una hipótesis?

La hipótesis científica es aquella formulación que se apoya en un sistema de conocimientos

Características de las hipótesis:

1. Deben referirse a un ámbito determinado de la realidad social.

 Deben referirse a un ámbito determinado de la realidad social.

¿Cómo se formula una hipótesis?

Las hipótesis contienen tres elementos estructurales que son:

 Las unidades de análisis o de observación. A saber, individuos, instituciones,

 Las empresas industriales tienen una organización jerárquica.

Funciones de objeto de estudio y su contexto.

• En los objetivos e hipótesis debemos identificar el objeto de estudio:

Sácate el carnet de conducir por 185€. AUTOESCUELA CIUDAD JARDIN.

MasterSevilla - Máster en Dirección y Gestión de Recursos Humanos

Una variable es el concepto o expresión de

Una variable sería una característica de

El concepto es la idea general que tenemos y podemos operacionalizarlo en variables.

Definición operacional: condición que requiere atención médica documentada por

Variable por tanto es el concepto más especificado, cómo lo vamos a medir.

Es un código específico, palabra o número que refleja la situación de un individuo en

Sácate el carnet de conducir por 185€. AUTOESCUELA CIUDAD JARDIN.

Valor: Ninguna vez / 1 vez / 2 veces / 3 veces / 4 veces o más.

Ej. Puntuación mínima en presión sanguínea:

IMPORTANTE: cuidado con el valor “otros”, no hay que abusar.

Exclusividad: cada sujeto únicamente puede ser asignado a un valor de respuesta de la

Ej. Puntuación mínima en presión sanguínea:

 La escala ordinal, además de las propiedades de la escala nominal, permite establecer

MasterSevilla - Máster en Dirección y Gestión de Recursos Humanos

- Temperatura de una persona.

Sácate el carnet de conducir por 185€. AUTOESCUELA CIUDAD JARDIN.

MasterSevilla - Máster en Dirección y Gestión de Recursos Humanos

o Ejemplo: Normalmente las variables de texto se colocan emparejadas con variables

C) TIPOS DE VARIABLES EN FUNCIÓN DEL PAPEL QUE JUEGAN EN LA RELACIÓN:

- Relación univariable: Solo existe una variable en cada término. No están

(Variable extraña) (Variable dependiente) (Variable independiente)