- 5.1. Percentiles
- 5.2 Deciles
- 5.3 Cuartiles
- 7.1. Introducción
- 7.2 Índices de asimetría
- 7.3 Índices de apuntamiento
3
BLOQUE 1. CIENCIA Y MÉTODO CIENTÍFICO.
FUNDAMENTOS METODOLÓGICOS PARA LA
INVESTIGACIÓN.
Tema 1. PLANTEAMIENTO VÁLIDO DE PREGUNTAS.
• El análisis de datos es tan solo una parte del proceso de investigar.
MÉTODO:
INTRODUCCIÓN MUESTRA,
OBJETIVOS RESULTADOS DISCUSIÓN
JUSTIFICACIÓN INSTRUMENTOS,
PROCEDIMIENTO
En la redacción se deben tomar en cuenta las siguientes recomendaciones para considerar los
aspectos más relevantes en su formulación:
Ejemplos.
Requisitos:
Tipos de hipótesis:
→ Las descriptivas (de una sola variable), señalan la presencia de ciertos hechos o
fenómenos en la población objeto de estudio. Son simples afirmaciones, no permiten
explicar los hechos o fenómenos, posibilitan probar la existencia de una característica o
cualidad en un grupo determinado.
7
→ Las correlacionales especifican las relaciones entre dos o más variables. Las relaciones
entre las variables son de covariancia, no de causalidad. Ninguna variable es la causa de
la otra. Las hipótesis correlacionales pueden establecer la relación entre dos variables
(o más) o señalar además, cómo están asociadas.
→ Las causales son aquellas que establecen relaciones de causa-efecto entre dos o más
variables. Pueden ser bivariadas o multivariadas. Las bivariadas establecen la relación
entre dos variables. Las multivariadas establecen una correlación entre varias variables.
Ejemplo.
Las preguntas que tenemos en un cuestionario, por ejemplo, son variables. Esto quiere
decir que una variable puede expresarse tanto en forma de pregunta como en solo una
palabra.
Ej:
Concepto: Lesión
Variable: ¿Cuántas veces ha tenido algún tipo de lesión para la que ha necesitado
asistencia de algún profesional médico o de enfermería en los últimos 12 meses?
VALOR
10
Ej:
Variable: ¿Cuántas veces ha tenido algún tipo de lesión para la que ha necesitado
asistencia de algún profesional médico o de enfermería en los últimos 12 meses?
CONDICIONES INDISPENSABLES:
Exhaustividad: todos los sujetos deben poder asignarse a algún valor de la variable.
a) Por debajo de 5
b) Entre 6 y 9
c) Por encima de 10
Error: ¿qué contestan los sujetos con una puntuación de 10? No pueden contestar en ninguna
opción.
a) por debajo de 5
b) entre 5 y 10
c) por encima de 10
Error: ¿qué contestan los sujetos con una puntuación de 5? tienes dos opciones para contestar
a y b.
11
A) tipos de variables en función del tipo de medida (valores).
Los valores son las distintas posibilidades en que puede ocurrir una variable.
Se entenderá por medición al proceso de asignar el valor a una variable de un elemento
en observación.
Las variables cuantitativas dan más juego para obtener más información que las ordinales. Las
de texto, son más complejas.
CATEGÓRICAS O NOMINALES:
VARIABLES NOMINALES:
→ La escala nominal sólo permite asignar un nombre al elemento medido. Esto la convierte
en la menos informativa de las escalas de medición.
- Nacionalidad.
- Uso de Gafas.
- Número de camiseta de equipo de fútbol.
- Número de Cédula Nacional de Identidad.
→ A pesar de que algunos valores son formalmente numéricos, sólo están siendo usados
para identificar a los individuos medidos. No se pueden ordenar sin los valores de la
variable (no puede decir que ser Francés sea más que ser español). No implica contar.
→ Los valores de estas variables son categorías, por lo que no admiten un orden natural
de los datos.
VARIABLES ORDINALES:
12
VARIABLES CUANTITATIVAS:
Son números.
ESCALA DE INTERVALO: además de todas las propiedades de la escala ordinal, hace que tenga
sentido calcular diferencias entre las mediciones. La cuantitativas lo que te preguntan es por el
mismo número, por lo que a este no se le puede dar un valor categórico. Aquí no se dan
opciones, por lo que el individuo debe dar un valor suyo. Aquí el valor del cero es relativo.
ESCALA DE RAZÓN: permite, además de lo de las otras escalas, comparar mediciones mediante
un cociente. El cero tiene un valor fijo en el que no existe otra escala de medida.
- Altura de personas.
- Cantidad de litros de agua consumido por una persona en un día.
- Velocidad de un auto en la carretera.
- Número de goles marcados por un jugador de básquetbol en un partido.
La escala de intervalo tiene un cero que se establece por convención y puede tener
variaciones. Es arbitrario. Por otra parte, la escala de razón tiene un cero real, fijo, no
sujeto a variaciones; es propio de la medición hecha.
En contraste a las anteriores variables, los valores de las variables cuantitativas SÍ refleja
algo real sobre un individuo, presentando un orden natural y un valor numérico. Por lo
tanto, los valores de una variable cuantitativa no son categorías, son los valores actuales
obtenidos por el que responde.
Con las variables que son nominales y ordinales existe una clasificación según el número de
valores en el concepto.
13
14
15
D) TIPOS DE RELACIÓN EN FUNCIÓN DE LA ESTRUCTURA.
El análisis de las estructuras de los conceptos puede hacerse tanto si son objetos de estudio
como si son del contexto. Se estudia a partir de los conceptos unitarios los cuales serían
Aprendizaje, emoción, personalidad, etc. Serían conceptos unitarios si se les concede sentido
por sí mismo y no necesariamente completados con otros elementos. Por otra parte, sería una
variable con distintos valores si, por ejemplo, en el caso de la personalidad tenemos subtipos.
Es decir, son conceptos que se pueden estudiar por separado, son aquellas cosas que aparecen
en la investigación sin necesidad de ser el foco central de la investigación. Si quiero ver
personalidad según patrones ya sería una variable. El concepto unitario es un punto de
especificación menor que la variable.
Relaciones entre variables: Además de identificar las variables y el número de ellas, debe
identificarse si hay planteada una relación o asociación entre diversos conceptos. Según la
estructura de las relaciones puede ser:
16
EJ: Influencia de una determinada terapia (VI) psicológica sobre el hábito de tabaquismo (VD)
de un paciente.
La VI debe tener al menos 2 valores. (En el ejemplo anterior sería por ejemplo dos tipos de
terapia). Para evaluar las variaciones conjuntas de ambos términos es preciso identificar
también los valores de la VD que aparecen ante cada valor del primero.
La comparación entre los distintos valores de la VD ante cada valor de la VI es lo que va a permitir
evaluar la posible covariación entre los valores de uno y otro término.
17
Se defenderá la covariación entre ambos términos en la medida que haya diferencias en esa
comparación entre valores del segundo ante cada valor del primero. Solo hay covariación
cuando hay VD Y VI y la VI tiene al menos dos valores
18
La validez permite distinguir entre relaciones causales y no causales. Aunque todas las relaciones
se definen en términos de covariaciones, no todas pueden considerarse causales.
Considerar causalidad implica suponer ajuste de la relación objeto de estudio al referente (debo
saber que estoy estudiando lo que quiero estudiar y debo tener claro que realmente es así), así
como diferenciación de ocurrencias de cada variable de contexto respecto a la independiente.
(Tengo que tener claro cuáles son mis variables objeto de estudio y cuales son aquellas otras
que están en el contexto pero que no son mi objeto de estudio, por ello pueda tenerlas en
cuenta y controlarlas)Además, ambas propiedades pueden ser consideradas en la medida en
que todas las variables estén delimitadas con precisión. (Tengo que tener muy bien definidas
mis variables, cuanto mejor definida esté más claro tengo que mido lo que quiero medir)Una
relación en que una variable explica la otra (la flecha solo va en una dirección).
19
- Cuando se está considerando la causalidad de una relación, se está valorando la
validez de ésta.
Relaciones NO causales son aquellas en las que haya insuficiencia de al menos 1 de las 3
propiedades definitorias de la validez. Relaciones no causales por insuficiente diferenciación
entre 2 o más variables (sean VI, de contexto, o entre ambas). Para identificar una relación como
no causal deberá detectarse que la posible covariación entre las VI y VD no se debe a que la
primera produzca los cambios en la segunda, sino que los de ambas son consecuencia de una
tercera (sea de contexto u otra VI). Relación espuria.
- La alta covariación entre la altura de las personas trabajadoras por cuenta ajena y
su salario en determinados países no refleja una influencia de una sobre la otra, sino
que ambas son consecuencia de la variable sexo, que hace que los hombres sean
más altos en general y que en determinados países reciban un salario mayor que las
mujeres.
Otras veces, la covariación entre una VI y una VD se debe a alguna variable de contexto que
conecta ambas. La relación entre ambos desaparecería si se eliminara el elemento intermedio o
la variación de sus valores; es una relación mediada.
Falta de causalidad puede deberse también a un inadecuado ajuste y también a una insuficiente
precisión de los términos del objeto de estudio y de su contexto, lo que puede ocultar variables
de las que dependan las de la relación planteada, dando apariencia de causal a una relación que
no lo es.
El sentido de la recogida de datos es obtener evidencias con las que responder a las preguntas
planteada. Puede realizarse de distintos modos, mediante diferentes diseños, métodos y
técnicas (depende de qué queramos obtener). Además de obtener información tiene otro
sentido, interpretar la realidad.
20
21
22
→ D. Factorial completo: cuando se combinan todos los valores de las distintas Vis. Todos
los valores de las variables independientes son combinados.
23
Considerando como Vis a profesores de secundaria y asignaturas impartidas,
uno de los profesores solo diera una de las asignaturas elegidas.
24
El número de datos a obtener de cada variable de prueba en cada unidad de estudio es lo que
define la estrategia del diseño.
Con estas dos estrategias de diseños se miden cada una de las variables dependientes. Para
saber si es longitudinal o trasversal hay que fijarse en la variable independiente.
25
Si es transversal, implica que los sujetos que estén en una condición no están en otra,
por lo que habrán de formarse distintos grupos de esas unidades, tantos como
condiciones.
- D. de medida única/multigrupos o intergrupos (control - experimental): la
comparación se realiza entre datos de distintos grupos de sujetos.
Si es longitudinal, implica que todos los sujetos forman un único grupo aportando más
de un dato de la VD en distintos momentos de la investigación, tantos como
condiciones.
- D. de medida repetida/intragrupo o intrasujeto (prestest - postest).
D. de series temporales, cuando se obtienen varios datos de cada sujeto por cada condición
(podría decirse que estos diseños son longitudinales no solo en su conjunto si no también en
cada una de sus condiciones).
26
o Intervenir en una VI implica que quien investiga decide y aplica qué valor o valores
de dicha variable va a recibir cada unidad de estudio, y en qué momentos lo va a
recibir.
→ Hay intervención en una VI cuando el contacto de los valores de dicha variable
con los sujetos depende de quien investiga, ya sea que lo decida directamente
o a través del azar.
→ No hay manipulación o intervención en la VI cuando el contacto de los valores
de la variable con los sujetos viene dado de modo previo al estudio.
o VI activa: aquella que es manipulada.
27
o VI asignada: aquella que NO es manipulada, sino que se asigna.
o Ej. Siendo la cafeína la VI de una relación, habría intervención cuando fuera la
persona que investiga quien decidiera qué sujetos o en qué momentos van a recibir
las dosis elegidas como valores de la citada variable. La no intervención supondría
que quien investiga selecciona a los sujetos según el valor de cafeína que hayan
consumido de manera natural.
o Importante: no todas las variables admiten manipulación cuando son planteadas
como VI.
o La edad y el sexo no pueden ser manipuladas.
o La intervención no tiene sentido en las variables de prueba.
o Natural. Ausencia de intervención tantos en las VIs como en las de contexto; por lo
que permanecen inalteradas las características de los sujeto y medio que forman el
contexto. A este tipo de intervenciones algunos autores la llaman metodología
cualitativa.
28
o Selectivo o ex post facto. falta de intervención en las VIs (por no existir o ser
asignadas), pero intervención en al menos una variable de contexto de sujeto o de
medio cualquiera que sea su grado.
29
→ Ej. calidad de vida en personas que viven solas frente a personas que viven
en pareja o con amigos.
30
• Observación: obtener datos sin que esa tarea implique intervención significa que se
logran esperando a que aparezcan para apreciar cuales son.
No confundir la intervención que suponen las encuestas con la intervención que define a la
manipulación de VIs.
31
Tema 4. PROCEDIMIENTOS DE SELECCIÓN DE LA MUESTRA.
Ej. El número de alumnos/as que interese estudiar constituirá el tamaño de esa población. El
número de días de un curso escolar en el que se quiera conocer el comportamiento de ese
alumnado determinará el tamaño de esa población de tiempo; y la cantidad de espacios de la
32
Identificar el tamaño de una población no es siempre posible, bien porque sea desconocido o
porque pueda considerarse infinito.
Ej. Poblaciones de personas con el virus del sida en países en los que no se lleve tal control.
Cuando sea conocido y no excesivo el número de unidades, las poblaciones pueden ser
estudiadas en su totalidad, lo que facilita la representatividad de la recogida de datos.
Otras veces ocurre que el tamaño de algunas poblaciones es excesivamente grande, lo que
impide o dificulta su estudio.
Ej. Si en relación al ejemplo anterior se planteara estudiar todas las noches de un año, a lo largo
de toda la infancia o a un conjunto muy numeroso de niños residentes en todas las localidades
de un país.
33
34
35
muestreo aleatorio sistemático.
- Lo elementos se seleccionan cuin un patrón que se inician con una selección
aleatoria.
- Es un tipo de muestreo aleatorio simple en el que los elementos se seleccionan
según un patrón que se inicia con una elección aleatoria. Es decir, se elige la
primera unidad al azar y el resto mediante una regla intencional fijada de antemano.
- Se tiene una lista de los individuos de la población de estudio. Si queremos una
muestra de un tamaño dado, elegimos individuos igualmente espaciados de la lista,
donde el primero ha sido elegido al azar.
- CUIDADO: Si en la lista existen periodicidades, obtendremos una muestra sesgada.
Ej: Un caso real: Se eligió una de cada cinco casas para un estudio de salud pública
en una ciudad donde las casas se distribuyen en manzanas de cinco casas. Salieron
con mucha frecuencia las de las esquinas, que reciben más sol, están mejor
ventiladas,…
Ej: Un colegio tiene 120 alumnos de bachillerato, y se quiere extraer una muestra
de 30 alumnos. Sería aleatorio sistemático si:
→ se numeran los alumnos de 1 al 120;
→ y posteriormente se calcula un intervalo constante entre cada individuo
(población/muestra=120/30=4).
→ Sorteamos un número del 1 al 4; supongamos que sale el 3.
→ El primer alumno seleccionado para la muestra sería el número 3; los
siguientes alumnos se obtendrían sumando 3 hasta llegar a tener 30
alumnos.
→ Los alumnos seleccionados serían: 3, 6, 9, 12, 15, 21, etc.
36
Imaginemos que queremos extraer una muestra de una población en la que sabemos que existe
un 60% de hombres, y 40% de mujeres. Podríamos, para estar seguros que respetamos las
proporciones, coger en nuestra muestra al 60% de hombres y el 40% de mujeres.
37
Ej: Para estudiar a los enfermos de cáncer en Andalucía, ¿tenemos un listado de enfermos de
cáncer en Andalucía? No, entonces podemos elegir varios hospitales de Andalucía y
seleccionarlos dentro de esos hospitales.
38
El muestreo puede ser monoetápico (solo una etapa) o polietápico (más de una etapa), pueden
hacerse en una o más etapas, quedando conformada cada etapa por la delimitación de estratos.
Ej: Imaginemos que queremos trabajar con los colegios públicos de Madrid. El problema es que
no podemos coger todos los colegios, por lo que decidimos dividir Madrid en distritos
(conglomerados), y elegir aleatoriamente algunos de ellos, centrándonos únicamente en los
colegios de los distritos elegidos. Si optamos por un muestreo polietápico, dividiríamos esos
distritos en manzanas, por ejemplo, y escogeríamos sólo algunas manzanas para centrarnos en
los colegios de dichas manzanas.
39
población. Por lo tanto, sólo se realiza una muestra sobre una cantidad de conglomerados. Los
demás quedan sin representación.
A nivel práctico se utilizan más estos pero los otros son más recomendables.
En este caso, los elementos son escogidos en base a criterios o juicios preestablecidos por el
investigador.
Los sujetos de una investigación específica, son seleccionados para el estudio sólo porque son
más fáciles de reclutar y el investigador no está considerando las características de inclusión de
los sujetos que los hace representativos de toda la población. No existen criterios previos
40
Esta es la razón por la cual la mayoría de los investigadores utilizan técnicas de muestreo, como
el muestreo de conveniencia, la más común de todas las técnicas de muestreo. Muchos
investigadores prefieren esta técnica de muestreo, ya que es rápida, barata, fácil y sobre todo,
los sujetos están disponibles.
En este tipo de muestreo se fijan unas "cuotas“, que consisten en un número de individuos que
reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo
femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que se
encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de
opinión.
41
Se diferencia del muestreo estratificado en que una vez determinada la cuota, el investigador
es libre de elegir a los sujetos de la muestra dentro de cada estrato (los elige intencionalmente,
sin azar).
En la medida que sus datos se asemejen suficientemente entre sí, o saturen en el sentido de no
aportar novedades, serán cada vez más amplias las poblaciones a las que pueda generalizarse lo
encontrado en dichas replicaciones.
Por ejemplo, para obtener sujetos para un estudio que quiere analizar una enfermedad rara, el
investigador puede elegir utilizar el muestreo de bola de nieve, ya que será difícil obtener
sujetos. También es posible
que los pacientes con la
misma enfermedad tengan
un grupo de apoyo, y si uno
de sus miembros es tu primer
sujeto, lo más probable es
que allí encuentres más
sujetos para el estudio.
42
Las variables extrañas (VVEE) son aquellas que no son objeto de nuestra investigación pero están
influyendo en ella. En los experimentos actúan adicionalmente a la V.I.
Puede afectar a la V.D., por ello son relevantes, pero en ese momento no interesa determinar si
afecta o no. Puede dar lugar a problema si no se tiene en cuenta la variable extraña.
En la realización de un experimento, el científico debe considerar todas las variables que podrían
contaminar el experimento; debe intentar evaluar las variables extrañas que pudieran afectar a
su V.D. y cuyos efectos no desea conocer.
La contaminación ocurre cuando una variable extraña está sistemáticamente relacionada con la
V.I., y puede afectar diferencialmente a la V.D.
Debemos poder afirmar que el efecto producido sobre la V.D. es debido sólo a la manipulación
de la V.I. Las variables extrañas deben ser controlada se intentar aislar el efecto de las VVII sobre
la dependiente.
Las variables extrañas (VVEE) suponen amenazas a la diferenciación en las recogidas de datos
(tengo que poder asegurar que cada cambio se debe a las variables que yo quiero impartir), por
2 motivos:
- Porque cualquier covariación de alguna de ellas con una VI supone una confusión,
impidiendo que distinguir si los cambios de la VD se deben a los cambios en la VI o
a los de la extraña
- Porque al definirse las VVEE como ajenas al objeto de estudio su número es
ilimitado. Ello conlleva la imposibilidad de controlar la diferenciación de todas las
extrañas, ya que siempre puede quedar sin considerar alguna que covaríe con las
VVII.
Por estos motivos, tenemos que numerar de forma exhaustiva qué VVEE son relevantes como
fuentes de posibles confusiones.
43
5.2 mecanismos de control de VVEE
Son aquellas VVEE presentes en la investigación que tienen 1 único valor, lo que supone que no
varían; y si no varían no pueden hacerlo conjuntamente con ninguna VI, por lo que podría
afirmarse que no están confundidas y sí controladas.
44
Cuando se aplica la eliminación al conocimiento del sujeto, del investigador o de ambos sobre
los grupos o condiciones a los que ha sido asignado se denominan técnicas de
enmascaramiento.
- Las técnicas de enmascaramiento más comunes son el simple ciego (el paciente,
pero no el investigador/médico, desconoce el grupo al que ha sido asignado, es
decir, ignora cuál de los posibles tratamientos recibe), el doble ciego
(investigador/médico y paciente desconocen el grupo de asignación de este último)
y triple ciego (cuando también el análisis y evaluación de los datos se hace sin
conocer la identidad de los grupos).
5.2.2 Variables extrañas con más de un valor.
Analizar el control (considerar si ambas variables covarían) de las VVEE presentes con más de un
valor respecto a cada VI, supone considerar si ambas covarían, es decir si existe asociación en la
forma en qué varían ambas variables.
En este caso, los grupos de sujetos diferentes en valores de la VI no deben serlo también en
valores de VVEE; ya que esto supondría una falta de diferenciación entre estas y la VI (confusión
de variables).
Por ejemplo supongamos que queremos analizar el rendimiento en un deporte en función del
sexo de los deportistas que lo practican y consideramos que la altura es una VE que puede influir
pero no se registra. Podría ser que siempre los hombres fueran más altos que los mujeres y por
tanto el efecto de la VE se puede confundir con el de la VI. Esto tendría sentido siempre que la
altura pudiera influir en la VD. En estos casos tendríamos que controlar la VE intentando
diferenciar el efecto de ambas.
Para ello es necesario asignar o repartir de manera homogénea los sujetos a los diferentes
grupos (que en todos los grupos haya de todo).
45
Se evita así que los investigadores apliquen criterios que determinen dichas
asignaciones. Si las asignaciones aleatorias se realizan en una muestra elegida
aleatoriamente, se está facilitando que cada condición quede conformada por un
número semejante de hombres y mujeres y, por tanto, también por otras VE de esas
personas.
Ejemplo: si tenemos una investigación para ver la influencia del método de enseñanza
(tradicional vs novedoso) sobre el aprendizaje y no podemos medir la inteligencia de los
alumnos, como esta es una variable que tiene influencia sobre el aprendizaje, sería una variable
extraña.
46
47
formar un bloque de 12 hombres y otro de 12 mujeres, y b) asignar aleatoriamente a cada
persona componente de cada bloque a uno de los 3 valores de la VI. De este modo, cada una de
las 3 condiciones estará formada por 4 hombres y 4 mujeres.
En este caso, el control de las VVEE consiste en asemejar sus valores en los distintos
momentos, con el fin de que no varíen a la vez que lo hacen los valores de la VI.
a) Sujetos como propio control: se consigue cuando a lo largo de todos los momentos, el
grupo de sujetos analizado es semejante a sí mismo (normalmente son los mismos
sujetos) en lo que se refiere a los valores de las VVEE.
Ej. Al investigar de modo longitudinal los efectos del alcohol en la atención a una tarea, se
estudia la atención del único grupo de sujetos en las sucesivas condiciones de alcohol. En todas
estas, los valores de las diferentes VVEE relevantes deberían aparecer con valores semejantes
para evitar su confusión con los cambios de la VI. Así, si hay 20 hombres y 7 mujeres en la primera
48
Ej. Al estudiar la relación entre la contemplación de programas violentos por parte de niños y la
agresividad que manifiestan posteriormente, podría hacerse que todos los niños visualizaran
primero un programa no violento y después otros violentos, estudiando su agresividad después
de cada programa. Las características personales y familiares de los niños quedarían controladas
si se mantuviera semejantes en las dos condiciones (lo cual se conseguiría siendo los mismos
niños).
Consiste en que cada ocurrencia de las variables repetidas acumula sus efectos a los de
ocurrencias previas, por lo que sus valores van cambiando a la vez que los de las VVII,
confundiéndose con estas.
Ej: En el ejemplo anterior sería si la mitad de los sujetos contemplasen primero el programa no
violento y la otra mitad el violento y, tras estudiar qué agresividad manifiestan, se hiciese que
cada grupo contemplase el programa que no hubiera visto.
Ej. a un experimentador le interesa saber si una señal de “alto” debería pintarse de amarillo o
rojo, su problema sería determinar el color de la señal a la que responde más rápido un sujeto.
Para responder esta pregunta podrá medir primero el tiempo de reacción (T.R.) de un sujeto a
la señal amarilla y luego a la señal roja. Repitiendo cierto número de veces el procedimiento,
quizá llegara a la conclusión de que el T.R. a la señal roja es el más corto. Sin embargo, como a
los sujetos se les mostró primero la señal amarilla, su T.R. a la señal roja dependerá parcialmente
de su aprendizaje para manejar los aparatos experimentales así como de su adaptación a la
49
50
PLANIFICACIÓN DE LA INVESTIGACIÓN:
¿QUÉ HACE UNA ASIGNATURA COMO ESTA EN UNA CARRERA COMO ESTA?
No importa a qué nos dediquemos como psicólogos/as en un futuro. Si llevamos nuestra labor
con profesionalidad, nos encontraremos casi continuamente recogiendo datos, analizándolos y
obteniendo conclusiones.
51
6.2 conceptos básicos:
Población (N): Conjunto de todos los elementos (personas, animales, cosas…) que tienen una o
varias características o propiedades en común (la población es el grupo de referencia que se
usará en el estudio):
Requisitos de una muestra para poder extraer conclusiones (hacer inferencias) en la población:
Parámetro poblacional: Son valores que determinan las propiedades descriptivas de una
población. (Se llama así a los típicos datos y elementos de la población).
No se suelen conocer:
52
Aunque estas estimaciones están sujetas a errores de diferente tipo, se utilizan para averiguar
el valor aproximado de los parámetros. Se utiliza nuestro alfabeto para su denominación.
Sujetos: Constituyen las unidades de análisis que poseen la/s característica/s que se pretenden
estudiar. Elementos que forman la muestra.
53
La información que recoge una variable a través del conjunto de valores que presenta, puede
ser tratada y resumida mediante técnicas estadísticas.
Existe una clasificación de las variables en función del tipo de operaciones matemáticas que nos
está permitido realizar con los números asignados (clasificación de Stevens).
- Clasificación de Stevens:
Tablas:
54
Cada sujeto es siempre una fila. Cada variable estudiada es siempre una columna.
¿Cómo podemos representar los datos y ofrecer información sobre ellos de la forma más
conveniente?
- Esto dependerá de su nº. Para trabajar con un nº de datos grande (que no podamos
obtener toda la información con un simple vistazo) utilizaremos dos estrategias
descriptivas básicas:
→ Tablas de frecuencias.
→ Representaciones gráficas.
55
Picado de datos:
Pero antes de obtener información sobre los datos, lo primero que debemos hacer es introducir
los datos en el programa estadístico.
Para crear y dar nombre a una nueva variable debemos completar los datos en Vista de
Variables.
Para introducir directamente los datos deberán completarse, para cada variable los siguientes
pasos:
56
Respecto al NOMBRE:
Anchura y decimales:
57
58
Una vez que tengo los datos introducidos en el programa estadístico, quiero obtener la
distribución de las frecuencias de cada una de las variables.
Tablas de frecuencias:
59
a) Frecuencia absoluta: fi
La muestra total es la suma de la frecuencia. Solo se obtiene la suma de los que sí han
respondido.
La frecuencia relativa es el cociente entre la frecuencia absoluta y la n. con esto se obtiene una
proporción.
Informa sobre la importancia que posee un valor dentro del conjunto al que pertenece:
Ej:
Propiedades:
c) Porcentajes
60
d) Frecuencia acumulada: Fi
Permite considerar cada valor no aislado de los demás, sino puesto en relación con ellos.
61
¿Cómo podemos representar los datos y ofrecer información sobre ellos de la forma más
conveniente?
- Dependiendo del tipo de variable: cualitativa o cuantitativa son más apropiado unos
u otros.
- Los más comunes son los gráficos de barras, sectores, líneas.
62
Gráfico de líneas
63
Para variables agrupadas.
64
1. Uno que refleje la tendencia central: valor que se represente al conjunto. Valor
alrededor del cual se encuentre la mayoría de los datos.
2. Otro que refleje la dispersión alrededor de este valor: si los datos están alejado o muy
juntos respecto al valor central.
El promedio de los valores de la muestra representativa dirá mucho del promedio que
obtendríamos en la población que representan.
La moda:
El valor que más se repite o el valor más frecuente observado en una muestra o población.
Aunque se mire la frecuencia absoluta, se dice la categoría.
“El valor de la variable con mayor frecuencia absoluta”. Se simboliza por Mo (Fechner y Pearson).
Cuando hay un único valor con la máxima frecuencia se llama distribución unimodal. Si tiene dos
sería bimodal. Cuando hay más de 2 que se repiten sería multimodal. Cuando no hay ninguna
que tenga una frecuencia mayor que otra se llama distribución amodal.
65
La media:
Es el índice tendencia central más utilizado. Suma de todos los valores dividido por el número
total de ellos.
66
Se usa, en principio siempre, a no ser que encuentra variables que no lo permitan, pues es el
valor en que se basan la mayoría de los estadísticos. Es la medida en la que se basan la mayoría
de los estadísticos y el mejor estimador de su parámetro.
La mediana:
Valor superado por la mitad de los sujetos. Justo el punto que la divide en dos partes iguales. Se
define como un punto o valor pero no como un dato. No tiene por qué aparecer entre los valores
de la variable.
Se usa cuando la variable sea ordinal, haya valores muy extremos o intervalos abiertos.
En la representación gráfica se define como un punto (un valor), y no como un dato o medida
particular. Es un punto cuyo valor no tiene por qué coincidir con ninguno de los valores
observados.
67
8.2 medidas de posición.
Los índices de tendencia central son utilizados para indicar sobre qué valor en particular ronda
un determinado conjunto de datos.
Las medidas de posición se utilizan para dar información acerca de la posición relativa en la que
se encuentra un caso, con respecto al conjunto al que pertenece. Son utilizados para interpretar
datos concretos, y aportan información que puede ser reutilizada para evaluar al conjunto.
Necesitamos saber algo más para poder hacer una valoración de esa puntuación, dado que
una valoración útil solo se puede hacer en términos relativos y con respecto a un marco de
referencia.
- Por ejemplo, decimos que una persona que mide 1,98 es alta, puesto que las
estaturas de la especie humana ésta sería superada por muy pocos individuos. Por
el contrario, la información de que un habitante de otro planeta mide 1,47 no nos
dice nada, en términos relativos, acerca de si esta es una estatura normal en su
grupo de referencia o no.
Deciles (Qk): dividen a la distribución en 10 partes: D1, D2, ... , D9: i/k = 1/10
Percentiles (Pk): dividen a la distribución en 100 partes: P1, P2, ... , P99: i/k = 1/100
68
En el caso de los bebés, el percentil se utiliza para hacer una valoración del crecimiento del
recién nacido. Los más utilizados son para el peso y la talla del bebé.
- Significa que de cada 100 bebés, 75 pesan más que ellas (24 pesarían menos).
- Que de cada 100 bebés, solo hay 20 que midan más que ella (luego 79 medirían
menos).
Por ejemplo, supongamos que hemos administrado un test de ansiedad a una muestra de 200
personas. Determinar. A) Los percentiles que le corresponde a las puntuaciones 9 y 13; y B) las
puntuaciones correspondientes a los percentiles 6 y 48.
69
Son índices grupales que dicen cómo se distribuyen y dispersan los datos. Es decir, la distancia
que hay. Entre los distintos datos de la muestra.
70
EJEMPLO:
Las medidas de dispersión y variabilidad entran en juego aquí. Aunque la media sea distinta de
la A y la C la dispersión es igual.
Cuantificadores de la variabilidad.
71
Variabilidad 0 es cuando todos los dos son iguales.
Es la diferencia entre los dos extremos; la diferencia entre el valor máximo y el mínimo.
72
La amplitud semiintercuartil.
Es la semidistancia entre el cuartil 3 y el cuartil 1. Se suele calcular cuando solo quieren tener en
cuenta las puntuaciones centrales de distribución o cuando la media no es utilizable.
EJEMPLO:
Análisis de datos.
73
Σ = sumatorio
La varianza de expresa en unidades al cuadrado, y esto no solemos utilizarlo (dos cebollas sí; 2
cebollas al cuadrado???).
74
Ej: edad.
- 78-80 años.
- 1-3 años.
- ¿esta diferencia de dos años, implica lo mismo?
Hay una diferencia psicológica que los números no pueden detectar. Nosotros, como psicólogos
(en un futuro próximo) tenemos que interpretarlo.
Simbólicamente:
Es preferible utilizar el CV antes que la S cuando quieran compararse las dispersiones de dos o
más distribuciones de datos. Las unidades grandes provocan diferencias más grandes, lo cual
se refleja en la media.
Cuando las medias sean parecidas, será más simple e igualmente válida la comparación en
términos de S (calcular el CV no aportaría nada nuevo).
75
Cuando las medias son iguales, CV no añade nada (mismas conclusiones).
EJEMPLO:
Se realiza un experimento sobre tiempos de reacción ante dos estímulos A y B en una muestra
de sujetos. Los resultados han sido los siguientes:
76
Sesgo o asimetría.
Dos distribuciones con la misma media y con la misma dispersión pueden ser, en cuanto a su
forma, totalmente distintas. Estas medidas nos indican en qué lado de la distribución existe
mayor dispersión.
Apuntamiento o curtosis.
77
Dos distribuciones con medias y desviaciones típicas iguales no tienen por qué tener la misma
forma.
EJEMPLO:
78
2) La solución basada en distancias a la media (xi) no es una solución del todo satisfactoria.
1 sujeto= 1 variable.
Una puntuación directa como 25 no aporta más que una cantidad. Pero, 25 ¿es mucho? ¿Es
poco? La respuesta es: DEPENDE.
79
CASO 2: 1 sujeto = 2 variables (no comparables).
Juan pesa 75 kg, y mide 1,80 m. Su peso ¿es mayor o menor que su altura?
80
CONCLUSIONES:
EJEMPLO:
CONCLUSIONES:
Como puede observarse, las puntuaciones del grupo A son bastante más homogéneas (menos
dispersas, menos variables) que las del grupo B. esto hace que, mientras que la puntuación 117
en el grupo A represente a un valor extremo (pues es la puntuación máxima) esa misma
puntuación en el grupo B no es tan extrema; hay otra puntuación por encima de ella (122).
81
Tipificación o estandarización.
Gráficamente se produce un desplazamiento hacia el lado izquierdo del eje de abscisas cuando
convertimos las puntuaciones directas en diferenciales.
82
Demostración.
Demostración.
Demostración.
Las puntuaciones típicas permiten, por tanto, hacer comparaciones entre unidades de distintos
grupos, entre variables medidas de distintas formas o incluso entre variables diferentes.
83
Entre todas las distribuciones de probabilidad de las variables
aleatorias absolutamente continuas, esta es la más
importante. Estas distribuciones son conocidas como
distribuciones de
Laplace-Gauss, aunque fueron utilizadas por primera vez
por De Moivre.
84
CASO 1:
Las características de la distribución normal las presentan muchas distribuciones, todas con sus
medias y desviaciones típicas.
Por lo general. No suelen interesarnos las distancias estandarizadas en sí mismas, sino como un
producto intermedio entre puntuaciones directas y proporciones.
85
Ej. En una distribución normal con media 100 y desviación tipo 15, ¿Qué proporción de datos
tiene valores comprendidos entre 70 y 130?
Ej. En una distribución normal con media 100 y desviación tipo 15, ¿Qué puntuación delimita el
10% superior de los datos?
86