Apuntes y tareas.
Grado en Trabajo Social
Curso: 2018/19
Universidad de Oviedo
-1-
________________________________
Índice general
3. Contrastes de hipótesis 14
Bibliografía 42
-2-
1
________________________________
-3-
1.2. Distribución de frecuencias y distribución de probabilidad
Si lanzamos un dado 80 veces podemos obtener los resultados que aparecen en la tabla 1, y
que pueden expresarse en términos de frecuencia absoluta, porcentaje o frecuencia relativa (tanto por
uno). La variable “resultado del lanzamiento de un dado” procedente de ese experimento se dice que es
una Variable Estadística. Sin embargo la misma variable entendida como el comportamiento teórico
del dado (tabla 2) se dice que es una Variable Aleatoria.
Al conjunto de valores obtenidos en la variable estadística acompañados de sus frecuencias se
le denomina Distribución de Frecuencias (Tabla 1), mientras que el conjunto de valores que puede
tomar una variable aleatoria junto con sus respectivas probabilidades constituyen la denominada
Distribución de Probabilidad de dicha variable aleatoria (Tabla 2).
Frecuencia
Valor Frecuencia Porcentaje relativa Valor Probabilidad
1 28 35 0,35 1 1/6
3 16 20 0,20 2 1/6
4 24 30 0,30 3 1/6
6 12 15 0,15 4 1/6
Total…... 80 100 1,00 5 1/6
6 1/6
Total…... 1,00
Tabla 1 Tabla 2
En el caso de variables aleatorias discretas (variables que toman una cantidad numerable de
valores) es posible asociar una probabilidad finita a cada punto del recorrido aunque el número de
puntos que constituye éste, sea infinito, verificándose que la suma de las probabilidades es igual a la
unidad; se tiene así la Función de Probabilidad. Para variables aleatorias continuas (variables que
toman valores en un intervalo) puede resultar más difícil la comprensión de estas ideas, debido al hecho
de que ese tipo de variable no toma valores de probabilidad en un punto, sino en un intervalo. Por
tanto, aquí, la noción de función de probabilidad no da resultados útiles. En su lugar utilizaremos la
Función de Densidad que proporciona un medio para determinar la probabilidad de un intervalo. Esta
probabilidad viene dada por el área que hay bajo la función de densidad en ese intervalo, y
matemáticamente se obtiene integrando la función de densidad sobre ese intervalo.
También de un modo paralelo con la Estadística Descriptiva nos podemos referir a las medidas
características o de resumen del comportamiento de una variable aleatoria. Así, hablaremos de
Esperanza Matemática como valor promedio de los valores de una variable aleatoria, o de Varianza
y de Desviación Típica, como medidas de variabilidad de los valores de la variable en torno a su valor
promedio.
-4-
Figura 1. Representación gráfica de la distribución U(0;1)
A partir de aquí, es muy cómodo introducir de forma intuitiva otras variables; como la
Distribución Normal, que juega un papel central en el análisis estadístico, pues proporciona una
adecuada representación de las distribuciones de una gran cantidad de variables físicas. Esta variable,
cuya función de densidad tiene forma acampanada (campana de Gauss), se simboliza como N(µ,σ),
siendo µ la media (esperanza matemática) y σ la desviación típica. Si la media es cero y la desviación
típica es uno, estamos ante la N(0,1), que se denomina Distribución Normal Estándar (figura 2).
Cualquier variable N(µ,σ) se puede transformar en una variable N(0,1) mediante la operación
conocida como tipificación de variables. Por ello a la N(0,1) también se la denomina Distribución
Normal Tipificada. Esa transformación nos permite entonces calcular cualquier probabilidad para una
N(µ,σ) mediante la distribución N(0,1).
Existen tablas para calcular las probabilidades más comunes. Así, si queremos obtener la
probabilidad de un intervalo del tipo [-z;z], como por ejemplo del intervalo [-1,5;1,5], habría que
obtener el área que hay bajo la curva en ese intervalo haciendo la integral correspondiente. Sin
embargo, basta consultar en las tablas de la N(0,1) y el resultado es 0,865. Es decir, que en una
población de individuos en la que analizamos una variable cuyo comportamiento venga dado por esta
gráfica el 86,5% de los individuos se sitúan entre -1,5 y 1,5; o dicho de otra forma, hay un 86,5% de
posibilidades (de confianza) de que un individuo, elegido al azar, se encuentre entre -1,5 y 1,5. A esa
confianza la simbolizaremos con δ.
Los siguientes intervalos del tipo [-z;z] tienen especial interés para su uso en otros temas de
esta asignatura:
-5-
z=1,645 ---> δ=0,9 (90%)
z=1,96 ---> δ=0,95 (95%)
z=2,00 ---> δ=0,955 (95,5%)
z=2,17 ---> δ=0,97 (97%)
z=2,576 ---> δ=0,99 (99%)
Finalizamos este apartado recordando otras distribuciones que también pueden ser útiles, como
la Distribución “t” de Student, también acampanada (figura 3), o la Jí Cuadrado (figura 4), cuyas
representaciones gráficas dependen de un parámetro k llamado “grados de libertad”.
________________________________
-6-
c) ¿Qué % de los días se venden menos de 98 billetes?.
d) ¿Qué % de los días la venta se desvía de la media en menos de 78 billetes?.
e) ¿Entre que valores oscila la venta en el 77% de los días situados en torno a la venta
media?.
Soluciones T 1.1:
a) El 87% (z=1,514)
b) El 7,25% (z=1,457)
c) El 7,25% (z=-1,457)
d) El 73,5% (z=1,114)
e) Entre 116 y 284 billetes (z=1,2)
Soluciones T 1.2:
a) El 8% (z=-1,405).
b) El 76% (z=1,175).
c) 7.320 entre 811 y 2.189 € (el 91,5%) (z=1,722). 340 menos de 811 € (el 4,25%).
d) 2.284 € (z=1,96).
T 1.3: El número de comidas diarias que se dan en un albergue de transeúntes sigue una
distribución N(70;10).
Soluciones T 1.3:
-7-
Soluciones T 1.4:
a) El 77%
b) El 19,5%
c) El 33%
d) El 68,5%
e) Entre 555 y 1245 €
T 1.5 El número de cigarrillos/día que fuman los fumadores habituales de una región sigue
una distribución N(28;4).
Soluciones T 1.5:
a) El 2,25%
b) El 86,5%
c) 43.250 entre 22 y 34 cigarrillos. 3.375 más de 34 cigarrillos.
d) 31,37 cigarrillos.
T 1.6 El tiempo que tardan las personas en resolver sus trámites en las ventanillas de un
servicio administrativo se comporta según una N(300;60) (expresado en segundos).
a) ¿Qué % de las personas son atendidas entre los 193 y los 407 segundos?.
b) ¿Cuál es el máximo tiempo que se necesita en el 10% de los casos más rápidos?.
c) ¿Qué confianza hay de que una persona emplee 145,4 y 454,6 segundos?.
d) Si en un mes pasaron por ese servicio 4000 personas ¿cuántas probablemente
habrán tardado más de 340 segundos en hacer sus trámites?. ¿Y más de 300
segundos?.
Soluciones T 1.6:
a) El 92,5%.
b) 223 segundos.
c) El 99%.
d) 1010 más de 340 segundos. La mitad de ellas, es decir 2000, más de 300 segundos.
T 1.7 La duración de las estancias de los pacientes en los hospitales públicos puede
suponerse que es de tipo N(7;2) (expresado en días).
Soluciones T 1.7:
a) El 97,75%.
b) 9,07 días como mínimo.
c) k=6 días.
-8-
2
________________________________
La toma de una muestra viene motivada, por tanto, por el interés que se tiene en conocer el
valor de algún Parámetro (dato desconocido de la población objetivo). Y así, con las observaciones
muestrales realizadas, obtendremos un Estimador (medida cuantitativa derivada de los datos de una
muestra, cuyo objetivo es inferir, estimar, el valor de un parámetro) que nos permita acercarnos al
verdadero valor del parámetro investigado. Por ejemplo, desconocemos cuál es la edad media
(parámetro) en la que los jóvenes de una ciudad comienzan a consumir un tipo de droga, pero a través
de una muestra obtenemos una edad media de 14 años (estimador) que nos permite pronosticar la
edad media de toda la población.
Es evidente que, desde el momento en que solo se entrevista a una parte de la población, las
conclusiones que se obtengan no serán exactas, llevarán aparejado un margen de error (la edad media
de 14 años pronosticada anteriormente no será exacta); y la magnitud de este error va a estar
determinada por tal cantidad de factores que podrían conducirnos a una calidad muy pobre de los datos
recogidos y, por tanto, de las conclusiones que se obtengan.
Esos factores pueden provenir del propio modelo teórico (metodología) de recogida de la
información que se haya aplicado o de otros aspectos externos, a veces imprevisibles, como puede ser
el hecho de que los encuestados se nieguen a responder. Los errores que se derivan del primer caso se
llaman Errores en el muestreo; los del segundo, Errores ajenos al muestreo.
-9-
2.2. Determinación de los errores en el muestreo
En general, la obtención concreta del error depende, como se acaba de sugerir, de dos factores:
la variabilidad de la muestra y el nivel de confianza deseado. La primera viene expresada por el Error
Estándar, también llamado Error Típico (ET); y el segundo permite obtener, a partir de la
distribución probabilística asociada al modelo, el número de errores estándares que podremos alejarnos
del pronóstico efectuado. De esta forma se obtiene la expresión
ε = z ∙ ET
Las fórmulas para los dos casos más habituales, el de estimación de una media y el de una
proporción, siempre que el tamaño muestral sea mayor de 30 (véanse otros requisitos y
recomendaciones en la bibliografía), son las siguientes:
N n
z z
n n N
p (1 p ) p (1 p ) N n
z z
n n N 1
En estas fórmulas, es la desviación típica de la población, p la proporción que se está
estimando, n el tamaño de la muestra, N el tamaño de la población, y z el valor obtenido en la
distribución N(0,1) para el nivel de confianza δ deseado.
A partir de las fórmulas del apartado anterior se pueden obtener las que nos permiten
determinar el número de entrevistas necesarias en una encuesta para obtener resultados con una
confianza determinada y con el error máximo que se esté dispuesto a admitir de antemano.
- 10 -
Tamaño de la muestra para la estimación de una media
2
z z2 2
N
n n 2
N z2 2
z 2 p (1 p) z 2 p (1 p ) N
n n
2
( N 1) 2 z 2 p (1 p )
Las fórmulas anteriores presentan algunos inconvenientes para poder ser aplicadas. Así,
presuponer cuál será el valor de la desviación típica ( ) o el de la proporción (p), precisamente antes
de haber recogido la muestra, puede ser una tarea de cierta dificultad. En el primero de los casos se
suele acudir a la realización de una encuesta piloto (pre-test) para evaluar el parámetro; en el segundo
se le asigna el valor 0,5 por ser el que maximiza el valor de n.
________________________________
Soluciones T 2.1:
- 11 -
T 2.2 Se va a realizar una encuesta entre las personas de 15 a 17 años en una ciudad con el
fin de estimar el número medio de horas semanales que esos jóvenes dedican a ver la TV, y
el porcentaje de jóvenes que leen la prensa diaria de forma habitual. En todas las
estimaciones se desea tener un 97% de confianza.
Soluciones T 2.2:
T 2.3 Una vez consultadas una de cada tres de las 270 residencias para personas mayores
de una región, se obtuvo que el 80% de los establecimientos disponen de página web.
a) ¿Qué margen de error tiene este resultado, al 95,5% de confianza?. Ese error, ¿es
grande?. Obtener el intervalo correspondiente e interpretar su significado.
b) Al 95,5% de confianza, ¿cuál es el error máximo de esa encuesta en los pronósticos
para porcentajes?. ¿Es grande?.
Soluciones T 2.3:
T 2.4 Se pretende hacer un estudio, a través de una encuesta, de diversos aspectos de las
120 asociaciones culturales que hay en una ciudad. En los resultados porcentuales que se
obtengan se admitirá hasta un 5% de error; en los que se expresen en forma de medias
se admite un error de 8 unidades, y se sabe que la máxima desviación típica de las
variables es de 70 unidades.
¿En cuántas asociaciones habrá que tomar datos, si se desea tener una confianza del
95,5%?.
Solución T 2.4:
T 2.5 Al salir de las consultas médicas de un Centro de Salud 196 personas elegidos al azar
manifestaron que tienen que realizar un gasto medio de 6 € por persona en las medicinas
recetadas, con un error típico igual a 0,12 €. También resultó que el tiempo de espera
medio para ser atendidos por su doctor/a fue de 20 minutos, con una desviación típica
igual a 17,5 minutos.
a) ¿En cuál de las dos medias estimadas se obtiene menos error, al 95,5% de
confianza?.
b) ¿Son ambos promedios unas buenas estimaciones?.
- 12 -
c) Dar un intervalo para cada media e interpretar el resultado.
Soluciones T 2.5:
a) Al afirmar que el gasto medio por persona es de 27 €/mes, ¿qué error se comete
como máximo al 95% de confianza?. Analícese la fiabilidad del pronóstico.
b) 49 jóvenes, de los 121 sondeados, afirman ir al cine casi todas las semanas. Al 90%
de confianza, ¿entre qué límites situaremos el porcentaje de jóvenes que van al cine
casi todas las semanas?. Analizar la precisión de esta estimación.
Soluciones T 2.6:
a) Error máximo de 1,41 €. Error relativo igual a 5,22% y confianza 95% (alta) ---> Bastante fiable.
b) El porcentaje es 40,5% (p=0,405) y el error es 7,24%. Intervalo: (33,26%;47,74%).
Como el error relativo es 7,24% y la confianza 90% (no muy alta) ---> Poco precisa.
- 13 -
3
________________________________
Contraste de hipótesis
Otro interés del investigador puede estar centrado en la formulación de dos hipótesis sobre el
verdadero valor del parámetro que está estimando, con el fin de decidir con qué hipótesis quedarse. La
solución será optar por la más razonable, en términos probabilísticos, teniendo en cuenta la información
de que disponemos en la muestra.
Así, por ejemplo, partiendo de la hipótesis teórica (llamada también Hipótesis Principal o
Hipótesis Nula, Ho ) de que el peso medio de una población es 65 kg., y habiendo obtenido en una
muestra de 90 individuos un peso medio de 70 kg. ¿es razonable suponer que el peso medio
poblacional es distinto de 65 kg. (Hipótesis Alternativa, H1) como se creía, rechazando así la
hipótesis teórica?. Es decir, ¿la información muestral nos permite decidir si las desviaciones observadas
con respecto a la hipótesis teórica son demasiado «significativas» como para poder atribuirlas al azar?.
¿Qué riesgo tenemos de equivocarnos si admitimos como buena la hipótesis alternativa?.
- 14 -
Alternativamente, H1 puede formularse como “La media poblacional es menor que k” ( µ < k ) o
como “La media poblacional es mayor que k” ( µ > k ).
Ejemplo a.1
Ejemplo a.2
Año 2003: las personas fumadoras de una ciudad consumen 20 cigarrillos/día por persona.
Año 2012: en una muestra de 250 personas fumadoras resulta un consumo de 15 cigarrillos/día.
Ejemplo
Año 2004: el % de jóvenes (14-18 años) que consumieron cannabis en el último mes es el 24 %.
Año 2012: en una muestra de 1.400 jóvenes, el 20% consumieron cannabis en el último mes.
Ejemplo
Varones: en una muestra elegida al azar en una población el consumo medio anual de alcohol es 13 l.
Mujeres: en idénticas condiciones muestrales el consumo medio anual de alcohol es 12 l.
Ho: Las medias generales son iguales en ambos sexos en esa población ( µ1 = µ2 )
H1: Las medias generales son diferentes en ambos sexos ( µ1 ≠ µ2 )
- 15 -
Ejemplo
Barrio 1: en una muestra elegida entre las familias, la oscilación de los ingresos familiares mensuales es
de 280 € ( σ1 = 280 € ; σ12 = 78400 €2 ).
Barrio 2: en idénticas condiciones muestrales, la oscilación de los ingresos familiares mensuales es de
300 € ( σ2 = 300 € ; σ22 = 90000 €2 ).
Ejemplo
En una muestra de 1.300 personas de una población se anota el barrio donde viven y si usan medios
anticonceptivos en sus relaciones sexuales.
Ejemplo
En una muestra elegida entre 350 personas fumadoras de una población se observan el volumen diario
de cigarrillos consumidos y la edad.
________________________________
Las aplicaciones y casos prácticos sobre este tema se verán a través del ordenador, dentro del
tema 5.
- 16 -
4
________________________________
En este tema se aborda la planificación de una encuesta desde el punto de vista estadístico,
incidiendo especialmente en los problemas técnicos más comunes que pueden aparecer en las
encuestas del ámbito del Trabajo Social.
Para una mejor comprensión del tema nos basaremos en el siguiente esquema (Figura 5), en el
que se detallan todos los apartados inherentes al planteamiento de una encuesta por muestreo:
- 17 -
4.1. Trabajos preliminares
Al iniciar el diseño de una encuesta hay que realizar una serie de tareas que van a determinar,
en gran medida, muchos de los aspectos estadísticos posteriores. En este sentido es imprescindible
definir claramente el ámbito y la población del estudio y elaborar la lista de objetivos de nuestro
trabajo; de ellos surgirá el modelo de cuestionario adecuado, que, junto con el presupuesto disponible,
determinarán todo el diseño de la muestra, buena parte del trabajo de campo y la tabulación
estadística.
4.1.1. Definiciones
El trabajo en una encuesta comienza por definir los conceptos de ámbito y población objetivo,
que ya han sido estudiados en el tema 2, y por elaborar una lista con los objetivos del estudio. Esta lista
puede comenzar presentando unos objetivos generales, y dentro de cada uno de estos, posteriormente,
concretar una serie de objetivos específicos.
Por ejemplo, una encuesta dirigida a las personas jóvenes de una ciudad podría tener los cuatro
siguientes objetivos generales, y, dentro de cada uno, los objetivos específicos que se citan:
- Disponibilidad de vivienda
o Detectar con quién viven los jóvenes
o Conocer el régimen de tenencia de la vivienda
o Estimar el gasto mensual en alquiler o pago de la vivienda
- Hábitos de ocio
o Estimar las horas libres disponibles para ocio
o Detectar cuáles son las actividades de tiempo libre más practicadas
Una premisa importante a la hora de plantearse la lista de objetivos es la de que ser comedido
con el número de ellos que propongamos. Tengamos en cuenta que a partir de los objetivos vamos a
elaborar las preguntas del cuestionario, y no interesa que este sea tan amplio que resulte inoperativo.
No hay que olvidar que un cuestionario muy amplio lleva aparejados una serie de inconvenientes
importantes como pueden ser la duración de la recogida de los datos, el aumento de los costes, la falta
de respuesta por cansancio del respondiente, y las pérdidas de calidad de los datos y de fiabilidad
estadística.
4.1.2. Cuestionario
La elaboración del cuestionario en el ámbito del Trabajo Social es una tarea compleja que, en
muchos casos, es realizada por varios profesionales de distintas áreas relacionadas con las temáticas del
estudio, como pueden ser sociólogos, psicólogos, trabajadores sociales, etc., y también por otros afines
a la computación o la estadística, estos con el fin de que la información del cuestionario sea leída
correctamente por los programas informáticos y se puedan realizar los análisis estadísticos adecuados.
- 18 -
Durante el proceso de preparación de un cuestionario se van introduciendo numerosos cambios,
dando lugar a una sucesión de cuestionarios previos. Cuando se supone que el cuestionario es el
adecuado se lleva a cabo una encuesta piloto (pre-test), con un pequeño número de personas de la
población objetivo, con el fin de detectar anomalías en dicho cuestionario y, tras las correcciones
oportunas, elaborar el cuestionario definitivo (figura 6).
Cuestionarios previos
Sin embargo esa encuesta piloto no sirve únicamente para ese fin, sino que tiene otras
aplicaciones muy importantes, algunas de tipo estadístico:
El cuestionario definitivo debe presentar una codificación adecuada de sus ítems, para que los
datos puedan ser tabulados correctamente. Realizar dicha codificación no suele ser, en general, tarea
complicada. En las preguntas ordinarias, como la siguiente, es bastante obvio numerar las distintas
opciones desde el 1 en adelante:
1 Temporal
2 Fijo
3 Por cuenta propia
4 Negocio familiar
Sin embargo, en algunos casos la codificación adecuada no es tan evidente. ¿Cuál sería la
codificación más correcta, que sustituiría a los interrogantes, en la siguiente pregunta?:
P 8.- ¿Qué actividades deportivas practica usted principalmente? (Señalar un máximo de dos)
En los anexos II y III figuran dos cuestionarios reales que presentan problemas de codificación
e inconvenientes de tipo estadístico. Serán comentados en el aula.
- 19 -
4.1.3. Costes estimados
Una vez realizada la encuesta piloto, que nos habrá ayudado a estimar la duración del trabajo
de campo y a planificar el muestreo, estaremos en condiciones de hacer una estimación razonable de
los costes de la encuesta, pues precisamente el trabajo de campo suele ser el capítulo de gastos más
elevados.
Habrá que tener en cuenta todas las necesidades materiales, como pueden ser los equipos
informáticos o el fotocopiado de cuestionarios, las necesidades de personal (encuestadores,
supervisores, etc.) y los costes que genera la recogida de los datos debido a los gastos y dietas de
desplazamiento.
Sin embargo, muchas veces, no se dispone del marco ni es posible su elaboración. En esos
casos, con mayor razón, hay que tratar de recopilar cualquier tipo de información complementaria sobre
la población objetivo que pueda ser beneficiosa para el diseño muestral. El conocimiento de datos como
el tamaño de la población o características como la distribución por sexo y edad pueden resultar
fundamentales para la calidad del muestreo y la fiabilidad de los resultados.
Una vez obtenida toda la información posible de la población objetivo y, en su caso, elaborado
el marco, se procede a realizar los cálculos del tamaño de la muestra. Para ello es necesario caracterizar
qué estimadores se van a utilizar (medias, proporciones, etc.), qué errores máximos estamos dispuestos
a admitir a priori y con qué nivel de confianza deseamos trabajar. Los cálculos relativos a este punto ya
han sido estudiados en el tema 2.
Dependiendo del tipo de población que estemos investigando y de los métodos de muestreo
que se estudian en el apartado siguiente, el tamaño muestral obtenido habrá que repartirlo en función
de diversas características poblacionales (por sexo, edad, barrio, etc.) con el fin de que la muestra
resulte lo más representativa posible de la población objetivo.
Por ejemplo, para realizar una encuesta en Gijón a la población de 15 a 29 años que vive en la
zona urbana es necesario disponer de la distribución de esas personas según las características de
edad, sexo y barrio (Tabla 3), para que una vez obtenido el tamaño muestral, en este caso 1.204
individuos, podamos hacer el reparto de éstos en función de dichas características (Tabla 4). Entonces
estaremos en condiciones de calcular los errores máximos en las estimaciones para cada tramo de
edad, para cada sexo y para cada barrio (Tabla 5).
- 20 -
DISTRIBUCIÓN DE LA POBLACIÓN POR BARRIOS SEGÚN EDAD Y SEXO
Total 9.224 8.772 10.396 10.208 8.873 8.775 28.493 27.755 56.248
Total 199 188 222 218 191 186 612 592 1.204
Tabla 4. Distribución una muestra de 1.204 personas de 15 a 29 años, según sexo y barrio
BARRIO Error máximo (%) EDAD Error máximo (%) SEXO Error máximo (%)
El Llano 7,4
- 21 -
4.2.3. Método de selección de la muestra
En el primer caso no todos los individuos tienen la misma probabilidad de ser elegidos,
quedando muchas veces a juicio del propio encuestador la decisión de a qué persona se va a encuestar;
por ello estos métodos también suelen llamarse “De juicio”.
En el caso de los métodos aleatorios todos los individuos de la población objetivo tienen la
misma probabilidad de ser escogidos; por esa razón también se llaman métodos probabilísticos.
Obviamente, en estos métodos no interviene el criterio del encuestador sobre el individuo a elegir.
OPINÁTICO
MÉTODOS
SIMPLE
DE MUESTREO
SISTEMÁTICO
ALEATORIOS RUTAS
(PROBABILÍSTICOS)
ESTRATIFICADO
CONGLOMERADOS
Las dificultades de diseño o los costes de los métodos probabilísticos obligan a veces al empleo
de métodos no aleatorios, aún a sabiendas de que presentan grandes inconvenientes para realizar
generalizaciones ya que la muestra extraída puede no ser representativa. En cualquier caso la premisa
general a la hora de seleccionar a los individuos debería ser la obtención de una muestra representativa,
utilizando para ello todos los criterios posibles, ya sean objetivos o subjetivos.
Un ejemplo es el del investigador que decide entrevistar solo a aquellos profesores de una
universidad que tienen el más alto nivel pedagógico, con el fin de determinar cuáles son las cualidades
que debe reunir un buen alumno.
4.2.3.1.2. Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a
otros, y así hasta conseguir una muestra suficiente. Este tipo de muestreo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones marginales, sectas, ciertos tipos de
enfermos, etc.
4.2.3.1.3. Muestreo por cuotas: En este método se establecen unas "cuotas", unos cupos, que
consisten en un número de individuos que reúnen unas determinadas condiciones, como por ejemplo
pedir al encuestador que obtenga una muestra de 20 individuos de 30 a 40 años, 12 mujeres (6
- 22 -
casadas y 6 solteras) y 8 hombres (4 casados y 4 solteros). Cumpliendo esas premisas, el entrevistador
decide a quién interroga.
Dichas cuotas las establece el equipo investigador en base al conocimiento previo que se tenga
de la población, con el fin de tratar de aproximarse lo más posible a la obtención de una muestra
representativa de la población.
Este tipo de muestreo se utiliza mucho en los estudios de mercado y sondeos de opinión. Aún
no tratándose de un método probabilístico, puede dar buenos resultados si se aplica con el rigor
suficiente.
Sin embargo no siempre son aplicables. Es relativamente frecuente encontrarse con situaciones
que hacen imposible su aplicación, como pueden ser los costes, la duración del trabajo de campo, la
complejidad del diseño o, muy a menudo, la falta de información sobre la población objetivo.
4.2.3.2.1. Muestreo aleatorio simple: El procedimiento tiene dos pasos: 1) se asigna un número a
cada individuo de la población y 2) se sortean tantos casos como sea necesario para completar el
tamaño de muestra requerido. Ese sorteo suele efectuarse a partir de tablas de números aleatorios o
generando por ordenador dichos números.
Este método, en principio muy simple, puede no ser útil si la población que estamos manejando
es muy grande. Además para aplicarlo es imprescindible disponer del marco (lista de unidades de la
población objetivo), lo que es imposible en muchos casos.
Un ejemplo de este método aparece cuando queremos obtener una muestra aleatoria de
comercios de un determinado tipo dentro de una ciudad, por ejemplo de agencias de viaje. A partir de
un listado de las agencias existentes se sortearía el número necesario de ellas para obtener la muestra.
4.2.3.2.2. Muestreo aleatorio sistemático: Para aplicar este método se parte de un número
aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que
ocupan los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el
resultado de dividir el tamaño de la población entre el tamaño de la muestra: k=N/n. A k se le llama
coeficiente de elevación, y su valor nos indica a cuántos elementos de la población representa cada
elemento de la muestra. Al elemento de lugar i elegido en primer lugar se le llama punto de arranque.
También es típica la selección sistemática de individuos por un lugar de paso, como ocurre con
las encuestas a los clientes a la entrada de un supermercado o a los turistas que van a coger el avión,
donde el encuestador elige a una de cada k personas o cada k minutos. Sin embargo en estos casos, al
no existir el marco ni estar fijado el valor de N, no está garantizada la equiprobabilidad para todos los
individuos; el método no es plenamente aleatorio.
El riesgo de este tipo de muestreo está en los casos en que se dan periodicidades en la
población, ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos
- 23 -
distorsionar la muestra hasta el punto de que no sea representativa en absoluto. Imaginemos que
estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones
y los 5 últimos mujeres; si empleamos un muestreo aleatorio sistemático con k=10 siempre
seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.
4.2.3.2.3. Muestreo por rutas aleatorias: Este procedimiento se caracteriza por la selección de
viviendas según una ruta aleatoria establecida por cada encuestador. Partiendo de un lugar elegido al
azar en una ciudad, el encuestador realiza sorteos de calle, portal, vivienda e individuo al que
entrevistar. Siempre que encuentre un cruce de calles vuelve a sortear por cuál debe continuar y, de
esa forma, va completando una ruta al azar.
El método podría parecer muy bueno en cuanto al grado de aleatoriedad. De hecho lo incluimos
dentro del grupo de los métodos aleatorios. Sin embargo el método es únicamente cuasi-probabilístico
pues normalmente no todas las viviendas tienen la misma probabilidad de formar parte de la muestra.
Este procedimiento es bastante utilizado con muy buenos resultados en encuestas generales
sobre ciudades de un tamaño medio o grande. Por la propia dinámica de selección de la muestra no
resulta eficaz en núcleos de población pequeños.
4.2.3.2.4. Muestreo aleatorio estratificado: Para aplicar este método hay que establecer una
partición de la población objetivo considerando categorías típicas diferentes entre sí (estratos) respecto
a alguna variable. Se puede dividir (estratificar) la población, por ejemplo, según el sexo, la edad, la
profesión, el estado civil, etc. Lo que se pretende con este tipo de muestreo es asegurarse de que todos
los estratos de interés estarán representados adecuadamente en la muestra.
Una vez establecidos los estratos de interés se reparte la muestra entre dichos estratos. El
último paso consiste en seleccionar dentro de cada estrato las unidades que formarán parte de la
muestra, para lo cual es preciso acudir a otro de los métodos aleatorios estudiados.
Tal sería, para una muestra de 400 personas en la que se desea estratificar por sexo, repartir
las entrevistas en 200 hombres y 200 mujeres, sin tener en cuenta los volúmenes totales de hombres y
de mujeres que haya en la población.
Así, si en el ejemplo anterior se sabe que en la población hay 10.000 personas de las que 4.000
(el 40%) son hombres y 6.000 (el 60%) son mujeres, lo razonable es aplicar estas proporciones al
tamaño de la muestra. Con ese criterio entrevistaríamos a 0,4x400=160 hombres y 0,6x400=240
mujeres.
Existen otros criterios de afijación, como la Afijación Óptima, que no son muy utilizados por
las dificultades técnicas que presentan.
- 24 -
4.2.3.2.5. Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están
pensados para seleccionar directamente los elementos de la población, es decir, que las unidades
muestrales son elementos de la población. En el muestreo por conglomerados la unidad muestral es un
grupo de elementos de la población, al que llamamos conglomerado. El método consiste en seleccionar
aleatoriamente un cierto número de conglomerados (el necesario para alcanzar el tamaño de muestra
establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos;
es decir, todos los elementos de los conglomerados seleccionados forman parte de la muestra.
Por ejemplo, supongamos que se desea elegir una muestra de 300 estudiantes de 1º de
bachillerato en una ciudad en la que hay una población de 3000 estudiantes de ese nivel, repartidos en
120 aulas en varios centros a razón de 25 alumnos por aula. Considerando cada aula como un
conglomerado de individuos, se seleccionan al azar 12 aulas de entre las 120, y se entrevista a todo el
alumnado de las aulas elegidas. De esa forma resultarían entrevistadas 12x25 = 300 personas.
Del ejemplo anterior pueden deducirse fácilmente las ventajas de este método frente al
aleatorio simple o el sistemático, ya que para poder aplicar estos se necesitaría una relación nominal de
los 3000 estudiantes, y además, una vez realizado el sorteo de las personas a encuestar, resultaría
mucho más complejo y costoso llevar a cabo las entrevistas al tener que contactar con estudiantes que
no están físicamente a la vez en el mismo aula. Sin embargo el propio sistema de aplicación del
muestreo por conglomerados hace que solo se utilice en casos muy concretos, al ser preciso que la
población pueda estructurarse en conglomerados que sean muy similares entre sí.
Son muy variadas las circunstancias o imprevistos que ocurren durante el proceso de la
encuesta y que pueden dar lugar a desviaciones en los resultados. A tales situaciones se les denomina
Errores ajenos al muestreo.
Posiblemente los 4 errores más típicos sean los siguientes:
Error de cobertura.
Error de respuesta.
Falta de respuesta.
Errores en el procesamiento informático de los datos.
Cuando en el cuestionario se observa una respuesta equivocada nos encontramos con el error
de respuesta.
La falta de respuesta aparece cuando un individuo deja sin responder una o más preguntas
del cuestionario.
Por último, es habitual encontrarse con errores derivados de la transcripción de los cuestionarios
al programa informático con el que se vayan a tabular los datos, o errores de codificación o de cálculo;
es decir, errores en el procesamiento informático.
En ocasiones, algunos de los errores ajenos al muestreo pueden preverse; en ese caso, suelen
establecerse unas normas o criterios a seguir ante su aparición. Tal es el caso de un entrevistador que
tiene que entrevistar en un determinado domicilio y no encuentra a nadie en la vivienda; debe de estar
previsto qué tiene que hacer ante esa situación.
- 25 -
4.3. Trabajos de campo
El éxito de una encuesta se basa muchísimo de la calidad de la información obtenida. Por ello
es imprescindible contar con un buen equipo de encuestadores y supervisores; es decir, es fundamental
hacer una buena selección y preparación del personal.
Otro aspecto no menos importante del trabajo de campo son los materiales e instrucciones para
la recogida de los datos, como pueden ser una hoja de ruta, tablas, plantillas, mapas, o un manual que
resuelva al entrevistador las dudas que le puedan surgir.
4.4. Tabulación
Desde el momento en que se van recogiendo los cuestionarios comienza la fase de tabulación.
En un primer paso aparece la ardua tarea de depurar cada cuestionario mediante su revisión y
corrección de errores, que de una forma muy básica se explica en la parte práctica de esta asignatura.
Por evaluación de resultados suele entenderse muchas veces al hecho de analizar los datos
recogidos y obtener las conclusiones pertinentes. Sin embargo, ese término comporta varios aspectos
más, como la autocrítica al trabajo realizado, observando los errores y revisando el presupuesto inicial,
o como la comparación con otros diseños o trabajos similares.
En un primer paso podemos analizar las discrepancias que haya entre el diseño teórico
propuesto inicialmente y su ejecución, revisando especialmente los errores ajenos al muestreo, con el
fin de buscar mejoras de cara a futuras encuestas. Es imprescindible también recalcular los errores en el
muestreo, obteniendo así los errores a posteriori.
Si es posible también es interesante comparar nuestro modelo de trabajo con los diseños de
otros estudios similares. Seguro que redundará en una mejora en las planificaciones futuras. Este
mismo beneficio lo obtendremos realizando una comparativa entre el presupuesto establecido
inicialmente y los costes finales de las partidas de dinero asignadas a cada parcela del trabajo.
Respecto al análisis de los datos podemos establecer varios niveles de profundidad, según el
grado de complejidad del trabajo y los intereses del investigador:
- 26 -
- Estadística descriptiva bivariante. Se obtienen cruces entre dos variables cualesquiera.
Es el caso de la obtención de resultados según el sexo, la edad, etc.
En el ámbito del Trabajo Social actualmente muy pocas encuestas se quedan en el primer nivel;
lo habitual es describir la población objetivo con cada una de las variables, y después ofrecer resultados
por sexo, edad, barrio, nivel de estudios, etc., es decir, abarcar los dos primeros niveles de análisis. Los
contrastes de hipótesis también aparecen en las encuestas con cierta frecuencia, ligados
fundamentalmente a la relación entre dos variables. Y casi únicamente en proyectos de investigación,
presentaciones en congresos o estudios muy específicos suelen aplicarse los métodos de estadística
multivariante.
En los últimos años están alcanzando una notoriedad extraordinaria el análisis masivo de datos
(Big Data) procedentes de internet y las encuestas on line, con el fin de diseñar estrategias comerciales.
De ambos métodos se harán reflexiones en el aula, observando las fortalezas y debilidades que
muestran.
En este epígrafe se pretende que el alumnado conozca cuáles son los apartados que suele
incluir un informe estadístico, y el contenido de los mismos. Para su desarrollo se parte del siguiente
esquema:
# INTRODUCCIÓN
# OBJETIVOS
# METODOLOGÍA
- 27 -
Instrumentos para recoger la información: observación directa, entrevista no
estructurada, cuestionario ....
Definición de las variables.
Técnicas de análisis para tratar los datos.
Cronograma.
Presupuesto.
Ficha técnica del trabajo.
# RESULTADOS
# BIBLIOGRAFÍA
# ANEXOS
Concretamente, los puntos que debe contemplar una ficha técnica son los siguientes:
- Ámbito:
- Población objetivo (Universo):
- Tamaño poblacional:
- Tamaño muestral:
- Método de muestreo (Selección de las personas entrevistadas):
- Fiabilidad:
- Instrumento de recogida de la información:
- Período de recogida de datos (Fecha de trabajo de campo):
- Encarga el trabajo:
- Patrocinadores:
- Dirección técnica:
- 28 -
4.8.1. Encuesta sobre actividades de tiempo libre
ÁMBITO:
Municipio de Gijón.
POBLACIÓN OBJETIVO:
Residentes en el Municipio, con edades entre 15 y 70 años, ambas inclusive.
TAMAÑO DE LA POBLACIÓN:
256.433 personas.
TAMAÑO DE LA MUESTRA:
400 personas.
MÉTODO DE MUESTREO:
Aleatorio estratificado, con afijación proporcional según el sexo, la edad y el distrito
en el que viven los entrevistados. Se siguió el método de rut as aleatorias, usando tablas con
el fin de elegir la planta, puerta y persona a entrevistar mediante cuestionario estructurado.
FIABILIDAD:
Se tiene un 95% de confianza de que los errores en las estimaciones de porcentajes
para la población objetivo no superarán el 5%.
PATROCINADOR:
Ayuntamiento de Gijón.
Figura 8. Ficha técnica de la encuesta ”Actividades de tiempo libre de los habitantes de Gijón”
- 29 -
4.8.2. Encuesta sobre gustos y temores en niños de 5 y 6 años.
ÁMBITO:
España peninsular.
UNIVERSO:
Niños de 5 o 6 años.
TAMAÑO DE LA MUESTRA:
400 entrevistas segmentadas de la siguiente manera:
- 50% niños y 50% niñas.
- 50% sujetos de 5 años y 50% de 6 años.
- 65% pertenecientes a colegios públicos.
- 35% pertenecientes a colegios privados.
- 70% hábitat urbano.
- 30% hábitat rural.
TIPO DE ENTREVISTA:
Personal, en los centros escolares, mediante cuestionario por cuotas de área
geográfica.
FIABILIDAD:
Estas entrevistas proporcionan un error para los datos de 4,85%, con un nivel de
confianza del 95% y el supuesto más desfavorable de la población (p=q=50).
- 30 -
4.8.3. Encuesta sobre ciberacoso en 2º de la E.S.O.
FIABILIDAD: Al 95% de confianza los errores en las estimaciones de porcentajes para la población
objetivo en general y para las subpoblaciones analizadas son inferiores a las siguientes cantidades:
- 31 -
4.8.4. Análisis de la oferta de alojamientos colectivos asturianos
Albergue 58 37 9,78%
Apartamento Turístico 77 57 6,66%
Casa de Aldea 321 284 1,98%
Casona Asturiana 24 24 0,00%
Camping 60 53 4,64%
Hoteles 3, 4 y 5 estrellas 69 67 2,05%
Hoteles 1 y 2 estrellas 234 196 2,83%
Hostales y Pensiones. 314 131 6,55%
Total 1.157 849 1,74%
(*): Con una confianza del 95% es el error máximo que se puede cometer en las
estimaciones de porcentajes.
Figura 11. Ficha técnica de la encuesta ”Oferta de alojamientos turísticos colectivos de Asturias”
- 32 -
4.8.5. Encuesta sobre intención de voto en Asturias
- 33 -
________________________________
El siguiente grupo de ejercicios integran todos los conceptos estudiados en los temas 2 y 4. Al
inicio de cada pregunta la forma del paréntesis nos indica a qué tema pertenece la pregunta en
cuestión. Así b) indica que corresponde al tema 2, y b( que pertenece al tema 4.
1) Ante la polémica surgida en una población por la posible instalación de una central térmica, el
Ayuntamiento decide realizar un sondeo entre las personas adultas preguntando a 400 y a 300
habitantes de las zonas urbana y rural, respectivamente. El resultado ha sido que 182 personas de la
1ª zona y 147 de la 2ª se mostraron en total disconformidad con el proyecto.
a) Dar sendos intervalos, al 95,5% de confianza, para el porcentaje de disconformes en cada zona. ¿En
qué zona se comete menos error en el pronóstico del porcentaje?.
b) El alcalde, ¿podrá sostener que los disconformes con la instalación no son la mayoría de la población
adulta, si se apoya para ello en un intervalo al 99% de confianza?.
2) En una zona de una ciudad, en la que el problema del paro entre los jóvenes cobra especial
intensidad, diversos Organismos de la Administración llevan a cabo una encuesta que permita
planificar actuaciones concretas. Se entrevista a 500 jóvenes, de los 1.100 que hay en esa zona, y
se obtienen los siguientes datos:
3) Desde la Consejería de Trabajo se encargó una encuesta a Teleopinión S.A. en la que interesaba
analizar la situación y expectativas de la población masculina en edad laboral (18 a 64 años) del
barrio de La Carriona en el Municipio de Avilés. La recogida de los datos se efectuó en el mes de
Marzo del presente año, entrevistando a 474 personas, y los resultados se presentaron siempre en
forma de porcentajes.
a) Determinar el error máximo de los resultados, al 95% de confianza. ¿Puede decirse que la encuesta
tiene mucha fiabilidad?.
b( ¿De qué forma llevarías a cabo la selección de los entrevistados?.
c( Con los datos disponibles hasta este apartado, haz una ficha técnica de esta encuesta.
d) De las entrevistas realizadas, 200 corresponden a personas de 18 a 35 años, y 274 al rango de 36 a
64 años. El 30% del primer grupo y el 24,82% del segundo son personas que están en paro.
¿Qué % de la población se encuentra en situación de paro?. Estimar puntualmente y por
intervalo al 99% de confianza, analizando la fiabilidad del pronóstico.
- 34 -
4) En el próximo mes de Octubre, la empresa Opinión S.A. realizará un muestreo, para la Consejería de
la Juventud, entre las asociaciones juveniles de Asturias con el fin de estimar diversos promedios
relativos a los ingresos y gastos anuales de esas asociaciones.
Para ello se dispone de un listado donde aparecen numeradas las distintas asociaciones,
clasificadas en tres grupos de acuerdo al volumen de socios:
Tipo de asociación
Pequeña Mediana Grande
Nº de asociaciones 200 50 6
Por análisis previos se sabe que la desviación típica de las variables a observar es del orden
de 1.250 €, y que ésta es básicamente la misma en cualquier tipo de asociación.
a) Determina, al 95% de confianza, el tamaño muestral necesario para que el error en la estimación de
las medias no supere 200 €.
Si se quisiera hacer pronósticos sobre porcentajes, ¿a cuántas asociaciones habría que
entrevistar para que los errores no superasen el 5%?.
b) Finalmente solo se analizan 90 asociaciones, y se obtiene un presupuesto medio anual para
actividades culturales de 5.000 € y una desviación típica de 1.200 €.
Dar, al 95,5% de confianza, un intervalo para ese presupuesto medio y analizar el error de
la estimación. ¿Por qué resulta mayor que el previsto en el apartado a)?.
c( Explica con detalle, razonándolo, el sistema que llevarías a cabo para seleccionar la muestra.
d( Presenta una ficha técnica del muestreo realizado.
5) Se realizó una encuesta en Gijón entre las mujeres casadas, en la que se pretendía analizar el
tiempo dedicado a las distintas tareas de la vida diaria. Para ello se entrevistó a 79 mujeres,
repartidas en 3 niveles de edad: 29 entrevistadas menores de 30 años, 21 con edad de 30 a 50, y
29 mayores de 50 años. La pregunta del cuestionario que analizaremos en este caso es “¿Cuántos
minutos dedicas a cocinar, semanalmente?”.
a) Se obtuvo que las entrevistadas dedican a cocinar, semanalmente, una media de 519 minutos con
una desviación típica igual a 348 minutos.
¿Es grande o pequeño el error que se comete en el pronóstico de la media, al 95,5% de
confianza?. ¿A qué factores achacas el hecho de que salga esa cantidad?.
¿A cuántas mujeres habría que entrevistar para que el error en esa estimación no fuese superior
a 13 minutos?.
b( ¿A que método de muestreo podría corresponder la recogida de los datos, según la información
disponible en el ejercicio?.
6) La Consejería de Trabajo y Promoción del Empleo del Principado de Asturias solicita al Departamento
de Sociología de la Universidad de Oviedo la realización de una encuesta con el fin de analizar
diversos aspectos socioeconómicos de la población masculina de Avilés, con edad entre 18 y 64
años, y en la que interesa particularmente distinguir dos sectores: personas en paro y personas en
activo.
Para llevar a cabo el estudio se dispone de sendos listados de la población citada donde figuran,
numerados, los nombres y direcciones de los 8.000 parados y de las 32.000 personas en activo que
hay en la ciudad.
La recogida de los datos se realizará en el próximo mes de Octubre, entrevistando a 360
parados y a 1.440 personas en activo, y los resultados serán reflejados, fundamentalmente, en
forma de porcentajes.
- 35 -
a) Con una confianza del 99%, ¿cuál es el error máximo que se comete al hacer estimaciones de
porcentajes para cada uno de los sectores indicados?. ¿Y para toda la población?. Analiza la
fiabilidad de esta encuesta.
b( Justifica, detalladamente, qué métodos de muestreo parecen más adecuados para seleccionar la
muestra en este caso.
c( Con la información que se desprende de este ejercicio, cubre una ficha técnica que recoja los
aspectos esenciales de la encuesta realizada.
7) Se trata de hacer una investigación en Gijón, mediante una encuesta, sobre las mujeres divorciadas.
El trabajo, subvencionado por el Ayuntamiento, lo llevará a cabo la consultoría Pearson & Co.,
realizando el trabajo de campo entre los días 12 al 30 del próximo mes de Abril, con la participación
de 10 encuestadores, 3 supervisores y 2 directores técnicos.
a) Los resultados se van a presentar en forma de porcentajes, y se desea tener un 95,5% de confianza
de que los errores no superarán el 5,5%. ¿A cuántas mujeres habrá que entrevistar?.
b( Reflexiona sobre los métodos de muestreo que se podrían llevar a cabo para recoger la información.
c) Finalmente, se decide entrevistar a 400 mujeres divorciadas. De ellas, 120 manifiestan la existencia
de malos tratos en su matrimonio. Dar una estimación por intervalo, al 99% de confianza, para el
porcentaje de casos de maltrato.
¿Se comete mucho error en la estimación?. Compáralo con el que se había previsto en a) y
razona a qué se debe la diferencia que se observa.
d) ¿Cuál es el error máximo a posteriori, al 95,5% de confianza?.
e( Presenta una ficha técnica con las características metodológicas más relevantes.
8) Dentro del presupuesto de una encuesta, en la que se van a estimar una serie de porcentajes en una
población de 2000 personas, se dispone de 4845 € para el pago a los entrevistadores por el
rellenado de los cuestionarios.
Si cada cuestionario cubierto se paga a 15 €, ¿qué tamaño muestral, qué nivel de confianza y
qué error de estimación propondrías?.
9) Se pretende estimar el ingreso medio que, en concepto de pensión, perciben mensualmente las
personas jubiladas de una ciudad. Experiencias anteriores indican que la dispersión de la cuantía de
esas pensiones es del orden de 180 €.
a) Si se desea tener una seguridad del 99% de que, en dicha estimación, no se cometerá un error
absoluto superior a 20 €, ¿a cuántos jubilados habrá que entrevistar?. ¿Y si finalmente nos informan
de que hay 2980 pensionistas en esa ciudad?.
b) Tras entrevistar a 576 pensionistas se encontró una pensión media de 900 € y una dispersión de
340,83 €.
Con un 95% de confianza, analizar el error máximo para la cuantía de la pensión media de los
2980 pensionistas. Compárese con el previsto en a) y analícese la situación.
¿En cuánto estimaríamos la cantidad global que se reparte en pensiones cada mes en esa
ciudad?. ¿Qué margen de error (en €) tiene esa cantidad?.
c( Explica con qué criterios de muestreo podríamos realizar la recogida de datos.
- 36 -
Soluciones
3) a) Tomando p=0,5 se calcula =4,5%. Como además =95% ----> Muy fiable.
b) O por rutas aleatorias, estratificando por edades, o no aleatoriamente por cuotas de edad.
d) El 27%. Se obtiene =5,25%, luego (21,75%;32,25%)
=5,25% (algo mayor del 5%), pero =99% ----> Muy fiable.
4) a) n=94,6 ----> 95 asociaciones. Para porcentajes resultaría n=153,8 ----> 154 asociaciones.
b) =203,72 €. Luego, (4.796,28 €; 5.203,72 €) .
8) n=4845/15=323 cuestionarios. Lo más razonable sería tomar =95%, pues nos lleva a =4,99%,
que es menor del 5%. Si tomamos =95,5%, entonces =5,1%, ligeramente mayor del 5%. Desde
luego no tomaríamos =99%, pues =6,56%.
- 37 -
respecto al apdo. a). Sin embargo la dispersión encontrada ahora es muy superior a la de a) y
esto hace que el error finalmente haya crecido. No obstante el error sigue siendo pequeño pues
- 38 -
5
________________________________
De forma general, la toma de datos estadísticos puede hacerse por dos vías: mediante la
recogida personal a través de encuestas o censos, o recopilando los datos de fuentes diversas. En los
temas anteriores nos hemos referido a la primera de esas vías; en este apartado incidimos en la
segunda vía, sugiriendo una serie de organismos que pueden resultar de utilidad para el trabajador
social.
Lógicamente, en primer lugar, debemos señalar al ente más significativo dentro de las
Estadísticas Oficiales: el Instituto Nacional de Estadística (INE) http://www.ine.es/. En su página web
se encuentra la información estructurada en los siguientes bloques:
Seguro que en todos ellos encontraremos estadísticas interesantes, pero quizá el apartado de
Sociedad sea el más interesante para nuestros fines. Se divide en los siguientes epígrafes:
- Educación
- Cultura y ocio
- Salud
- 39 -
- Seguridad y Justicia
- Nivel, calidad y condiciones de vida (IPC,...)
- Mercado laboral (EPA, Costes laborales,...)
- Análisis sociales
- Procesos electorales
Otro organismo importante como fuente de datos es el Ministerio de Sanidad, Servicios Sociales
e Igualdad (http://www.msc.es/). Al entrar en su página web se nos ofrece la posibilidad de consultar el
llamado Portal Estadístico de SNS.
A nivel regional, cada comunidad autónoma tiene sus propios organismos de elaboración de
estadísticas. En el caso del Principado de Asturias, el organismo más conocido es la Sociedad Asturiana
de Estudios Económicos e Industriales, llamada abreviadamente SADEI (http://www.sadei.es/).
Obviamente también podemos buscar información en la web del Gobierno del Principado
(http://www.asturias.es/) y en las webs de las Consejerías y Servicios que de él dependen, como
pueden ser los portales de salud y educación AsturSalud (http://www.asturias.es/portal/site/astursalud)
y Educastur (http://www.educastur.es/). Para temas relativos a género podemos dirigirnos al Instituto
Asturiano de la Mujer (http://institutoasturianodelamujer.com/iam/).
A nivel municipal tendremos que dirigir nuestra búsqueda de datos a los ayuntamientos
correspondientes, a través de sus empresas, fundaciones, patronatos, etc., o a todas aquellas entidades
públicas o privadas relacionadas con nuestro objeto de estudio.
Dada la variedad de organismos a los que podríamos dirigirnos según el tipo de estadística que
estemos interesados en encontrar, citaremos solo dos casos:
- Eurostat.
http://ec.europa.eu/eurostat/
- Organización Mundial de la Salud (WHO)
http://who.int/es/
Señalemos, finalmente, que en la página web del INE, en su apartado denominado “Datos
Internacionales” figuran también algunas estadísticas internacionales relativas a demografía, educación,
salud y condiciones de vida, entre otras.
- 40 -
Otros programas que pueden ser útiles son el R (http://www.r-project.org/), el PSPP
(http://www.gnu.org/software/pspp/pspp.html), el Statgraphics (http://www.statgraphics.net/) o el SAS
(http://www.sas.com/).
________________________________
Tareas no presenciales:
Se entregará una lista de ejercicios de análisis de datos, con sus soluciones, para que el
alumnado practique por su cuenta.
Tareas presenciales:
Discusión de aspectos técnicos de algunas de las encuestas elaboradas por los organismos
citados en este tema.
En la sala de ordenadores, a medida que se vayan explicando los apartados que conforman el
tema 5, se irán proponiendo ejercicios sobre el manejo del SPSS y la interpretación de los resultados
obtenidos.
- 41 -
________________________________
Bibliografía
Documento básico
1. Menéndez, J.M. (2017). “Estadística para el Trabajo Social. Apuntes y tareas”.
Referencias generales
2. Infante, F.G., Zárate, L. F. (2005). “Métodos estadísticos”. Ed. Trillas.
3. Levin, R. (1997). “Estadística para Administradores”. Ed. Prentice Hall.
4. Lohr, S. L. (2000). “Muestreo: diseño y análisis”. Ed. Thompson-Paraninfo.
5. Pérez, C. (2009). “Técnicas de muestreo estadístico”. Ed. Garceta.
6. Quesada, V., Isidoro, A., López, L.A. (1989): “Curso y ejercicios de Estadística”. Ed. Alhambra.
7. Ruiz Maya, L., Martín Pliego, F. J. (2002). “Estadística II: Inferencia”. Ed. AC..
- 42 -
________________________________
Anexo I:
- 43 -
TABLA DE LA DISTRIBUCIÓN N(0;1)
- 44 -
(en %) 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5
90,0 1,645 1,670 1,695 1,722 1,751 1,780 1,812 1,845 1,881 1,919 1,960 2,005 2,054 2,108 2,170 2,241 2,326 2,432 2,576 2,807
80,0 1,282 1,296 1,311 1,326 1,341 1,356 1,372 1,388 1,405 1,422 1,440 1,457 1,476 1,495 1,514 1,534 1,555 1,576 1,598 1,621
70,0 1,036 1,047 1,058 1,069 1,080 1,092 1,103 1,115 1,126 1,138 1,150 1,163 1,175 1,188 1,200 1,213 1,227 1,240 1,254 1,267
60,0 0,842 0,851 0,860 0,869 0,878 0,887 0,896 0,906 0,915 0,925 0,935 0,944 0,954 0,964 0,974 0,984 0,994 1,005 1,015 1,026
50,0 0,674 0,682 0,690 0,698 0,706 0,714 0,722 0,731 0,739 0,747 0,755 0,764 0,772 0,781 0,789 0,798 0,806 0,815 0,824 0,833
40,0 0,524 0,532 0,539 0,546 0,553 0,561 0,568 0,575 0,583 0,590 0,598 0,605 0,613 0,620 0,628 0,636 0,643 0,651 0,659 0,667
30,0 0,385 0,392 0,399 0,406 0,412 0,419 0,426 0,433 0,440 0,447 0,454 0,461 0,468 0,475 0,482 0,489 0,496 0,503 0,510 0,517
20,0 0,253 0,260 0,266 0,273 0,279 0,286 0,292 0,299 0,305 0,312 0,319 0,325 0,332 0,338 0,345 0,352 0,358 0,365 0,372 0,379
10,0 0,126 0,132 0,138 0,145 0,151 0,157 0,164 0,170 0,176 0,183 0,189 0,196 0,202 0,208 0,215 0,221 0,228 0,234 0,240 0,247
0,0 0,000 0,006 0,013 0,019 0,025 0,031 0,038 0,044 0,050 0,056 0,063 0,069 0,075 0,082 0,088 0,094 0,100 0,107 0,113 0,119
________________________________
Anexo II:
- 45 -
DATOS DEL GRUPO FAMILIAR
MIEMBROS
EDAD
SEXO
E. CIVIL
SALUD
ESTUDIOS
SIT. LABORAL
OCUPACIÓN
INGRESOS
Nº PAGAS
TIEMPO PARO
DATOS DE LA VIVIENDA
Nº DE HABITACIONES M2 APROXIMADOS
EQUIPAMIENTO CARENCIAS
- 46 -
________________________________
Anexo III:
- 47 -
- 48 -
- 49 -
- 50 -
________________________________
Anexo IV:
Ejemplo de cronograma
- 51 -
- 52 -