Anda di halaman 1dari 7

I

I
i
Capitulo 2

1: I

!
I ;'
Distribuciones de frecuenclos
"
unidimensionales
Ii: Ii

I,
IL
'I'
I
i"
I
I
'j
!
I

,I
" ,I

I, 1
II ' lj 2.1. Introduccion
Iii': ; j
l En este capitulo iniciamos 10 que hemos deriominado la Estadfstica Des­

III· .

~ ::
I criptiva 0 Deductiva que se ocupa de recopilar, organizar y analizar datos
numericos, El estudio 10 iniciamos con la presentaci6n de una serie de con­
. 1-:..
'I
!;
I ceptos previos fundamentales que se emplearan constantemente en el desarro­
llo de esta disciplina: poblaci6n, muestra, atributos, escalas de medici6n y va­

I
i!
I riables estadfsticas.
!
I'
t
En segundo lugar se aborda la explicaci6n de las distintas tareas que
Ii ' componen las tres grandes etapas de toda investigaci6n estadfstica: definici6n
1: "
j de objetivos, recogida de los datos y estimaci6n y descripci6ti de los parame­
tros poblacionales.
I El tercer aspecto que se estudia, centrandonos en la tarea descriptiva de la
!
i
II!)1
etapa denominada analisis descriptivo primario, es la elaboraci6n de 10 que se
I" denomina distribuci6n de frecuencias unidimensionales, tanto en su aspecto
(:
)' numerico como grafico, En cuarta posici6n se anallzan de forma global las
distribuciones de frecuencias a traves de sus medidas de posici6n: medias,
I

:.:

I,
mediana, moda y cuantiles.
I Otras medidas que se introducen, en quinto lugar, en el estudio de las
distribuciones son los denominados momentos potenciales con relaci6nal ori­
gen y a la media aritmetica. En sexta posici6n se abordan las medidas de
dispersi6n: recorrido, intervalos intercuartflicos, varianza, desviaci6n tfpica,
coeficiente de apertura, recorrido relativo, recorrido semi-intercuartflico y coe­
;:1] .
l":'1
p!.!
ficiente de variaci6n. Le siguen la exposici6n de 10 que se conoce como
II!,! «medidas de forma»: asimetrfa y curtosis. Dos distribuciones que tengan la
11 1i l,' misma media aritmetica y la misma varianza pueden diferir en la forma de sus
,i
!II!
a
ll
d,I,

;, nl:
'"II.'Iii
22 CASAS-sANCHEZ, 1. M. y SANTOS-PENAS, 1. DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 23

representaciones graficas, con 10 que se llega a un estudio mas profundo con Aunque los atributos no son susceptibles de ser medidos numericamente,
la utilizaci6n de las medidas de forma. sus modalidades pueden relacionarse con 10 que se denominan escalas nomi­
Por ultimo se abordan las medidas de concentracion 0 de desigualdad: nales y ordinales. Las observaciones de las distintas modalidades decimos que
Indice de Gini y Curva de Lorentz. Estas medidas se conciben para medir la estan en una escala nominal cuando los mimeros que Ie asignamos s610 se
equidad en la distribuci6n de ciertas caracterfsticas de contenido econ6mico: emplean para diferenciar las distintas categorfas, Si al ejemplo de los colores
rentas personales 0 familiares, salarios, beneficios, etc. del semaforo Ie asignamos los digitos 1, 2 y 3, s610 cabe la interpretaci6n de
que el 1 #- 2 #- 3 sin que se pueda afirmar que uno es superior a otro y sin
que se puedan ordenar. La escala nominal es la forma de medici6n mas debit
2.2. Conceptos fundamentales y se utiliza s6lo para clasificar las distintas modalidades de un atributo. No
permiten ninguna relaci6n de orden ni operaciones aritmeticas de suma, resta,
Vamos a exponer de forma sencilla una serie de definiciones que constan­ multiplicaci6n y divisi6n. La medici6n de las caracterfsticas cualitativas 0
temente las estaremos empleando en estadfstica, atributos tambien admite en ciertos casos 10 que se conoce como escalas
Poblaci6n. Se entiende por poblaci6n, universo 0 colectivo cualquier conjun­ ordinales. Se podra emplear la escala ordinal cuando las distintas modalidades
to de personas, objetos, animales, plantas, instituciones 0 entes en general que admiten una determinada graduaci6n u ordenaci6n. En estudios de mercado
son portadores de una serie de caracterfsticas que nos interesa estudiar. j y de opini6n se emplean con mucha frecuencia las escalas ordinales. La imagen
Ejemplos de poblaciones:
• Las personas que trabajan en la Administraci6n Central.
! de un determinado politico podra calificarse de: muy mala, mala, regular,
buena y muy buena. Si se Ie asignan los dlgitos 1, 2, 3, 4 y 5 no quiere decir
• Las lavadoras automaticas que se han producido en nuestro pais duran­
te 1994.
• Los pinos existentes en la Comunidad de Madrid a 31 de diciembre
I que la imagen buena sea el doble que la mala, sino que esta en un orden
superior. Este tipo de mediciones con escalas ordinales es superior al nominal
ya que adem as de clasificar las distintas modalidades permiten ordenarlas,
de 1994. perc tampoco admite, como en las nominales, las operaciones aritmeticas de
• Los autobuses de la E.M.T. a 30 de junio de 1995. suma, rest a, multiplicaci6n y divisi6n.
Variables. Son las caracterfsticas poblacionales susceptibles de tomar valo­
Las poblaciones estan compuestas de elementos 0 individuos por 10 que res numericos a los que se les pueda aplicar 10· que se conocen como escalas
deben de estar definidas con absoluta precisi6n de forma que siempre se pueda de intervalos y de razon 0 proporcion, Las primeras son aquellas que permiten
discernir si un elemento pertenece 0 no pertenece a la misma. Se clasifican en una unidad de medida con 10 que podemos cuantificar numericamente la
iii:' finitas 0 infinitas segnn que el mimero de elementos que la componen sea de distancia existente entre dos observaciones cualesquiera. El orden de esta
una clase u otra. En el mundo econ6mico y social estaremos casi siempre ante escala es superior a las nominales y ordinales ya que ademas de clasificar y
poblaciones finitas: habitantes de una regi6n, empresas de un sector, deman­ ordenar las mediciones permite diferenciar con exactitud unas situaciones de
dantes potenciales 0 reales de un producto, etc. otras. En el mundo econ6mico-empresarial tenemos multitud de caracterfsticas
Muestra. Llamamos muestra a todo subconjunto representative de la po­ en las que pueden aplicarse escalas de intervalos: salarios de una empresa,
blaci6n de forma que las conclusiones sacadas en aquella se generalizan a esta, cualquier tipo de presupuesto, gastos, ventas, etc. Las escalas de proporci6n 0
Las poblaciones se pueden estudiar bien realizando una investigaci6n exhaus­ razon, ademas de las cualidades de las de intervalo, se caracterizan por incor­
tiva de todos sus elementos y entonces diremos que estamos realizando un porar un punto de origen no arbitrario (un cero verdadero) como puede
censo, 0 bien, investigando una parte 0 subconjunto de las mismas y entonces ocurrir, con los pesos y las edades de las personas, litros de gasolina en
diremos que estamos realizando un estudio muestraI.. #
un dep6sito, etc. En conclusi6n podemos decir que las escalas de intervalo
i Atributo. Es toda caraeterfstica poblacional no susceptible de ser medida admiten unidades de medida y un origen (cero) arbitrarios y las de raz6n
numericamente, La observaci6n de un atnbuto da lugar a distintas modalidades. ademas de la unidad de medida tienen asignado un punto de origen no
,II'
Son ejemplos de atributos: arbitrario ya que es un verdadero cero 0 cero absoluto. En estas escalas sf
• El sexo de una poblaci6n humana cuyas modalidades son: varon y mujer. se permiten las operaciones aritmeticas de la suma, resta, multiplicaci6n y
• Los colores de un semaforo cuyas modalidades son: rojo, verde y amarillo. divisi6n.
• La profesidn de un conjunto de personas activas. Las variables estadfsticas pueden clasificarse de distintas maneras. Tenien­
,
I
24 CASAS-sANCHEZ, 1. M. y SANTOS-PENAS, 1. DISTRmUCIONES DE FRECUENCIAS UNIDIMENSIONALES 25

do en cuenta el nnmero de caracterfsticas que estudiamos en los elementos de


,
j CD Etapa: Definicion de objetivos
Ii una poblaci6n las variables pueden ser unidimensionales, 'bidimensionales 0
pluridimensionales. Por ejemplo, si en el colectivo 0 poblaci6n formado por las
empresas del sector qufrnico estudiamos solo su volumen de producci6n esta­
II Tareas:

remos ante una variable unidimensional. Si estudiamos al mismo tiempo la • Identificaci6n de caracterfsticas cualitativas 0 cuantitativas que
j se desean estudiar.
producci6n y el numero de trabajadores de cada empresa sera bidimensional
(se observan dos caracterfsticas 0 variables cuantitativas en los elementos I
1 • Definici6n de la poblaci6n portadora de las caracterfsticas a
poblacionales). Las variables tambien pueden ser discretas 0 continuas segun 1I investigar.
tomen un mimero finito 0 infinito numerable, 0 bien infinito no numerable de i • Identificar el marco 0 listado de unidades poblacionales especifi­
valores en un determinado intervalo de su campo de variaci6n. i cando sus soportes (magnetico, papel, documentos, etc.) y su
j
accesibilidad.'
1
• Decidir si la investigaci6n va a ser censal 0 muestral determinan­
2.3. Tareas a desarrollar en las grandes etapas
de la investigacion estadistica i
.
\
do tamafio de la muestra y presupuesto necesario.
• Especificar el ambito del estudio y la forma de recoger los datos:
Il entrevistas personales, por correo, por telefono 0 mixtas.
En el primer capitulo hemos considerado, de forma muy generica, las tres '
grandes etapas que pueden considerarse en toda operaci6n 'estadfstica: defini­
ci6n de objetivos, recogida de datos y estimaci6n y descripci6n de resultados 1
I
I:j
finales. En el presente apartado vamos a comentar brevemente las distintas
tareas contenidas en las grandes fases tal y como estan relacionadas en el I1
@ Etapa: Recogida de los datos estadfsticos
grafico 2.1.
I·'
En la definicion de objetivosla primera tarea es identificar las caracterfsticas I Tareas:
iii: · cualitativas 0 cuantitativas que se desean estudiar. Debe existir una necesidad I • Disefio del cuestionario.
de realizar la investigaci6n estadfstica explicitando que datos son los relevantes
I
'1, ,:"
'" '
• Diseiio muestral de acuerdo con el marco disponible.
1
para la toma de decisiones. El gobierno de un pais puede tener necesidad de
investigar a traves de una muestra representativa las siguientes caracterfsticas: • Disefio del material auxiliar de la encuesta.

II
,

• Recogida de los datos.


- Altas y bajas de empleados en distintos sectores econ6micos por tipo­
logfa de contratos (fijos, eventuales, por obra, de .formacion, a tiempo • Tratamiento de los datos.
completo, a tiempo parcial, etc.).
- Evoluci6n mensual de las ventas del comercio minotista.' I
- Evoluci6n del transporte de mercancfas por carretera. 1

1
Una empresa puede tener la necesidad de conocer: lI ® Etapa: Estimacion y descripcion de los parametres
poblacionales especificados en los objetivos
- El mercado actual de un determinado producto a traves de su volumen l
de ventas (caracterfstica cuantitativa). . • I
:1
Tareas:
- La motivaci6n fundamental por la que se compra un artfculo de una j
• Analisis descriptivo primario.
determinada marca (caracterfstica cualitativa) que se consume en los
hogares. • Estimaci6n de errores muestrales y no muestrales.
• Analisis especiales multivariantes.
El exito de toda investigaci6n estadfstica se basa en la correcta selecci6n
de las caracterfsticas que se van a analizar de forma que se alcancen los
GRAFIeo 2.1. Etapas y tareas de toda investigaci6n estadistica.
objetivos que nos hemos propuesto.

:i
I.I.I!.:

IIill·I!

Ii
:1: 26 CASAS-sANCHEZ, 1. M. y SANTOS-PENAS, 1. DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 27

La segunda tarea consiste en delimitar con absoluta precisi6n, sin ningun • Claridad en el lenguaje utilizado. El nivel cultural de los estrevistados es
tipo de ambiguedad, la poblaci6n en la que podemos estudiar las caracterfs­ heterogeneo en la mayorfa de los casos (se exceptuan las encuestas
ticas que nos interesan. En el caso de las altas y las bajas en el empleo senin realizadas a colectivos del mismo nivel cultural: medicos, abogados, in­
las empresas que conforman los distintos sectores, en el segundo ejemplo sera genieros, economistas, etc.) por 10 que hay que emplear un lenguaje
todo el conjunto de establecimientos minoristas (tiendas tradicionales, auto­ sencillo y directo evitando terminos tecnicos que solo son comprensibles
servicios, supermercados, hipermercados y grandes almacenes), en el tercer para los especialistas.
caso el censo de camiones y furgonetas de distintos tonelajes, en el cuarto caso • Precision en las preguntas. Deben de ser concretas y cortas con objeto
las empresas que fabriquen el producto en cuesti6n y en el quinto ejemplo los de obtener respuestas precisas. Un ejemplo de pregunta no concreta es
compradores del producto. lNo piensa Yd. que fuma mucho? El termino mucbo es subjetivo y tiene
La tercera tarea de la primera etapa es determinar el marco que contiene distinto valor para distintas personas. La pregunta concreta serfa lCuan~
a los elementos de la poblaci6n de nuestro estudio. En los ejemplos anteriores, tos cigarrillos fuma Vd. diariamente?
y siguiendo el mismo orden establecido los marcos suelen sec las bases de • No se debe influir en la respuesta, Deben evitarse juicios de valor a la
datos existentes en soportes magneticos en el Ministerio del Trabajo (altas y hora de efectuar las preguntas que condicionan las respuestas. No serfa
bajas de la Seguridad Social); los censos de establecimientos minoristas elabo­ correcto hacer preguntas del tipo lNo piensa Yd. que nuestra empresa
rados por organismos piiblicos 0 empresas privadas; los ficheros del Ministerio da un servicio posventa de gran eficacia? La pregunta correcta serfa:
de Transportes que contengan las licencias de transporte de mercancfas vigen­ lQu6 opina Yd. de nuestro servicio posventa?
tes; anuarios de fabricantes por productos y los censos de poblaci6n elabora­ • Deben evitarse las preguntas indiscretas que molestan al entrevistado. Hay
dos peri6dicamente por el INE. Los marcos deben estar actualizados y depu­ que tener en cuenta que determinadas preguntas pueden molestar al
rados de unidades extrafias ya que de ellos se seleccionan de forma aleatoria entrevistado con 10 que podemos conseguir que se niegue a contestar a
las unidades muestrales cuando la investigaci6n estadfstica no es exhaustiva. la totalidad del cuestionario, 0 bien, que nos den respuestas falseadas.
En la cuarta tarea se decidira si la investigaci6n estadfstica va a ser ex­ Esta demostrado que no deben de pedirse directamente los ingresos de
haustiva o,no dependiendo del tamano de la poblaci6n, las disponibilidades una persona ni la edad. Es mucho mas eficaz pedirles que se situen
econ6micas, el plaza disponible, etc. Normalmente se acudira a investigaciones dentro de una escala previamente establecida. La pregunta zCuales son
muestrales (no exhaustivas) con 10 que se estableceran los tamafios muestrales I sus ingresos anuales?, debe de sustituirse por: Indique, por favor, dentro

~j
de acuerdo con los niveles de confianza que se deseen y los errores muestrales de que tramo de la siguiente escala se encuentran sus ingresos anuales:
que estemos dispuestos a admitir. Estas tiltimas cuestiones que se refieren a la . menos de dos millones, entre dos y cuatro 0 mas de cuatro.
fiabilidad de la investigaci6n estan relacionadas con los costes de la misma ya • Hay que cuidar el orden de las preguntas. Las preguntas mas sencillas
que a mayor nivel de precisi6n se requerira una mayor muestra y por tanto, deben de ir al comienzo del cuestionario y las mas complejas 0 delicadas
un mayor presupuesto. Tambien tendremos que establecer elambito de la
investigaci6n: nivel municipal, comarcal, regional, nacional, etc., asf como la
j al final. Con ello se consigue un mayor grado de respuesta y colabora­
ci6n por parte del entrevistado ya que una vez que se ha avanzado en
forma mas adecuada de recoger la informaci6n: entrevistas personales, por
correo, por telefono 0 mixtas.
I la cumplimentaci6n es mas dificil que se niegue a seguir contestando
aunque las preguntas sean mas comprometidas.
La primera tarea de la segunda etapa (recogida de los datos estadfsticos)
es el diseiio del cuestionario. Para su elaboraci6n se parte de todos los antece­
il Las anteriores recomendaciones generales no agotan toda la normativa
existente de como deben confeccionarse las preguntas de un cuestionario. Se
dentes que nos proporciona la primera etapa: caractensticas que mediremos,
j ponen a titulo de ejemplo para dejar constancia de que es una tarea compleja
unidades que van a facilitar los datos: empresas, personas, organismos, etc., y
forma de recoger los datos: por correo, con agentes entrevistadores 0 por
1
I
que requiere verdaderos especialistas.
l

telefono. Toda esta serie de antecedentes nos van determinando el formato del J Las preguntas de un cuestionario pueden c1asificarse desde multiples as­
cuestionario y la naturaleza de sus contenidos. Elaborar un cuestionario que pectos. Si atendemos, por ejemplo, a la libertad de elecci6n de respuesta las
preguntas pueden ser:
no tenga fallos es una tarea especializada que debe de desarrollar un grupo
de expertos en las materias correspondientes. Aquf nos vamos a limitar a dar • Abiertas: son aquellas cuya respuesta es totalmente libre para el entre­
unas directrices para su buena confecci6n: vistado. Por ejemplo, a los cabezas de familia podna preguntarseles zQue
r',j

28 CASAS-sANCHEZ, J. M. YSANTOS-PENAS, J.
i!
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 29

usos les darla Vd. a los ordenadores personales en su hogar? Senale todos
1
,
maciones para cada estrato 0 subpoblacion en los que hemos dividido la
~
los que Ie parezean.interesantes, En esta cuesti6n nos encontraremos una 'j poblaci6n objeto de estudio. La estratificaci6n consiste en dividir la poblaci6n
gama variada de respuestas: hacer un inventario de 'las existencias de en grupos que sean homogeaeos internamente respecto a la caracterfstica que
"
productos alimenticios, hacer un presupuesto por partidas de gastos con estemos estudiando y que existan grandes diferencias entre unos y otros estra­
un seguimiento semanal, hacer un listado de productos que se van ago­ 1 tos. Si, por ejemplo, se desea investigar la renta de los hogares de la Comu­
tando para responerlos cuando vamos a la compra, confeccionar un ,I nidad de Madrid se pueden agrupar en tres estratos 0 grupos: renta baja,
archivo con telefonos y direcciones de nuestras amistades y proveedores, 1
'I'
media yalta. EI total de la muestra que se emplee puede distribuirse de forma
etc. En este caso el entrevistador anota literalmente las respuestas em­ proporcional a la poblaci6n de cada estrato 0 emplear otros criterios que
1
pleando las mismas palabras del entrevistado.
• Cerradas: son aquellas cuyas posibles respuestas estan listadas. EI entre­
j pueden estudiarse en los manuales de Muestreo de Poblaciones Finitas.
j c) Muestreo por conglomerados: Los conglomerados son agrupaciones de
vistado escoge una 0 varias respuestas de las que se Ie presentan. Si ,j
queremos cerrar la pregunta de los usos que se dan a los ordenadores ] elementos de la poblaci6n de naturaleza heterogenea dentro de ellos respecto
a la caracterfstica que estemos estudiando. En el ejemplo de los hogares un
personales en el hogar serfa: ;,Que usos dana Yd. a un PC en su hogar
de todos los siguientes?: D Para escribir cartas, D Hacer un invetario de I
j
conglomerado debe tener unidades de renta baja, media yalta de forma que
si se efectua un muestreo dentro del mismo se obtenga informaci6n de los
productos no perecederos, D Llevar la contabilidad del hogar, D Como ! distintos niveles que pueden alcanzar los ingresos de las unidades familiares.
pasatiempo con videojuegos, IJ Se distinguen varios tipos de muestreo por conglomerados: de distintos tama­
Otros aspectos que permiten clasificar las preguntas son: por el numero de 'j nos, de tamafios iguales, sin submuestreo, con submuestreo, etc.
respuestas que permiten: dieotemicas (dos respuestas) 0 de respuesta multiple; i1
por la forma de realizarse: directas 0 indirectas, etc. Un ejemplo de pregunta 'j d) Muestreo sistematico: Es una forma muy sencilla de selecci6n de la
dicot6mica y directa seria: ~Es Yd. fumador?: D Si, D No. i muestra dada en una poblaci6n numerada dell hasta N. EI procedimiento
I
Como recomendaci6n final en la elaboraci6n de un buen cuestionario hay • consiste en las fases siguientes: se divide el tamafio de la poblaci6n N por el
que hacer constar la absoluta necesidad de someterlo a una prueba piloto 0 1
1
de la muestra n; empleando una tabla de nnmeros aleatorios se elige uno que
este ·comprendido dentro del cociente dado por el resultado anterior (si
pretest con objeto de aseguramos su buen funcionamiento antes de proceder
a su edici6n.
II N = 100 y n = 5, N In = 20, se elige de forma aleatoria un mimero entre 1 y
La segunda tarea que se relaciona en el grafico 2.1, dentro de la segunda r 20) y por ultimo se obtienen los (n - 1) elementos muestrales restantes suman­
etapa, viene referida al diseno muestral en el supuesto de que la investigaci6n t
do al que se ha elegido de forma aleatoria el resultado del cociente (si en el
estadistica no tenga caracter de exhaustiva. EI disefio de muestras proba­ 1~
ejemplo el aleatorio ha sido 12, el segundo seria 12 + 20 = 32, el tercero serfa
bilisticas, que son las que deben emplearse en toda toma de datos, requieren I 32 + 20 = 52, el cuarto 52 + 20 = 72 y el quinto elemento muestral serfa
el dominio de la Teoria del Muestreo en Poblaciones Finitas que es una materia 1
72 + 20 = 92). Este procedimiento sedenomina sistematico ya que 10 nnico
1 que tiene aleatorio es el arranque. EI inconveniente de este disefio, igual que
compleja a la que se dedican cursos completos para obtener un nivel de
conocimientos adecuados. Los tipos de muestreo que se estudian son: 1 en el muestreo aleatorio simple, es que para utilizarlo es absolutamente nece­
J sario tener numerados del 1 al N todos 10 elementos de la poblaclo», Esta
i
a) Muestreo aleatorio simple (m.a.s.): Es la forma de muestreo mas sen­ j numeraci6n tiene que estar hecha alazar para evitar posibles sesgos sistema­
cilia. Los elementos de la poblaci6n objeto de estudio se numeran del 1 hasta 1 ticos a la hora de medir la caracterfstica de interes en nuestro estudio.
N y se seleccionan n de forma aleatoria (empleando tablas de mimeros alea­ :1
tori os) que constituyen una muestra aleatoria sin reemplazamiento (un lnisnio j e) Muestreo polietdpico 0 complejo: Es el que se aplica en la practica
mimero aleatorio solo aparece una vez) representativa de todo el conjunto. EI cuando se hacen estudios sociales. Los tipos de muestreo que hemos visto
j
disefio tambien puede efectuarse conreemplazamiento (m.a.s.r.). J anteriormente no suelen aplicarse en estado puro cuando deseamos medir

b) Muestreo estratificado: Es un disefio que se emplea mucho en la prac­ I

~
caracterfsticas de unidades de consumo (familias) 0 de producci6n (empresas)
por razones de carencias de marco (inexistencia de soportes que contengan
tica ya que permite mejorar la fiabilidad de las estimaciones respecto al m.a.s, numerados todos los elementos de la poblaci6n) 0 por razones de coste (el
para un mismo tamafio n de la muestra. Tambien nos permite obtener esti­ il metodo de selecci6n conlleva tal dispersi6n en la localizaci6n de las unidades
30 CASAS-sANCHEZ, J. M. Y SANTOS-PENAS, J. DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 31

de la poblaci6n que hacen inviable el estudio desde el punto de vista econ6­ aplica realmente en los estudios socio-econ6micos es una mezcla de los distin­
mico). Por estas tazones en la practica hay que acudir al muestreo polietapico ros tipos de muestreo que se estudian con 10 que los diseiios reales son
o complejo. complejos y su puesta en practica requiere el concurso de verdaderos especia­
Veamos esta problematica con un ejemplo. Supongamos que el Ministerio listas en la materia.
de Cultura desea entrevistar a la poblaci6n espanola mayor de 18 anos para f) Muestreos no probabiltsticos: Los muestreos que se han comentado de
conocer con que periodicidad se visitan los museos. Se considera que a nivel forma abreviada anteriormente son todos probabilisticos. Todos tienen en
nacional una muestra de 3.000 personas es suficiente. Para seleccionarlas por comiin que los elementos de la poblaci6n que entran a formar parte de la
un procedimiento puro de m.a.s, podrfa acudir a la Direcci6n General de la muestra se han obtenido por procedimientos de azar y todos tienen, a priori,
Policfa y solicitar que de forma aleatoria, utilizando los nnmeros del D.N.I., antes de ser seleccionados, una determinada probabilidad de ser elegidos.
se seleccionaran las 3.000 personas con su nombre completo, direcci6n y demas Cuando en e1 proceso de se1ecci6n existan unidades poblacionales que no
datos personales. Estas personas estarfan muy dispersas por todo el territorio: tengan probabilidad conocida y utilizada en laselecci6n para entrar a formar
zonas rurales, pueblos pequenos, median os, capitales de provincia, etc. Habrfa parte de la muestra, el muestreo no es probabilistico. Se pueden poner multitud
que entrevistar a una persona en un pueblo, a otra en una pedania, a dos en de ejemplos de muestreos no probabilisticos: un investigador de un lab oratorio
una capital de provincia y asf sucesivamente se tendrfa un perfodo largo y toma una muestra de conejillos introduciendo su brazo en una jaula con 10
dificultoso en recogida de informaci6n con costes de desplazamientos y dietas que s610 eligira los que esten a su alcance; el sociologo de una empresa toma
de los entrevistadores elevadfsimos. Tambien es probable que ni el Minis­ una muestra de empleados para saber su edad cogiendo, segtin su criterio
terio del Interior ni el Instituto Nacional de Estadfstica puedan por Ley personal, s610 las 50 primeras fichas de un montante de 500; a un entrevistador
utilizar esa informaci6n para facilitar la muestra al Ministerio de Cultura. se le ordena que en una manzana de casas escoja al azar, segtin su criterio, a
Luego en este diseiio de m.a.s. existen dos graves impedimentos: elevado coste 20 personas para entrevistarlas con la nnica condici6n de que el 50 % sean
y no disponibilidad de ficheros de poblaci6n para seleccionar aleatoriamente hombres y el 50 % mujeres. Este ultimo ejemplo es 10 que se conoce por
la muestra. muestreo por cuotas que se emplea normalmente en los sondeos de opini6n y
La nnica soluci6n viable suele ser acudir a un muestreo polietapico ejecu­ estudios de mercado ya que no exige la elaboraci6n de listados previos de los
tando el siguiente diseiio muestral complejo: en primer lugar se estratifican elementos que se van a se1eccionar. No es probabilistico al no seleccionar
(muestreo estratificado) los micleos de poblaci6n por cruce de Comunidades unidades de acuerdo con probabilidades conocidas y preasignadas por el
Aut6nomas y tamano de habitat; en segundo lugar (primera etapa de se1ecci6n) investigador.
se eligen municipios con probabilidad proporcional a su tamafio (muestreo La principal ventaja de utilizar un muestreo no probabilistico por cuotas es
por conglomerados). En esta etapa los municipios grandes de las capitales de .
r~'
•.....
que abarata mucho la recogida de informaci6n. Tiene el grave inconveniente,
provincia suelen estar autorrepresentados eligiendose de forma aleatoria s610 -
'1­
,;~
como todos los no probabilisticos, que carecen del rigor cientffico necesario
los medianos y pequefios, Los municipios grandes elegidos en la primera etapa . para estimar los posibles errores muestrales que se comenten al estimar carac­
se vuelven a estratificar (muestreo estratificado) en distritos de naturaleza .~ terfsticas poblacionales a traves de subconjuntos muestrales ni se pueden
homogenea respecto a caracterfsticas socio-econ6micas. Se eligen en una se­ \1 establecer intervalos de confianza para las estimaciones.
gunda etapa de selecci6n una serie de estos distritos 0 manzanas de naturaleza -.J

equivalente a las secciones censales disenados por el INE (muestreo por con­ 1'.~ La tercera tarea que se resalta en la segunda etapa del grafico 2.1 es
1
glomerados). En estas manzanas, elegidas en la segunda etapa hay que hacer elaborar el material auxiliar que sea necesario para que la recogida de infor­
un listado de todas las viviendas que contienen y sobre e1 mismo elegir me­ 1, maci6n tenga los men ores errores posibles ajenos al muestreo propiamente
diante m.a.s, las viviendas que correspondan. Una vez seleccionadas las vivien­ ,~,i
i dicho: hojas de control del trabajo de campo que contienen listados de direc­
das, y tambien por un procedimiento de m.a.s. se selecciona las personas ~ ciones donde hay que hacer las entrevistas, partes de incidencias que puedan
mayores de 18 alios a entrevistar. Estos conglomerados nltimos (manzanas de darse en el marco de la investigaci6n, material de inspecci6n, carnet de entre­
viviendas) que se han elegido suelen ser bastante homogeneos en cuanto a las vistador, cartas de presentaci6n, instrucciones generales para cumplimentar los
caracterfsticas socio-econ6micas de las personas con 10 que se aconseja realizar cuestionarios, etc.
en cada uno un maximo de 10 entrevistas. Como cuarta tarea de la segunda etapa aparece la recogida de los datos
En el esquema descrito anteriormente se observa que el muestreo que se propiamente dicha. Es la tarea esencial ya que la calidad de los datos depende
32 CASAS-sANCHEZ, J. M. Y SANTOS-PENAS, J. DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 33

de su correcto desarrollo mediante el adecuado manejo de sus multiples fac­ una de las variables que se han medido conviene obtener su distribucion de
tores: entrenamiento del personal que interviene y modalidad empleada en la frecuencias, su representacien graflca, sus medidas de posicion, de dispersion, de
recogida de los datos (entrevistas personales, por telefono, por correo, etc.). forma, etc. _
El personal que interviene suele dividirse en: entrevistadores, jefes de grupo, Despues de obtener estas primeras descripciones y medidas, cuando el
inspectores, codificadores, depuradores, grabadores, etc., que estan supervi­ estudio no es exhaustivo, hay que plantearse el grado de fiabilidad de las
sados por una Direcci6n de trabajos de campo. En las entrevistas personales estimaciones a traves del calculo de los errores de muestreo a posteriori. A
los agentes entrevistadores van provistos de los respectivos cuestionarios priori, en la primera etapa cuando se definen los objetivos de la investigaci6n,
editados en papeI. Otra variante que se utiliza actualmente son las entrevistas se ha debido de definir el tamafio de la muestra que asegura unos errores
personales asistidas por ordenadores portatiles, La entrevista se desarrolla maximos de muestreo para un determinado nivel de fiabilidad. Estas defini­
segun la secuencia que indica el ordenador en su programa de ejecuci6n que ciones previas hay que contrastarlas con los calculos de errores muestrales
tambien incorpora controles de inconsistencias, con 10 que se obtiene la para los distintos ambitos del estudio y las distintas variables observadas una
informaci6n de manera instantanea completamente depurada y coherente vez que tenemos las primeras estimaciones. Tambien hay que tener presente
enviandose por disquette 0 por m6dem a la central de procesamiento. Si se los errores ajenos al muestreo que hay que tratar de minimizarlos ya que los
emplea este moderno procedimiento los entrevistadores tienen que estar sesgos que introducen en las estimaciones pueden llegar a invalidarlas: cues­
entrenados en el manejo de estos costosos equipos, que requieren una inver­ tionarios mal disenados, grabaci6n de datos deficiente (siempre hay que veri­
si6n inicial considerable, que se ve compensada con el ahorro de grabaci6n y ficar con una doble grabaci6n), validaciones inadecuadas y mala actuacion de
validaci6n necesarias en los cuestionarios tradicionales editados en papeI. En los agentes entrevistadores.
la modalidad de entrevistas telefonicas asistidas por ordenador se emplea el Por ultimo, una vez que se han hecho los estudios descriptivos y de
mismo procedimiento metodo16gico indicado anteriormente con la enorme fiabilidad correspondientes es cuando se pueden plantear los analisis especiales
ventaja que los agentes entrevistadores no tienen que desplazarse con la con­ multivariantes de los datos: modelos de reduccion de la dimension (analisis
siguiente reducci6n de costes y tiempo invertido. factoriales, de componentes principales y correlaciones can6nicas); modelos
La Ultima tarea de la segunda etapa del proceso de investigaci6n causales (regresiones de todo tipo y analisis de la varianza); modelos de agru­
estadistica es el adecuado tratamiento de los datos. En el caso de las entrevistas paciones y clasificaciones (analisis de grupos y discriminante) y modelos dina­
personales 0 telef6nicas asistidas por ordenadores el tratamiento de la infor­ micos 0 de series temporales (estocasticos y no estocasticos); etc. En estos
maci6n (grabaci6n y depuraci6n de inconsistencias) se realiza de forma auto­ analisis especiales es donde se puede plantear la modelizaci6n estadistica en su
matica, Tras acceder al entrevistado el entrevistador conecta su ordenador y maximo nivel: postulado del modelo, contraste de las hipotesis iniciales del
va ejecutando el programa de la entrevista de forma que automaticamente va modelo, estimacion de los parametres del modelo, validaclen y resultados finales.
detectando las inconsistencias que han sido programadas previamente.
Si la encuesta se ejecuta por un procedimiento clasico (cuestionario editado
en papel y agente entrevistador sin ordenador personal), el tratamiento de la 2.4. Construccion nurnenco y grafica
informaci6n sigue el proceso siguiente: se agrupan los cuestionarios cumpIi­ de las distribuciones de frecuencias
I mentados en la sede central del trabajo estadistico, se codifican las preguntas unidimensionales

II,
que 10 exijan, se grab an de forma masiva, los ficheros se someten a un pro­
grama de validacion que saca los Iistados de inconsistencias, se corrigen y, por ,'­ Una vez que se han precisado los distintos conceptos basicos que se

I
~
ultimo, se almacenan los ficheros completamente depurados Iistos para some­ I} emplean en la elaboraci6n de datos estadfsticos, pasamos a analizar el proceso
terlos al programa de tabulaci6n. ~
de elaboraci6n de 10 que se llama en la Estadfstica Descriptiva distribuciones
15
. La tercera y Ultima etapa denominada esttmacien y descripcion de parame­ de frecuencias unidimensionales. Son unidimensionales porque s6lo observamos
tros poblacionales se compone de tres tareas fundamentales: analisis descriptivo una caracteristica (sus valores pueden representarse en el espacio de una
primario, estlmaeion de errores y analisis especiales multivariantes. dimensi6n) en los elementos de una poblaci6n (investigacion censal) 0 de una
Una vez que los datos estan depurados de todo tipo de inconsistencia se muestra (encuesta muestral). Existen dos tipos fundamentales de distribuciones
deben someter a un analisis descriptivo empleando los metodos de Estadistica de frecuencia: las de valores de la variable 0 datos no agrupados y las de datos
Descriptiva que se estudian en el presente capitulo y el siguiente. Para cada agrupados en intervalos de clases,

Anda mungkin juga menyukai