VISITA:
www.mitrabajoessocial.com
43
Nmero 44, (43-47), Mayo-Agosto 2009
Por tanto, no hay que perder de vista los fines como las condiciones del ejercicio profesional de
principales de la enseanza de la estadstica: este profesionista en cuanto a sus actividades re-
lacionadas con los usos de la estadstica.
Que los alumnos lleguen a comprender y a apre-
ciar el papel de la estadstica en la sociedad, Materiales y Mtodos
incluyendo sus diferentes campos de aplicacin
y el modo en que la estadstica ha contribuido a Se realiz un estudio de caso. Primeramente nos
su desarrollo, y; que los alumnos lleguen a com- centramos en el anlisis de los contextos y tareas
prender y a valorar el mtodo estadstico, esto que enmarcan las actividades estadsticas del
es, la clase de preguntas que un uso inteligente medio escolar. Se inici con un anlisis documen-
de la estadstica puede responder, las formas b- tal el cual consista en la revisin del Plan de Estu-
sicas de razonamiento estadstico, su potencia y dios y de los programas de 23 asignaturas en las
limitaciones. (Batanero, 2001). que la estadstica tiene un uso real o potencial
(currculum oficial). Para conocer la manera en
En concordancia con lo anterior, Moore (1997) que se instrumentan el Plan y los programas (cu-
y Wilks (2006) consideran que la enseanza de la rrculo real) y los usos que se dan a la estadstica
estadstica tiene que partir de actividades reales en el contexto de esta licenciatura, se realizaron
que permitan a los alumnos comprender los con- entrevistas a seis profesores del rea de Metodo-
ceptos y procedimientos de esta disciplina y que loga de la Investigacin y de Metodologa del
considere las variadas situaciones y contextos en Trabajo Social. Tambin se entrevistaron cinco
que los datos numricos adquieren su sentido en alumnas del 8 semestre que ya haban cursado
los campos particulares de cada profesional. todas las materias relativas a la estadstica y las
metodologas. Todas las entrevistas fueron graba-
En este trabajo se parte de la teora de la das. Para completar el diagnstico de la forma
matemtica en el contexto de la ciencia (Ca- en el que se ensea la estadstica en el marco
marena, 2004), que se fundamenta en tres pa- de las metodologas, se hizo una revisin de va-
radigmas: a) la matemtica es una herramienta rios documentos generados por las alumnas, ta-
de apoyo lo mismo que una materia formativa; les como apuntes y trabajos finales de los cursos
b) la matemtica tiene una funcin especfica metodolgicos.
en el nivel superior; c) los conocimientos nacen
integrados. Esta teora seala que es necesario En un segundo momento, se hizo el anlisis de
propiciar un aprendizaje contextualizado para los contextos y situaciones en donde se utiliza la
que sea significativo, duradero y que debe estadstica en las actividades propias del ejercicio
considerar los modelos matemticos que utiliza profesional. Para conocer esto, se entrevistaron a
efectivamente el profesionista y con los mismos diez trabajadores sociales que laboran en dife-
sistemas de representacin e instrumentos: rentes reas: educacin, salud, asistencia social,
seguridad pblica. De igual manera estas entre-
La matemtica en el contexto de las ciencias se vistas fueron grababas. A partir de la confronta-
encarga de que el alumno mire una matemti- cin de los entornos escolar y laboral, se identifi-
ca vinculada con sus intereses, sin aplicaciones can las semejanzas y las diferencias, los puntos de
artificiales, con la notacin que requerir en su contacto, as como elementos discordantes.
carrera de estudio, no rida, de tal forma que
logre conocimientos estructurados y no fraccio- Resultados
nados, que construya su propio conocimiento
con amarres firmes y duraderos y no voltiles y La formacin del Trabajador Social en la UAA
se encuentre motivado para que su desempeo El objetivo de esta carrera es formar profesionis-
acadmico se incremente, de tal forma que se tas del Trabajo Social, con un alto grado de sen-
le desarrollen habilidades para la transferencia sibilidad ante la problemtica social, preparados
del conocimiento (Camarena, 2004). cientficamente y con una gran actitud analtica.
Se espera que los egresados sean capaces de
El objetivo de la investigacin fue indagar las generar modelos de intervencin para la bs-
caractersticas y naturaleza de la enseanza de queda de soluciones a necesidades sociales en
la estadstica en la carrera de Trabajo Social en sus diferentes niveles: individual, grupal y comuni-
la Universidad Autnoma de Aguascalientes, as tario (UAA, 1999).
45
Nmero 44, (43-47), Mayo-Agosto 2009
Uno de los rasgos profesionales del Licencia- pero considerando los cursos de Metodologa y
do en Trabajo Social es su formacin como in- los talleres y prcticas, y no tanto por el curso de
vestigador social, entrenado para realizar diag- estadstica. El marcado nfasis algortmico que
nsticos sociales y con base en ellos, planear sus tiene el curso de estadstica 1, tiene como con-
acciones de intervencin. En el ciclo: secuencias que los aprendizajes significativos de
diagnstico planeacin intervencin conceptos y procedimientos estadsticos se dan
evaluacin, la estadstica puede llegar a tener un fuera de este curso, pues como sealan Batanero
papel preponderante, pero hasta ahora ha sido et.al. (1994), el conocimiento que los estudiantes
una herramienta ms bien marginal, como pudo tengan de las reglas de clculo de distintas medi-
constatarse con las entrevistas a los Trabajadores das estadsticas, como por ejemplo la media, no
Sociales en ejercicio. implica necesariamente una comprensin real
de los conceptos subyacentes.
Anlisis curricular de la Lic. en Trabajo Social
La conformacin del Plan de Estudio de la Lic. en En este sentido, encontramos que se cumple
Trabajo Social, en cuanto a la estadstica, tiene parcialmente con los criterios de contextualiza-
los siguientes componentes: cin sealados por Camarena (2004):
plementa y enriquece con informacin que el los Trabajadores Sociales y lo que stos necesitan
trabajador social observa y que no est definida en su ejercicio profesional, como por ejemplo:
en el instrumento. En esta fase, con frecuencia la a) Coincidencia de los mtodos y procedimien-
informacin cuantitativa queda subsumida a la tos enseados y utilizados en el campo laboral;
cualitativa, de manera similar a como los datos b) Los conceptos, procedimientos y sistemas de
numricos de un anlisis de laboratorio se inte- representacin estadstica ms utilizados en los
gran a la interpretacin de un caso patolgico cursos de metodologa y en los talleres y prc-
en el diagnstico mdico. ticas son los que efectivamente estn utilizan-
do los egresados, aunque en ambos casos son
Los diagnsticos comunitarios (comunidad muy elementales. Pero tambin encontramos
rural, colonia, etc.), se prestan al anlisis estadsti- varios desencuentros entre la formacin de este
co, pero tambin en stos predominan los acer- profesionista y su ejercicio laboral: a) El perfil de
camientos cualitativos, por una parte, debido investigador social est sobrevalorado en la uni-
a las tradiciones metodolgicas existentes en el versidad, mientras que en el campo laboral est
campo de la profesin, as como a las demandas subutilizado; b) Como en el campo laboral no se
laborales que les exigen tomar decisiones de ma- reconoce ni valora su papel como generador,
nera casi paralela al levantamiento de datos, he- procesador y analista de informacin, su desem-
cho que obliga a hacer interpretaciones holistas. peo estadstico es mnimo.
ANEXO
Elaboracin de bases de
datos en Excel.
REFERENCIAS
BATANERO, C., et al. Errors and difficulties in unders- GANI, J. The relevance of statistical training, Procee-
tanding elementary statistical concepts, International dings of the 1 ICOTS, Sheffield, 9-13 August, vol. 1, pp.
Journal of Mathematics Educational in Science and 50-68, 1982.
Technology, 25 (4), pp. 527-547, 1994.
MOORE, D.S. New Pedagogy and New Content: The
BATANERO, C. Didctica de la Estadstica, Granada, Case of Statistics, International Statistical Review, 65, 2,
Espaa: Universidad de Granada, 2001. pp. 123-165, 1997.
CAMARENA, P. La matemtica en el contexto de las STROUP, D. et al., Teaching Statistical Principles Using
ciencias, Acta Latinoamericana de Matemtica Edu- Epidemiology: Measuring the Health of Populations, The
cativa, Vol. 17, tomo I, pp. 57-61, 2004. American Statistician, February, vol. 58, no. 1, 2004.
CAMARENA, P. Desarrollo de competencias profesio- UAA, Plan de Estudios de la Lic. en Trabajo Social, Mxi-
nales del futuro ingeniero, en Memoria Electrnica del co: Centro de Ciencias Sociales y Humanidades de la
Cuarto Congreso Nacional y Tercero Internacional Re- Universidad Autnoma de Aguascalientes, 1999.
tos y Expectativas de la Universidad, Saltillo, Coahuila,
25 al 28 de febrero, 2004b. WILKS, S.S. Undergraduate Statistical Education, The
American Statistician, February, vol. 60, no. 1, pp. 39-
EUDAVE, D. El aprendizaje de la estadstica en estu- 45, 2006.
diantes universitarios de profesiones no matemticas,
en Educacin Matemtica, Vol. 19, nm. 2, pp. 41-66,
2007.
Fundamentos de Estadstica
para la
Toma de Decisiones en Investigacin Social
CONTENIDO
Pg.
Introduccin 3
Objetivo 6
Tpicos 7
Unidades de estudio
Glosario 55
Preguntas frecuentes 58
Obras de consulta 59
Anexos:
1. Tabla de dgitos aleatorios
2
2. Tabla de valores X
2
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
INTRODUCCIN
Ante esta disyuntiva debe considerarse el tipo de poblacin, objetivo de la investigacin y costo,
factor que implica tiempo, recursos materiales, humanos y financieros; as como el impacto o costo
social de la decisin que habr de tomarse y que en muchos de los casos es el que determina las
acciones a seguir.
Sin embargo, la naturaleza de las poblaciones puede simplificar el proceso, debido a que es posible
observar su forma real a partir de tomar corno referencia slo una parte de ella, lo que se referir
como muestra poblacional. Pero qu confianza puede tenerse al observar slo a una parte de la
poblacin y a partir de ella, emitir afirmaciones en relacin con las caractersticas y diversos aspectos
y condiciones en que se encuentra el universo en estudio. Cuntos elementos deben ser observados
para ese propsito, de tal manera que posean la credibilidad necesaria para tomar las medidas
conducentes al respecto.
La respuesta a esas preguntas es simple, ya que para estar cierto de 'las condiciones en que se
encuentran los elementos de una poblacin, slo bastar con observar detalladamente una parte de
ella y se llegar a la conclusin de que todos los individuos que la conforman tienen caractersticas
y actitudes comunes o similares, entre otras, que permiten su generalizacin a un menor costo; por
supuesto que la observacin detallada referida implica un proceso metodolgico a seguir, lo que
garantiza la efectividad de los resultados de la investigacin.
3
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Por tal virtud, se requiere que el investigador social posea un amplio dominio de la metodologa para
el diseo de muestras, donde cada una de las etapas que lo conforman resulta ser la ms importante
al momento de su aplicacin. Soslayar este requisito es contribuir a que los investigadores recurran a
diversas instancias para tal propsito, mismas que normalmente carecen del involucramiento
necesario para lograr la efectividad de la investigacin.
Como se ha sealado, cada una de las etapas del diseo de muestras es la ms importante al
momento en que se utiliza; sin embargo, la muestra no lo es todo en la investigacin, pero s las
bases que la sustentan; por lo que no hay que perder de vista que una vez recogida la muestra le
habrn de seguir un conjunto de mtodos, tcnicas, procedimientos para la obtencin de la
informacin requerida por la investigacin. Surgir una variedad de supuestos que tratarn de
explicar el por qu del comportamiento de las variables analizando la relacin entre ellas, conociendo
sus rasgos importantes, su magnitud y diversos aspectos de inters tanto para la investigacin como
para el mismo investigador.
El contenido de este material le ofrecer al lector diversos criterios que en la prctica profesional se
emplean para el tratamiento y anlisis estadstico de conjuntos de datos, considerando sobre todo
que el profesional medio de las ciencias sociales no est plenamente identificado o familiarizado con
los mtodos estadsticos; por lo que se procura utilizar un lenguaje sencillo y simple que, sin
deterioro de la calidad del contenido, permita la fcil comprensin de conceptos, trminos y la
realizacin de los ejercicios y casos prcticos que se incluyen, partiendo del supuesto de que se
tienen comprendidos los conceptos y uso de la metodologa de la estadstica descriptiva.
Asimismo, posteriormente al proceso del diseo de la muestra, los datos sern analizados a travs
de la utilizacin de pruebas para la contrastacin de hiptesis, mediciones estadsticas, pruebas de
correlacin entre todo tipo de variables.
4
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Las pruebas a realizar en este material, sern de correlacin y de independencia entre variables,
principalmente; considerando que en ciencias sociales, un gran nmero de investigadores utilizan
variables con respuestas mutuamente excluyentes como "SI" y "NO", "estoy de acuerdo" y "no estoy
de acuerdo" cuyas tendencias o comportamiento requieren de explicacin estadstica.
Bsicamente y por considerarse de inters para el autor, el contenido del presente est dividido en el
proceso para el diseo de muestras, planteamiento y diseo de pruebas de hiptesis y la realizacin
de pruebas estadsticas.
5
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
OBJETIVO GENERAL
Conocer y aplicar la metodologa para el diseo ptimo de muestras en una investigacin social, as
como la estructuracin de hiptesis estadsticas y su contrastacin.
PERFIL DE EGRESO
Asimismo, adquirir las aptitudes que le permitirn utilizar con efectividad los recursos estadsticos
para la generacin de informacin y la toma de decisiones en el contexto social principalmente.
6
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
TPICOS
I.2.3.2 Intencional.
I.2.3.4 Discrecional
I.2.4.3 Variabilidad.
II HIPTESIS ESTADSTICAS
7
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
III.1. Conceptos.
8
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
UNIDAD 1
INTRODUCCIN
En esta unidad se presenta la metodologa recomendada a seguir por los interesados en que sus
investigaciones sean soportadas por un diseo ptimo de la muestra.
OBJETIVO
Conocer las etapas del proceso para el diseo ptimo de muestras, considerando forma y modo de la
seleccin.
El objetivo de este material es que usted conozca de manera sencilla y prctica las aplicaciones de
los mtodos, tcnicas y pruebas estadsticas utilizadas en una investigacin social, recordndole que
lo fcil se hace difcil por nosotros mismos, esto es sencillo.
9
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Si algn elemento del conjunto no contiene todas las caractersticas referidas, entonces no formar
parte de l. Ejemplo: si alguna mujer trabajadora en esa industria no pertenece al turno matutino no
formar parte del conjunto especificado.
Poblacin finita: Es aquel conjunto en el que el nmero de sus elementos est definido o
determinado.
Ejemplo: los empleados que recibieron crdito hipotecario el mes pasado.
Muestra: Fraccin o parte de la poblacin. sta debe ser representativa del conjunto de
donde ha sido extrada. Para ostentar el carcter de representatividad, la muestra
deber evidenciar tanto las coincidencias como las discrepancias existentes en la
poblacin.
Estimador: Tambin llamado estadstico, es todo valor o caracterstica que ha sido calculado,
observado o extrado de una muestra. El propsito del estimador es dar a conocer los
parmetros sin observar a la totalidad de los elementos de la poblacin.
Hacer estimaciones refiere que el investigador parte de conocer los resultados obtenidos de una
muestra y referirlos confiablemente como los valores o caractersticas que posee la poblacin. La
estimacin es la obtencin de un valor o caracterstica de la poblacin, teniendo como origen una
10
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
muestra. En el caso de las variables numricas, la estimacin puede ser puntual o por intervalos.
Puntual es cuando se obtiene un slo valor y por intervalos, cuando se conoce un rango en el cual se
desplaza el parmetro o valor poblacional.
A partir del proceso del diseo de muestras, se pretende extender las conclusiones obtenidas a la
totalidad de los elementos de la poblacin, de all la importancia y trascendencia de la metodologa
para la obtencin de una muestra.
La experiencia indica que una proporcin significativa de los profesionales en ciencias sociales
manifiesta cierta aversin por todo aquello relacionado con nmeros, ya no se diga con matemticas,
como es el caso de la estadstica y su amplia gama de recursos; sin embargo, resulta paradjico
saber que para aplicar la estadstica en las disciplinas sociales se requiere de ingredientes tan
naturales en el ser humano como el sentido comn y la intuicin, as como no perder de vista que
las tcnicas y los mtodos son importantes, pero no determinantes, explicar por qu.
Cuando se posee ese atributo que confiere a una persona la habilidad para analizar, la dificultad para
el entendimiento, comprensin y operacionalizacin de la metodologa estadstica, se reduce
notablemente, dando oportunidad para una mayor dedicacin al anlisis de las variables incidentes
en el fenmeno estudiado y reduciendo consecuentemente el tiempo de operacin, lo que
garantizar informacin ms oportuna y mejores decisiones.
Por tal virtud, debe enfatizarse en la importancia que el proceso de diseo de muestras tiene en el
desarrollo de estudios e investigaciones y consistente en tres etapas que ofrecen respuesta a las
preguntas cmo? quin? cuntos? Es oportuno subrayar, que este proceso es ms efectivo y
garantiza mejores resultados, cuando es aplicable a poblaciones finitas.
11
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Consiste en determinar cmo sern seleccionados los elementos que habrn de integrar la muestra y
se clasifica en muestreo con reemplazo y sin reemplazo. El primero indica que los elementos de la
poblacin pueden pertenecer ms de una vez a la muestra; quiere decir que si un individuo ya fue
seleccionado, se le extraen los datos requeridos por la investigacin y se integra nuevamente a su
universo sin perder la oportunidad de volver a ser seleccionado para su estudio en la misma muestra.
Por su parte, el muestreo sin reemplazo indica que si un elemento de la poblacin ha sido extrado
para la muestra, no volver a tener la oportunidad de pertenecer nuevamente a ella.
La etapa para determinar el tipo de muestreo a utilizar en una investigacin o estudio reviste singular
importancia, debido a que es a travs de este procedimiento que se determina quin pasar a formar
parte de la muestra, de tal manera que conserve la forma de su poblacin, segn lo comentado en
prrafos anteriores.
12
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Muestreo sistemtico.
Muestreo estratificado.
Muestreo polietpico.
Se caracteriza porque es aquel en el que todos los elementos de la poblacin tienen la misma
probabilidad de ser seleccionados para la muestra. Para la seleccin se sugiere observar, que la
poblacin sea finita y que cada uno de sus elementos estn identificados, habitualmente por un
nmero.
Finalmente se requiere disponer de algn instrumento que facilite la seleccin, como puede ser una
calculadora cientfica, una computadora o una tabla de dgitos aleatorios, como la que se presenta en
el anexo 1.
Realizar una seleccin aleatoria resulta imprctica, a pesar del uso de la calculadora o la
computadora misma, en la medida en que la poblacin sea muy grande.
13
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
An formando parte del muestreo probabilstico, la oportunidad de que los elementos de la poblacin
tengan la misma probabilidad de ser seleccionados resulta relativa debido a que una vez
seleccionado el primer elemento para la muestra, podra decirse que automticamente ya se conoce
quines son los elementos que estarn en la muestra.
Este tipo de muestreo consiste en dividir el tamao de la poblacin entre el tamao de la muestra, lo
que significa que la poblacin es dividida en tantas partes como el tamao de la muestra sea y de
cada una de esas partes se extraer un elemento que habr de integrar a la muestra.
Por ejemplo, si se tiene una poblacin de 500 elementos y se determin seleccionar a 50 de ellos
para obtener el tamao de la muestra, se divide 500 entre 50, dando como resultado k=10, lo que
indica que la poblacin ha sido fragmentada en 50 partes y de cada una de ellas se tomar un
elemento para la muestra, con lo que al final se tendr el total de los elementos requeridos para el
anlisis muestral.
Una vez identificados los 50 grupos de 10 elementos cada de uno de ellos, segn el ejemplo; se
extrae aleatoriamente del primero de los grupos formados un elemento para la muestra. Su pngase
que los elementos estn identificados con la numeracin del 1 al 500, por lo tanto el primero de esos
grupos incluye a los elementos enumerados del 1 al 50, el segundo incluir a aquellos cuyo nmeros
estn del 51 al 100, el tercero del 101 al 150 y as sucesivamente hasta el grupo 50 que contiene a
los elementos identificados del 451 al 500. Para la primera seleccin se toma alguno de los
instrumentos sealados anteriormente y se busca un nmero entre 1 y 50, rango del primer grupo.
Supngase que el primer nmero que aparece en la calculadora o en la tabla de dgitos aleatorios es
el 25, lo que indica que el primer elemento de la muestra ser el 25, se encuentra en el primer grupo,
y a partir de l cuntense 50 elementos y extrigase el segundo, en este caso ser el 75; despus de
ste cuente otros 50 y seleccione al siguiente, ser entonces el 125, y as sucesivamente.
Este tipo de muestreo tiene la ventaja de garantizar la forma de la poblacin, ya que recorre todos los
sectores de la misma, esto es, observa desde el primero hasta el ltimo.
La desventaja en este tipo de muestreo, est en los casos en que se dan periodicidades en la
14
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
distribucin de la poblacin, ya que al elegir a los miembros de la muestra con una periodicidad
constante (k) se puede introducir una homogeneidad que no se da en la poblacin. Supngase que
se est seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son
varones y los 5 ltimos mujeres, si se utiliza el muestreo aleatorio sistemtico con k=10 siempre
sern seleccionaramos o slo hombres o slo mujeres, no podra haber una representacin de los
dos sexos.
Este tipo de muestreo tiene la ventaja de que permite establecer controles cualitativos para
garantizar la representatividad, por lo menos en forma, proporcional de la muestra segn la
distribucin poblacional.
Cuando una poblacin presenta tanto detalle de heterogeneidad en sus sectores o estratos que la
conforman, es recomendable pasar a un segundo plano o hasta el que sea necesario de clasificacin
o estratificacin y al final realizar la seleccin aleatoria o sistemtica, con las recomendaciones
anteriores.
Ejemplo: Se desea extraer una muestra cuyo inters radica en observar a los empleados de una
compaa considerando la divisin a la que pertenece, su gnero, categora y turno de trabajo, luego
15
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
entonces se recomienda estratificar primeramente por divisin y dentro de cada divisin hacerlo por
gnero; a partir de esta ltima variable estratificar por categora y en ella por turno. En este ltimo
nivel de estratificacin, se har la seleccin aleatoria o sistemtica, con la intencin de garantizar la
representatividad proporcional de la muestra, ya que sta ofrece mejores condiciones para el
anlisis.
Como puede deducirse, este tipo de muestreo aparenta ser complicado; sin embargo, ofrece grandes
ventajas cuando se dispone de un mayor tiempo y sobre todo si la poblacin evidencia distintos
niveles de heterogeneidad o cuando se requiere observar con mayor detalle la distribucin
poblacional.
Se realiza generalmente sobre la base del conocimiento, a veces parcial, de los estratos de la
poblacin o de los individuos ms representativos o para los fines de la investigacin. Tiene
semejanza con el muestreo aleatorio estratificado, pero sin el carcter de aleatoriedad de aqul.
En este tipo de muestreo se fijan cuotas que consisten en un nmero de individuos que renen
determinadas condiciones, por ejemplo: 20 individuos de 15 a 20 aos, de sexo femenino que
estudien en escuela pblica. Una vez determinada la cuota se eligen los primeros en la poblacin
que se encuentren y que cumplan esas caractersticas. Este mtodo se utiliza mucho en las
encuestas de opinin.
16
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Consiste en que el investigador selecciona directa e intencional mente los individuos de la poblacin.
El caso ms frecuente de este procedimiento es el utilizar como muestra los individuos a los que se
tiene fcil acceso, por ejemplo, las personas que se encuentran descansando en un parque o
esperando en la fila del supermercado.
A criterio del investigador los elementos son seleccionados si cree que pueden aportar datos o
informacin al estudio, recurdense las entrevistas de los reporteros de televisin.
Hasta este momento, el lector se habr dado cuenta del detalle que implica disear muestras para
una investigacin. No obstante, ese detalle es superado cuando existe involucramiento en el rea de
oportunidad en estudio, as como el conocimiento de lo que se pretende realizar y el objetivo a
alcanzar. Ciertamente, las etapas abordadas anteriormente ofrecen al investigador las herramientas,
sugiriendo la aplicacin de diversos criterios, para la seleccin de los individuos que formarn parte
de la muestra; sin embargo, la importancia de esas etapas se minimiza sin la consideracin del
nmero de sujetos que habrn de ser observados, de all que surge una etapa ms para el diseo de
la muestra: la determinacin de su tamao.
Tambin la experiencia indica la arbitrariedad con la que se fija el nmero de elementos que
formarn parte de la muestra. Se escucha por los pasillos de las reas de investigacin, por las
comunidades e incluso por las oficinas de empresas dedicadas a la investigacin de mercados,
17
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
encuestas y estudios de opinin, que deber tomarse el 10% el 20%, por citar algunos, como
tamao de muestra; cifras que pueden estar sustentadas en muchos aos o proyectos de
experiencia, soslayando que cada proyecto, estudio, poblacin, universo y muestra son diferentes en
tiempo, fondo y forma; por lo que deben ser tratados de manera diferente ya que no aplican reglas
generales para ello.
Antes de determinar el tamao de una muestra, se recomienda considerar el principio del Teorema
de Gorco: Si la poblacin es grande, naturalmente la muestra tiende a ser relativamente pequea; y
si la poblacin es pequea, entonces la tendencia de la muestra es a ser proporcionalmente grande.
A partir de este criterio de observacin, se presentan los tres elementos bsicos para la
determinacin del tamao de una muestra en la investigacin social, tanto para poblaciones finitas
como para poblaciones infinitas.
Esos tres elementos son el nivel de confianza, el margen de error y la dispersin en la poblacin,
considerada por diversos autores como la variabilidad o varianza. Se refiere como dispersin en la
poblacin considerando que en la investigacin social, principalmente inciden o se presentan
fenmenos de carcter cualitativo donde se aprecia la proporcin o porcentaje de elementos que
poseen las caractersticas o se ven inmersos en los aspectos principales de la investigacin.
Para el clculo del tamao de una muestra deber considerarse el tipo de poblacin de donde ser
extrada, y as seguir alguna de las siguientes frmulas bsicas:
p q z2
Para poblacin infinita n: ------------------------- ( Frmula 1 )
2
E
N p q z2
Para poblacin finita n: -------------------------------------- ( Frmula 2 )
E 2( N - 1 ) + p q z 2
18
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
N Tamao de la poblacin.
De manera sencilla, se desea determinar cuntos de cada 100 elementos que se tomen como
muestra, debern poseer las caractersticas de la poblacin. En otros trminos es la probabilidad de
que la estimacin efectuada se acerque a la realidad. Obviando el detalle de acceso a la tabla de
reas bajo la curva normal, en la cual se obtienen los coeficientes que representan el nivel de
confianza en el clculo del tamao de la muestra y considerando que comnmente en ciencias
sociales los niveles mayormente utilizados son del 90%, 95% Y 99%, stos son Z=1.64, Z=1.96 y
Z=2.57 respectivamente. Ms adelante se aplicarn en un ejemplo.
Tambin llamado error muestral o nivel de precisin, es la diferencia mxima que el investigador est
dispuesto a aceptar entre un estadstico y su parmetro. En una investigacin siempre se considera
la omisin de errores en el proceso, pero la naturaleza de la investigacin indicar hasta qu grado
es posible su presencia y su tolerancia. Un estadstico ser ms preciso en la medida que su error
sea ms pequeo o su precisin sea mayor.
Antes de iniciar una investigacin, el equipo de proyecto deber tener claro qu tipo de poblacin
estudiar, qu caractersticas sobresalen, cul es la variable principal u objeto de estudio, y otros
aspectos que son determinantes para el involucramiento en el tema y consecuentemente para
realizar diagnsticos y anlisis con mayor confiabilidad y credibilidad.
19
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Un factor importante para determinar el tamao de una muestra es conocer cmo se encuentra
distribuida la poblacin en relacin con la variable principal de la investigacin. Este factor puede ser
observado en trminos relativos o porcentuales y aplicarse de cualquier manera en la frmula para
su clculo, siempre y cuando se aplique en el mismo sentido: relativo o porcentual: siempre
proporciones o siempre porcentajes. Si la caracterstica principal del estudio la posee el 70% de la
poblacin, a este valor le llamaremos variabilidad o dispersin en la poblacin, y al porcentaje de
sujetos que no tienen esa caracterstica 30%, la identificaremos como el complemento a la
variabilidad, identificados como p y q respectivamente. Ambos tienen que sumar 100%.
( 500 ) ( 70 ) ( 30 ) ( 1.64 ) 2
n :: --------------------------------------------------
( 8 ) 2 ( 500 - 1 ) + ( 70 ) ( 30 ) ( 1.64 ) 2
n = 75
20
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Ejemplo 2. Para realizar una encuesta telefnica de opinin entre jvenes mayores de 18 aos en la
Ciudad de Mxico, se requiere una muestra con el 95% de confianza, un margen de error muestral
del 5% y dadas las caractersticas de la poblacin, considerada para este caso como infinita, se
tomar la mxima variabilidad.
Bajo el mismo principio de asignacin de valores que en el ejemplo 1, al sustituir los datos en la
frmula 1 y realizar las operaciones correspondientes, deber tomarse una muestra de:
( 1.96 ) 2 ( 50 ) ( 50 )
n = ------------------------------------
15
n = 384
21
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Actividades:
1. Para confirmar los criterios que se indican respecto a la presencia de poblaciones grandes con
tendencia de muestras pequeas y de poblaciones pequeas con muestras grandes; calcule 5
muestras con el 95% de confianza, 5% de margen de error y variabilidad del 80%, para las siguientes
poblaciones: N1 = 15000, N2 = 10000, N3 = 5000, N4= 1000 Y N5 = 350
Compare el porcentaje de elementos que debern tomarse como muestra, en cada caso, respecto al
tamao de su poblacin.
Ejercicio de aplicacin
Los datos que se presentan a continuacin, corresponden a la evaluacin del desempeo anual de
un grupo de 320 trabajadores de la industria de la panadera. Ese puntaje se obtuvo a travs de
aplicar un instrumento para conocer la opinin de jefes inmediatos, subordinados, compaeros en
lnea y autoevaluacin de cada uno de los trabajadores.
Por razones de tiempo, se decide disear una muestra de la tabla de resultados de la evaluacin del
desempeo de los trabajadores y presentar el informe correspondiente a ambas instancias.
Para ello, se le solicita a usted como consultor en investigacin y desarrollo, determinar el tamao de
la muestra que ser analizada y seleccionarla sistemticamente.
Los datos de los trabajadores son los siguientes y los identificaremos como sigue:
Cada lnea contiene 10 datos, cada uno de ellos es el puntaje obtenido por un trabajador, significa
que tenemos 10 trabajadores por rengln de la tabla. La primera lnea contiene a los trabajadores
22
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
cuyo nmero de identificacin es, por favor vea la siguiente tabla, 1 ( 60) y 10 el ltimo ( 98 ). La
segunda lnea contiene a los trabajadores identificados con los nmeros del 11 ( 90 ) al 20 ( 74 ) y as
sucesivamente hasta el trabajador con el nmero de identificacin 320, cuyo puntaje es 100.
Tabla 1
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 93 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
23
Se requiere que la muestra ofrezca el 95% de confianza ( Z = 1.96 ) con un margen de error del 7%
(E = 7). Observaciones de aos anteriores indican que el 80% de los trabajadores son categorizados
como de alto desempeo, por lo tanto tomaremos la variabilidad del 80% ( P = 80 ) Y su
complemento de 20% ( q = 20 ).
( 320 ) ( 80 ) ( 20 ) ( 1.96 ) 2
n = ------------------------------------------------------- = 90
( 7 ) 2 ( 320 - 1 ) + ( 80 ) ( 20 ) ( 1 .96 ) 2
Esto significa que el primer elemento de la muestra ser extrado aleatoriamente de los primeros
cuatro de la poblacin. Para seleccionar el segundo, contaremos cuatro elementos y el cuarto ser el
que debe ser extrado y as sucesivamente de cuatro en cuatro hasta recorrer toda la poblacin o
conjunto de trabajadores, en este ejemplo.
Al utilizar la tabla de dgitos aleatorios del anexo 1, observamos que el primer dgito que aparece
entre 1 y cuatro es precisamente el 4. Observe los datos de la tabla 1 del ejercicio y el cuarto
trabajador tiene una evaluacin de 95 puntos. A partir de ste, cada cuatro seleccionar al siguiente
para la muestra, hasta el final del conjunto.
En la siguiente tabla se han marcado los elementos que forman parte de la muestra y debern ser
analizados para el informe que se presentar a la empresa y al sindicato conjuntamente.
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Tabla 2
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
93 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
Los datos marcados con color, son los correspondientes a la muestra seleccionada
sistemticamente. Debido a que se redonde de 3.55 a 4, el total de datos de la muestra fue
finalmente 63. La diferencia es llamada error de redondeo por muestreo sistemtico.
25
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Actividad adicional
Con los datos de la muestra, elabore una tabla de distribucin de frecuencias en 6 intervalos de
clase. Dibuje su histograma y calcule la media, desviacin estndar, sesgo y curtosis. Interprete los
resultados y presente el informe requerido. Si es necesario, calcule algunos percentiles que apoyen
su exposicin.
En resumen, esta unidad le ha proporcionado los elementos necesarios para el diseo de muestras,
recordando que cada etapa es igualmente importante. Al calcular el tamao de la muestra, deber
procederse a su seleccin de acuerdo al mtodo y tipo determinado por el investigador.
Posteriormente habr que realizarse el procedimiento para la organizacin de los datos, realizacin
de pruebas estadsticas y todo aquello relacionado con los objetivos de la investigacin.
ACTIVIDADES DE APRENDIZAJE
1. Diga cules son y explique en que consiste cada una de las etapas para el diseo de muestras.
4. Distinga entre Parmetro y estimador y cite ejemplos de estudios para los cuales sea factible
trabajar con la poblacin o con muestras. Explquese.
6. Qu opina usted sobre cul debe ser el tamao ptimo de una muestra?
26
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Ejercicio:
Disee la muestra ptima que permita conocer las preferencias de las personas mayores de 18 aos
de la Ciudad de Mxico, por los programas nutricionales y sus condiciones de salud. El estudio
formal considerar, entre otros, hbitos alimenticios, frecuencia de ejercicio, calidad de vida,
enfermedades frecuentes y gasto mensual.
AUTO EVALUACIN
27
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
UNIDAD 2
HIPTESIS ESTADSTICAS
INTRODUCCIN
La investigacin social parte de suposiciones adoptadas para explicar hechos a travs de la relacin
entre variables. Para su tratamiento, esos supuestos son traducidos a trminos estadsticos y
sometidos a pruebas de validez, por lo que el investigador deber identificar claramente el tipo de
variables en estudio, as como la relacin que guardan entre s.
Esta unidad presenta la metodologa para el diseo y contrastacin de hiptesis, as como los errores
que pueden cometerse al tomar una decisin estadstica y las condiciones en que stas debern
tomarse.
OBJETIVO
28
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Ejemplo: La causa principal del desempleo en Mxico se debe a la mala suerte de los mexicanos.
Esta afirmacin ciertamente es un supuesto que puede ser verdadero o no; sin embargo, no es
posible medir el concepto mala suerte, por lo que esta hiptesis carece de comprobacin cientfica.
Es aquella que plantea el investigador o la investigacin como objeto o base de su anlisis y estudio;
trata de dar una explicacin tentativa al fenmeno que se est investigando. Esta es la hiptesis que
el investigador tratar de aceptar como resultado de su investigacin, rechazando la hiptesis nula, la
cual se comentar en otro apartado.
Ejemplo: La causa principal del desempleo en Mxico se debe principalmente a la reduccin de las
exportaciones, lo que ha provocado el cierre de fuentes de trabajo.
En este segundo caso, s es posible medir la relacin entre la reduccin de las exportaciones y cierre
de fuentes de trabajo con las tasas del desempleo y con fundamento en los resultados llegar a la
conclusin de validar o no la hiptesis mencionada.
Es un proceso estadstico que permite elegir una hiptesis de trabajo entre dos posibles y contraria
una a la otra. El contraste inicia con la formulacin de dos hiptesis sobre el valor de algn parmetro
o caracterstica poblacional, siendo ambas contradictorias, si una de ellas es verdadera por
consecuencia la otra no lo ser.
29
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
El contraste de hiptesis puede ser bilateral o unilateral, ser bilateral cuando la hiptesis est
planteada o diseada en trminos de igualdad o desigualdad entre variables. Ejemplo: La
productividad de los trabajadores est influida por la asistencia a programas de capacitacin.
Si dos valores no son iguales, al ser diferentes podr darse el caso de que uno sea mayor o menor
que el otro, surgiendo aqu el concepto de hiptesis unilateral.
En este caso la hiptesis slo podr ser rechazada si el salario de los titulados no es mayor que los
que no poseen el nivel licenciatura.
Al observar la seleccin del personal, la hiptesis slo ser rechazada si algn aspirante es
seleccionado con menos de 20 aos o mayor a los 25 aos de edad.
Para realizar el contraste de hiptesis se supone cierta una de ellas, llamada hiptesis nula Ho, la
cual es formulada por el investigador con el propsito de ser rechazada, este enfoque resulta en
30
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
ocasiones incomprensible, ya que se cuestiona cmo es posible que se plantee algo que pretende
rechazarse?
Con el siguiente ejemplo se explicar: La industria electrnica japonesa somete sus aparatos a
estrictas pruebas para el control de calidad. De un lote de DVD's seleccionan una muestra aleatoria y
las introducen en cmaras de prueba para someterlas al tratamiento promedio que les da el usuario,
como usted y yo; esto es, se exponen a cadas, temperatura, calor y derrame de lquidos. Al finalizar
la prueba se encienden todos los DVD's que fueron sometidos a control y si falla por lo menos uno de
ellos, todo el lote es destruido, no slo los que participaron en la prueba; de all la alta calidad de los
productos japoneses. Entendemos ahora a los investigadores?
Para entenderlos mejor, le dir que la hiptesis nula se plantea contraria a la hiptesis de trabajo y se
formula en trminos estadsticos.
Por su parte, la hiptesis alternativa se opone a la hiptesis nula y est en relacin directa con el
planteamiento de la hiptesis de trabajo, esto es, tienen el mismo sentido aunque planteada la
primera en trminos estadsticos y la ltima en el lenguaje de la investigacin.
Hiptesis de trabajo: "Asisten a los programas de capacitacin hasta el 30% de los trabajadores de la
empresa"
31
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Ntese que la formulacin de la hiptesis alternativa indica lo mismo que la hiptesis de trabajo y
ambas se oponen a la hiptesis nula. La prueba de hiptesis se realiza con el planteamiento de la
hiptesis nula ( Ho ), lo que significa que la que se acepta o no se acepta es sta. Si Ho no es
aceptada, el investigador asume que no se tiene evidencia suficiente para aceptarla, confirmando por
consecuencia su hiptesis de trabajo.
Error Tipo I: Es aquel cuando en la decisin se rechaza la Hiptesis Nula ( Ho ) siendo sta
verdadera.
Error Tipo II: Es aquel cuando en la decisin se acepta la Hiptesis Nula ( Ho ) siendo sta
no verdadera.
Pero realmente qu importancia puede tener el saber si se tom una decisin equivocada o no? La
importancia se sostiene en la trascendencia que puede tener para la investigacin o proyecto el
saber que la explicacin de los fenmenos hecha por el estudio, no corresponde a las causas reales
de la relacin entre las variables analizadas, lo que consecuentemente provocara decisiones
organizacionales irreales. Sin embargo, el saber que las decisiones estadsticas estn soportadas
por altos niveles de certidumbre en el anlisis de la relacin causa-efecto entres sus variables,
obviamente que conducir a tomar mejores y ms oportunas decisiones.
32
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Ejemplo: Ho : Q = O
H1 : Q 0
33
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Los datos de la muestra son sustituidos en la frmula aritmtica del paso 3 para
Siguiendo con el ejemplo y con el resultado obtenido en el paso 4, se llega a la conclusin de que
con los datos de la muestra se observa evidencia de que el desempeo de los trabajadores no es un
factor determinado por el rendimiento en los programas de capacitacin.
34
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
ACTIVIDADES DE APRENDIZAJE.
Ejercicio:
Los datos de la siguiente tabla corresponden a una muestra aleatoria de 60 personas poseedoras de
la cultura del ahorro.
Con la finalidad de crear un programa de intervencin dirigido a fomentar el hbito del ahorro que
permita a los trabajadores la manutencin de sus familias durante un plazo mximo de 12 meses, en
caso de que pierdan su empleo, se desea probar la validez del siguiente supuesto:
"La cantidad de dinero que ahorran los trabajadores est determinada por el salario"
35
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Tabla 3
AUTOEVALUACIN
Qu es la regla de decisin?
Qu es la hiptesis nula?
36
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
UNIDAD 3
INTRODUCCIN
Por medio de las pruebas estadsticas para la comprobacin de hiptesis se pretende encontrar la
relacin causal entre las variables, as como su fuerza, magnitud y sentido.
Las pruebas estadsticas ofrecen evidencias para determinar la fuerza de la relacin. Para ello se
considera el tipo de variables por nivel de medicin en virtud de que existen pruebas especficas para
cada uno de ellos.
OBJETIVO
En este apartado se incluyen las pruebas estadsticas bsicas para la comprobacin de hiptesis de
relacin entre variables, las que permitirn argumentar, a partir de los datos observados, cul es la
magnitud de la fuerza de asociacin que presentan las variables en estudio. Estas pruebas indicarn,
37
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
segn sea el caso, si dos variables mantienen la relacin de dependencia y en qu magnitud, para
que el investigador tenga elementos para llegar a conclusiones que le permitirn orientar la toma de
decisiones.
III.1 CONCEPTOS
Es menester que el lector se involucre con los trminos que se presentan a lo largo de las siguientes
lneas, sugirindole asistirse por otras fuentes para finalmente formarse el mejor concepto de los
elementos empleados en el proceso para la comprobacin o contrastacin de hiptesis estadsticas.
Frecuencias conjuntas: Es la frecuencia absoluta que se observa en cada celda de una tabla de
contingencia.
Frecuencias observadas: Para el anlisis de relacin entre dos variables, la frecuencia observada
es el nmero de casos que, a partir de los datos en estudio, forman parte de la interseccin entre. un
rengln y una columna en una tabla de contingencia.
38
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Frecuencias esperadas: Para el anlisis de relacin entre dos variables, la frecuencia esperada
es el nmero de casos que de acuerdo a la distribucin marginal, la tabla de contingencia espera en
cada celda para evidenciar la independencia entre variables.
En ciencias sociales es frecuente que el investigador disee sus instrumentos para la recoleccin de
datos, considerando slo dos caractersticas de las variables como: "SI" y "NO", "De Acuerdo" y "En
desacuerdo", "Hombre" y "Mujer". Este tipo de respuestas es el factor ms elemental de estudio; sin
embargo, no por elemental carece de importancia; ya que existen diversas pruebas estadsticas que
permiten encontrar las evidencias que justifican el comportamiento de dos variables. Recuerde que
las variables en ciencias sociales son medidas en diversas escalas o niveles, segn su naturaleza.
La prueba Q de Kendall (Rojas Soriano) tambin conocida como la Q de Yule, permite medir la
correlacin entre dos variables nominales con dos categoras cada una de ellas (Rojas Soriano), como
el sexo: "Masculino" y "Femenino", o como las respuestas a la pregunta de Se encuentra satisfecho
con los programas de capacitacin de su empresa? Cuyas respuestas son: "Si" y NO. Es una
prueba sencilla, muchos investigadores y especialistas la consideran como dbil y sin importancia;
claro que existen pruebas estadsticas de mayor complejidad para variables nominales; sin embargo,
es un indicador que permite, con un nivel alto de confianza, observar el comportamiento entre ese
tipo de variables, ofreciendo elementos sobre la fuerza en que estn interactuando.
Con esta prueba se obtiene el coeficiente Q, el cual parte de la observacin de las frecuencias
observadas conjuntas entre dos variables nominales de dos categoras. El coeficiente Q tiene un
rango de variacin de cero a uno, en valor absoluto. Los valores extremos que se pueden obtener al
realizar el clculo correspondiente indican lo siguiente: si el coeficiente es igual a cero, significa que
entre las dos variables en estudio, no existe relacin alguna. Si el coeficiente es igual a uno,
entonces se concluye que las variables se encuentran totalmente relacionadas entre s, lo que
significa que una depende totalmente de la otra. No obstante, en la prctica y sobre todo en ciencias
1
Rojas Soriano, Gua para realizar investigaciones sociales; UNAM; 1980
39
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Ejemplo: En una organizacin se pretende conocer el impacto que ha tenido el rendimiento de los
empleados en los programas de capacitacin con su desempeo en el trabajo. La variable
rendimiento est clasificada en "Rendimiento eficaz" y "Rendimiento ineficaz". El desempeo en el
trabajo est medido como "Buen desempeo" y "No buen desempeo". Supngase que al realizar
los clculos del coeficiente Q de Kendall tenemos un valor de Q = 0.7 lo que indica que las variables
nos estn totalmente relacionadas, pero s existe cierta dependencia entre ellas. La conclusin en
este caso es que el grado de asociacin alcanza el 70% de los casos observados, lo que en otras
palabras refiere que el desempeo en el trabajo mantiene relacin del 70% con el rendimiento en los
programas de capacitacin.
AD - BC
Q = -------------------------- ( Frmula 3 )
AD + BC
Variable 1
Categora 1 Categora 2
Categora 1
A B
Variable 2 Tabla 4
Categora 2 C D
40
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Ejemplo: con los datos de la siguiente tabla, se requiere probar la hiptesis nula de que la afectividad
de los trabajadores no influye en la relacin con sus compaeros de trabajo.
S No
Buena
23 15
Cmo considera la relacin
Con sus compaeros de
Tabla 5
trabajo?
Mala
18 25
Hiptesis estadstica:
Ho : Q = 0
H1 : Q 0
Interprete a Q = O como la inexistencia de relacin entre las variables analizadas, lo que significa
que se desea probar que la afectividad de los trabajadores es independiente de las relaciones en el
trabajo.
Esto significa que el criterio empleado para determinar si la afectividad influye en las relaciones en el
trabajo, es que por lo menos en el 80% de los datos observados se confirme el supuesto del
investigador, esto es, que no sea aceptada la hiptesis nula. Recuerde que la intencin de plantear la
41
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Al calcular el coeficiente Q con los datos de la tabla encontramos que su valor es Q = 0.36 y al
compararlo en la regla planteada nos lleva a la tomar la decisin estadstica correspondiente:
Conclusin: Los datos utilizados para la prueba pretenden confirmar que la afectividad de los
trabajadores en independiente, o tiene poca relacin o influencia en las relaciones de stos con sus
compaeros; ya que se observ, que slo 36 de cada 100, s presentan relacin alguna ( 36% ) entre
ambas variables. Seguramente que las relaciones personales estn influidas, por lo menos a partir
de los datos de la muestra tomada para la investigacin, por otras variables como el liderazgo, la
motivacin, entre otras.
Como ha sido referido anteriormente, las variables de mayor presencia o incidencia en las ciencias
sociales son de carcter no numrico, caracterstica que hace la diferencia con las dems disciplinas
o reas del conocimiento. Actualmente, nos encontramos en la etapa de adecuacin a los nuevos
ritmos y exigencia de los mercados tanto nacionales como internacionales, sea cual fuere su mbito
o contexto de accin: social, econmico, cultural; para cambiar el paradigma de que slo en la
investigacin social se trabaja con datos no numricos, de all la discrepancia, tambin actual, entre
investigadores y profesionales de la estadstica aplicada a las ciencias sociales.
La tendencia actual y firme recomendacin del autor, es que los fenmenos cualitativos sean
medidos escalarmente desde el diseo de la investigacin, con la ventaja de tener mayor libertad o
movilidad para la medicin de las variables y su relacin entre ellas. Uno de los recursos de mayor
confiabilidad para medir qu tanto impacta el comportamiento de una variable con aquellas con
quienes interacta, es el coeficiente de correlacin de Pearson, mismo que tambin mide el grado de
asociacin entre variables, pero en este caso slo escalares y con datos no agrupados, categora en
la que se integran, por razones prcticas, a las variables de nivel intervalar y racional.
42
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Cabe mencionar que este coeficiente es utilizado slo con datos numricos no agrupados por
intervalos, o lo que llamamos lista de datos.
120
100
80
El coeficiente de correlacin 60
25
El coeficiente de correlacin 20
dependientes. 10
0
0 5 10 15 20 25
rp ( Frmula 4 )
En esta prueba, la hiptesis nula apunta tambin, como el caso del coeficiente Q de Kendall, a
43
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
confirmar la inexistencia de correlacin entre las variables numricas consideradas para el anlisis.
Ejemplo: Los siguientes datos corresponden a las horas semanales que un grupo de 10 mujeres que
trabajan desde su casa, dedican a su negocio personal y los ingresos, en pesos, promedio obtenidos:
Tabla 6
Madre 1 2 3 4 5 6 7 8 9 10
Horas (X) 12 10 8 6 9 12 15 11 20 6
Ingresos (Y) 2400 1700 1900 1200 2200 1800 3000 2400 3800 1000
Se requiere probar la hiptesis de trabajo de que los ingresos de las personas que trabajan desde su
casa, estn determinados por las horas que le dedican al negocio personal. En este ejemplo se
desea conocer el nivel de correlacin entre dos variables numricas escalares con datos no
agrupados, por lo tanto la hiptesis estadstica ser la siguiente:
Al sustituir los datos requeridos por el estadstico de prueba en la Frmula 4 y realizar las
operaciones respectivas, se obtiene que el coeficiente de correlacin es:
rp = 0.93
Al comparar este resultado en la regla de decisin, la hiptesis nula no se acepta, lo que indica, por
la magnitud del valor obtenido, que existe una correlacin entre las horas de trabajo semanales y el
44
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Entre otras aplicaciones, la prueba Ji cuadrada (X2) pretende evidenciar, para la relacin entre
variables nominales u ordinales, si existe independencia entre una y otra, o qu tanto una explica el
comportamiento de la otra, por medio de la comparacin de la distribucin de las frecuencias
empricamente obtenidas (observadas) en el proceso de recoleccin de datos, con la distribucin de
las frecuencias que tericamente se esperaba por categora de incidencia.
Un ejemplo de una distribucin de frecuencias observadas se presenta en una tabla de contingencia
como la siguiente, y a partir de ella se realiza la prueba:
Tabla 7
Rendimiento en el
Estado civil trabajo Total
Bajo Medio Alto
Casado 82 76 20 178
Soltero 75 27 53 155
(Fo - Fe) 2
X2 = --------------------------
( Frmula 5 )
Fe
Donde:
45
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
categoras.
La prueba consiste en comparar el valor calculado de X2 utilizando para ello la Frmula 5, con el
obtenido a partir de la tabla de la Distribucin X2 que se presenta en el anexo 2. Para accesar a esa
tabla deber determinarse el nivel de significacin o el nivel de confianza con el que se desea hacer
la prueba y los grados de libertad de la distribucin, obtenidos de la siguiente manera:
La tabla de contingencia que se presenta en este apartado tiene 2 renglones y 3 columnas, por lo
tanto tiene (2 - 1 ) ( 3 - 1 ) = ( 1 ) ( 2 ) = 2 grados de libertad.
Para la obtencin del valor de X2 calculado, la tabla de contingencia presenta las frecuencias
observadas. Las frecuencias esperadas se calculan con la siguiente expresin:
En la tabla del ejemplo, la frecuencia observada en la primera celda es 82, que son el total de
personas casadas con bajo rendimiento en el trabajo. Si se desea obtener la frecuencia esperada en
esa celda, utilicemos la frmula 7 y obtendremos:
( 178) (157)
Fe = --------------------------- = 83.92
( 333 )
Significa que para evidenciar que las variables son independientes, la tabla de contingencia esperaba
que del total de personas tomadas para la prueba, 83.92 fueran casadas con bajo rendimiento en el
trabajo. Ntese que en este caso la diferencia entre la frecuencia observada (82) y la esperada
(83.92) es mnima. Por razones prcticas siga el criterio de redondear sus resultados al entero ms
cercano, en este caso la frecuencia esperada obtenida se redondea a 84.
En la siguiente tabla se presentan, entre parntesis, las frecuencias esperadas o tericas, para su
comparacin con las frecuencias observadas o empricas:
46
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Tabla 8
Rendimiento en el trabajo
Estado Total
Bajo Medio Alto
La prueba X2 compara la distribucin de esas frecuencias observadas y esperadas por cada celda, y
dependiendo qu tan grande se presente la diferencia, saca las conclusiones de si sta es
significativa para determinar si las variables puestas a prueba son independientes o no.
Analice las diferencias indicadas y le pregunto: Cul es su conclusin? Contine con el estudio de
los detalles de la prueba y compare su conclusin.
Este supuesto obvia tiempo de trabajo y permite tomar ms oportunamente las decisiones; sin
embargo, se recomienda que en los primeros ejercicios se acte con cautela, ya que para determinar
si la diferencia entre dos valores es grande o pequea, depender de diversos factores como el
contexto y las unidades de medicin, entre otros.
Por ejemplo: la diferencia de un minuto entre iniciar una sesin de trabajo antes o despus de la hora
fijada, tal vez no tenga ninguna trascendencia y se apreciara como mnima o despreciable. Pero si
ese minuto de diferencia se contextualiza en el suministro de oxgeno a un paciente hospitalario,
47
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
La regla de decisin de esta prueba se plantea a partir de indicar cul es el valor de X 2 que
determinar la frontera entre la regin de aceptacin y la regin de rechazo. Este valor es llamado X 2
terica y se obtiene de la tabla del anexo 2, considerando los grados de libertad y el nivel de
significacin con que se realizar la contrastacin de la hiptesis nula. El valor de la X 2 que se
calcula con los datos de la tabla de contingencia, se compara con el de la X 2 terica. Si el valor
calculado es menor al valor terico, entonces se acepta la hiptesis nula ( Ho ), lo que indica que las
variables son independientes; pero si el valor calculado es mayor al valor terico, entonces est
cayendo en la zona de no aceptacin, por lo que la hiptesis nula ( Ho ), no es aceptada, refiriendo
entonces que las variables no son independientes, esto es que una explica el comportamiento de la
otra.
48
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Para concluir la prueba en nuestro ejemplo, calculemos el valor de X2 los datos de la tabla de
contingencia, siguiendo la frmula ( 5 ):
Tabla 9
Con los dos grados de libertad de la tabla de contingencia y si deseamos realizar la prueba con el 5%
de nivel de significacin 95% de confianza, como a usted se le facilite, vea la tabla 2 del anexo y en
la primera columna localice 2 grados de libertad y busque la interseccin con la columna 0.05, all
encontrar que el valor de la X2 terica = 5.99147
Al comparar ambos valores (X2 calculada = 37.19 y X2 terica = 5.99147 ) en la regla de decisin, se
rechaza la hiptesis nula ( Ho ), concluyendo que las variables no son independientes, lo que se
interpreta afirmando que el rendimiento en el trabajo s mantiene relacin con el estado civil de los
empleados. Confirm su decisin anterior?
49
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
En ciencias sociales es comn que la investigacin requiera de realizar pruebas de correlacin entre
variables nominales de ms de dos categoras, al menos una de ellas. En este caso podr disponer
de un estadstico sencillo que se apoya en el principio del coeficiente X2.
El coeficiente C de Pearson es una herramienta que permite medir el nivel de correlacin entre dos
variables nominales con ms de dos categoras como estado civil: soltero, casado, divorciado; como
por ejemplo en la pregunta siguiente: est usted de acuerdo en trabajar en fines de semana? Cuyas
respuestas son: de acuerdo, ni de acuerdo ni en desacuerdo, en desacuerdo.
X2calculada
C = ------------------------------------- ( Frmula 8 )
X2 calculada + N
Para obtener el valor del coeficiente C de Pearson, deber calcularse el valor de X2 a partir de los
datos de la tabla que relaciona las variables.
Si este estadstico es igual a cero (C = O ) se dice que las variables no estn correlacionadas o son
independientes. Entre ms cercano se encuentre el coeficiente de cero mayor ser la tendencia a
que las variables comparadas no guarden relacin entre s. En la medida que el coeficiente vaya
aumentado su valor, las variables estarn ms correlacionadas. En otras palabras, una de ellas
explicar el comportamiento de la otra. El mximo valor que puede tomar el coeficiente C estar
cercano a la unidad, indicando la existencia de alto nivel de asociacin entre las variables.
50
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Dado que es una prueba de correlacin, la hiptesis nula se plantea en los siguientes trminos
Ejemplo: Se desea conocer si la disposicin de los trabajadores para laborar en fin de semana
depende de su estado civil, o qu tanto influye ste en la decisin de participar en esos das de
descanso. Los datos se presentan en la tabla siguiente:
Tabla 10
Est dispuesto a
trabajar en fin de
Estado civil semana? Total
No Tal vez S
Casado 15 11 18 44
Soltero 24 21 17 62
Total 39 32 35 106
En este caso plantearemos la regla de decisin que evidencie, en caso de ser aceptada la hiptesis
nula Ho, un alto nivel de correlacin entre esas dos variables nominales.
Regla de decisin:
2. No aceptar Ho si C 0.9
51
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Significa que en caso de ser aceptada la hiptesis nula ( Ho ), la decisin de menos del 90% de los
trabajadores entrevistados en su disposicin por trabajar en fin de semana se encuentra influida por
su estado civil.
Para obtener el coeficiente C de Pearson, estadstico de esta prueba, primero se encuentran las
frecuencias esperadas segn lo tratado anteriormente, obsrvelas entre parntesis en la tabla que a
continuacin se presenta:
Tabla 11
Est dispuesto a trabajar en fin
Estado civil de semana? Total
No Tal vez S
Total 39 32 35 106
1.67
C = ---------------------------------------
1.67 + 106
C = 0.12
52
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Comparando el valor del coeficiente C de Pearson se toma la decisin de aceptar la hiptesis nula
(Ho) significando que existe correlacin muy baja entre la disposicin de trabajar en fin de semana y
su estado civil, por lo que se debern buscar otras variables que permitan determinar las causas por
las que los empleados estn dispuestos a laboral en das de descanso.
ACTIVIDADES DE APRENDIZAJE
Ejercicio 1:
Con los datos de la Unidad 11 y especificando el proceso para la comprobacin de hiptesis, realice
una prueba de correlacin para variables numricas y datos no agrupados que indique el nivel de
correlacin entre ellas. Cul es la conclusin de la prueba y qu recomendaciones podra hacer
usted respecto a la cultura del ahorro?
Ejercicio 2:
Con los datos clasificados, construya la tabla de contingencia correspondiente e indique, mediante la
53
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
prueba estadstica que corresponda, si las variables son independientes o no. Indique el nivel de
confianza de su prueba y las conclusiones respectivas.
AUTOEVALUACIN
54
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
GLOSARIO
Muestra: Fraccin o parte de la poblacin, esta debe ser representativa del conjunto de donde
ha sido extrada; para ostentar el carcter de representatividad, la muestra deber evidenciar tanto
las coincidencias como las discrepancias existentes en la poblacin.
Mtodo de muestreo: Consiste en determinar cmo sern seleccionados los elementos que
habrn de integrar la muestra y se clasifica en muestreo con reemplazo y sin reemplazo.
Nivel de Confianza: De manera sencilla, se desea determinar cuntos de cada 100 elementos
que se tomen como muestra, debern poseer las caractersticas de la poblacin. En otros trminos
55
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Margen de error: Tambin llamado error muestral o nivel de precisin, es la diferencia mxima
que el investigador est dispuesto a aceptar entre un estadstico y su parmetro.
Contraste de hiptesis: Es un proceso estadstico que permite elegir una hiptesis de trabajo
entre dos posibles y contraria una a la otra.
Hiptesis nula ( Ho ): Para realizar el contraste de hiptesis se supone cierta una de ellas,
llamada hiptesis nula Ho, la cual es formulada por el investigador con el propsito de ser
rechazada; este enfoque resulta en ocasiones incomprensible, ya que se cuestiona cmo es posible
que se plantee algo que pretende rechazarse?
56
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
Error Tipo 11: El Error Tipo 11 se comete cuando en la decisin se acepta la Hiptesis Nula
(Ho) siendo sta no verdadera.
Frecuencias conjuntas: Es la frecuencia absoluta que se observa en cada celda de una tabla
de contingencia.
57
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________
PREGUNTAS FRECUENTES
De qu tamao debe ser una muestra para que sea representativa de la poblacin?
Si se pretende buscar la efectividad de una investigacin, para determinar el tamao de la muestra
deber considerarse el tamao de la poblacin: si la poblacin es grande, la muestra tiende a ser
relativamente pequea; y si la poblacin es pequea, la muestra tender a ser proporcionalmente
grande.
Cmo distinguir el tamao ptimo de una muestra del diseo ptimo de la misma?
Cuando se refiere al tamao ptimo, lo que se busca es determinar el nmero de elementos que
mnimamente permitirn que la estimacin de los parmetros sea altamente confiable. Sin embargo,
cuando se refiere el diseo ptimo de la muestra, al tamao deber agregrsele el tipo de muestreo
adecuado a las caractersticas de la poblacin, as como el mtodo ms apropiado para la
investigacin.
Por qu se dice que la hiptesis nula se plantea con el propsito de ser rechazada?
Lo que pretende el investigador es comprobar la validez de su hiptesis de trabajo y como la
hiptesis nula se plantea contraria a la de trabajo; entonces, lo que se busca es encontrar evidencias
para no aceptar la hiptesis nula.
Como recomendacin sera aventurado referir alguna prueba especfica, ya que cada grupo de datos
es diferente lo mismo que el planteamiento de la hiptesis. Se recomienda primeramente
involucrarse ampliamente en los objetivos de la investigacin y posteriormente plantear eficazmente
las hiptesis de trabajo, las que traern como consecuencia el diseo de las hiptesis nulas de
donde se deriva el estadstico de prueba a utilizar.
58
FUENTES DE CONSULTA
Gemmell Glass, Gene v.; Mtodos estadsticos aplicados a las ciencias sociales, Mxico Ed. Prentice
hall, 2004.
Guerrero g, Victor. Estadstica bsica para estudiantes de economa '1 otras ciencias sociales,
Mxico, Ed. Fondo de cultura econmica, 2000.
Holgun Quiones, Fernando. Estadstica descriptiva aplicada a las ciencias sociales, Mxico, Ed.
UNAM, facultad de ciencias polticas y sociales, 1998.
Kerllnger, Frederick Nichols. Investigacin del comportamiento. Tcnicas y metodologa, Mxico, Ed.
Trillas, (ltima edicin)
Leach Chris. Fundamentos de estadstica: enfoque no paramtrico para ciencias sociales, Mxico,
Ed. Limusa, 2005.
Levin, Jack. Fundamentos de estadstica en la investigacin social, Mxico, Ed. Harla, 2004.
Mateos Rivas, Jos. Estadstica en investigacin social: ejercicios resueltos, Madrid, Espaa, Ed.
Paraninfo, 1989.
Rodrguez Osuna, Jacinto. Mtodos de Muestreo, Madrid, Espaa, Ed. Centro de Investigaciones
Sociolgicas, 2003
Rojas Soriano, Ral. Gua para realizar investigaciones sociales. Mxico. Cal y Arena. 2008.