Anda di halaman 1dari 66

Este Documento provee acceso libre e inmediato a su

contenido bajo el principio de hacer disponible


gratuitamente investigacin al pblico y apoyar a un
mayor intercambio de conocimiento global.

Todos Los Derechos Y Crditos ntegramente Son De


Sus Autores Y Casas De Estudios

Nuestra labor es compartir y reconocer el arduo


trabajo de nuestros Colegas

VISITA:

www.mitrabajoessocial.com
43
Nmero 44, (43-47), Mayo-Agosto 2009

Del aula a la realidad: La formacin


estadstica del Trabajador Social

Daniel Eudave Muoz 1


Lizbeth Adriana de Anda Aguilera 1

Resumen well as the conditions of the professional practi-


ce in the areas where the statistics is an important
En este trabajo se analizan las condiciones curri- component. It was found that the concepts and
culares y didcticas de la formacin estadstica statistics tools utilized in the context of the univer-
del Trabajador Social en la Universidad Autno- sity formation are limited, but most of all, becau-
ma de Aguascalientes, as como las condiciones se of the eminently qualitative character of the
del ejercicio profesional en las reas en las cuales Social Worker Methodology. Moreover, the uses
la estadstica es un componente importante. Se of the statistics in their professional practice are
encontr que los conceptos y herramientas esta- multiple. Unfortunately, their work conditions limit
dsticos utilizados en el contexto de la formacin the application of their statistical and methodolo-
universitaria son limitados, debido, en parte, a la gical knowledge.
falta de una adecuada integracin didctica,
pero sobretodo, a causa del carcter eminente- Introduccin
mente cualitativo de la metodologa del Trabajo
Social. Por otro lado, los usos de la estadstica en La estadstica y la probabilidad son disciplinas que
su ejercicio profesional son mltiples. Desafortu- desde los aos sesentas se han incorporado de
nadamente, sus condiciones laborales limitan la manera casi universal en los estudios de nivel su-
aplicacin de sus conocimientos estadsticos y perior. Este inters por la estadstica tiene que ver
metodolgicos. con la gran cantidad de informacin numrico-
estadstica la cual debe enfrentarse y entender-
Abstract se, mediante grficas y tablas numricas que en-
contramos en todos los mbitos (Gani, 1982). Sin
This work analyzes the curricular and educational embargo, la enseanza de la estadstica en casi
conditions in the statistical formation of the Social todos los pases se ha centrado en la enseanza
Worker in the Aguascalientes State University, as de frmulas y la ejercitacin de algoritmos para
el clculo de diferentes medidas estadsticas,
creando no slo aprendizajes limitados, sino que,
adems, se ha generado aversin por su estudio
Palabras clave: Educacin estadstica, formacin profe-
(Stroup, et.al., 2004). A lo anterior, se suman otras
sional, Trabajo Social, matemticas en el trabajo, alfabet-
problemticas en el nivel superior tales como la
izacin numrico-estadstica, Educacin superior.
fragmentacin disciplinar que se traduce en la
Key words: Statistical education, professional training, So-
enseanza por asignaturas que no siempre per-
cial Work, mathematics and work, numeracy, university
education.
miten a los alumnos alcanzar la integracin y sis-
tematizacin de conocimientos que su ejercicio
Recibido: 15 de octubre de 2008, aceptado: 23 de enero de 2009 profesional les demanda. (Eudave, 2007).
1
Departamento de Educacin, Centro de Ciencias Sociales y Hu-
manidades, Universidad Autnoma de Aguascalientes,
deudave@correo.uaa.mx; labeth_2005@yahoo.com.mx
44
Nmero 44, (43-47), Mayo-Agosto 2009

Por tanto, no hay que perder de vista los fines como las condiciones del ejercicio profesional de
principales de la enseanza de la estadstica: este profesionista en cuanto a sus actividades re-
lacionadas con los usos de la estadstica.
Que los alumnos lleguen a comprender y a apre-
ciar el papel de la estadstica en la sociedad, Materiales y Mtodos
incluyendo sus diferentes campos de aplicacin
y el modo en que la estadstica ha contribuido a Se realiz un estudio de caso. Primeramente nos
su desarrollo, y; que los alumnos lleguen a com- centramos en el anlisis de los contextos y tareas
prender y a valorar el mtodo estadstico, esto que enmarcan las actividades estadsticas del
es, la clase de preguntas que un uso inteligente medio escolar. Se inici con un anlisis documen-
de la estadstica puede responder, las formas b- tal el cual consista en la revisin del Plan de Estu-
sicas de razonamiento estadstico, su potencia y dios y de los programas de 23 asignaturas en las
limitaciones. (Batanero, 2001). que la estadstica tiene un uso real o potencial
(currculum oficial). Para conocer la manera en
En concordancia con lo anterior, Moore (1997) que se instrumentan el Plan y los programas (cu-
y Wilks (2006) consideran que la enseanza de la rrculo real) y los usos que se dan a la estadstica
estadstica tiene que partir de actividades reales en el contexto de esta licenciatura, se realizaron
que permitan a los alumnos comprender los con- entrevistas a seis profesores del rea de Metodo-
ceptos y procedimientos de esta disciplina y que loga de la Investigacin y de Metodologa del
considere las variadas situaciones y contextos en Trabajo Social. Tambin se entrevistaron cinco
que los datos numricos adquieren su sentido en alumnas del 8 semestre que ya haban cursado
los campos particulares de cada profesional. todas las materias relativas a la estadstica y las
metodologas. Todas las entrevistas fueron graba-
En este trabajo se parte de la teora de la das. Para completar el diagnstico de la forma
matemtica en el contexto de la ciencia (Ca- en el que se ensea la estadstica en el marco
marena, 2004), que se fundamenta en tres pa- de las metodologas, se hizo una revisin de va-
radigmas: a) la matemtica es una herramienta rios documentos generados por las alumnas, ta-
de apoyo lo mismo que una materia formativa; les como apuntes y trabajos finales de los cursos
b) la matemtica tiene una funcin especfica metodolgicos.
en el nivel superior; c) los conocimientos nacen
integrados. Esta teora seala que es necesario En un segundo momento, se hizo el anlisis de
propiciar un aprendizaje contextualizado para los contextos y situaciones en donde se utiliza la
que sea significativo, duradero y que debe estadstica en las actividades propias del ejercicio
considerar los modelos matemticos que utiliza profesional. Para conocer esto, se entrevistaron a
efectivamente el profesionista y con los mismos diez trabajadores sociales que laboran en dife-
sistemas de representacin e instrumentos: rentes reas: educacin, salud, asistencia social,
seguridad pblica. De igual manera estas entre-
La matemtica en el contexto de las ciencias se vistas fueron grababas. A partir de la confronta-
encarga de que el alumno mire una matemti- cin de los entornos escolar y laboral, se identifi-
ca vinculada con sus intereses, sin aplicaciones can las semejanzas y las diferencias, los puntos de
artificiales, con la notacin que requerir en su contacto, as como elementos discordantes.
carrera de estudio, no rida, de tal forma que
logre conocimientos estructurados y no fraccio- Resultados
nados, que construya su propio conocimiento
con amarres firmes y duraderos y no voltiles y La formacin del Trabajador Social en la UAA
se encuentre motivado para que su desempeo El objetivo de esta carrera es formar profesionis-
acadmico se incremente, de tal forma que se tas del Trabajo Social, con un alto grado de sen-
le desarrollen habilidades para la transferencia sibilidad ante la problemtica social, preparados
del conocimiento (Camarena, 2004). cientficamente y con una gran actitud analtica.
Se espera que los egresados sean capaces de
El objetivo de la investigacin fue indagar las generar modelos de intervencin para la bs-
caractersticas y naturaleza de la enseanza de queda de soluciones a necesidades sociales en
la estadstica en la carrera de Trabajo Social en sus diferentes niveles: individual, grupal y comuni-
la Universidad Autnoma de Aguascalientes, as tario (UAA, 1999).
45
Nmero 44, (43-47), Mayo-Agosto 2009

Uno de los rasgos profesionales del Licencia- pero considerando los cursos de Metodologa y
do en Trabajo Social es su formacin como in- los talleres y prcticas, y no tanto por el curso de
vestigador social, entrenado para realizar diag- estadstica. El marcado nfasis algortmico que
nsticos sociales y con base en ellos, planear sus tiene el curso de estadstica 1, tiene como con-
acciones de intervencin. En el ciclo: secuencias que los aprendizajes significativos de
diagnstico planeacin intervencin conceptos y procedimientos estadsticos se dan
evaluacin, la estadstica puede llegar a tener un fuera de este curso, pues como sealan Batanero
papel preponderante, pero hasta ahora ha sido et.al. (1994), el conocimiento que los estudiantes
una herramienta ms bien marginal, como pudo tengan de las reglas de clculo de distintas medi-
constatarse con las entrevistas a los Trabajadores das estadsticas, como por ejemplo la media, no
Sociales en ejercicio. implica necesariamente una comprensin real
de los conceptos subyacentes.
Anlisis curricular de la Lic. en Trabajo Social
La conformacin del Plan de Estudio de la Lic. en En este sentido, encontramos que se cumple
Trabajo Social, en cuanto a la estadstica, tiene parcialmente con los criterios de contextualiza-
los siguientes componentes: cin sealados por Camarena (2004):

a) Un curso de estadstica impartido por el De- a) El establecimiento de la vinculacin entre dis-


partamento de Estadstica que incluye los ele- ciplinas a travs de problemas de las reas
mentos bsicos de la estadstica descriptiva y del conocimiento de la carrera, con las que
algunas nociones de la teora clsica de pro- se vincula la estadstica;
babilidades; b) Talleres integrales e interdisciplinarios, en don-
b) Una serie de cursos de Metodologa del Tra- de se resuelven problemas reales.
bajo Social, impartidos por el Departamento
de Trabajo Social, que de manera deductiva Anlisis de la prctica del Trabajador Social
ofrece a los estudiantes mediante activida- Se encontr que en esta profesin, los usos de la
des terico-prcticas, las fases y fundamen- estadstica son mltiples: elaboracin de encues-
tos metodolgicos en los que se contemplan tas, muestreos, acopio y anlisis de informacin,
algunas nociones y herramientas estadsticas; comunicacin de informacin estadstica a dife-
c) Una serie de cursos denominados Talleres y rentes usuarios. Cabe sealar que todas las activi-
Prcticas de Trabajo Social, tambin del De- dades antes mencionadas se ensean en los cur-
partamento de Trabajo Social, que de forma sos de metodologa, talleres y prcticas, mismos
inductiva, representan la puesta en prctica que estn prcticamente ausentes en el curso
de la metodologa as como la integracin de de estadstica. Algunos ejemplos de estas activi-
conocimientos tericos y prcticos de otros dades son los diagnsticos sociales de diferente
cursos, entre ellos, el de estadstica. nivel: individual, familiar, grupal, comunitario. Un
ejercicio de rutina de casi todos los profesionis-
En general, en los cursos de metodologa y tas entrevistados es la realizacin de estudios
prcticas hay una mnima utilizacin de las he- socioeconmicos, el cual tiene muchos usos: les
rramientas estadsticas, limitadas a los anlisis de permite canalizar a los usuarios hacia diferentes
frecuencias y de tendencia central, debido a un servicios, es un criterio para la asignacin de re-
desfase entre stos y el curso de estadstica, as cursos, les permite asignar cuotas diferenciadas,
como por el carcter eminentemente cualitativo y por tanto, una fuente de informacin para la
de los acercamientos metodolgicos utilizados toma de decisiones.
en el campo del Trabajo Social.
Con frecuencia, el Trabajador Social es el
Al realizar una valoracin global del contexto responsables de elaborar los instrumentos de ob-
formativo del Trabajador Social, puede afirmar- tencin de informacin, tales como cdulas de
se que ofrece condiciones de aprendizaje muy registro, entre otras, tarea que corresponde a la
variadas y sobretodo, vinculadas a la realidad fase metodolgica de la medicin. Tambin se
que enfrentar el estudiante cuando egrese, encargan del levantamiento de datos, mediante
entrevistas cara a cara con los distintos usuarios
que atienden. Este proceso es fundamental, de-
1
Esto se puede verificar en el programa y los apuntes del curso bido a que la medicin a partir del instrumento
impartido a las estudiantes entrevistadas.
definido (cuestionario, formato o cdula) se com-
46
Nmero 44, (43-47), Mayo-Agosto 2009

plementa y enriquece con informacin que el los Trabajadores Sociales y lo que stos necesitan
trabajador social observa y que no est definida en su ejercicio profesional, como por ejemplo:
en el instrumento. En esta fase, con frecuencia la a) Coincidencia de los mtodos y procedimien-
informacin cuantitativa queda subsumida a la tos enseados y utilizados en el campo laboral;
cualitativa, de manera similar a como los datos b) Los conceptos, procedimientos y sistemas de
numricos de un anlisis de laboratorio se inte- representacin estadstica ms utilizados en los
gran a la interpretacin de un caso patolgico cursos de metodologa y en los talleres y prc-
en el diagnstico mdico. ticas son los que efectivamente estn utilizan-
do los egresados, aunque en ambos casos son
Los diagnsticos comunitarios (comunidad muy elementales. Pero tambin encontramos
rural, colonia, etc.), se prestan al anlisis estadsti- varios desencuentros entre la formacin de este
co, pero tambin en stos predominan los acer- profesionista y su ejercicio laboral: a) El perfil de
camientos cualitativos, por una parte, debido investigador social est sobrevalorado en la uni-
a las tradiciones metodolgicas existentes en el versidad, mientras que en el campo laboral est
campo de la profesin, as como a las demandas subutilizado; b) Como en el campo laboral no se
laborales que les exigen tomar decisiones de ma- reconoce ni valora su papel como generador,
nera casi paralela al levantamiento de datos, he- procesador y analista de informacin, su desem-
cho que obliga a hacer interpretaciones holistas. peo estadstico es mnimo.

La informacin recabada sirve tambin para Conclusiones


alimentar bases de datos con las que se da segui-
miento de las situaciones atendidas, se elaboran En la actualidad es difcil imaginar un profesionis-
reportes y son un insumo importante para la toma ta universitario sin competencias estadsticas que
de decisiones a diferentes niveles de las estructu- le permitan obtener, procesar, analizar datos, y
ras institucionales. Por lo general, estas bases de sobretodo, fundamentar su toma de decisiones.
datos no son administradas ni explotadas por los Sin embargo, la formacin universitaria an pre-
trabajadores sociales, ms an, pocas veces tie- senta dificultades para lograr una adecuada
nen acceso a esta informacin que ellos mismos integracin de los conocimientos, habilidades y
ayudaron a generar. Esto se debe, principalmen- actitudes que permitan una autntica formacin
te, a que sus condiciones laborales centradas en estadstica. Para lograr esto, hace falta que tanto
la atencin directa de los usuarios y en la gestin los profesores de estadstica como los de las reas
de apoyos, no les deja tiempo para la realizacin en donde sta se aplica, reconozcan los vnculos
de anlisis estadsticos de la informacin acumu- entre la estadstica y la metodologa de investi-
lada. Todos los trabajadores sociales entrevista- gacin, y entre ambas y el resto de campos de
dos sealan esta limitacin y adems, reconocen competencia de cada profesin, tal y como lo
que sus conocimientos estadsticos son insuficien- sugiere la teora de la matemtica en el contexto
tes para una tarea de esa magnitud, cerrndose de las ciencias (Camarena, 2004). Las lneas que
as un crculo vicioso. permiten esta vinculacin estn trazadas en el
Plan de Estudios de la Lic. en Trabajo Social, pero
Discusin hay que explicitarlas y construir las estrategias di-
dcticas que les den cuerpo y que permitan la
Podemos sealar varios encuentros afortunados utilizacin de un mayor nmero de conceptos y
entre lo que hace la Universidad para formar a mtodos estadsticos.
47
Nmero 44, (43-47), Mayo-Agosto 2009

ANEXO

USOS DE LA ESTADSTICA EN EL CAMPO DEL TRABAJADOR SOCIAL

Proceso de obtencin de Tipo de datos ms Herramientas para


Usos de la estadstica
informacin utilizados el anlisis

Recabar datos sociodemo- Datos sociodemo- Frecuencias y por- Elaboracin de infor-


grficos de diversas poblacio- grficos. centajes. mes mensuales, semes-
nes. trales y anuales.
Datos del estado de ndices sociales y
Realizan entrevistas a usua- salud de los usuarios epidemiolgicos. Para el seguimiento
rios y elaboran reportes de visi- de hospitales. y evaluacin de activi-
tas domiciliares. Sistemas de Infor- dades.
Datos epidemiolgi- macin, con esta-
Hace los estudios socioeco- cos. dsticas bsicas (mu-
nmicos de las personas que nicipales, estatales,
atienden. nacionales).

Elaboracin de bases de
datos en Excel.

REFERENCIAS

BATANERO, C., et al. Errors and difficulties in unders- GANI, J. The relevance of statistical training, Procee-
tanding elementary statistical concepts, International dings of the 1 ICOTS, Sheffield, 9-13 August, vol. 1, pp.
Journal of Mathematics Educational in Science and 50-68, 1982.
Technology, 25 (4), pp. 527-547, 1994.
MOORE, D.S. New Pedagogy and New Content: The
BATANERO, C. Didctica de la Estadstica, Granada, Case of Statistics, International Statistical Review, 65, 2,
Espaa: Universidad de Granada, 2001. pp. 123-165, 1997.

CAMARENA, P. La matemtica en el contexto de las STROUP, D. et al., Teaching Statistical Principles Using
ciencias, Acta Latinoamericana de Matemtica Edu- Epidemiology: Measuring the Health of Populations, The
cativa, Vol. 17, tomo I, pp. 57-61, 2004. American Statistician, February, vol. 58, no. 1, 2004.

CAMARENA, P. Desarrollo de competencias profesio- UAA, Plan de Estudios de la Lic. en Trabajo Social, Mxi-
nales del futuro ingeniero, en Memoria Electrnica del co: Centro de Ciencias Sociales y Humanidades de la
Cuarto Congreso Nacional y Tercero Internacional Re- Universidad Autnoma de Aguascalientes, 1999.
tos y Expectativas de la Universidad, Saltillo, Coahuila,
25 al 28 de febrero, 2004b. WILKS, S.S. Undergraduate Statistical Education, The
American Statistician, February, vol. 60, no. 1, pp. 39-
EUDAVE, D. El aprendizaje de la estadstica en estu- 45, 2006.
diantes universitarios de profesiones no matemticas,
en Educacin Matemtica, Vol. 19, nm. 2, pp. 41-66,
2007.
Fundamentos de Estadstica
para la
Toma de Decisiones en Investigacin Social

M. en A. Jos Lus Sandoval Dvila


Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

CONTENIDO

Pg.

Introduccin 3

Objetivo 6

Tpicos 7

Unidades de estudio

Unidad 1: Diseo de Muestras en la Investigacin Social 9

Unidad 2: Hiptesis Estadsticas. 28

Unidad 3: Pruebas estadsticas de correlacin e independencia 37


entre variables

Glosario 55

Preguntas frecuentes 58

Obras de consulta 59

Anexos:
1. Tabla de dgitos aleatorios
2
2. Tabla de valores X

2
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

INTRODUCCIN

En la investigacin social es frecuente enfrentarse a la necesidad de disponer de informacin que


formalmente evidencie la realidad de los fenmenos sociales, as como la deteccin y estudio de sus
causas e impacto en sus efectos. Un factor determinante en ese proceso es la oportunidad con la
que debe tenerse la informacin, ya que a partir de ella est sustentada la toma de decisiones. Otro
de los factores es la naturaleza de las poblaciones en las que inciden esos fenmenos, en algunas
de ellas son conocidos sus elementos y en otras no, de all su clasificacin en finitas e infinitas. Sin
embargo, el investigador demanda los ingredientes que habrn de ser analizados como objeto de
estudio, mismos que debern ser obtenidos a partir de una eleccin: tomar una muestra de la
poblacin o realizar un censo de ella.

Ante esta disyuntiva debe considerarse el tipo de poblacin, objetivo de la investigacin y costo,
factor que implica tiempo, recursos materiales, humanos y financieros; as como el impacto o costo
social de la decisin que habr de tomarse y que en muchos de los casos es el que determina las
acciones a seguir.

Sin embargo, la naturaleza de las poblaciones puede simplificar el proceso, debido a que es posible
observar su forma real a partir de tomar corno referencia slo una parte de ella, lo que se referir
como muestra poblacional. Pero qu confianza puede tenerse al observar slo a una parte de la
poblacin y a partir de ella, emitir afirmaciones en relacin con las caractersticas y diversos aspectos
y condiciones en que se encuentra el universo en estudio. Cuntos elementos deben ser observados
para ese propsito, de tal manera que posean la credibilidad necesaria para tomar las medidas
conducentes al respecto.

La respuesta a esas preguntas es simple, ya que para estar cierto de 'las condiciones en que se
encuentran los elementos de una poblacin, slo bastar con observar detalladamente una parte de
ella y se llegar a la conclusin de que todos los individuos que la conforman tienen caractersticas
y actitudes comunes o similares, entre otras, que permiten su generalizacin a un menor costo; por
supuesto que la observacin detallada referida implica un proceso metodolgico a seguir, lo que
garantiza la efectividad de los resultados de la investigacin.

3
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Por tal virtud, se requiere que el investigador social posea un amplio dominio de la metodologa para
el diseo de muestras, donde cada una de las etapas que lo conforman resulta ser la ms importante
al momento de su aplicacin. Soslayar este requisito es contribuir a que los investigadores recurran a
diversas instancias para tal propsito, mismas que normalmente carecen del involucramiento
necesario para lograr la efectividad de la investigacin.

Como se ha sealado, cada una de las etapas del diseo de muestras es la ms importante al
momento en que se utiliza; sin embargo, la muestra no lo es todo en la investigacin, pero s las
bases que la sustentan; por lo que no hay que perder de vista que una vez recogida la muestra le
habrn de seguir un conjunto de mtodos, tcnicas, procedimientos para la obtencin de la
informacin requerida por la investigacin. Surgir una variedad de supuestos que tratarn de
explicar el por qu del comportamiento de las variables analizando la relacin entre ellas, conociendo
sus rasgos importantes, su magnitud y diversos aspectos de inters tanto para la investigacin como
para el mismo investigador.

El contenido de este material le ofrecer al lector diversos criterios que en la prctica profesional se
emplean para el tratamiento y anlisis estadstico de conjuntos de datos, considerando sobre todo
que el profesional medio de las ciencias sociales no est plenamente identificado o familiarizado con
los mtodos estadsticos; por lo que se procura utilizar un lenguaje sencillo y simple que, sin
deterioro de la calidad del contenido, permita la fcil comprensin de conceptos, trminos y la
realizacin de los ejercicios y casos prcticos que se incluyen, partiendo del supuesto de que se
tienen comprendidos los conceptos y uso de la metodologa de la estadstica descriptiva.

Asimismo, posteriormente al proceso del diseo de la muestra, los datos sern analizados a travs
de la utilizacin de pruebas para la contrastacin de hiptesis, mediciones estadsticas, pruebas de
correlacin entre todo tipo de variables.

Para el diseo y contrastacin de hiptesis estadsticas, debern considerarse diversos aspectos


como los pasos que habrn de darse en su metodologa, el tipo de prueba que se pretende realizar,
las reglas para la decisin de aceptar o no los supuestos de la investigacin, as como la bsqueda
de explicacin en el comportamiento de las variables, entre otros.

4
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Las pruebas a realizar en este material, sern de correlacin y de independencia entre variables,
principalmente; considerando que en ciencias sociales, un gran nmero de investigadores utilizan
variables con respuestas mutuamente excluyentes como "SI" y "NO", "estoy de acuerdo" y "no estoy
de acuerdo" cuyas tendencias o comportamiento requieren de explicacin estadstica.

Se explicarn los pasos para la comprobacin de hiptesis y se utilizarn estadsticos como la


prueba JI Cuadrada, Q de Kendall, C de Pearson y r de Pearson.

Bsicamente y por considerarse de inters para el autor, el contenido del presente est dividido en el
proceso para el diseo de muestras, planteamiento y diseo de pruebas de hiptesis y la realizacin
de pruebas estadsticas.

5
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

OBJETIVO GENERAL

Conocer y aplicar la metodologa para el diseo ptimo de muestras en una investigacin social, as
como la estructuracin de hiptesis estadsticas y su contrastacin.

PERFIL DE EGRESO

Al finalizar el estudio de este libro el lector tendr la habilidad para:

Determinar las caractersticas para el diseo ptimo de muestras en una


investigacin social.

Aplicar el proceso para la contrastacin de hiptesis estadsticas.

Identificar las caractersticas de las variables en estudio y estructurar las hiptesis


estadsticas correspondientes.

Utilizar el estadstico de prueba adecuado al tipo de variables en estudio y contrastar

las hiptesis inherentes a la investigacin.

Asimismo, adquirir las aptitudes que le permitirn utilizar con efectividad los recursos estadsticos
para la generacin de informacin y la toma de decisiones en el contexto social principalmente.

6
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

TPICOS

I DISEO DE MUESTRAS EN LA INVESTIGACIN SOCIAL.

I.1. Conceptos bsicos para el muestreo.


I.2. Etapas para el diseo de muestras.
I.2.1 Mtodos de muestreo: Con reemplazo y Sin reemplazo.
I.2.2 Tipos de muestreo probabilstica
I.2.2.1 Aleatorio.
I.2.2.2 Sistemtico.
I.2.2.3 Estratificado
I.2.2.4 Polietpico.

I.2.3 Tipos de muestreo no probabilstica

I.2.3.1 Por cuotas

I.2.3.2 Intencional.

I.2.3.3 Bola de nieve

I.2.3.4 Discrecional

I.2.4 Determinacin del tamao de la muestra

I.2.4.1 Nivel de confianza.

I.2.4.2 Margen de error.

I.2.4.3 Variabilidad.

II HIPTESIS ESTADSTICAS

II.1. Hiptesis Estadsticas

11.1.1 Caractersticas de las hiptesis

II.2. Hiptesis de trabajo

II.3. Contraste de Hiptesis

7
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

II4. Hiptesis Nula

II.5. Hiptesis Alternativa.

II.6. Errores Estadsticos.

II.7. Mtodo para la comprobacin de hiptesis estadsticas.

III PRUEBAS ESTADSTICAS DE CORRELACIN E INDEPENDENCIA ENTRE VARIABLES.

III.1. Conceptos.

III.2. Prueba de correlacin Q de Kendall.

III.3. Prueba de correlacin R de Pearson.

III.4.Prueba de independencia entre variables Ji Cuadrada.

III.5. Prueba de correlacin C de Pearson.

8
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

UNIDAD 1

DISEO DE MUESTRAS EN LA INVESTIGACIN SOCIAL.

INTRODUCCIN

Empricamente se ha demostrado que una de las principales reas de oportunidad en la


investigacin social, es el diseo de la muestra; de all la importancia de que el investigador conozca
y domine las etapas para la seleccin de sus unidades de muestreo que sern objeto de estudio.

En esta unidad se presenta la metodologa recomendada a seguir por los interesados en que sus
investigaciones sean soportadas por un diseo ptimo de la muestra.

OBJETIVO

Conocer las etapas del proceso para el diseo ptimo de muestras, considerando forma y modo de la
seleccin.

I.1. CONCEPTOS BSICOS PARA EL MUESTREO.

Qu importancia o peso especfico da usted a los conceptos? Qu tan efectivo es un proyecto de


investigacin si se dominan los conceptos que se involucran en l? Para responder estas
interrogantes, recuerde usted qu tan til le ha resultado conocer o desconocer cmo funciona una
computadora, o si slo le interesa que cuando usted se sienta frente a ella, sta encienda, le permita
guardar o imprimir sus archivos o le sirva para enviar un mensaje por correo electrnico a algn
amigo. Seguro que a usted slo le interesa que haga las cosas; pasando a segundo plano todo el
proceso que sigui el fabricante, desde el diseo hasta que se encontr en el escritorio de usted.

El objetivo de este material es que usted conozca de manera sencilla y prctica las aplicaciones de
los mtodos, tcnicas y pruebas estadsticas utilizadas en una investigacin social, recordndole que
lo fcil se hace difcil por nosotros mismos, esto es sencillo.

Poblacin: Es un conjunto de elementos bien determinados y con caractersticas comunes, que


los hace formar parte del mismo. Ejemplo: mujeres solteras que trabajan en la
industria farmacutica en el turno matutino.

9
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Si algn elemento del conjunto no contiene todas las caractersticas referidas, entonces no formar
parte de l. Ejemplo: si alguna mujer trabajadora en esa industria no pertenece al turno matutino no
formar parte del conjunto especificado.

Poblacin finita: Es aquel conjunto en el que el nmero de sus elementos est definido o
determinado.
Ejemplo: los empleados que recibieron crdito hipotecario el mes pasado.

Poblacin infinita: Es aquel conjunto en el que el nmero de sus elementos es indefinido o


indeterminado.
Ejemplo: Nmero de personas que caminan por las calles de la Ciudad de
Mxico.

Muestra: Fraccin o parte de la poblacin. sta debe ser representativa del conjunto de
donde ha sido extrada. Para ostentar el carcter de representatividad, la muestra
deber evidenciar tanto las coincidencias como las discrepancias existentes en la
poblacin.

Parmetro: Es todo valor o caracterstica que ha sido calculado, observado o extrado de la


poblacin.

Estimador: Tambin llamado estadstico, es todo valor o caracterstica que ha sido calculado,
observado o extrado de una muestra. El propsito del estimador es dar a conocer los
parmetros sin observar a la totalidad de los elementos de la poblacin.

Lo anterior sugiere que para determinar si un valor o caracterstica es un parmetro o un estimador,


deber observarse su origen, si ste es la poblacin ser un parmetro, pero si surge de la muestra,
entonces ser un estimador.

Hacer estimaciones refiere que el investigador parte de conocer los resultados obtenidos de una
muestra y referirlos confiablemente como los valores o caractersticas que posee la poblacin. La
estimacin es la obtencin de un valor o caracterstica de la poblacin, teniendo como origen una

10
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

muestra. En el caso de las variables numricas, la estimacin puede ser puntual o por intervalos.
Puntual es cuando se obtiene un slo valor y por intervalos, cuando se conoce un rango en el cual se
desplaza el parmetro o valor poblacional.

A partir del proceso del diseo de muestras, se pretende extender las conclusiones obtenidas a la
totalidad de los elementos de la poblacin, de all la importancia y trascendencia de la metodologa
para la obtencin de una muestra.

I.2. ETAPAS PARA EL DISEO DE MUESTRAS.

La experiencia indica que una proporcin significativa de los profesionales en ciencias sociales
manifiesta cierta aversin por todo aquello relacionado con nmeros, ya no se diga con matemticas,
como es el caso de la estadstica y su amplia gama de recursos; sin embargo, resulta paradjico
saber que para aplicar la estadstica en las disciplinas sociales se requiere de ingredientes tan
naturales en el ser humano como el sentido comn y la intuicin, as como no perder de vista que
las tcnicas y los mtodos son importantes, pero no determinantes, explicar por qu.

Cuando se posee ese atributo que confiere a una persona la habilidad para analizar, la dificultad para
el entendimiento, comprensin y operacionalizacin de la metodologa estadstica, se reduce
notablemente, dando oportunidad para una mayor dedicacin al anlisis de las variables incidentes
en el fenmeno estudiado y reduciendo consecuentemente el tiempo de operacin, lo que
garantizar informacin ms oportuna y mejores decisiones.

Por tal virtud, debe enfatizarse en la importancia que el proceso de diseo de muestras tiene en el
desarrollo de estudios e investigaciones y consistente en tres etapas que ofrecen respuesta a las
preguntas cmo? quin? cuntos? Es oportuno subrayar, que este proceso es ms efectivo y
garantiza mejores resultados, cuando es aplicable a poblaciones finitas.

11
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

I.2.1 MTODOS DE MUESTREO: CON REEMPLAZO Y SIN REEMPLAZO.

Consiste en determinar cmo sern seleccionados los elementos que habrn de integrar la muestra y
se clasifica en muestreo con reemplazo y sin reemplazo. El primero indica que los elementos de la
poblacin pueden pertenecer ms de una vez a la muestra; quiere decir que si un individuo ya fue
seleccionado, se le extraen los datos requeridos por la investigacin y se integra nuevamente a su
universo sin perder la oportunidad de volver a ser seleccionado para su estudio en la misma muestra.
Por su parte, el muestreo sin reemplazo indica que si un elemento de la poblacin ha sido extrado
para la muestra, no volver a tener la oportunidad de pertenecer nuevamente a ella.

Pregntese y contstese usted, en qu casos o cmo se determina el mtodo de muestreo a seguir


en un proceso de recoleccin de datos. Una respuesta sencilla es que las caractersticas de la
investigacin determinan observar a un individuo en ms de una ocasin y analizando las mismas
variables, slo que en tiempos diferentes. Cuando en la metodologa de una muestra no se
especifica el mtodo a seguir, considrese que es sin reemplazo.

I.2.2. TIPOS DE MUESTREO PROBABILSTICA.

La etapa para determinar el tipo de muestreo a utilizar en una investigacin o estudio reviste singular
importancia, debido a que es a travs de este procedimiento que se determina quin pasar a formar
parte de la muestra, de tal manera que conserve la forma de su poblacin, segn lo comentado en
prrafos anteriores.

El tipo de muestreo se clasifica en probabilstico y no probabilstico. El primero de ellos es aquel en el


que todos los elementos de la poblacin tienen una probabilidad conocida de formar parte de la
muestra. En el segundo se desconoce o es indeterminable esa probabilidad, restndole ciertos
efectos de representatividad.

El muestreo probabilstico ofrece seguridad y control en la forma de la muestra, dando mayor


garanta a las pruebas estadsticas que se realizan para explicar el comportamiento de las variables
o sus niveles de relacin entre s.

12
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Para realizar la extraccin de una muestra probabilstica, es indispensable conocer el tamao de la


poblacin, y que cada uno de los elementos que la conforman se encuentre identificado y localizable,
as como poseer una herramienta que permita realizar la seleccin con la ausencia de emociones,
sentimientos, gustos y otros aspectos de carcter personal en el investigador, dejando la absoluta
responsabilidad de la seleccin a la metodologa empleada.

A continuacin se presenta la clasificacin del muestreo probabilstico:

Muestreo aleatorio o al azar.

Muestreo sistemtico.

Muestreo estratificado.

Muestreo polietpico.

El seguir o utilizar alguno o algunos de ellos en un proceso de investigacin, depender


principalmente de las caractersticas poblacionales as como del objetivo y alcances del estudio.

1.2.2.1 Muestreo aleatorio o al azar.

Se caracteriza porque es aquel en el que todos los elementos de la poblacin tienen la misma
probabilidad de ser seleccionados para la muestra. Para la seleccin se sugiere observar, que la
poblacin sea finita y que cada uno de sus elementos estn identificados, habitualmente por un
nmero.

Finalmente se requiere disponer de algn instrumento que facilite la seleccin, como puede ser una
calculadora cientfica, una computadora o una tabla de dgitos aleatorios, como la que se presenta en
el anexo 1.

Realizar una seleccin aleatoria resulta imprctica, a pesar del uso de la calculadora o la
computadora misma, en la medida en que la poblacin sea muy grande.

13
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

1.2.2.2 Muestreo sistemtico.

An formando parte del muestreo probabilstico, la oportunidad de que los elementos de la poblacin
tengan la misma probabilidad de ser seleccionados resulta relativa debido a que una vez
seleccionado el primer elemento para la muestra, podra decirse que automticamente ya se conoce
quines son los elementos que estarn en la muestra.

Este tipo de muestreo consiste en dividir el tamao de la poblacin entre el tamao de la muestra, lo
que significa que la poblacin es dividida en tantas partes como el tamao de la muestra sea y de
cada una de esas partes se extraer un elemento que habr de integrar a la muestra.

Por ejemplo, si se tiene una poblacin de 500 elementos y se determin seleccionar a 50 de ellos
para obtener el tamao de la muestra, se divide 500 entre 50, dando como resultado k=10, lo que
indica que la poblacin ha sido fragmentada en 50 partes y de cada una de ellas se tomar un
elemento para la muestra, con lo que al final se tendr el total de los elementos requeridos para el
anlisis muestral.

Una vez identificados los 50 grupos de 10 elementos cada de uno de ellos, segn el ejemplo; se
extrae aleatoriamente del primero de los grupos formados un elemento para la muestra. Su pngase
que los elementos estn identificados con la numeracin del 1 al 500, por lo tanto el primero de esos
grupos incluye a los elementos enumerados del 1 al 50, el segundo incluir a aquellos cuyo nmeros
estn del 51 al 100, el tercero del 101 al 150 y as sucesivamente hasta el grupo 50 que contiene a
los elementos identificados del 451 al 500. Para la primera seleccin se toma alguno de los
instrumentos sealados anteriormente y se busca un nmero entre 1 y 50, rango del primer grupo.
Supngase que el primer nmero que aparece en la calculadora o en la tabla de dgitos aleatorios es
el 25, lo que indica que el primer elemento de la muestra ser el 25, se encuentra en el primer grupo,
y a partir de l cuntense 50 elementos y extrigase el segundo, en este caso ser el 75; despus de
ste cuente otros 50 y seleccione al siguiente, ser entonces el 125, y as sucesivamente.

Este tipo de muestreo tiene la ventaja de garantizar la forma de la poblacin, ya que recorre todos los
sectores de la misma, esto es, observa desde el primero hasta el ltimo.

La desventaja en este tipo de muestreo, est en los casos en que se dan periodicidades en la

14
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

distribucin de la poblacin, ya que al elegir a los miembros de la muestra con una periodicidad
constante (k) se puede introducir una homogeneidad que no se da en la poblacin. Supngase que
se est seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son
varones y los 5 ltimos mujeres, si se utiliza el muestreo aleatorio sistemtico con k=10 siempre
sern seleccionaramos o slo hombres o slo mujeres, no podra haber una representacin de los
dos sexos.

1.2.2.3 Muestreo Estratificado.

Consiste en considerar caractersticas heterogneas, llamadas estratos o subconjuntos, en la


poblacin y que al mismo tiempo son distinguidas por la homogeneidad respecto a alguna
caracterstica como la profesin, el sexo, el estado civil, la gerencia a la que se pertenece, entre
otras.
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de inters
estarn representados adecuadamente en la muestra. Cada estrato funciona independientemente,
pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el sistemtico; para elegir los
elementos concretos que formarn parte de la muestra. En ocasiones las dificultades que plantean
son demasiado grandes, pues exige un conocimiento detallado de la poblacin: sexos, edades,
entidad federativa, campus.

Este tipo de muestreo tiene la ventaja de que permite establecer controles cualitativos para
garantizar la representatividad, por lo menos en forma, proporcional de la muestra segn la
distribucin poblacional.

1.2.2.4 Muestreo polietpico (varias etapas).

Cuando una poblacin presenta tanto detalle de heterogeneidad en sus sectores o estratos que la
conforman, es recomendable pasar a un segundo plano o hasta el que sea necesario de clasificacin
o estratificacin y al final realizar la seleccin aleatoria o sistemtica, con las recomendaciones
anteriores.

Ejemplo: Se desea extraer una muestra cuyo inters radica en observar a los empleados de una
compaa considerando la divisin a la que pertenece, su gnero, categora y turno de trabajo, luego

15
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

entonces se recomienda estratificar primeramente por divisin y dentro de cada divisin hacerlo por
gnero; a partir de esta ltima variable estratificar por categora y en ella por turno. En este ltimo
nivel de estratificacin, se har la seleccin aleatoria o sistemtica, con la intencin de garantizar la
representatividad proporcional de la muestra, ya que sta ofrece mejores condiciones para el
anlisis.

Como puede deducirse, este tipo de muestreo aparenta ser complicado; sin embargo, ofrece grandes
ventajas cuando se dispone de un mayor tiempo y sobre todo si la poblacin evidencia distintos
niveles de heterogeneidad o cuando se requiere observar con mayor detalle la distribucin
poblacional.

1.2.3 TIPOS DE MUESTREO NO PROBABILSTICO.

Circunstancialmente, para estudios exploratorios, el muestreo probabilstico resulta excesivamente


costoso y el investigador se asiste con recursos no probabilsticos, aun siendo conscientes de que no
sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra extrada sea
representativa, ya que no todos los sujetos de la poblacin tienen la misma probabilidad de ser
elegidos, debido a que generalmente son seleccionados de acuerdo a criterios, en muchas ocasiones
poco ortodoxos.

I.2.3.1 Muestreo por Cuotas.

Se realiza generalmente sobre la base del conocimiento, a veces parcial, de los estratos de la
poblacin o de los individuos ms representativos o para los fines de la investigacin. Tiene
semejanza con el muestreo aleatorio estratificado, pero sin el carcter de aleatoriedad de aqul.

En este tipo de muestreo se fijan cuotas que consisten en un nmero de individuos que renen
determinadas condiciones, por ejemplo: 20 individuos de 15 a 20 aos, de sexo femenino que
estudien en escuela pblica. Una vez determinada la cuota se eligen los primeros en la poblacin
que se encuentren y que cumplan esas caractersticas. Este mtodo se utiliza mucho en las
encuestas de opinin.

16
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

I.2.3.2 Muestreo intencional.

Consiste en que el investigador selecciona directa e intencional mente los individuos de la poblacin.
El caso ms frecuente de este procedimiento es el utilizar como muestra los individuos a los que se
tiene fcil acceso, por ejemplo, las personas que se encuentran descansando en un parque o
esperando en la fila del supermercado.

I.2.3.3 Bola de nieve.

Consiste en entrevistar a individuos, los cuales conducen a otros, y as sucesivamente hasta


conseguir la muestra requerida. Este tipo de muestreo se emplea cuando se hacen estudios con
poblaciones difciles de acceder a ellas como son las de determinados tipos de enfermos.
I.2.3.4 Muestreo Discrecional.

A criterio del investigador los elementos son seleccionados si cree que pueden aportar datos o
informacin al estudio, recurdense las entrevistas de los reporteros de televisin.

I.2.4 DETERMINACIN DEL TAMAO DE LA MUESTRA.

Hasta este momento, el lector se habr dado cuenta del detalle que implica disear muestras para
una investigacin. No obstante, ese detalle es superado cuando existe involucramiento en el rea de
oportunidad en estudio, as como el conocimiento de lo que se pretende realizar y el objetivo a
alcanzar. Ciertamente, las etapas abordadas anteriormente ofrecen al investigador las herramientas,
sugiriendo la aplicacin de diversos criterios, para la seleccin de los individuos que formarn parte
de la muestra; sin embargo, la importancia de esas etapas se minimiza sin la consideracin del
nmero de sujetos que habrn de ser observados, de all que surge una etapa ms para el diseo de
la muestra: la determinacin de su tamao.

Tambin la experiencia indica la arbitrariedad con la que se fija el nmero de elementos que
formarn parte de la muestra. Se escucha por los pasillos de las reas de investigacin, por las
comunidades e incluso por las oficinas de empresas dedicadas a la investigacin de mercados,

17
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

encuestas y estudios de opinin, que deber tomarse el 10% el 20%, por citar algunos, como
tamao de muestra; cifras que pueden estar sustentadas en muchos aos o proyectos de
experiencia, soslayando que cada proyecto, estudio, poblacin, universo y muestra son diferentes en
tiempo, fondo y forma; por lo que deben ser tratados de manera diferente ya que no aplican reglas
generales para ello.

Antes de determinar el tamao de una muestra, se recomienda considerar el principio del Teorema
de Gorco: Si la poblacin es grande, naturalmente la muestra tiende a ser relativamente pequea; y
si la poblacin es pequea, entonces la tendencia de la muestra es a ser proporcionalmente grande.
A partir de este criterio de observacin, se presentan los tres elementos bsicos para la
determinacin del tamao de una muestra en la investigacin social, tanto para poblaciones finitas
como para poblaciones infinitas.

Esos tres elementos son el nivel de confianza, el margen de error y la dispersin en la poblacin,
considerada por diversos autores como la variabilidad o varianza. Se refiere como dispersin en la
poblacin considerando que en la investigacin social, principalmente inciden o se presentan
fenmenos de carcter cualitativo donde se aprecia la proporcin o porcentaje de elementos que
poseen las caractersticas o se ven inmersos en los aspectos principales de la investigacin.

Para el clculo del tamao de una muestra deber considerarse el tipo de poblacin de donde ser
extrada, y as seguir alguna de las siguientes frmulas bsicas:

p q z2
Para poblacin infinita n: ------------------------- ( Frmula 1 )
2
E

N p q z2
Para poblacin finita n: -------------------------------------- ( Frmula 2 )

E 2( N - 1 ) + p q z 2

18
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Donde: Z Representa el nivel de confianza.

E Indica el margen de error o nivel de precisin.


p Es la proporcin o porcentaje de elementos en la poblacin que

tienen la caracterstica en estudio.


q Indica el complemento de p: q = 1 - p

N Tamao de la poblacin.

I.2.4.1. Nivel de Confianza.

De manera sencilla, se desea determinar cuntos de cada 100 elementos que se tomen como
muestra, debern poseer las caractersticas de la poblacin. En otros trminos es la probabilidad de
que la estimacin efectuada se acerque a la realidad. Obviando el detalle de acceso a la tabla de
reas bajo la curva normal, en la cual se obtienen los coeficientes que representan el nivel de
confianza en el clculo del tamao de la muestra y considerando que comnmente en ciencias
sociales los niveles mayormente utilizados son del 90%, 95% Y 99%, stos son Z=1.64, Z=1.96 y
Z=2.57 respectivamente. Ms adelante se aplicarn en un ejemplo.

I.2.4.2 Margen de error.

Tambin llamado error muestral o nivel de precisin, es la diferencia mxima que el investigador est
dispuesto a aceptar entre un estadstico y su parmetro. En una investigacin siempre se considera
la omisin de errores en el proceso, pero la naturaleza de la investigacin indicar hasta qu grado
es posible su presencia y su tolerancia. Un estadstico ser ms preciso en la medida que su error
sea ms pequeo o su precisin sea mayor.

I.2.4.3 Dispersin en la poblacin o variabilidad.

Antes de iniciar una investigacin, el equipo de proyecto deber tener claro qu tipo de poblacin
estudiar, qu caractersticas sobresalen, cul es la variable principal u objeto de estudio, y otros
aspectos que son determinantes para el involucramiento en el tema y consecuentemente para
realizar diagnsticos y anlisis con mayor confiabilidad y credibilidad.

19
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Un factor importante para determinar el tamao de una muestra es conocer cmo se encuentra
distribuida la poblacin en relacin con la variable principal de la investigacin. Este factor puede ser
observado en trminos relativos o porcentuales y aplicarse de cualquier manera en la frmula para
su clculo, siempre y cuando se aplique en el mismo sentido: relativo o porcentual: siempre
proporciones o siempre porcentajes. Si la caracterstica principal del estudio la posee el 70% de la
poblacin, a este valor le llamaremos variabilidad o dispersin en la poblacin, y al porcentaje de
sujetos que no tienen esa caracterstica 30%, la identificaremos como el complemento a la
variabilidad, identificados como p y q respectivamente. Ambos tienen que sumar 100%.

En caso de que se desconozca esa caracterstica, deber asignarse la mxima variabilidad


correspondiendo el 50% a p y el 50% restante a q.

Con el conocimiento adquirido hasta el momento, ya es posible determinar el tamao de una


muestra, presentando a continuacin algunos ejemplos.
Ejemplo 1. De qu tamao ser una muestra si se tiene una poblacin de 500 individuos objetos de
estudio, requirindose para ello un nivel de confianza del 90% con un margen de error muestral del
8% y se sabe que el 70% de la poblacin posee la caracterstica en estudio, que puede ser el alto
nivel de desempeo, contra el 30% con un bajo nivel de desempeo. Los valores a sustituir en la
frmula 2 son: Z = 1.64 para el 90% de confianza, E = 8 como el porcentaje del error muestral, p = 70
como valor de la variabilidad, q = 30 como complemento de la variabilidad y N = 500 como tamao
de la muestra.

Al sustituir los datos en la frmula 2 y realizar las operaciones tendremos lo siguiente:

( 500 ) ( 70 ) ( 30 ) ( 1.64 ) 2
n :: --------------------------------------------------
( 8 ) 2 ( 500 - 1 ) + ( 70 ) ( 30 ) ( 1.64 ) 2

n = 75

20
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Ejemplo 2. Para realizar una encuesta telefnica de opinin entre jvenes mayores de 18 aos en la
Ciudad de Mxico, se requiere una muestra con el 95% de confianza, un margen de error muestral
del 5% y dadas las caractersticas de la poblacin, considerada para este caso como infinita, se
tomar la mxima variabilidad.

Bajo el mismo principio de asignacin de valores que en el ejemplo 1, al sustituir los datos en la
frmula 1 y realizar las operaciones correspondientes, deber tomarse una muestra de:

( 1.96 ) 2 ( 50 ) ( 50 )
n = ------------------------------------
15

n = 384

21
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Actividades:

1. Para confirmar los criterios que se indican respecto a la presencia de poblaciones grandes con
tendencia de muestras pequeas y de poblaciones pequeas con muestras grandes; calcule 5
muestras con el 95% de confianza, 5% de margen de error y variabilidad del 80%, para las siguientes
poblaciones: N1 = 15000, N2 = 10000, N3 = 5000, N4= 1000 Y N5 = 350

Compare el porcentaje de elementos que debern tomarse como muestra, en cada caso, respecto al
tamao de su poblacin.

Qu opinin tiene despus de haber realizado los ejercicios?

Ejercicio de aplicacin

Los datos que se presentan a continuacin, corresponden a la evaluacin del desempeo anual de
un grupo de 320 trabajadores de la industria de la panadera. Ese puntaje se obtuvo a travs de
aplicar un instrumento para conocer la opinin de jefes inmediatos, subordinados, compaeros en
lnea y autoevaluacin de cada uno de los trabajadores.

Para determinar el programa de estmulos y compensaciones para el prximo ejercicio, la empresa y


el sindicato acuerdan en analizar inicialmente el puntaje obtenido por los trabajadores durante el
ltimo ao y posteriormente tomar las medidas que beneficien las relaciones contractuales y plan de
beneficios para los trabajadores.

Por razones de tiempo, se decide disear una muestra de la tabla de resultados de la evaluacin del
desempeo de los trabajadores y presentar el informe correspondiente a ambas instancias.

Para ello, se le solicita a usted como consultor en investigacin y desarrollo, determinar el tamao de
la muestra que ser analizada y seleccionarla sistemticamente.

Los datos de los trabajadores son los siguientes y los identificaremos como sigue:

Cada lnea contiene 10 datos, cada uno de ellos es el puntaje obtenido por un trabajador, significa
que tenemos 10 trabajadores por rengln de la tabla. La primera lnea contiene a los trabajadores

22
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

cuyo nmero de identificacin es, por favor vea la siguiente tabla, 1 ( 60) y 10 el ltimo ( 98 ). La
segunda lnea contiene a los trabajadores identificados con los nmeros del 11 ( 90 ) al 20 ( 74 ) y as
sucesivamente hasta el trabajador con el nmero de identificacin 320, cuyo puntaje es 100.
Tabla 1

60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 93 90 63 98 88 49 42 98 70
39 76 84 91 51 75 50 69 56 100

23
Se requiere que la muestra ofrezca el 95% de confianza ( Z = 1.96 ) con un margen de error del 7%
(E = 7). Observaciones de aos anteriores indican que el 80% de los trabajadores son categorizados
como de alto desempeo, por lo tanto tomaremos la variabilidad del 80% ( P = 80 ) Y su
complemento de 20% ( q = 20 ).

Sustituyendo en la frmula 2 para poblaciones finitas tenemos:

( 320 ) ( 80 ) ( 20 ) ( 1.96 ) 2

n = ------------------------------------------------------- = 90

( 7 ) 2 ( 320 - 1 ) + ( 80 ) ( 20 ) ( 1 .96 ) 2

Lo que indica que se deber tomar una muestra de 90 trabajadores y seleccionarlos


sistemticamente. Para la seleccin sistemtica, dividiremos el total de la poblacin N = 320 entre el
tamao de la muestra n = 90

K = 320 I 90 = 3.55 ( Por criterio de trabajo, redondear a 4 )

Esto significa que el primer elemento de la muestra ser extrado aleatoriamente de los primeros
cuatro de la poblacin. Para seleccionar el segundo, contaremos cuatro elementos y el cuarto ser el
que debe ser extrado y as sucesivamente de cuatro en cuatro hasta recorrer toda la poblacin o
conjunto de trabajadores, en este ejemplo.

Al utilizar la tabla de dgitos aleatorios del anexo 1, observamos que el primer dgito que aparece
entre 1 y cuatro es precisamente el 4. Observe los datos de la tabla 1 del ejercicio y el cuarto
trabajador tiene una evaluacin de 95 puntos. A partir de ste, cada cuatro seleccionar al siguiente
para la muestra, hasta el final del conjunto.

En la siguiente tabla se han marcado los elementos que forman parte de la muestra y debern ser
analizados para el informe que se presentar a la empresa y al sindicato conjuntamente.
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Tabla 2

60 47 82 95 88 72 67 66 68 98

90 77 86 58 64 95 74 72 88 74

77 39 90 63 98 88 49 42 98 70

39 76 84 91 51 75 50 69 56 100

60 47 82 95 88 72 67 66 68 98

90 77 86 58 64 95 74 72 88 74

77 39 90 63 98 88 49 42 98 70

93 76 84 91 51 75 50 69 56 100

60 47 82 95 88 72 67 66 68 98

90 77 86 58 64 95 74 72 88 74

77 39 90 63 98 88 49 42 98 70

39 76 84 91 51 75 50 69 56 100

60 47 82 95 88 72 67 66 68 98

90 77 86 58 64 95 74 72 88 74

77 39 90 63 98 88 49 42 98 70

39 76 84 91 51 75 50 69 56 100

60 47 82 95 88 72 67 66 68 98

90 77 86 58 64 95 74 72 88 74

77 39 90 63 98 88 49 42 98 70

39 76 84 91 51 75 50 69 56 100

60 47 82 95 88 72 67 66 68 98

90 77 86 58 64 95 74 72 88 74

77 39 90 63 98 88 49 42 98 70

39 76 84 91 51 75 50 69 56 100

60 47 82 95 88 72 67 66 68 98

90 77 86 58 64 95 74 72 88 74

77 39 90 63 98 88 49 42 98 70

39 76 84 91 51 75 50 69 56 100

60 47 82 95 88 72 67 66 68 98

90 77 86 58 64 95 74 72 88 74

77 39 90 63 98 88 49 42 98 70

39 76 84 91 51 75 50 69 56 100

Los datos marcados con color, son los correspondientes a la muestra seleccionada
sistemticamente. Debido a que se redonde de 3.55 a 4, el total de datos de la muestra fue
finalmente 63. La diferencia es llamada error de redondeo por muestreo sistemtico.

25
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Actividad adicional

Con los datos de la muestra, elabore una tabla de distribucin de frecuencias en 6 intervalos de
clase. Dibuje su histograma y calcule la media, desviacin estndar, sesgo y curtosis. Interprete los
resultados y presente el informe requerido. Si es necesario, calcule algunos percentiles que apoyen
su exposicin.

En resumen, esta unidad le ha proporcionado los elementos necesarios para el diseo de muestras,
recordando que cada etapa es igualmente importante. Al calcular el tamao de la muestra, deber
procederse a su seleccin de acuerdo al mtodo y tipo determinado por el investigador.
Posteriormente habr que realizarse el procedimiento para la organizacin de los datos, realizacin
de pruebas estadsticas y todo aquello relacionado con los objetivos de la investigacin.

ACTIVIDADES DE APRENDIZAJE

Contestar las siguientes preguntas:

1. Diga cules son y explique en que consiste cada una de las etapas para el diseo de muestras.

2. Cul considera que es la etapa ms importante o trascendente del proceso de diseo de


muestras?

3. En qu consiste el diseo ptimo de una muestra?

4. Distinga entre Parmetro y estimador y cite ejemplos de estudios para los cuales sea factible
trabajar con la poblacin o con muestras. Explquese.

5. En su opinin, cul es la importancia del muestreo en la investigacin social?

6. Qu opina usted sobre cul debe ser el tamao ptimo de una muestra?

7. En qu casos considera que es ms viable la seleccin no probabilstica de una muestra?


Explquese.

26
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Ejercicio:

Disee la muestra ptima que permita conocer las preferencias de las personas mayores de 18 aos
de la Ciudad de Mxico, por los programas nutricionales y sus condiciones de salud. El estudio
formal considerar, entre otros, hbitos alimenticios, frecuencia de ejercicio, calidad de vida,
enfermedades frecuentes y gasto mensual.

Presente la metodologa a seguir, fundamentando su propuesta.

AUTO EVALUACIN

.Enuncie su concepto de muestreo.

Cmo estn clasificadas las poblaciones?

Cules son las etapas para el diseo de una muestra?

En qu consiste el diseo ptimo del tamao de una muestra?

En qu consiste el diseo ptimo de una muestra?

Cmo conceptualiza el nivel de confianza de una muestra?

Cmo conceptualiza el nivel de precisin de una muestra?

Cmo conceptualiza y determina la variabilidad para el diseo del tamao de una


muestra?

Qu se requiere para seleccionar una muestra aleatoriamente?

En qu casos es importante tomar muestras?

o En qu casos es necesario tomar muestras probabilsticas y en qu casos no


probabilsticas y cules son las ventajas y desventajas en ambos casos?

27
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

UNIDAD 2

HIPTESIS ESTADSTICAS

INTRODUCCIN

La investigacin social parte de suposiciones adoptadas para explicar hechos a travs de la relacin
entre variables. Para su tratamiento, esos supuestos son traducidos a trminos estadsticos y
sometidos a pruebas de validez, por lo que el investigador deber identificar claramente el tipo de
variables en estudio, as como la relacin que guardan entre s.

Esta unidad presenta la metodologa para el diseo y contrastacin de hiptesis, as como los errores
que pueden cometerse al tomar una decisin estadstica y las condiciones en que stas debern
tomarse.

OBJETIVO

Conocer la estructura y diseo de hiptesis estadsticas, su aplicacin en la investigacin social y su


importancia en la toma de decisiones.

II.1. HIPTESIS ESTADSTICA.

Enunciado que afirma la relacin, comportamiento, tendencia y diversos aspectos de ocurrencia


entre dos o ms variables de una muestra o poblacin y est sujeto a comprobacin. Este enunciado
podr ser verdadero o no verdadero. En otros trminos, podr aceptarse o no su validez.

II.1.1 Caractersticas de las hiptesis

Deben redactarse claramente, de tal manera que no permita interpretaciones.

Deben ser objetivas sin incluir juicios de valor.

Las variables deben estar implcitas o explcitas en la redaccin.

28
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Deben estar relacionadas con tcnicas estadsticas para someterlas a prueba.

Deben ser estadsticamente comprobables.

Ejemplo: La causa principal del desempleo en Mxico se debe a la mala suerte de los mexicanos.

Esta afirmacin ciertamente es un supuesto que puede ser verdadero o no; sin embargo, no es
posible medir el concepto mala suerte, por lo que esta hiptesis carece de comprobacin cientfica.

II.2. HIPTESIS DE TRABAJO.

Es aquella que plantea el investigador o la investigacin como objeto o base de su anlisis y estudio;
trata de dar una explicacin tentativa al fenmeno que se est investigando. Esta es la hiptesis que
el investigador tratar de aceptar como resultado de su investigacin, rechazando la hiptesis nula, la
cual se comentar en otro apartado.

Ejemplo: La causa principal del desempleo en Mxico se debe principalmente a la reduccin de las
exportaciones, lo que ha provocado el cierre de fuentes de trabajo.

En este segundo caso, s es posible medir la relacin entre la reduccin de las exportaciones y cierre
de fuentes de trabajo con las tasas del desempleo y con fundamento en los resultados llegar a la
conclusin de validar o no la hiptesis mencionada.

II.3. CONTRASTE DE HIPTESIS.

Es un proceso estadstico que permite elegir una hiptesis de trabajo entre dos posibles y contraria
una a la otra. El contraste inicia con la formulacin de dos hiptesis sobre el valor de algn parmetro
o caracterstica poblacional, siendo ambas contradictorias, si una de ellas es verdadera por
consecuencia la otra no lo ser.

En el caso del segundo ejemplo, los planteamientos seran:

La tasa del desempleo est determinada por la reduccin de las exportaciones

29
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

La tasa del desempleo no est determinada por la reduccin de las exportaciones

Al analizar los datos de la muestra seleccionada para la comprobacin de la hiptesis, se concluir


cul de las dos es verdadera. Si la primera no lo es, la conclusin ser que existen otras causas o
variables, diferentes a la reduccin de exportaciones, que estn provocando el fenmeno del
desempleo.

El contraste de hiptesis puede ser bilateral o unilateral, ser bilateral cuando la hiptesis est
planteada o diseada en trminos de igualdad o desigualdad entre variables. Ejemplo: La
productividad de los trabajadores est influida por la asistencia a programas de capacitacin.

Si dos valores no son iguales, al ser diferentes podr darse el caso de que uno sea mayor o menor
que el otro, surgiendo aqu el concepto de hiptesis unilateral.

Ejemplo de hiptesis unilateral:


Al recibir el ttulo profesional, los empleados obtienen mayor salario que aquellos que no han
concluido sus estudios universitarios.

En este caso la hiptesis slo podr ser rechazada si el salario de los titulados no es mayor que los
que no poseen el nivel licenciatura.

Ejemplo de hiptesis bilateral:


Los puestos vacantes son ocupados por personas de 20 a 25 aos de edad.

Al observar la seleccin del personal, la hiptesis slo ser rechazada si algn aspirante es
seleccionado con menos de 20 aos o mayor a los 25 aos de edad.

II.4. HIPTESIS NULA ( Ho ).

Para realizar el contraste de hiptesis se supone cierta una de ellas, llamada hiptesis nula Ho, la
cual es formulada por el investigador con el propsito de ser rechazada, este enfoque resulta en

30
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

ocasiones incomprensible, ya que se cuestiona cmo es posible que se plantee algo que pretende
rechazarse?

Con el siguiente ejemplo se explicar: La industria electrnica japonesa somete sus aparatos a
estrictas pruebas para el control de calidad. De un lote de DVD's seleccionan una muestra aleatoria y
las introducen en cmaras de prueba para someterlas al tratamiento promedio que les da el usuario,
como usted y yo; esto es, se exponen a cadas, temperatura, calor y derrame de lquidos. Al finalizar
la prueba se encienden todos los DVD's que fueron sometidos a control y si falla por lo menos uno de
ellos, todo el lote es destruido, no slo los que participaron en la prueba; de all la alta calidad de los
productos japoneses. Entendemos ahora a los investigadores?

Para entenderlos mejor, le dir que la hiptesis nula se plantea contraria a la hiptesis de trabajo y se
formula en trminos estadsticos.

Ejemplo de hiptesis de trabajo:


Asisten a los programas de capacitacin hasta el 30% de los trabajadores de la empresa.

Hiptesis nula: P > 30%

Obsrvese la oposicin que presenta la hiptesis nula en relacin con el planteamiento de la


hiptesis de trabajo y el trmino proporcional ( P ) que se emplea para su formulacin.

II.5. HIPTESIS ALTERNATIVA ( H1 ).

Por su parte, la hiptesis alternativa se opone a la hiptesis nula y est en relacin directa con el
planteamiento de la hiptesis de trabajo, esto es, tienen el mismo sentido aunque planteada la
primera en trminos estadsticos y la ltima en el lenguaje de la investigacin.

Retomando el ejemplo anterior, se formularn las hiptesis mencionadas:

Hiptesis de trabajo: "Asisten a los programas de capacitacin hasta el 30% de los trabajadores de la
empresa"

31
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Hiptesis Nula: Ho: P > 30%

Hiptesis alternativa: H 1 : P < = 30% El smbolo ( < = ) lase menor o igual

Ntese que la formulacin de la hiptesis alternativa indica lo mismo que la hiptesis de trabajo y
ambas se oponen a la hiptesis nula. La prueba de hiptesis se realiza con el planteamiento de la
hiptesis nula ( Ho ), lo que significa que la que se acepta o no se acepta es sta. Si Ho no es
aceptada, el investigador asume que no se tiene evidencia suficiente para aceptarla, confirmando por
consecuencia su hiptesis de trabajo.

II.6. ERRORES ESTADSTICOS.

Al realizar pruebas para la contrastacin de hiptesis, finalmente deber tomarse la decisin de


aceptar o no aceptar la hiptesis nula ( Ho ), que no garantiza que la conclusin a la que se ha
llegado sea realmente lo que esta ocurriendo en el contexto poblacional. El investigador puede errar
el planteamiento de sus hiptesis de trabajo o el diseo de la hiptesis estadstica, razn por la que
deber considerarse la posible comisin de errores al tomar la decisin o los niveles de incertidumbre
a los que estn sometidas las pruebas de hiptesis. Estos errores son clasificados e identificados en
estadstica inferencial como el Error Tipo I y el Error Tipo II

Error Tipo I: Es aquel cuando en la decisin se rechaza la Hiptesis Nula ( Ho ) siendo sta
verdadera.

Error Tipo II: Es aquel cuando en la decisin se acepta la Hiptesis Nula ( Ho ) siendo sta
no verdadera.

Pero realmente qu importancia puede tener el saber si se tom una decisin equivocada o no? La
importancia se sostiene en la trascendencia que puede tener para la investigacin o proyecto el
saber que la explicacin de los fenmenos hecha por el estudio, no corresponde a las causas reales
de la relacin entre las variables analizadas, lo que consecuentemente provocara decisiones
organizacionales irreales. Sin embargo, el saber que las decisiones estadsticas estn soportadas
por altos niveles de certidumbre en el anlisis de la relacin causa-efecto entres sus variables,
obviamente que conducir a tomar mejores y ms oportunas decisiones.

32
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

II.7. MTODO PARA LA COMPROBACIN DE HIPTESIS.

Para la comprobacin de hiptesis estadsticas se sigue un mtodo de 7 pasos, sencillo y prctico,


que facilita el anlisis de relacin entre variables, pruebas de independencia y otros aspectos de
inters para la investigacin y la toma de decisiones.

Paso 1. Planteamiento de la hiptesis de trabajo

En ella el investigador trata de dar explicacin a la relacin entre las variables en


estudio. Se plantea en formato de texto.

Ejemplo: El desempeo de los trabajadores en el campo laboral, es una de las consecuencias


de su rendimiento en los programas de capacitacin".

Paso 2. Planteamiento de la hiptesis estadstica.

Se identifican las variables y su relacin en la hiptesis de trabajo y se traduce a


trminos estadsticos, creando con ello la hiptesis nula ( Ho ) e hiptesis alternativa ( H1 ).

Ejemplo: Ho : Q = O

H1 : Q 0

Paso 3. Determinacin del estadstico de prueba


Se especfica la frmula aritmtica que ser utilizada para realizar el clculo que
sustentar la prueba.

Ejemplo: AD - BC Nota: Este estadstico Q se toma para


Q = -------------------------- explicar el proceso, ser explicado con
detalle en la siguiente unidad.
AD + BC

Este estadstico es llamado Q de Kendall y permite correlacionar dos variables


nominales de dos categoras cada una. Considrese que en este ejemplo, las categoras de la
variable "Desempeo" son "Buen desempeo" y "Mal desempeo"; y para la variable "Rendimiento
en los programas de capacitacin" son "Evidencia rendimiento" y "No evidencia rendimiento".

33
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Paso 4. Planteamiento de la regla de decisin

Se especifican las condiciones en las que se deber aceptar o no aceptar la hiptesis


nula.

Ejemplo: 1. Aceptar Ho si el valor de Q < 0.8

2. No aceptar Ho si el valor de Q > = 0.8

Paso 5. Clculo del estadstico de prueba

Los datos de la muestra son sustituidos en la frmula aritmtica del paso 3 para

obtener el resultado del clculo.

Ejemplo: Supngase que al sustituir los valores y calcular el estadstico de prueba se


obtiene el valor de Q = 0.79

Paso 6. Decisin estadstica.

El resultado obtenido del clculo anterior se compara en la regla de decisin y se


indica si se acepta o no se acepta la hiptesis nula.

Ejemplo: Comparando el valor calculado de Q en el paso 4, se toma la decisin de


aceptar Ho.

Paso 7. Conclusiones de la prueba.


En los trminos en que fue planteada la hiptesis de trabajo se indican los resultados
de la prueba y la evidencia que present para ser aceptada o no aceptada:.

Siguiendo con el ejemplo y con el resultado obtenido en el paso 4, se llega a la conclusin de que
con los datos de la muestra se observa evidencia de que el desempeo de los trabajadores no es un
factor determinado por el rendimiento en los programas de capacitacin.

34
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

ACTIVIDADES DE APRENDIZAJE.

Contestar las siguientes preguntas:

1. Cmo distingue una hiptesis de trabajo de una hiptesis estadstica?

2. Cul es la intencin de plantear la hiptesis nula en una investigacin? Fundamente su


respuesta.

3. Qu importancia le da usted a los errores estadsticos en una investigacin social?

4. Para usted cul es el paso ms importante en el proceso para la comprobacin de hiptesis?


Fundamente su respuesta.

Ejercicio:

Los datos de la siguiente tabla corresponden a una muestra aleatoria de 60 personas poseedoras de
la cultura del ahorro.

Con la finalidad de crear un programa de intervencin dirigido a fomentar el hbito del ahorro que
permita a los trabajadores la manutencin de sus familias durante un plazo mximo de 12 meses, en
caso de que pierdan su empleo, se desea probar la validez del siguiente supuesto:

"La cantidad de dinero que ahorran los trabajadores est determinada por el salario"

Con los datos de la siguiente tabla realice la comprobacin de este supuesto.

35
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Tabla 3

No. Salario Ahorro No. Salario Ahorro No. Salario Ahorro


mes por mes mes por mes mes por mes
1 27 5.7 21 14 4.2 41 12 2.2
2 18 4.0 22 11 2.6 42 14 3.0
3 12 2.1 23 15 3.8 43 16 3.4
4 13 2.1 24 12 2.7 44 15 3.5
5 21 4.5 25 11 2.4 45 15 4.5
6 13 3.2 26 9 1.6 46 13 2.5
7 18 3.6 27 9 2.1 47 15 2.7
8 9 2.1 28 12 3.1 48 13 2.6
9 12 2.7 29 27 6.0 49 14 2.8
10 13 2.4 30 14 3.2 50 15 3.0
11 16 3.0 31 15 4.2 51 9 2.2
12 12 2.8 32 11 3.1 52 21 4.8
13 14 2.7 33 13 2.9 53 21 4.5
14 16 3.5 34 15 3.1 54 20 4.1
15 13 2.7 35 15 3.6 55 18 5.4
16 15 4.0 36 9 1.9 56 10 2.6
17 14 4.6 37 11 2.3 57 16 3.3
18 27 6.3 38 13 3.0 58 14 2.1
19 14 2.8 39 9 1.5 59 10 3.0
20 22 2.5 40 25 4.0 60 13 2.8

AUTOEVALUACIN

Enuncie su concepto de hiptesis de trabajo. .

Enuncie su concepto de hiptesis estadstica.

Cules son los pasos para la comprobacin de hiptesis estadsticas?

Cules son los errores estadsticos?

Qu es la regla de decisin?

Qu es la hiptesis nula?

Qu relacin guarda la hiptesis nula con la hiptesis de trabajo?

36
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

UNIDAD 3

PRUEBAS ESTADSTICAS DE CORRELACIN E INDEPENDENCIA ENTRE


VARIABLES.

INTRODUCCIN

Por medio de las pruebas estadsticas para la comprobacin de hiptesis se pretende encontrar la
relacin causal entre las variables, as como su fuerza, magnitud y sentido.

Las pruebas estadsticas ofrecen evidencias para determinar la fuerza de la relacin. Para ello se
considera el tipo de variables por nivel de medicin en virtud de que existen pruebas especficas para
cada uno de ellos.

En esta unidad se presentan pruebas de correlacin para variables numricas y no numricas, as


como para variables nominales y ordinales, con las que el investigador adquirir los elementos y
criterios bsicos para la comprobacin de sus hiptesis de trabajo.

OBJETIVO

Conocer e identificar las pruebas estadsticas para la contrastacin de hiptesis en la investigacin


social.

Fundamentalmente, toda investigacin busca explicar el comportamiento de los fenmenos en


funcin de la relacin entre variables. Terica o empricamente, el investigador supone cules son la
posibles causas que originan que una variable determine la fuerza de relacin entre dos o ms de
ellas; sin embargo, esas suposiciones debern sustentarlas mediante la aplicacin de diversas
pruebas estadsticas que le permitan confirmar o desechar las hiptesis que se ha planteado para su
proceso de investigacin.

En este apartado se incluyen las pruebas estadsticas bsicas para la comprobacin de hiptesis de
relacin entre variables, las que permitirn argumentar, a partir de los datos observados, cul es la
magnitud de la fuerza de asociacin que presentan las variables en estudio. Estas pruebas indicarn,

37
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

segn sea el caso, si dos variables mantienen la relacin de dependencia y en qu magnitud, para
que el investigador tenga elementos para llegar a conclusiones que le permitirn orientar la toma de
decisiones.

III.1 CONCEPTOS

Es menester que el lector se involucre con los trminos que se presentan a lo largo de las siguientes
lneas, sugirindole asistirse por otras fuentes para finalmente formarse el mejor concepto de los
elementos empleados en el proceso para la comprobacin o contrastacin de hiptesis estadsticas.

Nivel de significacin: Es la probabilidad de cometer el error tipo 1, esto es, rechazar la


hiptesis nula ( Ho ) cuando sta es verdadera.

Grados de libertad: Nmero de posibilidades que en un conjunto de datos, se tiene para la


asignacin de valores, tambin identificado como la cantidad de variables independientes para la
realizacin de una prueba estadstica. Si los grados de libertad de un modelo tienden a
incrementarse, la forma de la distribucin tiende a ser normal.

Tabla de contingencia: Tambin llamada de doble entrada, es aquella que presenta


matricialmente la relacin entre dos variables. Esa relacin se observa mediante las frecuencias de
incidencia entre las variables involucradas. La interseccin entre un rengln y una columna es
llamada celda.
Frecuencias marginales: Es la suma total de las frecuencias absolutas que corresponde a cada
valor, intervalo o categora de una variable que se est relacionando con otra en una tabla de
contingencia o de doble entrada.

Frecuencias conjuntas: Es la frecuencia absoluta que se observa en cada celda de una tabla de
contingencia.

Frecuencias observadas: Para el anlisis de relacin entre dos variables, la frecuencia observada
es el nmero de casos que, a partir de los datos en estudio, forman parte de la interseccin entre. un
rengln y una columna en una tabla de contingencia.

38
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Frecuencias esperadas: Para el anlisis de relacin entre dos variables, la frecuencia esperada
es el nmero de casos que de acuerdo a la distribucin marginal, la tabla de contingencia espera en
cada celda para evidenciar la independencia entre variables.

111.2 PRUEBA DE CORRELACIN Q DE KENDALL1

En ciencias sociales es frecuente que el investigador disee sus instrumentos para la recoleccin de
datos, considerando slo dos caractersticas de las variables como: "SI" y "NO", "De Acuerdo" y "En
desacuerdo", "Hombre" y "Mujer". Este tipo de respuestas es el factor ms elemental de estudio; sin
embargo, no por elemental carece de importancia; ya que existen diversas pruebas estadsticas que
permiten encontrar las evidencias que justifican el comportamiento de dos variables. Recuerde que
las variables en ciencias sociales son medidas en diversas escalas o niveles, segn su naturaleza.

La prueba Q de Kendall (Rojas Soriano) tambin conocida como la Q de Yule, permite medir la
correlacin entre dos variables nominales con dos categoras cada una de ellas (Rojas Soriano), como
el sexo: "Masculino" y "Femenino", o como las respuestas a la pregunta de Se encuentra satisfecho
con los programas de capacitacin de su empresa? Cuyas respuestas son: "Si" y NO. Es una
prueba sencilla, muchos investigadores y especialistas la consideran como dbil y sin importancia;
claro que existen pruebas estadsticas de mayor complejidad para variables nominales; sin embargo,
es un indicador que permite, con un nivel alto de confianza, observar el comportamiento entre ese
tipo de variables, ofreciendo elementos sobre la fuerza en que estn interactuando.

Con esta prueba se obtiene el coeficiente Q, el cual parte de la observacin de las frecuencias
observadas conjuntas entre dos variables nominales de dos categoras. El coeficiente Q tiene un
rango de variacin de cero a uno, en valor absoluto. Los valores extremos que se pueden obtener al
realizar el clculo correspondiente indican lo siguiente: si el coeficiente es igual a cero, significa que
entre las dos variables en estudio, no existe relacin alguna. Si el coeficiente es igual a uno,
entonces se concluye que las variables se encuentran totalmente relacionadas entre s, lo que
significa que una depende totalmente de la otra. No obstante, en la prctica y sobre todo en ciencias

1
Rojas Soriano, Gua para realizar investigaciones sociales; UNAM; 1980

39
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

sociales, esos valores extremos son materialmente imposibles de presentarse.

Ejemplo: En una organizacin se pretende conocer el impacto que ha tenido el rendimiento de los
empleados en los programas de capacitacin con su desempeo en el trabajo. La variable
rendimiento est clasificada en "Rendimiento eficaz" y "Rendimiento ineficaz". El desempeo en el
trabajo est medido como "Buen desempeo" y "No buen desempeo". Supngase que al realizar
los clculos del coeficiente Q de Kendall tenemos un valor de Q = 0.7 lo que indica que las variables
nos estn totalmente relacionadas, pero s existe cierta dependencia entre ellas. La conclusin en
este caso es que el grado de asociacin alcanza el 70% de los casos observados, lo que en otras
palabras refiere que el desempeo en el trabajo mantiene relacin del 70% con el rendimiento en los
programas de capacitacin.

El coeficiente Q de Kendall se calcula con el siguiente estadstico:

AD - BC

Q = -------------------------- ( Frmula 3 )

AD + BC

donde los coeficientes A, B, C y D son las frecuencias conjuntas observadas en la tabla de


contingencia o matriz de doble entrada:

Variable 1

Categora 1 Categora 2

Categora 1
A B
Variable 2 Tabla 4

Categora 2 C D

40
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Ejemplo: con los datos de la siguiente tabla, se requiere probar la hiptesis nula de que la afectividad
de los trabajadores no influye en la relacin con sus compaeros de trabajo.

Se considera usted afectivo?

S No

Buena
23 15
Cmo considera la relacin
Con sus compaeros de
Tabla 5
trabajo?

Mala
18 25

Hiptesis estadstica:
Ho : Q = 0

H1 : Q 0

Interprete a Q = O como la inexistencia de relacin entre las variables analizadas, lo que significa
que se desea probar que la afectividad de los trabajadores es independiente de las relaciones en el
trabajo.

La regla de decisin ser:

1. Aceptar Ho, si el coeficiente Q a calcular es menor a 0.8

2. No aceptar Ho si el coeficiente Q es mayor o igual a 0.8

Esto significa que el criterio empleado para determinar si la afectividad influye en las relaciones en el
trabajo, es que por lo menos en el 80% de los datos observados se confirme el supuesto del
investigador, esto es, que no sea aceptada la hiptesis nula. Recuerde que la intencin de plantear la

41
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

hiptesis nula es rechazarla y su sentido es contrario a la hiptesis de trabajo.

Al calcular el coeficiente Q con los datos de la tabla encontramos que su valor es Q = 0.36 y al
compararlo en la regla planteada nos lleva a la tomar la decisin estadstica correspondiente:

Decisin estadstica: Aceptar Ho.

Conclusin: Los datos utilizados para la prueba pretenden confirmar que la afectividad de los
trabajadores en independiente, o tiene poca relacin o influencia en las relaciones de stos con sus
compaeros; ya que se observ, que slo 36 de cada 100, s presentan relacin alguna ( 36% ) entre
ambas variables. Seguramente que las relaciones personales estn influidas, por lo menos a partir
de los datos de la muestra tomada para la investigacin, por otras variables como el liderazgo, la
motivacin, entre otras.

III.3 COEFICIENTE DE CORRELACIN DE PEARSON.

Como ha sido referido anteriormente, las variables de mayor presencia o incidencia en las ciencias
sociales son de carcter no numrico, caracterstica que hace la diferencia con las dems disciplinas
o reas del conocimiento. Actualmente, nos encontramos en la etapa de adecuacin a los nuevos
ritmos y exigencia de los mercados tanto nacionales como internacionales, sea cual fuere su mbito
o contexto de accin: social, econmico, cultural; para cambiar el paradigma de que slo en la
investigacin social se trabaja con datos no numricos, de all la discrepancia, tambin actual, entre
investigadores y profesionales de la estadstica aplicada a las ciencias sociales.

La tendencia actual y firme recomendacin del autor, es que los fenmenos cualitativos sean
medidos escalarmente desde el diseo de la investigacin, con la ventaja de tener mayor libertad o
movilidad para la medicin de las variables y su relacin entre ellas. Uno de los recursos de mayor
confiabilidad para medir qu tanto impacta el comportamiento de una variable con aquellas con
quienes interacta, es el coeficiente de correlacin de Pearson, mismo que tambin mide el grado de
asociacin entre variables, pero en este caso slo escalares y con datos no agrupados, categora en
la que se integran, por razones prcticas, a las variables de nivel intervalar y racional.

42
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Este coeficiente de correlacin de Pearson se desplaza tambin alrededor del intervalo de O a 1. Si


el coeficiente toma el valor de 1 se dice que la correlacin es perfecta, pero si toma el valor cero se
identifica como correlacin nula.

Cabe mencionar que este coeficiente es utilizado slo con datos numricos no agrupados por
intervalos, o lo que llamamos lista de datos.

120

100

80

El coeficiente de correlacin 60

ser igual a cero si la 40

correlacin es nula. Las 20

variables son independientes. 0


0 20 40 60 80 100

25

El coeficiente de correlacin 20

ser igual a uno si la correlacin


es perfecta. Las variables son 15

dependientes. 10

0
0 5 10 15 20 25

El coeficiente de correlacin de Pearson se obtiene mediante la siguiente expresin:

rp ( Frmula 4 )

En esta prueba, la hiptesis nula apunta tambin, como el caso del coeficiente Q de Kendall, a

43
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

confirmar la inexistencia de correlacin entre las variables numricas consideradas para el anlisis.
Ejemplo: Los siguientes datos corresponden a las horas semanales que un grupo de 10 mujeres que
trabajan desde su casa, dedican a su negocio personal y los ingresos, en pesos, promedio obtenidos:

Tabla 6

Madre 1 2 3 4 5 6 7 8 9 10

Horas (X) 12 10 8 6 9 12 15 11 20 6

Ingresos (Y) 2400 1700 1900 1200 2200 1800 3000 2400 3800 1000

Se requiere probar la hiptesis de trabajo de que los ingresos de las personas que trabajan desde su
casa, estn determinados por las horas que le dedican al negocio personal. En este ejemplo se
desea conocer el nivel de correlacin entre dos variables numricas escalares con datos no
agrupados, por lo tanto la hiptesis estadstica ser la siguiente:

Hiptesis nula Ho: rp = O

Hiptesis alternativa H1: rp O

El estadstico de prueba a utilizar es el coeficiente de correlacin de Pearson ( Frmula 4 ),

planteando la regla de decisin como sigue:

1. Aceptar Ho si el valor de rp < 0.8

2. No aceptar Ho si el valore de rp 0.8

Al sustituir los datos requeridos por el estadstico de prueba en la Frmula 4 y realizar las
operaciones respectivas, se obtiene que el coeficiente de correlacin es:

rp = 0.93

Al comparar este resultado en la regla de decisin, la hiptesis nula no se acepta, lo que indica, por
la magnitud del valor obtenido, que existe una correlacin entre las horas de trabajo semanales y el

44
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

ingreso promedio de las mujeres que laboran desde su hogar.

III.4 PRUEBA JI CUADRADA ( X2 ) DE INDEPENDENCIA ENTRE VARIABLES.

Entre otras aplicaciones, la prueba Ji cuadrada (X2) pretende evidenciar, para la relacin entre
variables nominales u ordinales, si existe independencia entre una y otra, o qu tanto una explica el
comportamiento de la otra, por medio de la comparacin de la distribucin de las frecuencias
empricamente obtenidas (observadas) en el proceso de recoleccin de datos, con la distribucin de
las frecuencias que tericamente se esperaba por categora de incidencia.
Un ejemplo de una distribucin de frecuencias observadas se presenta en una tabla de contingencia
como la siguiente, y a partir de ella se realiza la prueba:

Tabla 7

Rendimiento en el
Estado civil trabajo Total
Bajo Medio Alto

Casado 82 76 20 178

Soltero 75 27 53 155

Total 157 103 73 333

El estadstico utilizado para esta prueba es:

(Fo - Fe) 2

X2 = --------------------------
( Frmula 5 )

Fe

Donde:

Fo = frecuencia observada en la incidencia entre dos categoras de las


Variables u obtenidas en la recoleccin de datos.

Fe = frecuencia esperada por la tabla de contingencia entre esas dos

45
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

categoras.
La prueba consiste en comparar el valor calculado de X2 utilizando para ello la Frmula 5, con el
obtenido a partir de la tabla de la Distribucin X2 que se presenta en el anexo 2. Para accesar a esa
tabla deber determinarse el nivel de significacin o el nivel de confianza con el que se desea hacer
la prueba y los grados de libertad de la distribucin, obtenidos de la siguiente manera:

Grados de libertad = ( Total de renglones - 1 ) ( Total de columnas - 1 ) ( Frmula 6 )

La tabla de contingencia que se presenta en este apartado tiene 2 renglones y 3 columnas, por lo
tanto tiene (2 - 1 ) ( 3 - 1 ) = ( 1 ) ( 2 ) = 2 grados de libertad.

Para la obtencin del valor de X2 calculado, la tabla de contingencia presenta las frecuencias
observadas. Las frecuencias esperadas se calculan con la siguiente expresin:

( Total de frecuencias del rengln) (Total de frecuencias de la columna) (Frmula 7 )


Fe = ------------------------------------------------------------------------------------------------------
( Suma total de frecuencias marginales de la tabla)

En la tabla del ejemplo, la frecuencia observada en la primera celda es 82, que son el total de
personas casadas con bajo rendimiento en el trabajo. Si se desea obtener la frecuencia esperada en
esa celda, utilicemos la frmula 7 y obtendremos:

( 178) (157)
Fe = --------------------------- = 83.92
( 333 )

Significa que para evidenciar que las variables son independientes, la tabla de contingencia esperaba
que del total de personas tomadas para la prueba, 83.92 fueran casadas con bajo rendimiento en el
trabajo. Ntese que en este caso la diferencia entre la frecuencia observada (82) y la esperada
(83.92) es mnima. Por razones prcticas siga el criterio de redondear sus resultados al entero ms
cercano, en este caso la frecuencia esperada obtenida se redondea a 84.

En la siguiente tabla se presentan, entre parntesis, las frecuencias esperadas o tericas, para su
comparacin con las frecuencias observadas o empricas:

46
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Tabla 8

Rendimiento en el trabajo
Estado Total
Bajo Medio Alto

Casado 82 (84) 76 (55) 20 ( 39) 178

Soltero 75 (73) 27 (48) 53 (34) 155

Total 157 103 73 333

La prueba X2 compara la distribucin de esas frecuencias observadas y esperadas por cada celda, y
dependiendo qu tan grande se presente la diferencia, saca las conclusiones de si sta es
significativa para determinar si las variables puestas a prueba son independientes o no.

Si la diferencia no es notablemente grande, la conclusin es que las variables relacionadas son


independientes y una no explica a la otra, lo que en el ejemplo significara que el rendimiento en el
trabajo no depende del estado civil de los empleados, sino que sern otras causas las que lo
determinen. Si por el contrario, las diferencias mencionadas s son significativamente grandes, la
conclusin es que s existe dependencia entre las variables en estudio, lo que indicara en el ejemplo
que el estado civil determina o influye en el rendimiento laboral.

Analice las diferencias indicadas y le pregunto: Cul es su conclusin? Contine con el estudio de
los detalles de la prueba y compare su conclusin.

Este supuesto obvia tiempo de trabajo y permite tomar ms oportunamente las decisiones; sin
embargo, se recomienda que en los primeros ejercicios se acte con cautela, ya que para determinar
si la diferencia entre dos valores es grande o pequea, depender de diversos factores como el
contexto y las unidades de medicin, entre otros.

Por ejemplo: la diferencia de un minuto entre iniciar una sesin de trabajo antes o despus de la hora
fijada, tal vez no tenga ninguna trascendencia y se apreciara como mnima o despreciable. Pero si
ese minuto de diferencia se contextualiza en el suministro de oxgeno a un paciente hospitalario,

47
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

puede ser fatal.


Continuando con la presentacin y realizacin de nuestra prueba X2 , obsrvese. la siguiente grfica,
en ella se indica la regin de aceptacin de la hiptesis nula Ho la regin de no aceptacin, tambin
referida como nivel de significacin a ( alfa ), en este caso de 0.05 5%.

La regla de decisin de esta prueba se plantea a partir de indicar cul es el valor de X 2 que
determinar la frontera entre la regin de aceptacin y la regin de rechazo. Este valor es llamado X 2
terica y se obtiene de la tabla del anexo 2, considerando los grados de libertad y el nivel de
significacin con que se realizar la contrastacin de la hiptesis nula. El valor de la X 2 que se
calcula con los datos de la tabla de contingencia, se compara con el de la X 2 terica. Si el valor
calculado es menor al valor terico, entonces se acepta la hiptesis nula ( Ho ), lo que indica que las
variables son independientes; pero si el valor calculado es mayor al valor terico, entonces est
cayendo en la zona de no aceptacin, por lo que la hiptesis nula ( Ho ), no es aceptada, refiriendo
entonces que las variables no son independientes, esto es que una explica el comportamiento de la
otra.

Regla de decisin de la prueba X2:

1. Aceptar Ho si: X2 calculada < X2 terica

2. No aceptar Ho si: X2 calculada > X2 terica

48
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Para concluir la prueba en nuestro ejemplo, calculemos el valor de X2 los datos de la tabla de
contingencia, siguiendo la frmula ( 5 ):

Tabla 9

Celda Frec observada Frec esperada (Fo - Fe ) ( Fo - Fe )2 ( Fo - Fe)2 I Fe


1 82 84 -2 4 0.05
2 76 55 21 441 8.02
3 20 39 -19 361 9.26
4 75 73 2 4 0.05
5 27 48 -21 441 9.19
6 53 34 19 361 10.62
Suma 37.19

Con los dos grados de libertad de la tabla de contingencia y si deseamos realizar la prueba con el 5%
de nivel de significacin 95% de confianza, como a usted se le facilite, vea la tabla 2 del anexo y en
la primera columna localice 2 grados de libertad y busque la interseccin con la columna 0.05, all
encontrar que el valor de la X2 terica = 5.99147

Al comparar ambos valores (X2 calculada = 37.19 y X2 terica = 5.99147 ) en la regla de decisin, se
rechaza la hiptesis nula ( Ho ), concluyendo que las variables no son independientes, lo que se
interpreta afirmando que el rendimiento en el trabajo s mantiene relacin con el estado civil de los
empleados. Confirm su decisin anterior?

49
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

III.5 PRUEBA DE CORRELACIN C DE PEARSON

En ciencias sociales es comn que la investigacin requiera de realizar pruebas de correlacin entre
variables nominales de ms de dos categoras, al menos una de ellas. En este caso podr disponer
de un estadstico sencillo que se apoya en el principio del coeficiente X2.

El coeficiente C de Pearson es una herramienta que permite medir el nivel de correlacin entre dos
variables nominales con ms de dos categoras como estado civil: soltero, casado, divorciado; como
por ejemplo en la pregunta siguiente: est usted de acuerdo en trabajar en fines de semana? Cuyas
respuestas son: de acuerdo, ni de acuerdo ni en desacuerdo, en desacuerdo.

El estadstico de prueba es el siguiente:

X2calculada
C = ------------------------------------- ( Frmula 8 )
X2 calculada + N

Para obtener el valor del coeficiente C de Pearson, deber calcularse el valor de X2 a partir de los
datos de la tabla que relaciona las variables.

Si este estadstico es igual a cero (C = O ) se dice que las variables no estn correlacionadas o son
independientes. Entre ms cercano se encuentre el coeficiente de cero mayor ser la tendencia a
que las variables comparadas no guarden relacin entre s. En la medida que el coeficiente vaya
aumentado su valor, las variables estarn ms correlacionadas. En otras palabras, una de ellas
explicar el comportamiento de la otra. El mximo valor que puede tomar el coeficiente C estar
cercano a la unidad, indicando la existencia de alto nivel de asociacin entre las variables.

50
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Dado que es una prueba de correlacin, la hiptesis nula se plantea en los siguientes trminos

Hiptesis nula Ho: C = 0

Hiptesis alternativa H1: C 0

La regla de decisin depender del inters y exigencia del investigador o de la investigacin,


recordando que el valor mximo podr estar muy cercano a la unidad.

Ejemplo: Se desea conocer si la disposicin de los trabajadores para laborar en fin de semana
depende de su estado civil, o qu tanto influye ste en la decisin de participar en esos das de
descanso. Los datos se presentan en la tabla siguiente:

Tabla 10

Est dispuesto a
trabajar en fin de
Estado civil semana? Total
No Tal vez S

Casado 15 11 18 44

Soltero 24 21 17 62

Total 39 32 35 106

En este caso plantearemos la regla de decisin que evidencie, en caso de ser aceptada la hiptesis
nula Ho, un alto nivel de correlacin entre esas dos variables nominales.

Regla de decisin:

1. Aceptar Ho si C < 0.9

2. No aceptar Ho si C 0.9

51
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Significa que en caso de ser aceptada la hiptesis nula ( Ho ), la decisin de menos del 90% de los
trabajadores entrevistados en su disposicin por trabajar en fin de semana se encuentra influida por
su estado civil.

Para obtener el coeficiente C de Pearson, estadstico de esta prueba, primero se encuentran las
frecuencias esperadas segn lo tratado anteriormente, obsrvelas entre parntesis en la tabla que a
continuacin se presenta:
Tabla 11
Est dispuesto a trabajar en fin
Estado civil de semana? Total
No Tal vez S

Casado 15 (16) 11 (13) 18 (15) 44

Soltero 24 (23) 21 (19) 17 (20) 62

Total 39 32 35 106

El valor de X2 calculada se obtiene en la siguiente tabla:


Tabla 12
Celda Frec. obsevada Frec. esperada ( Fo Fe ) ( Fo Fe ) ( Fo Fe ) / Fe
1 15 16 -1 1 0.06
2 11 13 -2 4 0.31
3 18 15 3 9 0.6
4 24 23 1 1 0.04
5 21 19 2 4 0.21
6 17 20 -3 9 0.45
calculada 1.67

Sustituyendo en el estadstico de prueba se obtiene:

1.67
C = ---------------------------------------
1.67 + 106

C = 0.12

52
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Comparando el valor del coeficiente C de Pearson se toma la decisin de aceptar la hiptesis nula
(Ho) significando que existe correlacin muy baja entre la disposicin de trabajar en fin de semana y
su estado civil, por lo que se debern buscar otras variables que permitan determinar las causas por
las que los empleados estn dispuestos a laboral en das de descanso.

ACTIVIDADES DE APRENDIZAJE

Contestar las siguientes preguntas:

1. Cmo entiende usted el significado de una prueba de independencia entre variables?


2. Cmo entiende usted una prueba de correlacin entre variables?
3. Cul es la diferencia objetiva entre esos dos tipos de pruebas estadsticas?
4. Qu ventajas observa usted al realizar una prueba estadstica de independencia entre variables
con una de correlacin?

Ejercicio 1:

Con los datos de la Unidad 11 y especificando el proceso para la comprobacin de hiptesis, realice
una prueba de correlacin para variables numricas y datos no agrupados que indique el nivel de
correlacin entre ellas. Cul es la conclusin de la prueba y qu recomendaciones podra hacer
usted respecto a la cultura del ahorro?

Ejercicio 2:

Clasifique los datos de la Unidad II en las siguientes categoras

Salario: Menos de 20 >>> Salario Bajo


20 ms >>> Salario alto

Ahorro: Menos de 2.0 >>> Ahorro bajo


De 2.0 a 4.0 >>> Ahorro medio
Ms de 4.0 >>> Ahorro alto

Con los datos clasificados, construya la tabla de contingencia correspondiente e indique, mediante la

53
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

prueba estadstica que corresponda, si las variables son independientes o no. Indique el nivel de
confianza de su prueba y las conclusiones respectivas.

AUTOEVALUACIN

Enuncie su concepto de prueba estadstica.

Cul es la importancia de realizar pruebas estadsticas?

Qu es una prueba estadstica de correlacin?

Qu es una prueba estadstica de independencia?

Cules son las caractersticas de la prueba Ji cuadrada?

Cules son las caractersticas de las pruebas de correlacin de Pearson?

54
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

GLOSARIO

Poblacin: Es un conjunto de elementos bien determinados y con caractersticas comunes,


que los hace formar parte del mismo. Ejemplo: mujeres solteras que trabajan en la industria
farmacutica en el turno matutino.

Poblacin finita: Es aquel conjunto en el cual su nmero de elementos est definido o


determinado. Ejemplo: los empleados que recibieron crdito hipotecario el mes pasado.

Poblacin infinita: Es aquel conjunto en el que el nmero de sus elementos es indefinido o


indeterminado. Ejemplo: los trabajadores que recibirn prstamos para adquisicin de automvil
durante los prximos diez aos.

Muestra: Fraccin o parte de la poblacin, esta debe ser representativa del conjunto de donde
ha sido extrada; para ostentar el carcter de representatividad, la muestra deber evidenciar tanto
las coincidencias como las discrepancias existentes en la poblacin.

Parmetro: Es todo valor o caracterstica que ha sido calculado, observado o extrado de la


poblacin.

Estimador: Tambin llamado estadstico, es todo valor o caracterstica que ha sido


calculado, observado o extrado de una muestra. El propsito del estimador es dar a
conocer los parmetros sin observar a la totalidad de los elementos de la poblacin.

Mtodo de muestreo: Consiste en determinar cmo sern seleccionados los elementos que
habrn de integrar la muestra y se clasifica en muestreo con reemplazo y sin reemplazo.

Tipos de muestreo: Se clasifica en probabilstico y no probabilstico. El primero de ellos es


aquel en el que todos los elementos de la poblacin tienen una probabilidad conocida de formar parte
de la muestra. En el segundo se desconoce o es indeterminable esa probabilidad.

Nivel de Confianza: De manera sencilla, se desea determinar cuntos de cada 100 elementos
que se tomen como muestra, debern poseer las caractersticas de la poblacin. En otros trminos

55
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

es la probabilidad de que la estimacin efectuada se acerque a la realidad.

Margen de error: Tambin llamado error muestral o nivel de precisin, es la diferencia mxima
que el investigador est dispuesto a aceptar entre un estadstico y su parmetro.

Dispersin en la poblacin o variabilidad: Antes de iniciar una investigacin, el equipo de


proyecto deber tener claro qu tipo de poblacin estudiar, qu caractersticas sobresalen, cul es
la variable principal u objeto de estudio y otros aspectos que son determinantes para el
involucramiento en el tema y consecuentemente para realizar diagnsticos y anlisis con mayor
confiabilidad y credibilidad.

Hiptesis: Enunciado que afirma la relacin, comportamiento, tendencia y diversos


aspectos de ocurrencia entre dos o ms variables de una muestra o poblacin y est sujeto a
comprobacin.

Hiptesis de trabajo: Es aquella que plantea el investigador o la investigacin como objeto o


base de su anlisis y estudio; trata de dar una explicacin tentativa al fenmeno que se est
investigando.

Contraste de hiptesis: Es un proceso estadstico que permite elegir una hiptesis de trabajo
entre dos posibles y contraria una a la otra.

Hiptesis nula ( Ho ): Para realizar el contraste de hiptesis se supone cierta una de ellas,
llamada hiptesis nula Ho, la cual es formulada por el investigador con el propsito de ser
rechazada; este enfoque resulta en ocasiones incomprensible, ya que se cuestiona cmo es posible
que se plantee algo que pretende rechazarse?

Hiptesis alternativa (H1): La hiptesis alternativa se opone a la hiptesis nula y est en


relacin directa con el planteamiento de la hiptesis de trabajo, esto es, tienen el mismo sentido
aunque planteada la primera en trminos estadsticos y la ltima en el lenguaje de la investigacin.
Error Tipo 1: El Error Tipo I se comete cuando en la decisin se rechaza la Hiptesis Nula (Ho)
siendo sta verdadera.

56
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

Error Tipo 11: El Error Tipo 11 se comete cuando en la decisin se acepta la Hiptesis Nula
(Ho) siendo sta no verdadera.

Nivel de significacin: Es la probabilidad de cometer el error tipo 1, esto es, rechazar la


hiptesis nula ( Ho ) cuando sta es verdadera.

Grados de libertad: Nmero de posibilidades que en un conjunto de datos, se tiene para la


asignacin de valores, tambin identificado como la cantidad de variables independientes para la
realizacin de una prueba estadstica. Si los grados de libertad de un modelo tienden a
incrementarse, la forma de la distribucin tiende a ser normal.

Tabla de contingencia: Tambin llamada de doble entrada, es aquella que presenta


matricialmente la relacin entre dos variables de dos o ms valores o categoras. Esa relacin se
observa mediante las frecuencias de incidencia entre esos elementos de las variables relacionadas.
La interseccin entre un rengln y una columna es llamada celda.

Frecuencias marginales: Es la suma total de las frecuencias absolutas que corresponde a


cada valor, intervalo o categora de una variable que se est relacionando con otra en una tabla de
contingencia o de doble entrada.

Frecuencias conjuntas: Es la frecuencia absoluta que se observa en cada celda de una tabla
de contingencia.

Frecuencias observadas: Para el anlisis de relacin entre dos variables, la frecuencia


observada es el nmero de casos que, a partir de los datos en estudio, forman parte de la
interseccin entre un rengln y una columna en una tabla de contingencia.

Frecuencias esperadas: Para el anlisis de relacin entre dos variables, la


frecuencia esperada es el nmero de casos que de acuerdo a la distribucin marginal, la tabla
de contingencia esperaba en cada celda para evidenciar la independencia entre variables.

57
Fundamentos de Estadstica para la Toma de Decisiones Jos Luis Sandoval Dvila
_______________________________________________________________________________________________________________

PREGUNTAS FRECUENTES

De qu tamao debe ser una muestra para que sea representativa de la poblacin?
Si se pretende buscar la efectividad de una investigacin, para determinar el tamao de la muestra
deber considerarse el tamao de la poblacin: si la poblacin es grande, la muestra tiende a ser
relativamente pequea; y si la poblacin es pequea, la muestra tender a ser proporcionalmente
grande.

Cmo distinguir el tamao ptimo de una muestra del diseo ptimo de la misma?

Cuando se refiere al tamao ptimo, lo que se busca es determinar el nmero de elementos que
mnimamente permitirn que la estimacin de los parmetros sea altamente confiable. Sin embargo,
cuando se refiere el diseo ptimo de la muestra, al tamao deber agregrsele el tipo de muestreo
adecuado a las caractersticas de la poblacin, as como el mtodo ms apropiado para la
investigacin.

Por qu se dice que la hiptesis nula se plantea con el propsito de ser rechazada?
Lo que pretende el investigador es comprobar la validez de su hiptesis de trabajo y como la
hiptesis nula se plantea contraria a la de trabajo; entonces, lo que se busca es encontrar evidencias
para no aceptar la hiptesis nula.

Qu tipo de prueba estadstica es la ms recomendable en ciencias sociales?

Como recomendacin sera aventurado referir alguna prueba especfica, ya que cada grupo de datos
es diferente lo mismo que el planteamiento de la hiptesis. Se recomienda primeramente
involucrarse ampliamente en los objetivos de la investigacin y posteriormente plantear eficazmente
las hiptesis de trabajo, las que traern como consecuencia el diseo de las hiptesis nulas de
donde se deriva el estadstico de prueba a utilizar.

58
FUENTES DE CONSULTA

Cochran Willlam. Tcnicas de muestreo, Mxico Ed. Cecsa, 2003.

Gemmell Glass, Gene v.; Mtodos estadsticos aplicados a las ciencias sociales, Mxico Ed. Prentice
hall, 2004.

Guerrero g, Victor. Estadstica bsica para estudiantes de economa '1 otras ciencias sociales,
Mxico, Ed. Fondo de cultura econmica, 2000.

Holgun Quiones, Fernando. Estadstica descriptiva aplicada a las ciencias sociales, Mxico, Ed.
UNAM, facultad de ciencias polticas y sociales, 1998.

Kerllnger, Frederick Nichols. Investigacin del comportamiento. Tcnicas y metodologa, Mxico, Ed.
Trillas, (ltima edicin)

Leach Chris. Fundamentos de estadstica: enfoque no paramtrico para ciencias sociales, Mxico,
Ed. Limusa, 2005.

Levin, Jack. Fundamentos de estadstica en la investigacin social, Mxico, Ed. Harla, 2004.

Mateos Rivas, Jos. Estadstica en investigacin social: ejercicios resueltos, Madrid, Espaa, Ed.
Paraninfo, 1989.

Rodrguez Osuna, Jacinto. Mtodos de Muestreo, Madrid, Espaa, Ed. Centro de Investigaciones
Sociolgicas, 2003

Rojas Soriano, Ral. Gua para realizar investigaciones sociales. Mxico. Cal y Arena. 2008.

Fecha de ltima actualizacin: 20 enero 2012 Derechos Reservados saira_consultores@yahoo.com.mx

Anda mungkin juga menyukai