Anda di halaman 1dari 51

INSTITUTO DE CIENCIAS Y ESTUDIOS SUPERIORES

DE TAMAULIPAS A.C

BIOESTADISTICA II

Compilador: Ricardo Alberto Ponce de León Díaz

Tampico, Tamps. Mayo de 2015

1
ÍNDICE

Objetivo General de la Antología 4


Introducción a la Bioestadística 5

Unidad I: Universo Estadístico y Técnicas de Recopilación de Datos


Objetivo de la Unidad 6
1.1. Definición de términos 6
1.2. Universo 7
1.3. Muestra 7
1.4. Elemento 18
1.5. Ejercicios 20
Actividades de Aprendizaje Unidad I 20
Síntesis de la UnidadI 21

Unidad II: Técnicas de Medición Estadística Hospitalaria


Objetivo de la unidad 22
2.1. La media, procedimiento y uso. 22
2.2. El rango, procedimiento y uso. . 23
2.3. La desviación estándar, procedimiento y uso. 24
2.4. La varianza, procedimiento y uso. 27
Actividades de Aprendizaje Unidad II 29
Síntesis de la Unidad II 29

2
Unidad III: Tablas y Gráficos Estadísticos
Objetivo de la unidad 30
3.1 Datos agrupados . 30
3.2 Frecuencias relativas 31
3.3 Frecuencias acumuladas 32
3.4 Elaboración de cuadros comparativos 32
3.5 Ejercicios 33
3.6 Gráficas de barras 34
3.7 Gráficas de sectores circulares 35
3.8 Histogramas 35
3.9 Polígonos de frecuencias 36
3.10 Ojivas 37
3.11 Pictogramas 38
3.12 Combinadas 39
3.13 Análisis e interpretación de resultados 40
3.14 Elaboración de cuadros estadísticos 43
Actividades de aprendizaje Unidad III 47
Síntesis de la Unidad III 47
Bibliografía y Fuentes Consultadas 48

3
OBJETIVO GENERAL DE LA ANTOLOGIA

La información contenida en ésta antología reúne, explica y relaciona los métodos estadísticos,
enlistados en la carta descriptiva de ésta materia, que será la herramienta que el alumno necesitará
para la solución de problemas estadísticos. Su lectura y consulta constante será de gran ayuda para
su entendimiento.

4
INTRODUCCION A LA BIOESTADÍSTICA

La estadística puede definirse como la disciplina científica dedicada al tratamiento de la información


que contiene series de datos que proceden de la observación de fenómenos colectivos
(demográficos, económicos, sanitarios, etc.) en los que intervienen factores de variación que hacen
necesario formular modelos probabilísticos para poder llegar a conclusiones ó predicciones bajo un
determinado nivel de probabilidad. En general, los procedimientos estadísticos se aplican a la
recopilación, organización, presentación, análisis e interpretación de datos numéricos con el fin de
realizar una toma de decisiones más efectiva.

Se le denomina Bioestadística a la aplicación particular de la estadística a las ciencias biológicas y de


la salud. Es decir, a la obtención y análisis de los datos biológicos ó de salud mediante la utilización
de métodos estadísticos.

Por ejemplo, la bioestadística se puede usar para apoyar a comprender las posibles causas de un
cáncer ó con qué frecuencia se presenta una enfermedad en un determinado grupo de personas. En
algunos ámbitos se le denomina biometría. (Sábado, 2009)

5
UNIDAD I

UNIVERSO ESTADÍSTICO Y TÉCNICAS DE RECOPILACIÓN DE DATOS

Objetivo de la Unidad: Reconocer datos estadísticos y aplicar las técnicas de recopilación de datos
para la realización de investigaciones.

1.1 Definición de Términos

Los datos con los cuales se realizan los trabajos estadísticos varían entre individuos y se obtienen a
partir de elementos que en conjunto conforman un universo. Con frecuencia dato e información se
utilizan como sinónimos. Sin embargo, por información entendemos los datos procesados de manera
significativa para el receptor, con valor real y perceptible para tomar decisiones presentes y futuras,
los cuales se nos presentan en forma de indicadores. La información así planteada se obtiene como
resultado o producto del proceso que se muestra en la siguiente figura:

Figura núm. 1 (Celis de la Rosa, 2014)

6
Los datos no son útiles o significativos como tales, sino hasta que son procesados y convertidos en
información. De alguna manera, la información es el conocimiento derivado del análisis de los datos.
Ésta es la diferencia básica entre datos e información. Hay que hacer notar que la información
obtenida en un proceso puede servir como dato para otro proceso. (Celis de la Rosa, 2014)

1.2 Universo

Una decisión fundamental en todo proceso de investigación es el lugar donde se va a llevar a cabo el
estudio. Las razones que mueven a un investigador o investigadora a un cierto terreno pueden ser de
la más variada índole (cercanía, comodidad personal, factibilidad u otras). Sin embargo, de no haber
un cruce convincente con la pregunta o hipótesis planteada, los resultados serán poco creíbles y
carecerán del peso suficiente para sostener las conclusiones. Las preguntas de investigación
reclaman lugares o territorios sociales para ser respondidas. Las posibilidades de una investigación
cualitativa son normalmente limitadas para abordar la totalidad del universo de estudio. (Díaz
Narváez, 2009)

En estadística universo o población se definen como el conjunto de valores por los cuales existe
algún interés. El total del universo o población se representa con la letra mayúscula N . Las
poblaciones pueden definirse especificando una regla (o reglas). Éstas pueden ser: características de
individuos, límites geográficos, grupos ya existentes, límites de tiempo, etc. Por ejemplo: residentes
de Guadalajara, asistentes a un paseo escolar, derechohabientes del IMSS, enfermos de cólera.
(Celis de la Rosa, 2014)

Las limitaciones para acceder al universo ó población pueden ser de diferente índole. Puede que no
se cuente con los recursos necesarios como para obtener datos para todas las unidades de estudio o
que éstas sean prácticamente infinitas. (Balzarini, 2013)

7
1.3 Muestra

El universo de interés es infinito, ó finito pero enorme, por lo que es imposible estudiar a todos sus
elementos. Por ejemplo, existe interés en estudiar el peso y la talla de todos los humanos que viven
en la actualidad. El universo de interés es tan grande, disperso y difícil de localizar que el investigador
decide estudiar una muestra.

Los trabajos estadísticos deben cumplir con uno de los siguientes objetivos:

a) Describir cuantitativamente una población estudiando la totalidad de sus elementos.


b) Describir cuantitativamente una población a partir de una pequeña parte del total de sus
elementos. (Celis de la Rosa, 2014)

La muestra es una parte del todo, es la parte que será analizada unidad por unidad para finalmente
inferir o especular el comportamiento de la variable de interés en la población. Por lo tanto, es
importante conseguir una buena muestra. (Balzarini, 2013)

Durante el proceso de investigación se debe procurar alcanzar el primer objetivo. Por desgracia, esto
no siempre es posible, por lo que se opta por estudiar sólo una parte, o muestra, del universo. Entre
los diversos motivos que obligan a esto se encuentran:

 Parte de la población no está disponible para el estudio. Por ejemplo, el interés reside en
estudiar el efecto de un medicamento en un grupo de enfermos, pero algunos elementos de la
población están recibiendo otro tratamiento que modifica la respuesta del que se quiere
probar.
 Para estudiar sus características es necesario destruir a los elementos. Por ejemplo, al médico
le interesa conocer la concentración de glucosa en sangre de su paciente. Dado que estudiar
toda la sangre probablemente represente la muerte del paciente, sólo se toma una parte de
ella (no más de 10 ml de sangre) para realizar el estudio.

8
 Es imposible identificar todos los elementos del universo de interés. Por ejemplo, a un
epidemiólogo le interesa describir los antecedentes hereditarios de los enfermos de diabetes
mellitus. Dado que no todos estos enfermos están identificados, se conforma con estudiar una
muestra de ellos.
 Existen pocos recursos (económicos, humanos, tecnológicos) para estudiar el universo. Por
ejemplo, durante la investigación surge la necesidad de practicar una tomografía axial
computarizada (TAC) a los elementos del universo de interés. Desgraciadamente, no hay
personal capacitado en cantidad suficiente para realizar el estudio en todo el universo y la
capacitación de ellos excede los límites de la investigación (mucho tiempo y dinero para ello).
Los investigadores deciden practicar la TAC en una parte del universo. (Celis de la Rosa,
2014)

El diseño del muestreo, es decir el planificar cómo se tomará una muestra, usualmente se relaciona
con preguntas tales como: ¿cuántas unidades conformarán una muestra?, ¿cómo se seleccionarán
estas unidades desde la población? Como el objetivo es concluir sobre la población a través de lo
observado en una parte de ella, todas estas preguntas persiguen un mismo fin: obtener muestras
representativas de la población. Esto implica que la muestra seleccionada para llevar a cabo el
estudio, nos permitirá conocer acertadamente características de la población de la que ha sido
extraída. El tamaño de la muestra es una característica a considerar para lograr buena
representatividad. Los procedimientos de selección de muestra o de muestreos basados en el azar
(procedimientos aleatorios) son preferibles a los procedimientos de muestreos basado en el juicio del
investigador sobre cuáles elementos considerar en la muestra y cuáles no. (Balzarini, 2013)

Las muestras son útiles cuando es impráctico ó muy costoso obtener la información de toda la
población. Una muestra representativa permite obtener conclusiones generalizadas a toda la
población (Hernández Avila & Lazcano Ponce, 2013)

En términos generales, existen dos tipos de procedimientos mediante los cuales se obtiene una
muestra: muestreo probabilístico y muestreo no probabilístico. Sólo para el muestreo probabilístico
existen procedimientos estadísticamente seguros que permiten hacer inferencias, a partir de una
muestra, sobre la población. (Celis de la Rosa, 2014)

9
Muestreo probabilístico
Una muestra probabilística es una muestra extraída de una población, de tal manera que todo
miembro de la población tenga una probabilidad conocida, mayor de 0, de ser incluido en la muestra.
Se reconocen cuatro tipos de muestreo probabilístico:

— Aleatorio simple.
— Aleatorio estratificado.
— Por racimos o conglomerados.
— Sistemático.

Muestreo Aleatorio Simple


Muestreo aleatorio simple Si tenemos una población de tamaño N y seleccionamos una muestra de
tamaño n cuando todas las muestras posibles de ese tamaño n tienen la misma probabilidad de ser
seleccionadas, entonces hemos seleccionado una muestra aleatoria simple. Para su empleo es
indispensable disponer de un marco muestral, es decir, un listado con los elementos de la población
numerados del 1 a N ( N = tamaño de la población). La selección de los elementos que componen la
muestra es al azar, por lo que las preferencias y deseos del sujeto no influyen en este proceso. Para
que la selección sea al azar se debe utilizar uno de los siguientes procedimientos: sorteo, tabla de
números aleatorios, números aleatorios generados por una calculadora o por una computadora.

10
Ejemplo: Supóngase que se tiene interés en calcular el peso promedio del grupo de 24 niños descrito
en la figura

Tabla núm. 1 Características de un grupo de recién nacidos sanos (Celis de la Rosa, 2014)

Pero sólo se cuenta con recursos para 10 estudios, y se decide estudiar una muestra de 10 niños
para inferir las características del grupo en conjunto. Para seleccionar una muestra aleatoria se
procede de la siguiente manera:

1. Obtenemos una lista o relación de los 24 recién nacidos y los numeramos del 1 al 24.
2. Para la selección de los 10 niños se debe escoger entre realizar un sorteo o utilizar números
aleatorios.
a) El sorteo implica que se tomen 24 fichas (o pelotitas) idénticas y que a cada una de ellas
se le identifique con un número del 1 al 24. Después, las 24 fichas se depositan en una
urna (o algo parecido) y se agitan hasta tener la seguridad de que están perfectamente
mezcladas. Por último, se extraen 10 fichas (es importante que al seleccionar las fichas

11
quien las tome no las vea para que al extraerlas no intervenga su voluntad, ya que se
invalidaría la selección aleatoria). Sólo restaría buscar en la lista de los 24 niños (en el
marco muestral) los números que aparecen en las fichas extraídas de la urna. A ellos se
les practicaría el examen.
b) La tabla de números aleatorios es una colección de dígitos del 0 al 9 generados mediante
sorteo o en computadora, acomodados en columnas y renglones. En la figura 1.3 se
muestra una tabla pequeña. En ella se pueden apreciar grupos de cinco renglones y cinco
columnas separadas entre sí por un renglón y una columna sin números. La separación es
artificial y su único objetivo es facilitar el uso de la tabla.

Tabla núm. 2 (Celis de la Rosa, 2014)

Para seleccionar a los 10 niños con la tabla se procede de la siguiente manera:

1. Se identifica el número mínimo de dígitos que incluye el tamaño del universo. Para el
presente ejemplo, un dígito no es suficiente, ya que el valor máximo que se puede lograr
con un dígito es 9, el cual es excedido por 24, el tamaño del universo. Dos dígitos son
adecuados, porque el valor 99 incluye el tamaño de la población que se está estudiando.

2. Antes de iniciar la identificación de los elementos a estudiar, es preciso tomar algunas


decisiones. Primero, en qué orden se tomarán los dos dígitos (p. ej., suponiendo que se
inicie a partir del primer valor, el 5 arriba a la izquierda, se tienen varios números de dos
dígitos, ellos son el 56, el 59 y el 52, que corresponden a seleccionar la secuencia
horizontal, diagonal o vertical). Segundo, cómo se tomará el segundo grupo de dos dígitos
(p. ej., el siguiente número es el 90 o el 29 para la opción horizontal, el 67 o el 24 para la

12
diagonal, o el 08 o 69 para la vertical. Por último, se debe pensar qué pasará si se acaban
los dígitos en el renglón o en la columna y no se ha terminado con la selección de la
muestra (p. ej., si se está trabajando con la opción horizontal, de tal manera que se han
seleccionado los valores 56 y 90, qué pasará con el siguiente valor: se descarta el 8, se le
une con la siguiente columna y se convierte en 88 o se continúa con el mismo grupo de 25
dígitos y se le une con el 2 para obtener el 82). En realidad, todas las opciones señaladas,
y algunas otras que se le puedan ocurrir al investigador, son correctas y pueden utilizarse.
Lo importante es que la decisión sea tomada antes de iniciar la selección de la muestra.
Por otra parte, antes de iniciar se debe especificar la posición a partir de la cual se
buscarán los números. Para la tabla de la figura 1.2, que tiene 10 columnas y 10 renglones
de dígitos, existen 100 opciones. En la selección de una de ellas no debe intervenir la
voluntad. Se le podría pedir a algún compañero que dijera dos números del 1 al 10. El
primero señalaría la columna y el segundo el renglón (pero esto no se le debe decir a él).
Supóngase que dijo 5 y 3. Así pues, el dígito con el cual se empezará es el 0, que se
encuentra en la quinta columna y el tercer renglón.

3. Supóngase que se escogió un patrón horizontal y continuo, a partir del valor 0 de la quinta
columna y tercer renglón, para la selección de los individuos. Sólo resta identificar los
valores que corresponden al marco muestral. Para ello, existen dos opciones:

a) En la primera, se tendría el valor 03 que se incluye en la población a estudiar, por lo


que sería la primera selección. Se continuaría con el 81, que deberá descartarse
por no estar incluido en el marco muestral. El siguiente número es el 03, que podría
ser descartado (si el muestreo se realiza sin reemplazo) o incluido (si el muestreo
se realiza con reemplazo). Seguirían 84, 85 y 60, que se descartarían por exceder
24, hasta llegar al 05, que sí se seleccionaría porque está incluido en el marco
muestral. Y así se continuaría, descartando y tomando valores, hasta completar 10
elementos del universo. Como ya se habrá notado, este procedimiento consume
tiempo porque puede ocurrir que sea necesario descartar muchos valores.
Realmente no es una buena opción, excepto para el caso de que el tamaño del

13
universo sea próximo al valor máximo que se puede obtener con los dígitos que se
están trabajando (9 para un dígito, 99 para dos, 999 para tres, etc.).

b) En la segunda opción hacemos un uso más eficiente de la tabla de números


aleatorios. Para ello, se toma el primer valor de dos dígitos (03) y, escribiendo el
punto decimal a la izquierda, se convierte en una fracción (0.03), que se multiplica
por el tamaño del universo (0.03 X 24 = 0.72); al producto anterior se le suma 1
(0.72 + 1 = 1.72) y del resultado se toma el valor entero (1). Ese es el sujeto a
seleccionar en el marco muestral. De esta manera, sólo bastan 10 dígitos, y algo
más por las repeticiones si se les quiere excluir, para seleccionar los elementos que
compondrán la muestra. Extendiendo el procedimiento, que se muestra en la figura
1.4, se encontraría que los siguientes cuatro elementos a seleccionar serán: 20, 21,
15 y 24. Algunas calculadoras y programas de cómputo generan números
aleatorios en forma de fracciones. Partiendo de ellos, es posible seleccionar los
elementos de la muestra siguiendo el procedimiento anteriormente descrito.

Tabla núm. 3 Ejemplo de uso de números aleatorios para seleccionar elemetos a utilizar (Celis de la Rosa, 2014)

4. La muestra seleccionada se le practican los estudios estadísticos de interés y, a partir de


ella, se hacen inferencias sobre la población de la cual se tomó la muestra.

14
Muestreo Estratificado
En ocasiones, se sabe que la población está distribuida en subgrupos, y que los miembros de cada
subgrupo difieren de los demás en cuanto a las características que se desea estudiar. Para controlar
esa diferencia entre los subgrupos, se puede tomar en cuenta el subgrupo, o estrato, al que
pertenecen los elementos. El principio básico en que se apoya este tipo de muestreo es dividir la
población en estratos con el fin de obtener representatividad de los distintos subgrupos que
componen la población y hacer comparaciones entre ellos. En cada uno se selecciona una muestra,
cuya suma representa la muestra total. En este tipo de muestreo, los estratos se consideran como
poblaciones independientes. Una vez que se ha decidido cuántos elementos de cada estrato se
deben seleccionar, sólo resta aplicar los criterios del muestreo aleatorio simple a cada estrato.

Ejemplo: Se está estudiando una población compuesta por trabajadores en la que 90% está formado
por profesionales técnicos y el resto por obreros no calificados, y el interés es estimar qué ingreso
mensual promedio tienen en conjunto y qué proporción gana más de cinco mil. Si se toma una
muestra aleatoria simple de esta población, el número de obreros no calificados seguramente será
muy pequeño (alrededor de 10% en la muestra). Además, se supone que los profesionales técnicos
tienen un ingreso mayor que los obreros no calificados y no se quiere correr el riesgo de que la
muestra, por puro azar, se componga exclusivamente de profesionales técnicos. Por lo tanto, se
decide tomar una muestra estratificada según el tipo de trabajador (profesional técnico u obrero
calificado). Se cuenta con pocos recursos y, después de varias consultas con un experto en
muestreo, se ha decidido que la muestra más adecuada consiste en tomar 30 elementos de cada
grupo. Es decir, se tomarán 30 del grupo de profesionales técnicos y 30 del grupo de obreros no
calificados. Para seleccionar los 30 del primer grupo, se necesita un listado de todos los elementos
que componen el subgrupo profesionales técnicos, del cual se seleccionan, mediante muestreo
aleatorio simple, los elementos que compondrán la muestra. Se procede de igual manera con el
grupo de obreros no calificados.

15
Muestreo por racimos o conglomerados
En ocasiones el universo es muy grande y no es posible obtener un marco muestral de él. En estos
casos, generalmente se pueden identificar ciertos agrupamientos naturales que sí es posible
enumerar, y es factible realizar el muestreo considerando los diferentes subgrupos o conglomerados.
A diferencia del muestreo estratificado en que se toman todos los subgrupos, en el muestreo por
conglomerados sólo algunos subgrupos se seleccionan aleatoriamente. Después, se registran las
características de todos los elementos del conglomerado seleccionado, o bien, se selecciona una
muestra de él. El muestreo por conglomerados puede verse como un muestreo en etapas, en el que
cada etapa es en sí un muestreo aleatorio simple. Éste es un procedimiento de gran ayuda cuando
los estudios son a gran escala. Su ventaja principal es el ahorro de recursos y tiempo.

Ejemplo: Existe interés en estudiar la calidad de la atención que brindan los médicos que laboran en
el IMSS en Jalisco. Se podría obtener un listado de todos ellos y seleccionar una muestra aleatoria de
médicos. El problema sería el costo del estudio. Dado que es posible que se seleccionaran elementos
en todas las unidades médicas del IMSS, se tendría que gastar mucho en transporte. Una opción
sería muestrear en varias etapas. En la primera, el marco muestral estaría conformado por todas las
unidades de atención médica del IMSS. De él se seleccionaría una muestra aleatoria de unidades. En
la segunda etapa, en las unidades seleccionadas, a partir del marco muestral para cada unidad
seleccionada, se tomaría una muestra aleatoria de médicos. De estos elementos se obtendrían los
datos mediante los cuales se inferirían las características de la población.

Muestreo Sistemático
En este procedimiento se seleccionan los elementos de la muestra determinando de antemano
cuántos elementos se dejarán pasar antes de seleccionar el que se tomará en cuenta para integrar la
muestra. Aunque se considera que no reúne todos los requisitos de aleatoriedad, es de suma utilidad
cuando el tamaño de la población es muy grande y es difícil elaborar un marco muestral, o no se
dispone de suficientes páginas de números aleatorios.

16
Ejemplo: Si existiera interés en estudiar las características de los pacientes que acuden a consulta
de urgencia en el transcurso de una semana, no se podría definir un marco muestral del cual obtener
una muestra aleatoria simple o estratificada. El muestreo por conglomerados sería una opción, pero
difícil de realizar. Una alternativa es el muestreo sistemático.

1. Para este procedimiento, primero se decide cuántos elementos hay que estudiar:
supóngase que se eligió estudiar 100 sujetos.

2. En segundo lugar, hay que tener una definición, o al menos una buena aproximación, del
tamaño del universo. Supóngase que los registros de consulta de urgencia del año anterior
informan que en una semana se atienden, en promedio, 1 000 consultas de urgencias.

3. Después, se divide el tamaño del universo entre el tamaño de la muestra a estudiar (1 000
÷ 100 = 10). El resultado indica a qué sujetos se va a estudiar. Para este ejemplo, sería el
décimo al que se le otorgue consulta.

4. Tan sólo falta decidir a cuál de los 10 primeros se tiene que estudiar. Para ello, mediante
sorteo o tabla de números aleatorios, se selecciona un número entre 1 y 10. Supóngase
que se obtiene el ocho. Ese es el primero a quien se encuestará. Es decir, a partir de que
se inicie el trabajo de campo se dejará pasar a los primeros siete pacientes y al octavo se
le estudiará. Después de él, sólo será necesario contar 10 sujetos para encontrar el
siguiente, y así se continuará hasta completar el tamaño de la muestra necesario para el
estudio. En otras palabras, se estaría seleccionando al 8, 18, 28, 38, 48 y así hasta
completar la muestra. (Celis de la Rosa, 2014)

17
Muestreo No Probabilístico
El muestreo no probabilístico se justifica por la comodidad y la economía, pero tiene el inconveniente
de que los resultados de la muestra no siempre pueden generalizarse para toda la población. Entre
los tipos de muestreo no probabilístico se encuentran:

— Muestreo de casos consecutivos.


— Muestreo de conveniencia.
— Muestreo en bola de nieve.
— Muestreo a criterio.

Muestreo de casos consecutivos


Entre los muestreos no probabilísticos, éste es el que más se aproxima a la selección aleatoria y se
puede utilizar en una gran variedad de investigaciones. Consiste en estudiar a todos los sujetos
accesibles que se puedan identificar durante el tiempo en que se realiza el estudio.

Ejemplo: Un investigador está interesado en estudiar las lesiones que sufren los niños como peatones
en accidentes de tráfico de vehículo de motor. El investigador tiene varias opciones para sistematizar
sus casos de estudio: lesionados que fallecieron, lesionados que ameritaron hospitalización,
lesionados atendidos en unidades de emergencia, lesionados que ameritaron uno o más días de
incapacidad para desarrollar sus actividades habituales, etc. Cada uno de estos criterios tiene
características que dificultan una selección aleatoria, pero el más difícil de superar tiene que ver con
la población a la que le interesaría representar: seguramente el investigador quiere hacer inferencias
sobre la población de lesionados que se presentará en los años que siguen. De esta manera, es
imposible diseñar un marco muestral, y tampoco es posible esperar muchos años para que conteste
su pregunta de investigación. En estas condiciones, una selección de casos consecutivos es lo más
parecido a un muestreo aleatorio, siempre y cuando los casos seleccionados sean todos, o casi
todos, los casos potenciales de estudio. En la medida que la “no respuesta” de los sujetos a estudiar
aumenta y rebasa 10%, la muestra estudiada puede no ser representativa de la población.

18
Muestreo de conveniencia
Mediante este procedimiento, la muestra se conforma por sujetos que pueden ser fácilmente
accesibles en la población que se desea estudiar.

Ejemplo: El investigador quiere realizar un diagnóstico de comunidad y para su muestra selecciona a


los habitantes del centro de la población. Su decisión está basada en el hecho de que son más
accesibles y fáciles de localizar.

Muestreo en bola de nieve


En este muestreo, a los sujetos estudiados se les pide que recomienden a otros sujetos, a los que se
buscará para entrevistarlos.

Ejemplo: El investigador, después de entrevistar a un adicto a las drogas, quiere obtener más datos,
así que le pregunta al entrevistado a quién más podría visitar, de tal manera que cuando inicie la
entrevista se presente señalando que alguien conocido lo envió.

Muestreo a criterio
Este muestreo contempla la selección de sujetos que, a juicio del investigador, podrán proporcionar
mayor información entre la población estudiada.

Ejemplo: Durante la búsqueda de datos, el investigador incluye en su muestra al párroco del lugar, al
médico de la clínica y a los profesores de la escuela primaria, además del comisario ejidal y de la
persona de mayor edad en la región. Él cree que estas personas tienen la información que le
interesa. (Celis de la Rosa, 2014)

19
1.4 Elemento
Los elementos del universo pueden ser personas, lugares o cosas, ya sean individuos únicos o
agrupados. Por ejemplo: los pacientes encamados son elementos que conforman parte del universo
definido como hospital, pero también el personal, el mobiliario y los diversos servicios que en él se
prestan pueden ser elementos del mismo conjunto. Para individualizarlo, cada elemento de la
población se identifica con un número progresivo, que inicia en 1 y termina en N . Esta identificación
de cada sujeto se representa como un subíndice y se le conoce como valor “i” o valor i -ésimo. (Celis
de la Rosa, 2014)

Las propiedades de los elementos de la población se le denomina variables y pueden dividirse en


variables cualitativas y cuantitativas.

Variables cualitativas
Son aquellas que describen una característica en función de alguna cualidad, denominación o
característica se pueden dividir en:

 Nominales: cuando los valores posibles son de tipo nominal. Por ejemplo, una variable
de olor, sabor, color, aspecto, entre otros.
 Ordinales: cuando a pesar de que sus valores son de tipo nominal, es posible
establecer un orden entre ellas. Por ejemplo, si se estudia la displasia del cuello
uterino, se puede hablar de displasia leve, moderada o grave, o cuando nos referimos
al dolor en un individuo puede decirse que es leve, moderado o intenso.

20
Variables cuantitativas
Son las que tienen por valor cantidades numéricas con las que se pueden hacer operaciones
aritméticas. Dentro de este tipo de variables se distinguen dos grupos:

 Discretas: cuando no admiten un valor intermedio o fraccionado en su evaluación. Un


ejemplo es el número de personas en un estudio, donde no se podría tener “medias”
personas sino sólo personas completas, ya sea uno, dos o tres individuos
 Continuas: cuando admiten un valor intermedio o fraccionado entre dos valores, por
ejemplo, el peso de un individuo adulto. En este caso, podría ser de 87.5 kg, 87.7 kg o
90.0 kg. (Arceo Díaz, 2010)

1.5 Ejercicios
Una localidad tiene 3 000 pacientes diabéticos. Se quiere extraer una muestra de 120.

Explica cómo se obtiene la muestra:


a) Mediante muestreo aleatorio simple.
b) Mediante muestreo aleatorio sistemático.
Solución:
a) Muestreo aleatorio simple.
 Se numeran los pacientes diabéticos del 1 al 3 000.
 Se sortean 120 números de entre los 3 000.
 La muestra estará formada por las 120 pacientes diabéticos a las que
correspondan los números obtenidos.

b) Muestreo aleatorio sistemático.

Coeficiente de elevación: h = 3000/ 120 = 25

 Se sortea un número del 1 al 25. Supongamos que sale el 9.


 Los pacientes diabéticos seleccionados para la muestra serían los que
correspondieran a los números 9, 34, 59, 84, 109,…, 2 984.

21
Actividades del Aprendizaje Unidad I

1. Elabora una presentación en power point titulada “Universo Estadístico y Técnicas de


Muestreo”.
2. Participa en el foro “Universo estadístico y técnicas de recopilación de datos”.
3. Resuelve cuestionario de la unidad I.

Síntesis de la Unidad:

La unidad vista nos permite tener una mejor visión acerca de la importancia de tener una buena
recopilación de datos que nos llevarán a obtener información más solida y representativa de la
población a la que se le está realizando cierta investigación, mediante las diferentes técnicas del
universo estadístico.

22
UNIDAD II

TÉCNICAS DE MEDICIÓN ESTADÍSTICA HOSPITALARIA

Objetivo de la Unidad.

Identificar y utilizar las técnicas estadísticas más apropiadas a la investigación, así como una
evaluación de la más adecuada al tipo de estudio.

2.1 La Media, Procedimiento y Uso

Es la medida de tendencia central más utilizada en estadística y es la que se conoce como el


promedio de todas las observaciones, sin embargo, debido a la confusión que hay con el término
promedio, los estadístico han decidió de forma unánime llamarla Media Aritmética ó simplemente
Media.

La media de un conjunto de n observaciones x1, x2, x3, …….xn es igual a la suma de las
observaciones divididas entre n. (Marqués de Cantú, 1991)

Por lo general, es el valor más representativo del conjunto de valores obtenidos de la muestra, pero
tiene el problema, cuando se trata de muestras pequeñas, que se ve muy influenciada por los valores
extremos, es decir, por los más pequeños ó más grandes. Esto quiere decir que cuando se elimina
uno de los valores extremos, ya sea el más grande ó el más pequeño, de las observaciones en la
muestra, el promedio de los valores restantes en la muestra puede cambiar fuertemente con respecto
al que se obtiene con todos los valores.

23
Un ejemplo de su uso; En el estudio de plomo, el peso al nacer fue registrado en 215 niños, y los
valores encontrados varían entre 1.000 kgs y 4.475 kgs. La media de los 215 valores es de 3.076
kgs.

Los 3 valores más pequeños son 1.000, 1.175 y 1.900 kgs. Como se mencionó, el peso promedio
obtenido en la muestra es de 3.076 kgs, mientras que si se calculara sin los dos valores más
pequeños, entonces se debería informar el peso promedio a partir de 213 observaciones y tendría un
valor de 3.094 kgs.

Hay que notar que aún cuando visualmente, estos dos valores están separados del resto, el impacto
que tienen sobre la media de peso se reduce a una diferencia de 0.018 kgs.

Existen otras situaciones en donde el cambio que se observa en la media aritmética al ignorar algún ó
algunos valores extremos, es relevante, en términos de la escala y del contexto. (Hernández Avila &
Lazcano Ponce, 2013)

Las siguientes son propiedades de la media o promedio:

1. Unicidad. Para un conjunto determinado de datos, sólo existe una media aritmética.
2. Simplicidad. La media aritmética es fácil de comprender y calcular.
3. Todos los valores en la serie de datos se utilizan para su cálculo. Por ello, los valores
extremos pueden sesgar el resultado.
4. Con base en la media y el número de observaciones de cada grupo, es posible calcular el
caso de unir dos grupos en uno solo, media ponderada.

La media se utiliza para resumir datos cuantitativos cuando el grupo en estudio es grande o la serie
de observaciones no tiene valores extremos. (Celis de la Rosa, 2014)

24
2.2 El Rango, Procedimiento y su Uso

Otro aspecto importante de una distribución ó de un conjunto de valores de una variable numérica es
la dispersión. Una medida de dispersión ó variación es una cantidad que refleja cuán esparcidos ó
separados se encuentran los datos, ya sea en forma global ó bien con respecto a un punto de
refrerencia.

La medida más sencilla de dispersión es el rango ó amplitud que se define como la diferencia entre el
valor máximo y el mínimo de la muestra, es decir, es la medida de la distancia total en la escala
numérica a lo largo de la cuál varían las observaciones de la variable en estudio.

En algunos casos, el rango se presenta como la pareja formada por el mínimo y el máximo valores de
la muestra. De ésta definición, es claro que ésta es una medida que puede ser independiente influida
por un valor no usual de la variable, y además es muy sensible al tamaño de la muestra.

La notación usual para el valor máximo y mínimo de una muestra de tamaño n es X (n) y X(1) de
manera respectiva, por lo que:
Rango = X(n) – X(1)

Un ejemplo de su uso; El peso al nacer, registrado en 215 niños, varían entre 1.000 kgs y 4.475 kgs.
El rango del peso registrado de éstos niños es de 3.475 kgs según fórmula.

El rango presenta tres características que limitan su utilización:

1. Está determinado por dos valores, por lo que desprecia el resto de los datos.
2. La interpretación del rango depende del número de observaciones.
3. Los cálculos basados en valores extremos no son confiables debido a que entre dos
investigaciones similares pueden ocurrir valores extremos diferentes. (Celis de la Rosa,
2014)

25
2.3 La Desviación Estándar, Procedimiento y Uso
La desviación estándar es una medida de dispersión usada de manera habitual y conjuntamente con
la media aritmética, constituye la base de los valores biológicos. Al respecto Pizzi señaló: La medicina
no es más que una ciencia de promedios. (Álvarez Alva, 2002)

Podemos pensar a la dispersión de las observaciones en término del desvío de cada una de ellas
con respecto a la media de la distribución, esto es…… Desvío = observación - media

Y luego, para medir la dispersión, necesitaríamos alguna suerte de promedio de cuánto desvío
muestra cada observación. Sin embargo no podemos promediar los desvíos respecto de la media ya
que la suma de ellos es cero, si tomamos los valores de las diferencias conservando el signo
correspondiente, habrá tantos valores positivos como negativos, por lo que la suma nos dará siempre
0.

Por ejemplo, en la figura, se muestran cinco observaciones, con media 3, sus respectivos desvíos
serán:
Individuo Valor (X ) Desvío (X - x)
obs obs

1º 1 1-3=-2
2º 2 2-3=-1
3º 3 3-3=0
4º 4 4-3=1
5º 5 5-3=2
Suma 15 0
Promedio 3 0

Como allí se refleja la suma de los desvíos respectos de la media, y por lo tanto su promedio, es cero,
este hecho no es accidental sino que surge inevitablemente de la definición de la media. Entonces, si
se quiere utilizar los desvíos respecto de la media para definir una medida de variabilidad, dado que
su suma es siempre cero, no podemos usar ningún promedio simple de ellos, así, una posibilidad
sería tomar una medida de dispersión que promedie los desvíos al cuadrado.

26
Por lo tanto se define el desvío estándar de una muestra de observaciones como la raíz cuadrada de
la suma de los desvíos al cuadrado dividido en n-1. Es decir,

Para calcular el SD del ejemplo anterior,

2
Individuo Valor Desvío (X - x) (X - x)
i
i

1º 1 1-3=-2 4
2º 2 2-3=-1 1
3º 3 3-3=0 0
4º 4 4-3=1 1
5º 5 5-3=2 4
Suma 15 0 10
Promedio 3 0 2

Se puede pensar que a la suma de los cuadrados deberíamos dividirla por el tamaño de la muestra
(n). Pero, basándose en ciertas propiedades, se conviene, en el caso de tratarse de una muestra de
observaciones dividir por n-1, mientras que si se estuviera calculando el desvío estándar de la
población dividir en n.

Cabe destacar que el desvío estándar es una medida de variabilidad de las observaciones respecto
de la media, de esta manera, un gran desvío estándar muestra que la distribución de frecuencia está
ampliamente extendida alrededor de la media, mientras que un desvío estándar pequeño indica que
ella esta muy concentrada alrededor de la media con poca variabilidad entre una observación y otra.

El desvío estándar tiene la ventaja de resumir esta diferencia simplemente midiendo la variabilidad de
cada distribución con un sólo número; este número también nos permite probar si la diferencia

27
observada entre dos medias y entre dos grados de variabilidad son más de lo que podría esperarse
que surja por azar.

Debe destacarse que el desvío estándar depende de las unidades de medidas de las observaciones,
ya él está expresado en las mismas unidades que las observaciones originales, y por lo tanto del
orden de magnitud de lo que se está midiendo. Por ejemplo, la altura media de un grupo de niños
puede ser 122 cm y el desvío estándar de 15,2 cm.

Por otra parte, se puede ver que no es posible por simple comparación de los valores de los mismos,
decir, por ejemplo, que el peso es una característica más variable que la altura; ya que las dos
características no son medidas en las mismas unidades. Por otra parte, un desvío estándar de 10
alrededor de una media de 40 debe indicar un grado relativamente más grande de dispersión que un
desvío estándar de 10 alrededor de una media de 400 aunque las unidades de medida sean las
mismas. (Dawson, 2005)

2.4 La Varianza, Procedimiento y Usos

La medida más usada de dispersión es la varianza. Este valor refleja que tan disperso es un conjunto
de datos con respecto a su media.

La varianza que se denota por S2, es una medida de dispersión que toma en cuenta todos los valores
observados y que caracteriza la separación de los valores individuales partiendo de un punto de
referencia dado por la tendencia central.

(Hernández Avila &


Lazcano Ponce, 2013)

La varianza no tiene la misma magnitud que las observaciones (por ejemplo, si las observaciones se
miden en milímetros, la varianza lo hace en milímetros cuadrados). Si queremos que la medida de
dispersión sea de la misma dimensionalidad que las observaciones, bastará con tomar su raíz

cuadrada. Por ello, se define a la desviación estándar como .

28
Las siguientes propiedades de la varianza (respectivamente, desviación estándar) son importantes a
la hora de hacer un cambio de origen y escala a una variable.

 En primer lugar, la varianza no se ve afectada si al conjunto de valores de la variable


se le añade una constante. Si además, cada observación es multiplicada por otra
constante, en este caso, la varianza cambia en relación al cuadrado de la constante.
 Ambas son sensibles a la variación de cada una de las puntuaciones, es decir, si una
puntuación cambia, cambia con ella la varianza.
 Si se calculan a través de los datos agrupados en un cuadro o tabla, dependen de los
intervalos elegidos.
 La desviación estándar tiene la propiedad de que en el intervalo se encuentra, al
menos, 75% de las observaciones. Incluso si hay muchos datos y éstos provienen de
una distribución normal es posible llegar al 95%.
 No es recomendable su uso, y tampoco el de la media, como medida de tendencia
central. (Arceo Díaz, 2010)

Ejemplo de uso de la desviación estándar y varianza


Existe interés es describir la dispersión de la talla en un grupo de recién nacidos, por lo que
procederemos a calcular la varianza en la secuencia que se muestra en los siguientes incisos

Tabla núm. 4 (Celis de la Rosa, 2014)

29
1. Calculamos la media de la talla: = 1,169 ÷ 24 = 48.71

2. Sustraemos el valor de la media al de cada observación:

3. El resultado anterior lo elevamos al cuadrado:


4. Sumamos la columna con los valores elevados al cuadrado:
5. El resultado anterior dividido entre N es la varianza: 176.96 ÷ 24 = 7.37 cm 2

Para obtener el valor de la desviación estándar o típica, únicamente nos falta calcular la raíz
cuadrada de la varianza: . (Celis de la Rosa, 2014)

Actividades de Aprendizaje Unidad II

1. Realiza los ejercicios de Media, Desviación Estándar y Varianza correspondientes al tema


Técnicas de Medición Estadística.
2. Participa en el foro “Técnicas de Medición Estadística Hospitalaria”.
3. Resuelve cuestionario de la unidad II

Síntesis Unidad II

En la presente unidad el alumno entiende que las diferentes técnicas de medición estadística tienen
un amplio campo de aplicación en la investigación médica y muchas otras actividades. Así como
también en el transcurso de la unidad se explican con ejemplos prácticos el desarrollo de las técnicas
estadísticas.

30
UNIDAD III

TABLAS Y GRÁFICOS ESTADÍSTICOS

Objetivo de la Unidad

Conocer la manera de presentar los resultados de una investigación en forma gráfica, mediante la
elaboración de cuadros y gráficas.

3.1 Datos Agrupados


Los datos de variables cuantitativas pueden presentarse en forma tabular mediante un arreglo
ordenado, donde los valores se agrupan en intervalos de clase que señalan los valores que deben
incluirse en la tabulación, y son definidos por sus límites inferior y superior de clase. Los intervalos de
clase no deben traslaparse y son consecutivos, por lo que el límite superior de clase de un intervalo
es el límite inferior de clase del siguiente. Para la elaboración de un arreglo ordenado, se procede de
la siguiente manera:

1. Definir el número de intervalos de clase. Se recomienda que el número de intervalos no sea


menor de 5, ni mayor de 15. Generalmente, el número de observaciones determina el de
intervalos: mientras más observaciones más intervalos. La siguiente fórmula es útil para
definirlos. k = 1 + 3.322(log n).
Donde k corresponde al número de intervalos de clase y n es el número de observaciones que
se quieren agrupar. El resultado es una orientación y el investigador podrá cambiarlo según
convenga a su presentación.
2. Definir la amplitud de cada intervalo de clase. Generalmente, todos los intervalos que se
presentan tienen la misma amplitud, aunque no es obligatorio que sea así. Algunas
tabulaciones tienen intervalos que muestran amplitudes de diferente magnitud. Por ejemplo,
en el campo de la salud, los menores de 10 años suelen agruparse en menores de 1 año, de 1
a 4 años y de 5 a 10 años. Cuando se desea que todos los intervalos tengan la misma
amplitud, éstos se determinan dividiendo el rango (valor superior menos valor inferior) entre k,
o número de intervalos de clase. El resultado debe ser tomado como una aproximación y
deberá modificarse en beneficio de la tabulación de datos.

31
3. Contar el número de observaciones cuyos valores se incluyen en cada intervalo de clase.
Un cuadro que presenta los intervalos de clase y la frecuencia de observaciones que corresponde
a cada intervalo es conocido como distribución de frecuencia. A partir de una distribución de
frecuencia podemos obtener una distribución de frecuencia acumulada ó una distribución de
frecuencia relativa. (Celis de la Rosa, 2014)

El agrupamiento de los datos continuos es necesario a los fines de conocer la distribución de


frecuencias puesto que si no son agrupados es muy probable, por la naturaleza de la variable, que
cada valor de la misma aparezca una sola vez en el conjunto de datos y por tanto las frecuencias
absolutas serán 1 para la mayoría de los valores. (Balzarini, 2013)

3.2 Frecuencias Relativas


Con FR se representan las frecuencias relativas al total de datos, es decir, el cociente entre la
correspondiente FA y el total de datos. Estas FR nos remiten a la idea de proporciones, que
multiplicadas por 100 pueden ser interpretadas como porcentajes. La suma de las FR debe ser igual
a 1. (Balzarini, 2013)

Brindan respuestas a preguntas tales como ¿qué proporción o porcentaje de cobertura, tuvo en el
año 2002, el Sistema de Vigilancia Epidemiológica en México? (respuesta: 82%), ¿qué proporción o
porcentaje representan las defunciones por enfermedad diarreica en México en el año 1993?
(respuesta: 12.8%). (Álvarez Alva, 2002)

En términos simples, si se observa el 10% de ocurrencia de diabetes gestacional en una muestra


representativa de 500 mujeres con sobrepeso que se estudian durante el embarazo, entonces la
probabilidad de que una mujer seleccionada al azar, de la misma población estudiada, desarrolle
diabetes gestacional es de 0.10. Así, una interpretación de la probabilidad radica en la frecuencia
relativa observada en un gran número de casos. (Hernández Avila & Lazcano Ponce, 2013)

32
3.3 Frecuencias Acumuladas
La frecuencia absoluta representada por FA, indica las veces que se registró cada valor de la variable
discreta, o la cantidad de datos que hay en cada intervalo de clase de la variable continua. (Balzarini,
2013)

Las FA responden a preguntas del tipo: ¿qué edades son las más frecuentes de pacientes con
gonorrea? (respuesta: 15 años, 25 años, etc.), ¿qué cantidad de defunciones por enfermedad
diarreica se presentaron en México en el año 1993? (respuesta: 6463 defunciones). (Álvarez Alva,
2002)

La suma de todas las FA debe coincidir con el total de datos, es decir con el tamaño poblacional si se
está analizando una población entera ó con el tamaño muestral si el estudio se realiza a partir de una
muestra. (Balzarini, 2013)

3.4 Elaboración de Cuadros Comparativos

Su utilidad es muy similar a la de los diagramas de Venn, permiten caracterizar y establecer


relaciones de similitud y diferencia entre temáticas. Usualmente se representan por medio de tablas,
se eligen categorías y luego se describen. Deben ubicarse las clases descriptivas a un mismo nivel
para cada categoría.

El manejo de este cuadro, es muy variado, pero es principalmente utilizado en la docencia e


investigación, por lo cual esta es la aplicación más difundida.

“El cuadro comparativo es un organizador que se emplea para sistematizar la información y permite
contrastar los elementos de un tema. Está formado por un número variable de columnas en las que
se lee la información en forma vertical y se establece la comparación entre los elementos de las
columnas.

33
3.5 Ejercicios

El siguiente es un cuadro comparativo sobre las Tarjetas de crédito ofrecidas por diferentes bancos,
donde pueden compararse las tasas de interés que cada uno ofrece.

Tabla núm. 5 http:www.yucatanalamano.com/p=10488

En los cuadros comparativos se organizan “los datos en tantas columnas como elementos se quieran
comparar, quedando de esta manera claramente expresadas las diferencias y las coincidencias.
Cada columna se encabeza con el nombre del elemento y debajo de él se colocan sus
características. Las ventajas de este tipo de cuadros es que ofrecen una visión conjunta de todo el
tema. (DEVYD, 2008)

34
3.6 Gráficas de Barras

En el gráfico de barras, las frecuencias de cada característica se representan por una barra o
rectángulo. Los siguientes son aspectos que deben tenerse en cuenta cuando se elabora este gráfico:

1. Todas las barras deben tener la misma anchura.


2. Las barras han de estar separadas por un espacio que no deberá ser mayor que el espesor
de las mismas.
3. A menos que los datos tengan que presentarse en una secuencia predeterminada, las
barras se ordenarán de mayor a menor. Existe una excepción; si una de las barras agrupa
varias categorías bajo el subtítulo de “otras” o “el resto”, esta barra se situará al final de la
serie sin importar que su tamaño sea mayor que el de la categoría con menor frecuencia.

Existen variaciones del gráfico simple de barras que facilitan la presentación y comparación de datos,
por ejemplo:
 Diagramas de barras dobles.
 Diagramas de barras compuestas.

Tabla núm 6 (Celis de la Rosa, 2014)

Una gráfica de barras se emplea para analizar información con una escala nominal u ordinal; se
construye a partir de rectángulos separados, del mismo ancho y de altura dependiendo de la
proporción de la categoría que representan. (Hernández Avila & Lazcano Ponce, 2013)

35
3.7 Gráficas de Sectores Circulares

El diagrama de sectores o gráfico de pastel se utiliza con fines comparativos. En él pueden


representarse cifras absolutas o porcentajes. Dado que el círculo tiene 360°, para elaborar este
gráfico es necesario que a cada 1% de la distribución de frecuencias porcentuales le corresponda
3.6° del círculo.

Figura núm. 2 (Celis de la Rosa, 2014)

Un gráfico de sectores circulares ó de pastel se emplea para representar las proporciones de cada
uno de los posibles nombres ó categorías de una variable nominal u ordinal. (Hernández Avila &
Lazcano Ponce, 2013)

3.7 Histograma
Un histograma es una gráfica de barras con bases iguales al rango de los intervalos y con área
proporcional a sus frecuencias. (Hernández Avila & Lazcano Ponce, 2013)

En el eje X se representan los valores de la variable y en el eje Y, la frecuencia. En un histograma se


observan “clases” sucesivas. Cada barra se levanta sobre un conjunto de puntos del eje X (una clase
o un intervalo de clase). La altura de la “barra” señala la frecuencia relevada para la clase. Las barras
se dibujan pegadas, y no separadas como en las variables discretas, para indicar que la variable
continua puede asumir cualquiera de los valores comprendidos entre la primera y la última clase.
(Balzarini, 2013)

36
Se utiliza cuando se trabaja con una variable cuantitativa continua ó discreta para representar
gráficamente el porcentaje que corresponde a cada intervalo establecido en la tabla de frecuencias;
es importante indicar que los intervalos podrán tener una amplitud constante. La longitud del intervalo
ó amplitud de las barras corresponde a los intervalos de clase; este intervalo se obtiene restando el
límite superior de un intervalo del límite inferior del anterior; este corresponderá al espacio que tendrá
en la barra.

En el eje Y de las ordenadas se distribuye el evento que se estudia; se puede emplear la frecuencia
absoluta en aquellos casos en los que las amplitudes de clase son iguales, aunque generalmente lo
que se grafica es la frecuencia relativa. (Borda Pérez, 2013)

Tabla núm. 7 (Celis de la Rosa, 2014)

37
3.8 Polígono de Frecuencias
Es una forma de representar gráficamente las frecuencias relativas observadas en los intervalos de
clase. Este polígono se construye uniendo con una línea continua, los puntos medios de la parte
superior de las barras del histograma correspondiente. Es usual que se presente el polígono de
frecuencias en una figura sin incluir el histograma que le dio origen. Este tipo de figuras son útiles
para vislumbrar tendencias ó patrones de comportamiento ligado al incremento ó disminución de la
variable bajo consideración. (Hernández Avila & Lazcano Ponce, 2013)

El polígono de frecuencias sirve para el mismo fin que el histograma. La frecuencia relativa de la
ocurrencia de las observaciones entre dos valores cualesquiera es igual a la proporción del área total
entre los dos puntos. El histograma se utiliza cuando se tiene interés en comparar dos o más series
de datos en una misma figura. (Celis de la Rosa, 2014)

Figura núm. 3 (Celis de la Rosa, 2014)

38
3.9 Ojivas

Los polígonos de frecuencias relativas acumuladas también se conocen como ojivas.

Para construir estas ojivas se ordenan los valores de menor a mayor y a cada uno le asigna una
frecuencia relativa (FR) calculada como el cociente entre el orden o ranking de ese dato en la lista de
datos ordenados y el total de casos. En el eje X se muestran los valores observados de X y en el eje
Y la función de distribución empírica evaluada en cada valor observado, que sugiere la proporción de
valores que son menores o iguales al observado.

El siguiente gráfico corresponde a la distribución empírica (ojiva) de los datos de pesos de cabezas
de ajo blanco.

Figura núm. 4 (Balzarini M. T., 2011)

39
El énfasis en conocer empíricamente (es decir a partir de los datos) la distribución de una variable se
relaciona con la necesidad de poder luego aproximar, razonablemente, los valores observado de la
variable con modelos matemáticos teóricos que permitirán calcular probabilidades fenómenos
aleatorios y concluir bajo incertidumbre. (Balzarini M. T., 2011)

3.10 Pictogramas

Es un tipo de representación que se utiliza para variables cualitativas, y que consiste en representar
los datos con dibujos alusivos a la estadística estudiada. Los pictogramas son muy expresivos, pero
poco precisos.

Hay dos clases de pictogramas:

 Se utiliza un dibujo que representa la variable estadística y ésta se repite tantas


veces como haga falta (frecuencia absoluta).

 El dibujo utilizado varía de tamaño dependiendo de su frecuencia; a mayor


frecuencia mayor es el dibujo.

El siguiente pictograma representa en forma gráfica, los datos de la evolución de la población de


España desde el año 1900.

Figura núm. 5 (Reguera García & García Fernández, 2009)

40
3.11 Combinadas

Se usan para presentar simultáneamente dos ó más variables. Se utilizan tanto en datos cualitativos
como cuantitativos. Para enfatizar distintos tipos de información en un gráfico, puede combinar dos o
más tipos de gráfico en ese gráfico. Por ejemplo, puede combinar un gráfico de columnas con uno de
líneas para conseguir un efecto visual instantáneo que facilite la comprensión del gráfico. (Álvarez
Alva, 2002)

Figura núm. 6 (office, 2015)

3.12 Análisis e Interpretación de Resultados


Las respuestas a las interrogantes de la investigación surgen a partir del análisis. Esta es la etapa
crítica. Los materiales recabados esperan a ser sometidos al escrutinio que establecerá su valor en
relación con la investigación planteada. Las piezas que laboriosamente han sido recogidas a través
de entrevistas, observaciones, grupos de discusión u otros medios aguardan revelar sus secretos.

41
Tomemos un texto al azar: Un estudiante narra su relación con la policía. Cuenta no haber tenido
contacto “salvo en el colegio, cuando estuve en la brigada de transito. Una vez trataron de detenerme
por sospecha. Iba caminando por la calle y un carabinero me pide los documentos. Este es el que
ayer nos trató de “pacos”, dijo al otro. Nos tuvieron un rato pero justo pasó mi padre y me rescató.
Peleó con los carabineros. Justo esa semana les habíamos donado un terreno que no era menor.
Bastó una llamada por teléfono para que no me llevaran”. Esta anécdota puede ser leída como un
incidente menor en la vida de un joven de una ciudad intermedia, en un país latinoamericano. Otras
lecturas son posibles. En efecto, en la investigación cualitativa la tarea consiste en rastrear los otros
mensajes que se encubren en una evidencia. Es como en arqueología: un insignificante fragmento de
cerámica puede ser el indicador de una transición fundamental en la vida de un pueblo. Para
desentrañar el significado de un texto y establecer su relación con la pregunta de investigación es
importante considerar tres momentos en la relación del investigador o investigadora con sus datos:
pensar, notar y coleccionar. Cualquier evidencia debe ser interrogada desde el punto de vista de
aquella pregunta, cualquier indicio requiere ser notado (subrayado, resaltado) y el conjunto de
elementos resaltados se agrupan en categorías.

Figura núm. 7 (Díaz Narváez, 2009)

El procedimiento seguido corresponde a la codificación, la cual representa una de las principales


herramientas analíticas para poder dar cuenta de las regularidades, tipologías, procesos, patrones u
otros hallazgos de lo que procuramos dar cuenta a través de la investigación cualitativa. Importante
es subrayar que estos son los procedimientos en los que se basa la mayoría de los programas
computacionales disponibles para estos fines.

42
Los pasos sugeridos para realizar un análisis incluyen los siguientes momentos:
1) Hacerse una idea de la totalidad que se dispone.
2) Tomar un documento. Preguntarse sobre el significado de esta entrevista, su significado
subyacente. Garabatear los tópicos emergentes.
3) Repetir el procedimiento varias veces y luego hacer un listado de los tópicos emergentes.
Agrupar los tópicos en columnas que pueden ser tópicos principales, tópicos únicos y tópicos
residuales.
4) Sobre la base de este listado, vuelva a su data. Abrevie los tópicos usando códigos y
aplicándoles a la derecha del texto. Evalúe si en este proceso surgen nuevas categorías.
5) Encuentre la mejor verbalización de sus tópicos y defina las categorías. Trate de reducir el
listado total de sus categorías agrupando los tópicos que se relacionan entre sí. Puede
diagramar las relaciones entre las categorías.
6) Decida acerca de la codificación definitiva y alfabetice los códigos.
7) Agrupe todo el material en cada categoría y haga un análisis preliminar. Si es necesario, re-
codifique la información.

Los procedimientos involucrados en estudios como estos incluyen la creación de códigos para la
identificación de aquellos fragmentos que dan cuenta del fenómeno en estudio. Este procedimiento
permite segmentar el cuerpo de información disponible y relacionar los segmentos en relación a la
pregunta planteada. Los criterios de calidad a que se somete la investigación cualitativa se relacionan
con su plausibilidad, credibilidad y contrastabilidad.

La confiabilidad y validez son dos criterios importantes en el campo de la investigación cualitativa.

Confiabilidad. Se refiere a la consistencia de los hallazgos de la investigación. Abarca, pues, a la


totalidad de la investigación.

Validez. Se refiere a la verdad y corrección de un planteamiento. Un argumento válido es plausible,


bien fundamentado, justificable, fuerte y convincente. Una inferencia válida se deriva correctamente
de sus premisas. En la investigación cualitativa, la validez refleja el grado en que el método investiga
lo que se propone investigar al punto que las observaciones reflejan el fenómeno o las variables en
estudio. (Díaz Narváez, 2009)

43
Etapas de la validación:
 Tematización: La validez de una investigación descansa en la plausibilidad de los
supuestos teóricos y en la lógica de derivación de la teoría a las interrogantes del estudio.
 Diseño: La validez depende de la adecuación del diseño y métodos usados al tema y a los
propósitos del estudio.
 Recolección: La validez responde a la credibilidad de la información recogida y a la calidad
de las técnicas empleadas en su recolección.
 Registro: La adecuada trascripción e identificación de la información recogida es fuente de
validez de la investigación.
 Análisis: Se cuestiona la pertinencia de las preguntas a que se somete la información, si
son válidas y si la lógica en que se sostiene la interpretación es válida.
 Validación: ¿Cuáles son las formas de validación adecuadas al estudio? ¿Es posible
triangular la información?
 Informe: ¿Es el informe un recuento válido de la información recogida?

El investigador debe explicitar su perspectiva y los medios de los que se vale para neutralizar sus
sesgos y percepciones selectivas. Se trata de jugar al abogado del diablo con la propia investigación.
La validación no se hace al final del proceso sino durante el mismo, aplicándosela a la credibilidad,
plausibilidad y confiabilidad de los hallazgos. Las tácticas para hacerlo incluyen:

 Verificar la representatividad de los sujetos Identificar el impacto ejercido por el investigador o


investigadora
 Triangular entre:
o Entre investigadores
o Entre fuentes
o Entre teorías e información
 Sopesar la evidencia
 Evaluar el significado de los casos sobresalientes
 Usar casos extremos
 Seguir las sorpresas
 Buscar evidencia negativa
 Realizar pruebas «si-acaso»

44
 Descartar relaciones espurias
 Replicar hallazgos
 Confrontar con explicaciones rivales
 Obtener retroalimentación de los informantes (Díaz Narváez, 2009)

3.14 Elaboración de Cuadros Estadísticos

Los cuadros se utilizan para presentar los resultados de las tabulaciones estadísticas. Al elaborarlos,
buscamos que la información que se muestre sea fácil de entender y que nos ayude a comprender
las relaciones que guardan los datos. De manera general, los cuadros estadísticos constan de:

1. Título.
2. Cuerpo del cuadro.
3. Notas explicativas.

Para que los cuadros se entiendan fácilmente, el título debe reunir dos condiciones:

a) Ser completo; es decir, debe responder a las preguntas: ¿qué?, ¿cómo?, ¿dónde?,
¿cuándo?
b) Debe ser sucinto, pero sin sacrificar la claridad.

De manera breve, puede decirse que el cuerpo del cuadro consta de un conjunto de columnas y filas
que, en conjunto, forman celdas. En la primera fila o renglón, el de los encabezados, se indica a qué
se refieren los datos que se anotan en los siguientes renglones; deben ser breves, pero
suficientemente explícitos. La primera columna, o columna matriz, se reserva para señalar las
diferentes categorías de la variable de clasificación. Cuando las observaciones se refieren a una sola
variable, las categorías de la misma deben anotarse en esta columna, pero cuando se clasifican
simultáneamente por dos o más variables es recomendable que la que tenga más categorías se sitúe
en la primera columna. Las notas colocadas en la parte superior afectan todo el contenido del cuadro,
mientras que aquellas que se colocan en la parte inferior sólo se refieren a las cifras de determinadas
celdas o de una fila o columna en particular, lo cual se indicará con un pequeño símbolo (que puede
ser número o letra). En los trabajos originales en los cuales el investigador lo considere preciso, y

45
siempre en los que no son originales, debe ponerse al pie del cuadro la fuente de la cual se
obtuvieron los datos.

Al elaborar cuadros estadísticos, con frecuencia se cometen errores que deben evitarse; los
siguientes son algunos de los más comunes:

 Disposición incorrecta de los datos.


 Títulos y encabezados incompletos o inadecuados.
 Cuadros que solamente presentan porcentajes.
 Cuadros con mucha información.

Para leer un cuadro debemos seguir un orden, que puede ser el siguiente:
1. Título.
2. Continuar con las notas explicativas.
3. Identificar las unidades de medida que se reportan.
4. Observar los resultados correspondientes a las celdas de totales (columnas y filas).
5. Comparar los totales con las diferentes celdas que contengan información.
6. Relacionar las variables que se estudian.
7. Buscar, intencionadamente, irregularidades de los datos.
8. Elaborar una conclusión final del cuadro.

Ejemplo; la Tabla 8 muestra resultados correspondientes a una investigación sobre homicidio


mientras la víctima se encontraba trabajando. El título señala el “qué” (homicidio en varones), el
“cómo” (ocurrido durante el trabajo), el “dónde” (Jalisco) y el “cuándo” (1989-1991). Este cuadro sólo
presenta una variable, la edad de la víctima en años agrupados. Las siguientes columnas
corresponden respectivamente a cuántos habitantes del Estado están en riesgo de morir durante el
tiempo al cual se refiere el título del cuadro (sólo aquellos que desarrollaban una ocupación laboral en
el periodo), las frecuencias absoluta y relativa de homicidios por grupo de edad. Además, el cuadro
contiene cuatro observaciones señaladas mediante los superíndices “ A ”, “ B ”, “ C ” y “ D ”.

46
El primero refiere la fuente de la que se tomó el tamaño de la población para cada grupo de edad. La
segunda hace notar que dos niños menores de 12 años fallecieron a causa de homicidio mientras
realizaban una actividad laboral. Dado que no fue posible conocer cuántos niños de 12 años en
Jalisco desempeñan una actividad laboral, el autor no calculó la tasa de mortalidad para este grupo
de edad. La nota “C” describe cómo se calcularon las tasas; por lo regular, esto no es necesario; sin
embargo, dado que el cálculo de las tasas implica un periodo de tres años, el autor consideró que
sería importante hacerlo notar. La cuarta nota destaca el hecho de que no se pudo conocer la edad
de varios sujetos. El censo incluye un grupo de sujetos que no registran edad, pero ese grupo no
puede tomarse como población de referencia para el estudio de homicidios. Por último, el cuadro
especifica las fuentes de las cuales se obtuvo la información con la que fue elaborado.

Tabla núm. 8 (Celis de la Rosa, 2014)

47
Ejercicio

Desarrolle un cuadro comparativo sobre el tema características de la evolución del hombre.

Característica HOMO HABILIS HOMO ERECTUS HOMO SAPIENS


Andaban a saltos, con los Bípeda, y sin ningún tipo
Forma de Andar Bambolea. Brazos caídos.
brazos caídos. de inseguridad.
Posición Muy curva, similar a la
Erguida. Erguida.
Vertebral de un gorila.
Mal formadas y poco Frente abultada y mandíbula
Cara Definidas, bien formadas.
definidas. muy grande.
Se encuentra por todo el Sólo se encuentra en la Sólo se encuentra en la
Pelo
cuerpo. cabeza. cabeza.
Su propio pelo. No Vestían con pieles de Vestimenta muy simple.
Indumentaria
vestían nada. animales. Llevan calzado.
Son muy agresivos por Luchan por la supervivencia. Ríen y lloran, sienten y
Comportamiento
naturaleza. Se ayudan. comprenden.
Se comunican a base de Utilizan las palabras para
Comunicación Nula
sonidos naturales. comunicarse.
Carne, vegetales, leche y
Alimentación Carne animal. Carne y huevos.
agua.
Cabañas construidas con
Habitan en... Dormían al aire libre. Vivían en abrigos y cuevas.
pieles animales.
Pequeños grupos con los Pequeños grupos con los que
Relaciones Grandes colonias.
que atacan. atacan.

http://evolucion-del-hombre.galeon.com/

48
Actividades del Aprendizaje Unidad III

 Elaboración de un Cuadro Comparativo en Power Point sobre el tema “Diferencias entre los
hemisferios derecho e izquierdo del cerebro” que contenga: Introducción, las comparaciones y
emite su conclusión.
 Participa en el foro “Técnicas de Análisis Estadístico abordados en la unidad”
 Resuelve cuestionario de la unidad de la Unidad

Síntesis de la Unidad III


En ésta unidad se lleva a cabo la explicación de los distintos métodos de distribución que nos llevan a
interpretar correctamente los resultados de una investigación estadística para la mejor toma de
decisiones, en el entendido que los resultados no debe ir exentos del sentido común y más
tratándose del área médica.

49
BIBLIOGRAFIA Y FUENTES CONSULTADAS

Álvarez Alva, R. (2002). Salud Pública y Medicina Preventiva. México: El Manual Moderno.
Arceo Díaz, J. L. (2010). Manual de medicina basada en evidencias. México: Editorial El Manual
Moderno.
Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e Infostat en problemas de
agronomía. México: Editorial Brujas.
Balzarini, M. T. (2011). Introducción a la bioestadística: aplicaciones con Infostat en agronomía.
México: Editorial Brujas.
Borda Pérez, M. (2013). Métodos cuantitativos: herramientas para la investigación en salud (4a. ed.).
México: Universidad del Norte.
Cajeme, I. T. (2009). Rúbricas Itescavirtual. Obtenido de http://www.e-
itesca.edu.mx/RubricasITESCAVIRTUAL/cuadro_sinptico.html
Celis de la Rosa, A. d. (2014). Bioestadística (3a. ed.). México: Editorial El Manual Moderno.
Dawson, B. (2005). Bioestadística Médica. México: El Manual Moderno.
Deconceptos. (2015). Recuperado el 2015, de http://deconceptos.com/general/cuadro-sinoptico
DEVYD, F. u. (2008). Herramientas maestras. Obtenido de
http://www.ulibertadores.edu.co:8089/virtual/Herramientas/cuadros_comparativos.htm
Díaz Narváez, V. P. (2009). Metodología de la investigación científica y bioestadística: para médicos,
odontólogos y estudiantes de ciencias de la salud (2a. ed.). México: RIL editores.
e, F. (s.f.).
Escolares, F. (2015). Umel. Recuperado el 2015, de
http://www.umel.mx/Escolares/Formatos/Formatos/Cuadro%20sinoptico.pdf
Fingermann, H. (2012). Educación La guía 2000. Recuperado el 2015, de
http://educacion.laguia2000.com/estrategias-didacticas/pasos-para-realizar-un-cuadro-
sinoptico
Hernández Avila, M., & Lazcano Ponce, E. (2013). Salud Pública Teoría y Práctica. México: El Manual
Moderno.
Marqués de Cantú, M. J. (1991). Probabilidad y estadística para ciencias químico-biológicas. México:
McGraw-Hill Interamericana.

50
office, s. (2015). support office. Recuperado el 2015, de https://support.office.com/es-
es/article/Presentar-datos-en-un-gr%C3%A1fico-combinado-3f9aa612-1714-435c-af10-
ec33f588243f?ui=es-ES&rs=es-ES&ad=ES
Reguera García, A., & García Fernández, A. (2009). EPA Educación de Personas Adultas.
Recuperado el 2015, de
http://web.educastur.princast.es/proyectos/formadultos/unidades/matematicas_2/creditos.html
Sábado, J. T. (2009). Fundamentos de Bioestadística y Análisis de datos para Enfermería. Barcelona,
España: Servei de publicacions.

51