1 USAMEDIC 2017
FUNCIONES DE LA BIOESTADISTICA
TOMAR 1. Recoger o
DECISIONES recopilar
BIOESTADISTICA 1
4. INFORMACION 2.Organizar
Interpretar (DATO) u ordenar
INTRODUCCION Y
CONCEPTOS GENERALES
3. Procesar
o analizar
DEFINICION
1. RECOPILAR DATOS (RECOGER / RECOLECTAR)
La Estadística en Medicina, nace por la necesidad de “MEDIR” y
conocer el comportamiento de la Población en relación a aspectos
FUENTE PRIMARIA
relacionados con la salud y la enfermedad.
Es la matemática aplicada a las ciencias de la salud.
Cuando se registran
Funciones:
características mediante
- Recolección de datos.
- Organización datos. la medición, observación y
- Procesamiento y análisis de datos.
- Interpretar resultados conteo, para lo cual FUENTE SECUNDARIA
TIPOS
LA APLICACIÓN DE LA BIOESTADISTICA EN LA
MEDICINA ASISTENCIAL Y LA SALUD PUBLICA
2. ORGANIZAR DATOS (ORDENAR)
Cuando se ordenan para una mejor comprensión y
facilitar sus análisis.(tablas, gráficos y figuras)
Edad N° Pacientes
30 - 34 6
35 - 39 12
40 - 44 8
45 - 49 2
BIOESTADÍSTICA 1 Pag. 2 USAMEDIC 2017
cuando se establecen • En ciencia sociales: la familia, el obrero, la empresa, los grupos, las naciones,
etc.
relaciones entre las
variables (regresión y
correlación).
PESO
COLOR
PISOS
MIEMBROS
variable es:
VENTANAS
a. Que se derive siempre de COLOR DE
CABELLO
PROFESION
mínimo de variación
PRESION
ARTERIAL
VALOR
CONCEPTOS BASICOS Un valor es la magnitud, rango o atributo a través del cual se
de BIOESTADISTICA expresa la variable.
La variable edad puede tomar los
siguientes valores:
Cada uno de estos – 1 a 10 años
– 11 a 20 años
1. Dato o Información rangos son valores de
– 21 a 30 años
la variable – 31 a 40 años
2. Población y muestra
3. Marco poblacional y marco muestral La variable sexo admite dos valores
4. Parámetro y estadístico • Hombre
• Mujer
5. Tipos de datos
6. Clasificación de variables La variable educación puede ser construida mediante
tres valores
7. Escalas de medición • Educación alta
• Educación media
• Educación Baja
Peso 75 Kg.
Estatura 1,80 mts.
Las tres partes del “dato”: Profesión Médico ----
UNIDAD DE ANALISIS
(SUJETO)
INDIVIDUO
Si el DATO es útil para tomar decisiones
DATO O
SUJETO
se convierte en INFORMACIÓN.
VARIABLE
VALOR O MAGNITUD
(CARACTERISTICA)
BIOESTADÍSTICA 1 Pag. 3 USAMEDIC 2017
m1 m2 m3 mn
75 datos
Registro
de la POBLACIÓN POBLACIÓN POBLACIÓN POBLACIÓN
ESTADÍSTICA
MUESTRA DESCRIPTIVA carac-
POBLACIÓN terística.
P1 P2 P3 ... Pn
INFERENCIA ESTADÍSTICA
1 MARCO MUESTRAL n
« » MUESTRAS
1 MARCO POBLACIONAL n
« » POBLACIONES Las constantes no son de mayor interés en Estadística.
BIOESTADÍSTICA 1 Pag. 4 USAMEDIC 2017
CLASIFICACIÓN DE VARIABLES
1.- Variable Numérica o Cuantitativa : a) Escala Nominal:
(variables cualitativas nominales)
Las que se expresan por números los que se obtienen por
conteo o medición. • La escala de medida nominal, consiste en la asignación arbitraria de
Las operaciones posibles con estas son los promedios y números o símbolos a cada una de las diferentes categorías en las cuales
podemos dividir el carácter que observamos, sin que puedan
medidas de dispersión, entre otras. establecerse relaciones entre dichas categorías.
Estas variables necesariamente tienen unidades de medida. – consiste en clasificar los objetos de estudio según las categorías de una
variable. El alcance de esta escala es el conteo.
Las variable cuantitativa puede ser:
Ejemplo
- DISCRETA : Cuando la variable sólo puede tomar valores enteros dentro
de una escala de valores. Proviene de un conteo. Sexo 1:Masculino 2:Femenino
Ejemplo: Número de emergencias médicas por día.
Especialidad 1:Clínico 2:Cirugía
- CONTINUA : Cuando la variable puede tomar cualquier valor (entero o
fracción), dentro de una escala de valores. Provienen de una medición.
ESCALA
Ejercicio Aplicativo 1
En un programa para la detección de hipertensión del Hospital de Pelotillehue, hay
2,300 pacientes hombres de edades entre 30 a 40 años, del cual se extrae un grupo de
30 pacientes para estudiar su presión diastólica. La distribución de la presión
diastólica en mm Hg fue la siguiente:
70 85 85 75 65 90 110 95 90 70
60 75 80 120 85 95 90 70 100 65
80 90 95 90 95 110 100 85 80 75
BIOESTADISTICA 2
Cual es el Marco Poblacional:
Cual es la Población: PRESENTACION DE DATOS
Cual es el Marco Muestral:
Cual es la Muestra:
Cual es el individuo o unidad de análisis
Cual es un valor
Que tipo de variable es:
Cual es la Unidad de Media..
Ejercicio Aplicativo 2
Tabulación y Graficación
En un Centro Médico se desea estimar el
número promedio diario de procesos que no
cumplen las normas de calidad. Con este fin
se elige por sorteo 10 días laborales del Todo análisis estadístico es una estrategia para traducir la
último mes. En uno de los días elegidos se cantidad de información obtenida en la recolección de datos, a
registraron 32 procesos médicos índices o formas que sean interpretables y que representen
deficientes. alguna dimensión del comportamiento de las variables
Frecuencias absolutas: Contabilizan el número total de variables de cada Deben ser fáciles de interpretar
modalidad o clase (intervalo).
Frecuencias relativas (porcentajes unitarios): Ídem, pero dividido por el
total, normalizadas y expresada en proporción o porcentaje.
Frecuencias acumuladas absolutas y relativas: Acumulan las frecuencias Deben llevar un título representativo (bajo el gráfico y numerado)
absolutas y relativas. Son especialmente útiles para calcular cuantiles
(como veremos más adelante).
OPERARIO GENERAL
OPERADOR DE M AQUINA
AUTOM ATICA
TALON
CARGO Frec
CUERPO
DESPACHADOR DE PRODUCTO
8
120
Número de operarios
100
CUERPO 80
60
40
20 10 8 12
4 1 5
0
OPERARIO GENERAL OPERADOR DE MAQUINA DESPACHAD OR DE OPERADOR DE DOBLE OPERADOR DE MAQUINA OPERADOR DE OPERADOR GR AL.
AUTOMATICA PRODUCT O TERMINAD O FILO ST SERVICIOS GENERALES ALMACEN MAT ERIA
LOCAL PRIMA Y PRODUCTOS
TERMINAD OS
NOTAS EXPLICATIVAS (Fuente)
Tipo de operario
Las barras están separadas entre si, y el ancho de las mismas no es representativo
Ejemplo de Tabla para variables cualitativas nominales Gráficos circulares (tortas, sectores, pie)
Al igual que los gráficos de barra, se utilizan para representar variables de tipo
cualitativa, generalmente para representar distribuciones porcentuales
respecto a una clasificación.
2% 1%
Ejemplo de Tabla para variables cuantitativas discretas 3%
OPERARIO GENERAL
4%
5% OPERADOR DE MAQUINA ST
TABLA DE FRECUENCIAS (Ejemplo con variable continua) Otros gráficos para variables cualitativas
Frecuencia Frecuencia Frecuencia Frecuencia
Variable Normalizada Acumulada acumulada normalizada
absoluta (relativa o %)
Pictogramas
(relativa o %) absoluta
x f fr F Fr
60 - 69 3 0.1 (10%) 3 0.1 (10%) Fáciles de entender.
Cada modalidad debe ser
70 - 79 6 0.2 (20%) 9 0.3 (30%) proporcional a la
frecuencia.
80 - 89 7 0.23 (23%) 16 0.53 (53%)
Ojiva
Gráficos para variables cuantitativas
VARIABLES CUANTITATIVAS DISCRETAS También se vincula a los histogramas, ya que usa la información de la tabla de
frecuencia (frecuencia acumulativa) para generar un gráfico muy usado para
GRAFICO DE BARRAS GRAFICO INTEGRAL hacer estimaciones y generar respuestas
(diferencial)
Ojiva
Resultado Evaluación
1,2
1
Operadores
0,8
0,6
0,4
0,2
0
11,53 12,17 12,81 13,45 14,08 14,72 15,36 16,00 16,64
Salarios en miles de Bs.
70 Cuartil 1 Cuartil 3
60
Operadores
50
mínimo 25% 25% 25% 25% máximo
40
30
20
10
0 Mediana
10.89 11.55 12.22 12.88 13.54 14.21 14.87 15.53 16.20 (Cuartil 2)
Salarios en miles
Diagramas de dispersión
(gráfico de puntos o nube)
Histograma Son gráficos muy simples que sirven para comparar la relación que existe entre
variables cuantitativas.
• Es una gráfica de barras de una distribución de frecuencias.
Clase o intervalo
Curva de frecuencia
fx
Frecuencia
Peso - Talla
Tipos de
Clases
Clases
Limite superior de clase
Peso - Velocidad Edad - Talla
Limite inferior de Clase
Polígonos de frecuencia
Diagrama de Tallos y Hojas
Están vinculados al histograma porque trabajan con la misma información.
Es un diagrama donde cada
valor de datos es dividido en
Resultado Evaluación Con dos pequeños
una “hoja” (normalmente el
cambios se puede último dígito) y un “tallo” (los
60
convertir un otros dígitos). Por ejemplo el
50
histograma en este
valor 32 seria dividido en “3”
Operadores
40
polígono.
30 (tallo) y “2” (hoja).
20
10 No es un gráfico muy
0 difundido a pesar de Se aplica para variables
11.21 11.85 12.49 13.13 13.77 14.40 15.04 15.68 16.32 sus ventajas sobre el cuantitativas discretas.
Salarios en miles histograma.
ESTADISTICA DESCRIPTIVA I
Energía Consumida Mensual
8.000
7.500
7.000
GWh
6.500
6.000
5.500
5.000
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35
Meses
. . . .
.
. .
.
.. . . . . MTC.
.
.
. .... . .
MEDIA
MEDIANA
MODA
PERCENTILES
CUARTILES
BIOESTADÍSTICA 1 Pag. 9 USAMEDIC 2017
Ventajas: Ventajas:
ä Concepto familiar para muchas personas ä Los valores extremos no afectan a la mediana como en el caso de la media aritmética.
ä Es fácil de calcular, interpretar y entender.
ä Es única para cada conjunto de datos
ä Se puede determinar para datos cualitativos.
ä Es posible comparar medias de diferentes muestras
Desventajas:
SI NO MEDIA
MODA
PERCENTILES
x x
CUARTILES
DEFINICIONES Y EQUIVALENCIAS
LA MODA
100%
• Las medidas de posición nos permiten
dividir a una distribución en 2 o mas partes,
iguales.
• Según el número de partes, éstas divisiones
• La moda es el dato que más se repite o el tendrán distintos nombres: 50% M 50%
dato que ocurre con mayor frecuencia.
– Percentiles: Cuando dividimos una
distribución en100 partes.
• Un grupo de datos puede tener más de 25%
Q1
25%
Q2
25%
Q3
25%
una moda.
– Deciles: Cuando dividimos una
distribución en 10 partes.
• Se puede aplicar para variables
cuantitativas y cualitativas nominales. – Cuartiles : Cuando dividimos una
20% 20% 20% 20% 20%
distribución en 4 partes.
• Veamos el siguiente ejemplo: se tiene una D5
muestra con valores 20, 23, 20, 24, 25, 25, – Mediana: Cuando dividimos una 10% 10%
26 y 30. El 20 y 25 son la moda entonces, distribución en 2 partes.
se dice que es bimodal. Se aplica para Variables cuantitativas,
excepcionalmente ordinales. P25 P50 P75
1% 1% 1% 1%
Calculo de la moda
Obtención: se obtiene organizando la serie de datos y seleccionando el o los datos
PERCENTILES
que más se repiten.
• Los percentiles dividen a los datos en cien partes iguales, cada una de
Ejemplo:
ellas contiene el 1% de los elementos del conjunto.
4, 5, 7, 8, 8 , 10, 12, 15 • Más o menos el (p) por ciento de los datos tienen valores menores que
el percentil y aproximadamente (100-p) por ciento de los datos tienen
4, 7, 12,12 , 15, 16, 20, 20 , 24, 27 valores mayores que el percentil.
• Un percentil nos provee información de como se distribuyen los
7, 12, 15, 18, 25, 30, 31, 38 valores de los datos desde el menor hasta el mayor.
• Para calcular la posición del percentil, debe seguir los siguientes pasos:
• Si una distribución es simétrica, la media, Paso 1. Ordene los datos de manera ascendente.
mediana y modo coinciden Paso 2. Calcule un índice (i) que indica la
posición del percentil que se busca P
i n
en la serie de datos ordenados. 100
en donde (p) es el percentil de interés y (n) es el número de datos u
• Si una distribución no es simétrica, las tres medidas observaciones del conjunto o serie.
difieren. Paso 3.
Asimetría hacia la derecha Asimetría hacia la izquierda a) Si (i) no es entero, utilizando las reglas de redondeo, se lleva al próximo
(asimetría positiva) (asimetría negativa) numero entero. El valor entero inmediato mayor que (i) indica la posición
donde se encuentra el percentil. Esto significa que si (i) = 3.5, el percentil
se encuentra en la posición 4 de los datos ordenados.
100 100
Paso 3. Como (i) no es entero, redondeamos al próximo entero mayor que 7.5, o sea, el Segundo cuartil:
lugar 8. Al referirnos a los datos del ejemplo, vemos que el percentil 75 es el valor del dato
ubicado en la posición número 8, que en este caso es 27. Q2 = segundo cuartil, o percentil 50 (también la mediana)
50
19 20 21 22 23 25 26 27 28 30 i 10 = 5
posición 1 2 3 4 5 6 7 8 9 10
100
Como (i) es un número entero, el segundo cuartil es el promedio de los valores de los
datos que están en las posiciones i e (i+1), que en este caso es, (14+15)÷2=14.5,
Nota. Recuerda que (i) nos indica el lugar del dato donde se encuentra el percentil que
estamos buscando. entonces, el segundo cuartil en los datos se divide así:
5 8 11 12 14 15 18 20 25 30 Q1=11 ; Q2=14.5
Significa que el 75% de las edades son menores de 27 1 2 3 4 5 6 7 8 9 10
VALORES
• Tercer cuartil:
Q3 = tercer cuartil, o percentil 75
75 = 7.5
i 10
100
Como (i) no es un número entero, se redondea al próximo entero mayor que
7.5, o sea 8. Al referirnos a los datos , vemos que el tercer cuartil está ubicado
1 2 3 4 5 6 7 en posición 8 de los datos que en este caso es el 20. Finalmente, los cuartiles en
este caso se presentan de la siguiente forma:
5 8 11 12 14 15 18 20 25 30
1 2 3 4 5 6 7 8 9 10
CUARTILES Ejemplos
1500 gr 4500 gr
3000 gr
75% 25%
25% 75%
Ejercicios
PASOS PARA CALCULAR LOS CUARTILES
• El 5% de los recién nacidos tiene un peso demasiado bajo. ¿En que
• A continuación se presenta un conjunto de datos con los siguientes valores; percentil se encuentra el peso por debajo del cual se considera
5, 12, 8, 14, 11, 15, 20, 18, 30 y 25. “demasiado bajo”?
Se ha obtenido una muestra del salario de los Bomberos. Los datos recopilados
RANGO
fueron los siguientes:
1500 $1400 $1600 $2100
1200 1300 1900 1800 RANGO INTERCUARTIL
2000 1200 1200 1500
2200 2300 1500 1400 DESVIACION MEDIA
COEFICIENTE DE VARIACION
BIOESTADISTICA 4
RANGO
Interpretación
La diferencia entre el valor mayor y el menor es de 30.
(Xi – X)
Ya sabemos por el ejemplo anterior que S2 = 11,6 quejas2.
DM =
----------- Entonces:
n
S
2
Ejemplo
Calcular la desviación media de la distribución: s
9, 3, 8, 8, 9, 8, 9, 18
VARIANZA
COEFICIENTE DE VARIACION R
• La varianza es otra medida de dispersión que se basa en la diferencia entre
el valor de cada dato (Xi) y la media (x ). •También llamado COEFICIENTE DE VARIACION DE PEARSON.
• La diferencia entre cada dato (Xi) y su media (x ) para una muestra se llama
desviación con respecto a la media o promedio y se expresa con la siguiente •Es una medida de variabilidad relativa de los datos, permite comparar la
fórmula: variabilidad de dos o más conjuntos de datos expresados en unidades
n
(X i x )
2
diferentes (peso; kg. y libras).
S
2 i 1
Ejemplo:
La siguiente información se refiere al número de quejas recibidas en un Centro Ejemplo:
Médico durante una semana. Calcule la varianza de 8, 10, 5, 12, 10, 15.
Elaboramos un cuadro de la forma siguiente A continuación se presentan las ventas (en unidades
monetarias) logradas durante una semana por dos farmacias.
x Xi x Xi x 2 La farmacia I vende en soles y la farmacia II en dólares ¿Cuál
de ellos tiene un desempeño más estable, en cuanto a nivel de
8 8 - 10 = - 2 4 ventas?.
60
x
10 10 - 10 = 0 0
5 5 - 10 = - 5 25 6 Farmacia I (soles) Farmacia II (dólares)
12 12 - 10 = 2 4
10 10 - 10 = 0 0
15 15 - 10 = 5 25 x 10 40,70,60,48,52,65,58 70,35,150,140,82,110,140,120
X 60 Xi x 0 Xi x 58
2
Calculamos la media y desviación estándar para cada una de
las farmacias
Xi x 58
2
(X i x )
2
2 58
2
S 11,6 quejas2
S n 1 6 1
BIOESTADÍSTICA 1 Pag. 14 USAMEDIC 2017
Farmacia I n
Media
aritmética 4. FORMAS DE DISTRIBUCION
Xi
393 (GRAFICOS)
x i 1
56,14
n 7
x Xi x Xi x 2
4.1 SIMETRIA DE LOS DATOS
40 -16,14 260,50
70 13,86 192,10 Otra característica de un conjunto de datos es la forma, es decir, la
60 3,86 manera en que están distribuidas las observaciones.
14,90
48 -8,14 66,26 La distribución de los datos puede ser o no simétrica. Si la
distribución de los datos no es simétrica, se llama asimétrica, No
52 -4,14 17,14 Normal o sesgada.
65 8,86 78,50
Para describir la forma se puede comparar la media y la mediana.
58 1,86 3,46
Xi x 0 Xi x
También puede observarse a través del coeficiente de asimetría Mide el
X 393 2
632,86 grado de Simetría / Asimetría de la distribución
11
0
Si Xi x 2 632,86
Desviación Ejemplos de diferentes formas de distribución
estándar
n
( Xi x )
2 Distribuciones simétricas
i 1 632,86
S 10,27
n 1 7 1
S
CV 100 Distribuciones asimétricas
x
10,27
CV 100 18,29
56,14 Sesgo positivo Sesgo negativo
Asimétrica Positiva Asimétrica Negativa
Farmacia II Media
n 11
Xi
aritmética Relación entre la media, la mediana y la moda 1
847
x i 1 105,87
n 8
ASIMETRIA DERECHA o POSITIVA ASIMETRIA IZQUIERDA o NEGATIVA
x Xi x Xi x 2
Frecuencia
Frecuencia
70 -35,87 1286,6569
35 -70,87 5022,5569
150 44,13 1947,4569
140 34,13 1164,8569 promedio
moda promedio moda
82 -23,87 569,7769
110 4,13 17,0569 Magnitud Magnitud
140 34,13 1164,8569
120 14,13 199,6569
Cuando los datos son sesgados es mejor emplear la Mediana
X 847
Xi x 0,04 Xi x
2
11372,88
Si Xi x 11372,88
n 2
Desviación
Regla Empírica “Teorema de Chebyshev”
i 1 estándar (para distribuciones simétricas)
n
( Xi x )
2
i 1 11372,88
S 40,30
n 1 8 1
S 40,30
CV 100 CV 100 30,06
x 105,87 -1 1
-2 2
68%
-3 95% 3
La farmacia II presenta una mayor variabilidad en el volumen de
ventas.
99.9%
BIOESTADÍSTICA 1 Pag. 15 USAMEDIC 2017
• Diga ud. ¿cual es el intervalo de peso en Kg. en el que se Mide el grado de apuntamiento de la curva
encontrará el 68% de individuos de un marco muestral, en el
Interpretación:
cual la media de peso es de 78Kg con una DS de + - 6 Kg.? .
=0 Mesocúrtica
MEDIA
Fácil de calcular e interpretar.
MEDIANA
• Cálculo: VARIANZA
ASP
3 X Md . . . .
. .. .
.. . .
. . . . .
.
.
. .
. SIMETRIA
. . . .. . .
s MODA . . . . . . . . .. .
. . .
.
. DISTRIBUCION = GRAFICO
.. . . . . . . . KURTOSIS
..
. .. . . . .
.
o Interpretación:
RANGO
= 0, X=Md Simétrica PERCENTIL
CUARTIL
4.2 KURTOSIS
La Forma de la distribución
Otra manera de apreciar la forma de una distribución es observar el
nivel de apilamiento o llanura de la curva