1 USAMEDIC 2015
DEFINICION
La Estadística en Medicina, nace por la necesidad de “MEDIR” y 1. RECOPILAR DATOS (RECOGER / RECOLECTAR)
conocer el comportamiento de la Población en relación a aspectos
relacionados con la salud y la enfermedad. FUENTE PRIMARIA
Es la matemática aplicada a las ciencias de la salud.
Cuando se registran
Funciones: características mediante la
- Recolección de datos.
- Organización datos. medición, observación y
- Procesamiento y análisis de datos.
- Interpretar resultados conteo, para lo cual utiliza
FUENTE SECUNDARIA
Para la toma de decisiones. Fuentes primarias o
secundarias.
Sus fines son describir al conjunto de datos obtenidos y tomar
decisiones o realizar generalizaciones acerca de las características de
todas las observaciones bajo consideración.
TIPOS DE ESTADISTICA
• Una vez que se
ha realizado la
recolección de
los datos, se
obtienen
datos en
bruto, los
cuales rara
vez son
significativos
sin una
organización y
tabulación.
LA APLICACIÓN DE LA BIOESTADISTICA EN LA
MEDICINA ASISTENCIAL Y LA SALUD PUBLICA
2. ORGANIZAR DATOS (ORDENAR)
Cuando se ordenan para una mejor comprensión y
facilitar sus análisis.(tablas, gráficos y figuras)
Edad N° Pacientes
30 - 34 6
35 - 39 12
40 - 44 8
45 - 49 2
BIOESTADÍSTICA 1 Pag. 2 USAMEDIC 2015
variables (regresión y
VENTANAS
a. Que se derive siempre de COLOR DE
CABELLO
PROFESION
mínimo de variación
PRESION
ARTERIAL
VALOR
4. INTERPRETAR RESULTADOS Un valor es la magnitud, rango o atributo a través del cual se
expresa la variable.
La variable edad puede tomar los
Cada uno de estos siguientes valores:
rangos son valores de – 1 a 10 años
la variable – 11 a 20 años
Cuando se le otorga un – 21 a 30 años
1. ¿Qué es un DATO?
Ejemplo de dato:
Peso 75 Kg.
Estatura 1,80 mts.
Profesión Médico ----
• La variable o variables
Si el DATO es útil para tomar decisiones se convierte en
• El valor o magnitud. INFORMACIÓN.
INFERENCIA ESTADÍSTICA
BIOESTADÍSTICA 1 Pag. 3 USAMEDIC 2015
5. Parámetros y estadísticos
3. MARCO POBLACIONAL Y POBLACION ESTADISTICA
MARCO POBLACIONAL: Es el conjunto total de individuos, elementos o unidades
• Parámetro: Valor representativo de una POBLACION. Se
simboliza por letras griegas. Sólo hay un parámetro en cada población.
de análisis.
Media poblacional
2 Varianza poblacional
Desviación estándar poblacional
Proporción poblacional
s2 Varianza muestra.
Cada población tiene el mismo número de VARIABLES que número de INDIVIDUOS
tiene el marco poblacional. s Desviación estándar muestral.
De cada Marco Poblacional se podrán extraer tantas poblaciones como características p Proporción muestral.
de interés se deseen investigar.
m1 m2 m3 mn
75 datos
Ejemplo:
P1 P2 P3 ... Pn
Los datos variables son los de mayor interés en Estadística.
A estos se les denomina comúnmente “VARIABLES”.
BIOESTADÍSTICA 1 Pag. 4 USAMEDIC 2015
CLASIFICACIÓN DE VARIABLES
1.- Variables Numéricas o Cuantitativas : Aquellas variables que a) Escala Nominal:
se expresan por números los que se obtienen a través de un
(variables cualitativas nominales)
conteo o una medición. Las operaciones posibles entre estas • La escala de medida nominal, consiste en la asignación arbitraria de
variables son los promedios y las medidas de dispersión, números o símbolos a cada una de las diferentes categorías en las cuales
podemos dividir el carácter que observamos, sin que puedan
entre otras. Se reconocen porque tienen unidades de establecerse relaciones entre dichas categorías.
medida. – consiste en clasificar los objetos de estudio según las categorías de una
variable. El alcance de esta escala es el conteo.
Las variables cuantitativas pueden ser:
Ejemplo
- DISCRETA : Cuando la variable sólo puede tomar valores enteros
dentro de una escala de valores. Proviene de un conteo. Sexo 1:Masculino 2:Femenino
Ejemplo: Número de emergencias médicas por día.
Especialidad 1:Clínico 2:Cirugía
39
• OPERADOR DE MAQUINA
AUTOMATICA
– La forma más sencilla de presentar la información obtenida en un de tipo cualitativa, por lo general de nivel nominal.
OPERADOR DE DOBLE FILO
OPERARIO GENERAL
estudio es contabilizar el número de veces que aparece cada OPERADOR DE DOBLE FILO
120
Número de operarios
– Frecuencias relativas (porcentajes unitarios): Ídem, pero dividido 100
60
Las barras están separadas entre si, y el ancho de las mismas no es representativo
TABLA DE FRECUENCIAS
Ejemplo de Tabla para variables cualitativas nominales Gráficos circulares (tortas, sectores, pie)
Al igual que los gráficos de barra, se utilizan para representar variables de tipo
cualitativa, generalmente para representar distribuciones porcentuales
respecto a una clasificación.
44
Otros gráficos para variables cualitativas
Fáciles de entender.
Cada modalidad debe
ser proporcional a la
Son complementos a la tabulación frecuencia.
Ojiva
Gráficos para variables cuantitativas
VARIABLES CUANTITATIVAS DISCRETAS También se vincula a los histogramas, ya que usa la información de la tabla de
frecuencia (frecuencia acumulativa) para generar un gráfico muy usado para
GRAFICO DE BARRAS GRAFICO INTEGRAL hacer estimaciones y generar respuestas
(diferencial)
Ojiva
Resultado Evaluación
1,2
1
Operadores
0,8
0,6
0,4
0,2
0
11,53 12,17 12,81 13,45 14,08 14,72 15,36 16,00 16,64
Salarios en miles de Bs.
50
máximo
40
30 mínimo
20
10 Mediana
0 (Cuartil 2)
10.89 11.55 12.22 12.88 13.54 14.21 14.87 15.53 16.20
Salarios en miles
Tipos de
Clases
Clases
Limite superior de clase
Polígonos de frecuencia
Diagrama de Tallos y Hojas
Están vinculados al histograma porque trabajan con la misma información.
Es un diagrama donde cada
valor de datos es dividido en
Resultado Evaluación Con dos pequeños una “hoja” (normalmente el
cambios se puede último dígito) y un “tallo” (los
60
convertir un
50
histograma en este otros dígitos). Por ejemplo el
Operadores
40
polígono. valor 32 seria dividido en “3”
30
20 (tallo) y “2” (hoja).
10 No es un gráfico muy
difundido a pesar
0
11.21 11.85 12.49 13.13 13.77 14.40 15.04 15.68 16.32 de sus ventajas
Se aplica para variables
Salarios en miles sobre el histograma. cuantitativas discretas.
Se utilizan para representar series de datos donde el eje horizontal está representado
por el tiempo, es decir la variable evoluciona en el tiempo. ESTADISTICA DESCRIPTIVA I
Energía Consumida Mensual
8.000
7.500
7.000
GWh
6.500
6.000
5.500
5.000
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35
Meses
Ejemplo: Variación en el número de emergencias diarias por semana. Julio 2. Medidas de Posición
1998 – Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
100
90
• Cuantiles, percentiles, cuartiles, deciles,...
80
3. Medidas de Dispersión
70
60 – Indican la mayor o menor concentración de los datos con respecto a
50 las medidas de centralización.
40 • Desviación típica, coeficiente de variación, rango, varianza
30
20 4. Formas de la Distribuciòn
10 – 4.1 Simetría
0 – 4.2 Apuntamiento o curtosis
1ra. Semana 2da. Semana 3ra. Semana 4ta. Semana
. . . .
.
. .
.
.. . . . . MTC.
.
.
. .... . .
MEDIA
MEDIANA
MODA
PERCENTILES
CUARTILES
BIOESTADÍSTICA 1 Pag. 9 USAMEDIC 2015
Otro Ejemplo:
• En este caso la mitad (50%) de los datos estará
por encima de la mediana y la otra mitad (50%)
La siguiente tabla muestra el número de reclamos y quejas presentadas por pacientes de una clínica a lo estará por debajo de ella.
largo de una semana. Calcule e interprete la media.
Día/Semana Lun Mar Mier Jue Vier Sab • La mediana es el valor intermedio cuando los
Reclamos/día 8 10 5 12 10 15 valores de los datos se han ordenado.
Media aritmética =
8 10 5 12 10 15
60 • Se puede aplicar para variables cuantitativas y
6 6 cualitativas ordinales.
x = 10 reclamos
xg n X1 X2 X3 ... Xn
2º Si la serie es par, la mediana se obtiene de la semisuma de los dos
valores centrales de la serie previamente ordenada.
xh Ejemplo:
Se utiliza para calcular variables como productividades, velocidades, rendimiento, aceleración media, cambios o
8, 10, 14, 18, 23, 24, 32, 34
variaciones como el tiempo medio para realizar un proceso médico.
18 23
mediana 20,5
2
a) Obtención: se obtiene calculando el inverso de la media aritmética de los inversos de una serie.
1
xh 3º Sea la serie par o impar, la mediana ocupa el lugar,
n 1 n 1
de la serie previamente ordenada. 2
i 1
X
i
n
BIOESTADÍSTICA 1 Pag. 10 USAMEDIC 2015
ä Los valores extremos no afectan a la mediana como en el caso de la media aritmética. • Si una distribución es simétrica, la media,
ä Es fácil de calcular, interpretar y entender. mediana y modo coinciden
ä Se puede determinar para datos cualitativos.
PERCENTILES CUARTILES
• Los percentiles dividen a los datos en cien partes iguales, cada una de • Los cuartiles dividen los datos en cuatro partes iguales.
ellas contiene el 1% de los elementos del conjunto. • Cada una de las partes representa una cuarta parte, o el 25% de las observaciones.
• Más o menos el (p) por ciento de los datos tienen valores menores que • Los cuartiles son percentiles específicos; por consiguiente, los pasos para calcular los
el percentil y aproximadamente (100-p) por ciento de los datos tienen percentiles los podemos emplear para calcular los cuartiles.
valores mayores que el percentil. • El primer cuartil Q1 es un valor que deje por debajo de él 25% de las y por encima 75%
• Un percentil nos provee información de como se distribuyen los de las observaciones (equivale al P 25). El Q2 es la mediana (50%) (equivale al P50) y
Q3 deja por debajo 75% y por encima 25% de las observaciones (equivale al P75)
valores de los datos desde el menor hasta el mayor.
Paso 2. Calcule un índice (i) que indica la ¿ Cómo identificamos los cuartiles en este ejemplo?
posición del percentil que se busca P Utilizarás los mismos pasos para identificar los percentiles:
i n
en la serie de datos ordenados. 100 Primero, ordenamos los datos
VALORES
• Tercer cuartil:
Q3 = tercer cuartil, o percentil 75
75
i 10 = 7.5
100
Como (i) no es un número entero, se redondea al próximo entero mayor que
7.5, o sea 8. Al referirnos a los datos , vemos que el tercer cuartil está ubicado
en posición 8 de los datos que en este caso es el 20. Finalmente, los cuartiles en
este caso se presentan de la siguiente forma:
5 8 11 12 14 15 18 20 25 30
Ejemplos
3. MEDIDAS DE DISPERSIÓN
En el Hospital Dos de Mayo los pesos de RN durante el año 2009 variaron
entre los 1500 gr hasta los 4,500 gr. Diga usted que porcentaje de niños
tuvieron un peso mayor de 3000 gr si se sabe que este peso corresponde
Llamadas también medidas de variabilidad, variación
al percentil 80 de la serie total de RN durante el 2009? Son útiles porque:
p80 ä Permiten juzgar la confiabilidad de la medida de tendencia central.
Ejercicios
• El 5% de los recién nacidos tiene un peso demasiado bajo. ¿En que percentil se
encuentra el peso por debajo del cual se considera “demasiado bajo”?
Medidas de dispersión
Ejemplo de dos conjuntos de datos con igual media
◦ ¿En que percentil se encuentra el peso que es superado sólo por el 25% de los
recién nacidos?
◦ ¿Entre qué percentiles se encuentran los valores en los que está la mitad de los
individuos “más normales” de una población?
Se ha obtenido una muestra del salario de los Bomberos. Los datos recopilados
RANGO
fueron los siguientes:
1500 $1400 $1600 $2100
1200 1300 1900 1800 RANGO INTERCUARTIL
2000 1200 1200 1500
2200 2300 1500 1400 DESVIACION MEDIA
COEFICIENTE DE VARIACION
BIOESTADISTICA 4
RANGO
• Es también llamado: Amplitud, intervalo, recorrdio o Alcance.
• Es la medida de dispersión más sencilla.
• Se determina restando el valor mayor de los datos del valor menor.
35 – 5 = 30
ESTADISTICA DESCRIPTIVA II
Interpretación
La diferencia entre el valor mayor y el menor es de 30.
BIOESTADÍSTICA 1 Pag. 13 USAMEDIC 2015
DESVIACION MEDIA
Ventajas y desventajas del rango
Permite calcular la desviación media de todos los datos respecto a su media
aritmética.
Ventajas
fácil de calcular A cada dato se le resta la Media Aritmética sin hacer caso de los signos negativos
(valor absoluto), y se divide luego por el número total de términos.
fácil de entender e interpretar
(Xi – X)
DM =
-----------
Desventajas n
RI Q3 Q1
Ejemplo:
La siguiente información se refiere al número de quejas recibidas en un Centro
Veamos el siguiente ejemplo: Médico durante una semana. Calcule la varianza de 8, 10, 5, 12, 10, 15.
Determine el rango intercuartil para los datos siguientes (pesos de pacientes pediátricos);
Elaboramos un cuadro de la forma siguiente
30, 40, 35, 5, 10, 20, 15, 30 y 45:
x Xi x Xi x 2
Como (i) no es un entero, redondeamos al próximo entero mayor que 2.25, o sea 3. Así,
(X i x )
2
2 58
que Q1 está ubicado en la posición tres (3) de los datos, que en este ejemplo es 15. 2
S 11,6 quejas2
S n 1 6 1
n
(Xi x)2
Rango Intercuartil = Q3 – Q1 i 1
• S loss 2datos
Para poder interpretar debemos regresarlos a la escala original
(sacar la raíz cuadrada de la varianza). n 1
Interpretación:
El 50% de los pacientes pediátricos pesan entre 15 y 25 Kilos.
El rango intercuartilico de pesos de los pacientes pediátricos es de 20 Kilos.
BIOESTADÍSTICA 1 Pag. 14 USAMEDIC 2015
Ejemplo:
Farmacia I n
La siguiente información se refiere al número de quejas recibidas en Xi
un Centro Médico durante una semana. Calcule la desviación 393
estándar.
x i 1
56,14
n 7
40 -16,14 260,50
Ya sabemos por el ejemplo anterior que S2 = 11,6 quejas2.
70 13,86 192,10
Entonces:
60 3,86 14,90
S
2
48 -8,14 66,26
s
52 -4,14 17,14
65 8,86 78,50
S 11,6 quejas2
La unidad de medida de la DS es
igual a la de las variables del 58 1,86 3,46
Xi x 0 Xi x
conjunto
X 393 2
632,86
S 3,4 quejas
Si Xi x 2 632,86
Propiedades del desviación estándar
n
• Mide la dispersión respecto a la media. Debe emplearse solo
( Xi x )
2
cuando se escoge la media como medida central de la 632,86
i 1
distribución. S 10,27
n 1 7 1
• S = 0; solo ocurre cuando no hay dispersión: todas las
observaciones toman el mismo valor. De lo contrario S > 0.
• Cuanto más dispersión hay entre las observaciones, mayor es S. S
CV 100
• Al igual que la media, la desviación estandar se encuentra x
fuertemente influenciado por las observaciones extremas.
10,27
CV 100 18,29
56,14
106
Farmacia II
COEFICIENTE DE VARIACION R n
Xi
847
x i 1 105,87
•También llamado COEFICIENTE DE VARIACION DE PEARSON. n 8
•Es una medida de variabilidad relativa de los datos, permite comparar la x Xi x Xi x 2
Para la muestra:
s
CV 100
82 -23,87 569,7769
x 110 4,13 17,0569
140 34,13 1164,8569
Para la población: CV 100 120 14,13 199,6569
X 847 Xi x 0,04
Xi x
2
11372,88
Ejemplo:
Si Xi x 11372,88
n 2
A continuación se presentan las ventas (en unidades i 1
monetarias) logradas durante una semana por dos farmacias.
La farmacia I vende en soles y la farmacia II en dólares ¿Cuál n
( Xi x )
2
de ellos tiene un desempeño más estable, en cuanto a nivel de 11372,88
i 1
ventas?. S 40,30
n 1 8 1
Farmacia I (soles) Farmacia II (dólares)
S 40,30
40,70,60,48,52,65,58 70,35,150,140,82,110,140,120
CV 100 CV 100 30,06
x 105,87
Calculamos la media y desviación estándar para cada una de
las farmacias
La farmacia II presenta una mayor variabilidad en el volumen de
ventas.
BIOESTADÍSTICA 1 Pag. 15 USAMEDIC 2015
4.1 SIMETRIA DE LOS DATOS • Diga ud. ¿cual es el intervalo de peso en Kg. en el que se encontrará
el 68% de individuos de un marco muestral, en el cual la media de
peso es de 78Kg con una DS de + - 6 Kg.? .
Otra característica de un conjunto de datos es la forma, es decir, la
manera en que están distribuidas las observaciones. • En que rango de Talla se encontrará el 95% de la población en la que
La distribución de los datos puede ser o no simétrica. Si la
se sabe que la media de talla es de 160 cm con una DS de + - 15 cm?
distribución de los datos no es simétrica, se llama asimétrica o
sesgada. • En que rango de edades se encontrará el 99% de individuos de una
muestra (marco), cuya media aritmética fue de 35 años con una DS
Para describir la forma se puede comparar la media y la mediana.
de +- 3 años.
También puede observarse a través del coeficiente de asimetría Mide
el grado de Simetría / Asimetría de la distribución
11
4
<0 Platicúrtica
Distribuciones asimétricas
En la distribución Normal es 0 mesocúrtica
Sesgo positivo Sesgo negativo Si es – indicará que es más aplanada que la normal platicúrtica (mayor
dispersión)
Asimétrica Positiva Asimétrica Negativa
11
5
Relación entre la media, la mediana y la moda La Forma de la distribución
Frecuencia
Frecuencia
Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
(M) (M) (M)
leptocúrtica Platicúrtica mesocúrtica
• Si la mediana está muy cerca del Q1, se dice que existe un sesgo positivo.
. (menor dispersión) (mayor dispersión)
• Si la mediana está muy cerca del Q3, se dice que existe un sesgo negativo
• Si la mediana está en el centro entre Q1 y Q3, se dice que la distribución es simetría en el 50% de los
datos centrales El coeficiente de kurtosis mide el grado de apuntamiento de la
curva
Cuando los datos son sesgados es mejor emplear la Mediana
ASP
3 X Md
s
o Interpretación:
-1 1 = 0, X=Md Simétrica
-2 2
68% ASP > 0, X>Md Asimétrica Positiva
-3 95% 3
< 0, X<Md Asimétrica Negativa
99.9%
BIOESTADÍSTICA 1 Pag. 16 USAMEDIC 2015