Anda di halaman 1dari 59

UNIVERSIDAD NACIONAL “PEDRO RUIZ GALLO”

FACULTAD DE MEDICINA HUMANA

SALUD PÚBLICA III

Conceptos básicos de estadística


aplicada
Definición de estadística

Estadística es la ciencia y
técnica que tiene que ver con
la recolección, procesamiento,
análisis e interpretación de
datos.

Puede ser:
• Descriptiva
• Inferencial
Estadística descriptiva
Incluye la tabulación,
representación y descripción de
conjuntos de datos.
A partir de ellos se puede
organizar, simplificar y resumir
información básica.
Los datos pueden ser de
variables cuantitativas o
categóricas.
Estadística inferencial

Proporciona
métodos para
estimar las
características de
un grupo Muestra
Población

(población)
basándose en los
datos de un
conjunto pequeño
(muestra).
Estadística en Medicina
El resultado de un análisis estadístico no es un objetivo
en sí mismo, sino una herramienta para:
• comprobar o rechazar una hipótesis de trabajo,
• representar de una forma eficiente y resumida un
colectivo de observaciones,
• para validar un modelo de un proceso fisiológico
Datos cuantitativos
En el grupo de datos cuantitativos tenemos
• aquellos cuyo resultado puede variar de forma
continua, como puede ser el peso, la presión arterial,
el nivel de colesterol, etc. y
• los que sólo pueden tomar valores enteros como por
ejemplo el número de hijos, el número de ingresados
en el Servicio de Ortopedia, un día concreto, etc.
Datos cualitativos
Pueden ser:
• nominales, que constituyen una simple
etiqueta como puede ser el sexo, el grupo
sanguíneo, etc.
• ordinales, en las que se da una relación de
orden entre las respuestas, por ej. resultado
de una patología/tratamiento (fallece,
empeora, sin cambios, mejora, curación).
Presentación de datos cuantitativos
• Indicar un valor central y uno de variabilidad o
dispersión.
• Cuando es razonable suponer que los datos
pueden seguir una distribución normal, se
estimará la media y la desviación estándar.
• Ejemplo: La media de la PAS fue de 139.2 ±
14.9 mmHg
Distribución normal: distribución
aproximada de valores
Distribución normal: curva simétrica

30

25

20

15

10

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Asimetría a la izquierda

30

25

20

15

10

0
1 2 3 4 5 6 7 8 9 10 11 12 13
Asimetría a la derecha

30

25

20

15

10

0
1 2 3 4 5 6 7 8 9 10 11 12 13
Medidas de Variabilidad

50
45
40
35
30
25
20
15
10
5
0
1 3 5 7 9 11 13 15 17 19 21 23
Coeficiente de variación
El CV es igual al cociente entre la desviación típica y la
media

Si encontramos que el coeficiente de variación es


próximo o mayor que 0.5 y no puede haber datos
negativos, la distribución no es normal
Ej.: triglicéridos en pacientes
diabéticos

Por tanto el coeficiente de variación es 0.49.


Presentación de datos cualitativos
Los datos cualitativos (nominales u ordinales) se
cuantifican como recuentos del número de casos
observados para cada categoría, y suelen expresarse
habitualmente como porcentajes u otro tipo de
cocientes.
Ej. La proporción de mujeres con síndrome X es del 82 %
(55 de 67)
Gráficos
Son imágenes que, combinando la utilización de
sombreado, colores, puntos, líneas, símbolos,
números, texto y un sistema de referencia
(coordenadas), permiten presentar información
cuantitativa.
Gráficas
• Sirven para:
– Organizar los datos
– Observar patrones
– Observar agrupamientos
– Observar relaciones
– Comparar distribuciones
– Visualizar rápidamente la distribución de los datos
– Visualizar, obtener y comparar medidas estadísticas
Gráficas
La calidad de un gráfico estadístico consiste en comunicar ideas
complejas con precisión, claridad y eficiencia, de tal manera
que:
• Induzca a pensar en el contenido más que en la apariencia
• No distorsione la información proporcionada por los datos
• Presente mucha información (números) en poco espacio
• Favorezca la comparación de diferentes grupos de datos o de
relaciones entre los mismos (por ejemplo una secuencia
temporal)
Estadística
Gráficos estadísticos (I)

Gráficos estadísticos

La información contenida en las tablas de


frecuencias resulta más accesible y fácil de
interpretar si se representan por medio de gráficos
estadísticos.

Diagrama de barras Histograma

En él se asocia a cada valor de la variable una barra, Está formado por rectángulos, cuyas bases se
cuya longitud es igual o proporcional a su frecuencia. corresponden con los intervalos de clase y sus áreas
son iguales o proporcionales a sus frecuencias.
Diagrama de Pastel

Partes del todo

17%
29%
Opcion 1
Opcion 2
Opcion 3
22% Opcion 4
Opcion 5
13%
19%
Diagrama de puntos
Media de los resultados del cuestionario de calidad de vida

Hombres = rojo Mujeres = amarillo


Diagrama de Caja y Bigotes

Min Max

Q1 mediana Q3

Escala
Intervalos de confianza
Recomendaciones para un gráfico
• Si es estético, fomenta la lectura y comprensión.
• Sencillez y claridad, el uso del color debe ser
moderado y bien elegido.
• Usar líneas finas, eliminar las superfluas
• Usar grid si es necesario
• Balance entre el espacio en blanco y datos
• Idealmente no hay que acudir al texto .
• Balance entre texto, tablas e imágenes,
• Combinar texto y tablas insertas
MEDIDAS DE DISPERSIÓN

• Estudia lo concentrada o dispersa que está la


distribución de los datos con respecto a la media
aritmética.

• Rango o recorrido, desviación media, varianza y


desviación típica o estándar, y coeficiente de variación.
- MEDIDAS DE POSICIÓN

• Permiten conocer otros puntos característicos de la


distribución que no son los valores centrales

• Cuartiles, deciles y percentiles


MEDIDAS DE TENDENCIA CENTRAL. MEDIA ARITMÉTICA

Es la suma de todos los valores de una variable dividida


por el número total de ellos.
-DATOS SIN AGRUPAR:
_
X = x1 + x2 + x3 + ....... + xn = Σxi
N N
-DATOS AGRUPADOS:
_
X = Σxi . fi
N

CARACTERÍSTICAS:
• Es sensible a la variación de las puntuaciones
• Si hay intervalos de clase abiertos no se puede calcular
• No es recomendable cuando hay valores muy extremos
CÁLCULO DE LA MEDIA. EJEMPLOS
1.- DATOS NO AGRUPADOS: Calcular la T.A. sistólica
media de 5 pacientes en los que se han obtenido las siguientes
cifras. 110, 118, 125, 136, 145
_X = 110 + 118 + 125 + 136 + 145 = 634 = 126,8
5 5

2.- DATOS AGRUPADOS:


xi fi xi . fi
1 3 3
2 4 8 _
3 6 18 X = Σxi . fi = 59 = 2,95
4 5 20 N 20
5 2 10
___ ___
20 59
 En un brote de hepatitis A, 6 personas iniciaron síntomas 24 a 31
días después de la exposición. Calcule el promedio del período de
incubación en éste brote; los períodos de incubación para las i
personas afectadas (X) fueron: 29,31,24,29,30 y 25
1.- Para calcular el numerador sume las observaciones individuales
x = 29+31+24+29+30+25= 168
2.- Para calcular el denominador cuente el número de las
observaciones : n=6
3.- Para calcular la media divida el numerador sumatoría de las
observaciones) entre el denominador (numero de las
observaciones). media x = 29 31 24 29 30 25 = 168 = 28 días
6 6
 Entonces: el promedio del período de incubación del brote es 28
días.
• En una lista de 5 variables para 11 personas. Vamos a demostrar
como se calcula la media de cada variable (A-E) en el listado.

Persona # Variable A Variable B Variable C Variable D Variable E


1 0 0 0 0 0
2 0 4 1 1 6
3 1 4 2 1 7
4 1 4 3 2 7
5 1 5 4 2 7
6 5 5 5 2 8
7 9 5 6 3 8
8 9 6 7 3 8
9 9 6 8 3 9
10 10 6 9 4 9
11 10 10 10 10 10
1. Para calcular el numerador, sume todas las observaciones
individuales:
A. ∑i x = 0+0+1+1+1+5+9+9+9+10+10 = 55
B. ∑i x = 0+4+4+4+5+5+5+6+6+6+10 = 55
C. ∑i x = 0+1+2+3+4+5+6+7+8+9+10 = 55
D. ∑i x = 0+1+1+2+2+2+3+3+3+4+10 = 31
E. ∑i x = 0+6+7+7+7+8+8+8+9+9+10 = 79
2.- Para calcular el denominador cuente el número de observaciones
(n=11) para cada variable.
3.- Para calcular la media, divida el numerador (suma de las
observaciones) entre el denominador (número de las observaciones).
 Media de la variable A= 55/11= 5
 Media de la variable B= 55/11= 5
 Media de la variable C= 55/11= 5
 Media de la variable D= 31/11= 2.82
 Media de la variable E= 79/11= 7.18
MEDIDAS DE TENDENCIA CENTRAL. MEDIANA

La mediana de una serie de N datos ordenados en orden


creciente o decreciente es la puntuación que ocupa el valor
central de la distribución.

- DATOS SIN AGRUPAR: Rango mediano = (n+1)


2

a) Nº de datos impares: Valor central

7,4,2,5,9 2,4,5,7,9 X=5

b) Nº de datos pares: Media de los dos valores centrales:

7,4,2,5,9,6 2,4,5,6,7,9 X = 5 +6 = 5,5


2
MEDIDAS DE TENDENCIA CENTRAL. MEDIANA

- DATOS AGRUPADOS:

La mediana es el valor de la variable que tiene la propiedad


de que los valores menores que él son tan frecuentes como los
mayores que él.
Rango mediano = (n+1)
X = Li + N/2 – fd .i 2
fc

donde: Li = Límite inferior del intervalo crítico


N = Nº total de datos
fd = Frecuencia acumulada por debajo del intervalo crítico
fc = Frecuencia del intervalo crítico
i = Amplitud del intervalo
INTERVALOS fi Fac. Rango mediano = (n+1)
2
151,5 – 172,5 5 5

172,5 – 193,5 7 12

193,5 – 214,5 9 21

214,5 – 235,5 6 27

235,5 – 256,5 3 30
___
30

X = Li + N/2 – fd . i = 193,5 + 30 /2 - 12 . 21 = 200,5


fc 9
CARACTERÍSTICAS DE LA MEDIANA

• Es menos sensible que la media a la variación de las


puntuaciones. Ejemplo: A 24,25,29,30,31 Media 28.0 mediana 29
B 24,25,29,30,131 Media 44.7 mediana 29

• Se puede calcular aunque existan algún intervalo abierto,


siempre que no sea ese el intervalo crítico.

• Es más representativa cuando la distribución tiene


puntuaciones muy extremas.
Ejemplo
A 0 0 1 1 1 5 9 9 9 10 10
B 0 4 4 4 5 5 5 6 6 6 10
C 0 1 2 3 4 5 6 7 8 9 10
D 0 1 1 2 2 2 3 3 3 4 10
E 0 6 7 7 7 8 8 8 9 9 10
1.- Organice las observaciones en orden creciente (ya está hecho)
2.- Encuentre el rango medio de las observaciones
(11 observaciones + 1) /2 = 12/2 = 6
3.- Identifique el valor de la mediana que es el de la 6a observación:
La mediana para las variables A, B y C es 5;
La mediana para la variable D es 2;
La mediana para la variable E es 8;
MEDIDAS DE TENDENCIA CENTRAL. MODA
Es el valor de la variable a la que corresponde la máxima frecuencia.

Si los datos están agrupados en intervalos, la moda es la marca de


clase del intervalo con mayor frecuencia.

CARACTERÍSTICAS:

• Es muy sencilla de obtener.

• Se puede calcular aunque existan intervalos abiertos, siempre que no


esté incluida en él.

• Es poco representativa.
MODA
• La moda es el dato que más se repite (el de más alta frecuencia).
Por ejemplo: ¿cuántas veces se repite la letra “e” en la palabra
“representatividad”? se repite 3 veces y te fijarás que es la que
más se repite, por lo tanto se dice que la letra “e” es la moda de
este conjunto de letras.
• Podremos determinar la moda en muestras de variables tanto
cualitativas como cuantativas (datos agrupados o no).
• La moda es muy fácil de calcularla y útil, pro tiene sus
limitaciones, a veces no encontraremos moda (cuando todos o
más de dos tienen la misma frecuencia) o muestras bimodales
(con dos modas). Por lo tanto veremos otras opciones.
Para datos no agrupados
• La moda se define como el valor o clase que tiene la
mayor frecuencia, en un conjunto de observaciones.
• Cuando los datos obtenidos solamente pueden clasificarse
en categorías, se emplea la moda para describirlo. Sin
embargo el empleo de la moda no está limitado al tipo de
datos cualitativos o descriptivos.
• La moda resulta sumamente útil para expresar la
tendencia central de observaciones correspondientes a
características cualitativas tales como color, estado civil,
ocupación, lugar de nacimiento, etc.
Media, mediana y moda

• La media, la mediana y la moda son


idénticas en una distribución simétrica
• La mediana puede ser la idónea en
distribuciones sesgadas, ya que no se
afecta tanto por valores extremos.
• Sin embargo no se cuenta con un
criterio único para aplicar alguna de
las tres medidas
ÍNDICES DE POSICIÓN

• PERCENTILES (P): Es el valor de la variable por debajo del cual


se encuentra un porcentaje determinado de observaciones.

• CUARTILES (Q): Son los valores de la variable que dejan por


debajo el

25% de los datos ............... Primer cuartil Q1 (25%)

50% de los datos................ Segundo cuartil Q2 (50%)

75% de los datos................ Tercer cuartil Q3 (75%)


CUARTILES

75% 25%
25% 75%

25% 25% 25% 25%


Cuartil 1 MedianaCu Cuartil 3 Máximo
Mínimo
Q1 artil 2 Q2 Q3
PERCENTILES

Los percentiles dividen en dos partes


las observaciones. Por ejemplo, el
percentil 20, P20, es el valor que
deja por debajo un 20% y por
encima un 80% de las observaciones
PERCENTILES

20% 80%
Mínimo Percentil 20 Máximo

P20
MEDIDAS DE DISPERSIÓN
• VARIANZA: Es la media de los cuadrados de las
diferencias entre cada valor de la variable y la media
aritmética.
_
S² = Σ (xi - X )² o bien S² = 1 Σxi ² - (Σxi )²
N
_ N N
S² =Σxi ² - X ²
También:
N
Para datos agrupados:
_
S² = Σfi (xi - X )² o bien S² = 1 Σfi . xi ² - (Σfi . xi )²
N _ N N

También: S² = Σfixi ² - X ²
N
• DESVIACIÓN TÍPICA: Es la raíz cuadrada de la varianza
MEDIDAS DE DISPERSIÓN
• COEFICIENTE DE VARIACIÓN DE PEARSON:
Es la «desviación típica medida en unidades de media» y se
mide en %; o lo que es lo mismo, indica el tanto por ciento de
la media que representa la desviación típica. Así:
_
CV = S / X . 100
• RANGO, RECORRIDO O AMPLITUD:
Es la diferencia entre los valores más grande y más pequeño de
la distribución.

• RANGO INTERCUARTÍLICO:
Es la diferencia entre el tercer cuartil y el primero (Q3 – Q1).
Ejemplo:
En éste ejemplo se demuestra cómo se encuentran los valores
mínimo y máximo y el rango de los siguientes datos:
29,31,24,29,30,25.
1.- Organice los datos de menor a mayor: 24,25,29,29,29,30,31;
2.- Identifique los valores mínimo y máximo: mínimo=24 y
máximo=31
3.- Calcule el rango: rango = máximo - mínimo =31-24=7; entonces el
rango es igual a 7.
RANGO INTERCUARTÍLICO:

1. Organice las observaciones en orden ascendente.


Dados estos datos: 13, 7, 9, 15, 11, 5, 8, 4,
hay que organizarlos así: 4, 5, 7, 8, 9, 11, 13, 15.
2. Encuentre la posición del primer y el tercer cuartil. Dado que hay
8 observaciones, n = 8.
posición del primer cuartil (Q1) = (n + 1) / 4
= (8 + 1) / 4 = 2.25
posición del tercer cuartil (Q3) = 3(n + 1) / 4 = 3 x Q1
3(8 + 1) / 4 = 6.75
Así, se encuentra Q1 (1/4) de las observaciones entre 2 y 3 y Q3
(3/4) entre las observaciones entre 6 y 7.
3. Identifique el valor del primer y el tercer cuartil.
Valor de Q1: La posición de Q1 es 2 1/4; así, el valor de Q1 es el
valor de la observación 2 más 1/4 de la diferencia entre los valores de
las observaciones 2 y 3.
Valor de la observación 3 (ver paso 1) : 7
Valor de la observación 2: 5
Q1 = 5 + 1/4( 7-5 ) = 5 + 1/4(2) = 5 + 0,5 = 5.5
Valor de Q3: La posición de Q1 es 6 3/4; así, el valor de Q3 es el
valor de la observación 6 más 3/4 de la diferencia entre los
valores de las observaciones 6 y 7.
Valor de la observación 7 (ver paso 1) : 13
Valor de la observación 6: 11
Q3 = 11 + 3/4( 13-11 ) = 11 + 3/4 (2) = 11 + 1.5 = 12.5
4. Calcule el rango intercuartílico como Q3 menos Q1.
Q3 = 12,5 (ver paso 3) Q1 = 5,5
Rango intercuartílico = 12,5 - 5,5 = 7

 En general, se usan los cuartiles y el rango intercuartílico para


describir la variabilidad cuando se está usando la mediana como
la medida de tendencia central.
 Cuando se está usando la media aritmética, hay que usar la
desviación típica.
VARIANZA y DESVIACIÓN TIPICA

• Si se resta la media aritmética de cada observación, la suma de


las diferencias es cero.
• Este concepto de restar la media de cada observación es la base
para dos medidas de dispersión: la varianza y la desviación típica
o estándar.
• Para estas medidas, hay que elevar al cuadrado las diferencias
para eliminar los números negativos.
VARIANZA y DESVIACIÓN TIPICA

• Después, se suma el cuadrado de las diferencias y se divide por


n-1 para encontrar la "media" de las diferencias al cuadrado.
• Esta "media" es la VARIANZA
• Para convertir la varianza a las unidades originales, hay que
obtener la raíz cuadrada. Se denomina DESVIACIÓN TIPICA
Ó ESTANDAR .
Valor menos la media Diferencia Diferencias al cuadrado
24-28 -4 16
25-28 -3 9
29-28 +1.0 1
29-28 +1.0 1
30-28 +2.0 4
31-28 +3.0 9
168-168.0=0 -7+7=0 40
Varianza = ∑ diferencias cuadráticas = 40 = 8
n-1 5

Desvío estándar= √8 = 2.83


 La varianza y la desviación estándar son medidas de la desviación o
dispersión de las observaciones alrededor de la media de la
distribución.
 La varianza es la media de las diferencias cuadradas de las
observaciones alrededor de la media. Se representa como "S2 " en las
fórmulas.
 La desviación estándar es la raíz cuadrada de la varianza; se representa
con "s"
ESTADÍSTICA DESCRIPTIVA

• Se ocupa de obtener datos nuevos.


• Con los que procede a resumir y organizar esos datos
para facilitar su análisis e interpretación.
• Utiliza medidas de tendencia central, de dispersión y
posición.
DESV.
CUARTILES PERCENTILES RANGO VARIANZA STANDART

Q1= n + 1 x 1 P(p)= n + 1 (p) S² = Σ(xi - X)²


4 100 R = VM - Vm n -1 DS = √ S²
Q2= n + 1 x 2 P(25)=n + 1 (25) δ² = Σ(xi - μ)²
4 100 R / 6 = DS N

Q3= n + 1 x 3
4 δ² = R / 4
COEFICIENTE DE
VARIACIÓN AMPLITUD MEDIA MEDIANA

CV = S x 100 A=R/K X = Σ Xi / n Me = n + 1
X 2

A = VM – Vm Me = n
K 2

Anda mungkin juga menyukai