Anda di halaman 1dari 22

BIOESTADÍSTICA 1 Nuevo Pag.

1 USAMEDIC 2019

BIOESTADISTICA 1 PROCESO ESTADISTICO


INTRODUCCION Y CONCEPTOS GENERALES
TOMAR 1. Recoger o
DEFINICION DECISIONES recopilar

La Estadística en Medicina, nace


por la necesidad de “MEDIR” y
conocer el comportamiento de la
Población en relación a aspectos 4. INFORMACION 2.Organizar
relacionados con la salud y la Interpretar (DATO) u ordenar
enfermedad.
Es la matemática aplicada a las
ciencias de la salud.

 Sus fines son describir al conjunto de datos obtenidos y tomar


3. Procesar
o analizar
decisiones o realizar generalizaciones acerca de las características
de todas las observaciones bajo consideración.

TIPOS DE BIOESTADISTICA 1. RECOPILAR DATOS (RECOGER / RECOLECTAR)


Cuando se registran características mediante la
medición, observación y conteo, para lo cual utiliza
Fuentes primarias o secundarias.

FUENTE PRIMARIA

 Una vez que se ha


realizado la
recolección de los
datos, se
obtienen datos en
bruto, los cuales
FUENTE SECUNDARIA rara vez son
significativos sin
una organización
y tabulación.
BIOESTADÍSTICA 1 Nuevo Pag. 2 USAMEDIC 2019

2. ORGANIZAR DATOS (ORDENAR)


4. INTERPRETAR RESULTADOS
Cuando se ordenan para una mejor comprensión y
facilitar sus análisis.(tablas, gráficos y figuras)

Tabla de Distribución Diagrama Circular Cuando se le otorga un


sentido práctico a los
Edad N° Pacientes
resultados obtenidos en el
30 - 34 6 análisis
35 - 39 12
40 - 44 8
45 - 49 2

3. PROCESAR DATOS (ANALISIS) CONCEPTOS BASICOS


E. DESCRIPTIVA
Cuando se calculan
promedios y medidas de
variabilidad entres otros 1. Dato o Información
cálculos.
2. Marco poblacional - población
3. marco muestral - muestra
E. ANALITICA 4. Parámetro y estadístico
cuando se establecen 5. Tipos de datos
relaciones entre las
6. Clasificación de variables
variables (regresión y
correlación). 7. Escalas de medición
BIOESTADÍSTICA 1 Nuevo Pag. 3 USAMEDIC 2019

1. ¿Qué es un DATO (información)? LA VARIABLE (característica a estudiar)


• Es una dimensión o característica de la unidad de análisis, que permite
su clasificación.
Toda unidad Estructura a partir de la • propiedad, atributo, rasgos o cualidades de las Unidades de Análisis
de cual el investigador genera (individuos), que es materia de interés del estudio.
Información sus estudios e
indagaciones
«Es aquello que se quiere conocer de la unidad de análisis»
Ejemplo
Las tres partes del “dato”:
En la familia: numero de componentes, ingresos, el grado de educación, gastos
UNIDAD DE ANALISIS mensuales, etc.
(SUJETO)
Lo importante en una EDAD
TALLA COLOR
PISOS
variable es: PESO MIEMBROS

DATO a. Que se derive siempre COLOR PROFESION VENTANAS

de una unidad de DE
CABELLO AREA
análisis. IDIOMA
VALOR O VARIABLE b. Que admita un rango PRESION
ARTERIAL
MAGNITUD (CARACTERISTICA)
mínimo de variación

VALOR
LA UNIDAD DE ANALISIS (sujeto o individuo estadístico)
Un valor es la magnitud, rango o atributo a través del cual se
• Es el elemento mínimo de estudio, observable o medible en relación expresa la variable.
con un conjunto de elementos que son de su mismo tipo.
La variable edad puede tomar los
• Se denomina también UNIDAD ELEMENTAL o ESTADISTICA. siguientes valores: • 1 a 10 años
Cada uno de estos • 11 a 20 años
rangos son valores de • 21 a 30 años
«Es la persona, animal o cosa de la que se quiere la variable • 31 a 40 años

conocer o saber algo»


La variable sexo admite dos valores
Ejemplos
• Hombre
• En ciencia sociales: la familia, el obrero, la empresa, los grupos, las • Mujer
naciones, etc.
La variable educación puede ser construida mediante
tres valores
• Educación alta
• Educación media
• Educación Baja
BIOESTADÍSTICA 1 Nuevo Pag. 4 USAMEDIC 2019

3. MARCO MUESTRAL Y MUESTRA


Ejemplo de dato:
MARCO MUESTRAL: subconjunto de individuos estadísticos,
extraídos de un marco poblacional.
Características (Variable) Valor Unidad de medida

Peso 75 Kg.
Estatura 1,80 mts.
Profesión Médico ---- Sub conjunto de Unidades de análisis
(Individuos)

MUESTRA: subconjunto de variables de estudio, de


INDIVIDUO
un marco muestral.
Si el DATO es útil para tomar decisiones
O
SUJETO •Una muestra tiene el mismo número de variables que número de
se convierte en INFORMACIÓN. individuos tiene el marco muestral.
•De cada marco muestral se podrán extraer tantas muestras como
características se deseen investigar.

2. MARCO POBLACIONAL y POBLACION Marco Poblacional Técnicas Marco Muestral


1200 pacientes de un hospital de muestreo 75 pacientes de un hospìtal
MARCO POBLACIONAL: Es el conjunto total de individuos
estadísticos, elementos o unidades de análisis. Característica Edad Peso Énf. Ant. Estado civil

Edad Peso Enf. Ant. Estado civil


MUESTRA MUESTRA MUESTRA MUESTRA

m1 m2 m3 mn

75 datos

TODAS las Unidades de análisis


Registro
(Individuos) POBLACIÓN POBLACIÓN POBLACIÓN POBLACIÓN
de la
carac-
POBLACION (UNIVERSO): Es el conjunto total de variables terística.
(características de interés) de estudio, de un marco poblacional.
P1 P2 P3 ... Pn
Cada población tiene el mismo número de VARIABLES que número de
INDIVIDUOS tiene el marco poblacional. 1 MARCO POBLACIONAL n
« » POBLACIONES
De cada Marco Poblacional se podrán extraer tantas poblaciones como
características de interés (variables), se deseen investigar. 1 MARCO MUESTRAL n
« » MUESTRAS
BIOESTADÍSTICA 1 Nuevo Pag. 5 USAMEDIC 2019

4. PARAMETROS y ESTADISTICOS
• Parámetro: Valor representativo de
ESTADISTICO
- DATO VARIABLE: Si la característica
una POBLACION. Se simboliza por de interés puede adoptar diversos valores
letras griegas. Sólo hay un parámetro
por cada población. Muestra en las unidades estadísticas (individuos
 Media poblacional
Muestra estadísticos).
POBLACION
2 Varianza poblacional
 Desviación estándar poblacional Ejemplo:
 Proporción poblacional
• Edad de los pacientes: 20 años, 54 años, 43 años, etc.
• Estadístico: Valor representativo de una ESTADISTICO
MUESTRA. Se simboliza por letras latinas. ESTADISTICO • Profesión de los profesores de la Universidad Daniel
Existen tantos estimadores como muestras Alcides Carrión: médicos, abogados, economistas, etc.
se extraigan de una población. Sinónimo: PARAMETRO
Estimador- Estadígrafo.
x Media muestral.
Varianza muestra.
Los datos variables son los de mayor interés en Estadística.
s2
s Desviación estándar muestral.
A estos se les denomina comúnmente “VARIABLES”.
p Proporción muestral.

5. TIPOS DE DATOS (INFORMACION) 6. CLASIFICACIÓN DE VARIABLES

¬ DATO CONSTANTE: Si la característica de   CONTÍNUAS


interés solo puede adoptar un sólo valor en  NUMÉRICAS 
 
todas las unidades estadísticas (individuos  cuantitativas 
estadísticos).   DISCRETAS

VARIABLES 
Ejemplo:

 
• Profesión de los integrantes del Colegio DICOTOMICAS
 
Médico del Perú
 CATEGORICAS  ORDINALES
 cualitativas 
  NOMINALES
Las constantes no son de mayor interés en Estadística.
BIOESTADÍSTICA 1 Nuevo Pag. 6 USAMEDIC 2019

CLASIFICACIÓN DE VARIABLES
1.- Variable Numérica o Cuantitativa : 7. ESCALAS DE MEDIDA O MEDICION:
 Las que se expresan por números los que se obtienen por
conteo o medición.
 Las operaciones posibles con estas son los promedios y
DEFINICION
medidas de dispersión, entre otras.

 Estas variables necesariamente tienen unidades de medida. Una escala es un patrón


Las variable cuantitativa puede ser: convencional de medición, y
básicamente consiste en un
- DISCRETA : Cuando la variable sólo puede tomar valores enteros
dentro de una escala de valores. Proviene de un conteo. instrumento capaz de
Ejemplo: Número de emergencias médicas por día. representar con gran fidelidad
verbal, gráfica o simbólica, el
- CONTINUA: Cuando la variable puede tomar cualquier valor estado de una variable
(entero o fracción), dentro de una escala de valores. Provienen
de una medición.
Ejemplo: Tiempo de permanencia de un paciente en un consultorio

CLASIFICACIÓN DE VARIABLES
2.-Variable Cualitativa : Tipos de escalas de medición
 Es la que no se pueden expresar mediante números, sino por
cualidades o categorías que representen sus atributos.
a) Escala Nominal o Intensiva: variables cualitativas nominales
 Solo se pueden registrar mediante el conteo.
 En casos especiales se puede expresar por un número pero
b) Escala Ordinal: variables cualitativas ordinales
este se reconoce porque carece de unidad de medida.
 Matemáticamente las operaciones posibles con estas son: la
tasa porcentual (porcentaje), proporciones y la moda. c) Escala de Intervalo

Ejemplo: Profesión de los participantes a un curso. d) Escala de Proporción o Razón


• 80% son médicos (tasa porcentual).
• 8 de cada 10 participantes son médicos (proporción).
Las variables cualitativas pueden ser:
a) Dicotómicas o Binarias (si o no)
b) Ordinales (orden creciente o decreciente)
c) Nominales (Profesiones, Estado Civil, etc.)
BIOESTADÍSTICA 1 Nuevo Pag. 7 USAMEDIC 2019

a) Escala Nominal: c) Escalas de intervalos:


(variables cuantitativas)
(variables cualitativas nominales)
• Se basa en la afirmación de la existencia de un continuo, seccionable en
• La escala de medida nominal, consiste en la asignación partes iguales, en donde cada parte seccionada contiene la misma
arbitraria de números o símbolos a cada una de las cantidad de unidades que cualquier otra sección.
diferentes categorías en las cuales podemos dividir el
carácter que observamos, sin que puedan establecerse • Es importante destacar que el punto cero en las escalas de intervalos
iguales es arbitrario, y no refleja en ningún momento ausencia de la
relaciones entre dichas categorías. magnitud que estamos midiendo.

• consiste en clasificar los objetos de estudio según las • Esta escala, además de poseer las características de la escala ordinal,
categorías de una variable. El alcance de esta escala es el encontramos que la asignación de los números a los elemento es tan
conteo. precisa que podemos determinar la magnitud de los intervalos
(distancia) entre todos los elementos de la escala.

Ejemplo
ESCALA
Ejemplo: Año 0
Sexo 1: Masculino 2: Femenino
Hora 00:00
Especialidad 1: Clínico 2: Cirugía
Temperatura 0ºC

b) Escala Ordinal: d) Escala de coeficientes o Razones:


(variables cualitativas ordinales y cuantitativas ordenadas)
(Variables cuantitativas)
• En caso de que puedan detectarse diversos grados de un atributo, la escala ordinal
es la indicada, puesto que puede recurrirse a la propiedad de "orden" de los • La escala de medida más elevada es el de coeficientes o
números asignándolo a los objetos en estudio de modo que, si la cifra asignada al
objeto A es mayor que la de B, puede inferirse que A posee un mayor grado que B. razones, y se diferencia de las escalas de intervalos iguales
únicamente por poseer un punto cero propio como origen;
• Hay variables cuantitativas que se pueden convertir en una forma ordinal, por es decir que el valor cero de esta escala significa ausencia de
ejemplo, la glicemia, se puede expresar en: Hipoglicemia, Normoglicemia e la magnitud que se mide.
Hiperglicemia.
ESCALA
• Además, siendo que cero ya no es arbitrario, sino un valor
Ejemplo:
absoluto, podemos decir que A. Tiene dos, tres o cuatro
• Calificación : A,B,C,D A>B veces la magnitud de la propiedad presente en B.
• Lugar : 1º , 2º , 3º 1º > 2º
• Grado de deshidratación : I, II, III, IV I>II Ejemplo:
• APGAR, Silverman, Glasgow. Ingreso mensual : S/.00.
• Escala del dolor Nº de hijos : 0
Procesos deficientes : 0
• Satisfacción de usuarios
BIOESTADÍSTICA 1 Nuevo Pag. 8 USAMEDIC 2019

BIOESTADISTICA 2 Ejemplo de Tabla para variables cualitativas nominales

Título
PRESENTACION DE DATOS Resultados de la votación distrital

Tabulación y Graficación
Talón Cuerpo
Todo análisis estadístico es una
estrategia para traducir la cantidad
de información obtenida en la Fuente
recolección de datos, a índices o XXXX

formas que sean interpretables y que Ejemplo de Tabla para variables cuantitativas discretas
representen alguna dimensión del
comportamiento de las variables

La estrategia más sencilla es mostrar


la información en un formato visual
(gráficos) o en un esquema
sintetizado (tablas)
OJO: Todo tipo de variables (cuanti y cuali) se puede tabular.

TABLAS ESTADISTICAS (de frecuencia)


Características
GRAFICOS (graficación)
 Las tablas deben incluir todos los puntajes registrados
 Deben respetar las características de la variable
 Llevan un título representativo del contenido (sobre la tabla, numerado)
 Al pie de la tabla se debe consignar la fuente de la que proceden los datos.
• Son complementarios a la tabulación
 La forma más sencilla de presentar la información obtenida en un estudio
es contabilizar el número de veces que aparece cada VARIABLE. Este
indicador se conoce como la frecuencia (cantidad) de aparición da cada • Representan la distribución de la variable
variable.
 Cuando presentamos una variable indicando la frecuencia de aparición de
cada uno de sus valores, tenemos una tabla de frecuencia. • Deben ser fáciles de interpretar

 Frecuencias absolutas: Contabilizan el número total de variables


de cada modalidad o clase (intervalo). • Deben llevar un título representativo (bajo el gráfico y
 Frecuencias relativas (porcentajes unitarios): Ídem, pero dividido numerado)
por el total, normalizadas y expresada en proporción o porcentaje.
 Frecuencias acumuladas absolutas y relativas: Acumulan las
frecuencias absolutas y relativas. Son especialmente útiles para
calcular cuantiles (como veremos más adelante).
BIOESTADÍSTICA 1 Nuevo Pag. 9 USAMEDIC 2019

Gráficos para variables cualitativas Otros gráficos para variables cualitativas


CARGO

OPERARIO GENERAL
OPERADOR DE M AQUINA

Gráficos de barras AUTOM ATICA


DES PACHADOR DE PRODUCTO
TERM INADO LOCAL
Pictogramas
OPERADOR DE DOBLE FILO
OPERARIO GENERAL
OPERADOR DE DOBLE FILO
Se utilizan para representar la frecuencia de variables  Fáciles de entender.
CARGO Frec

de tipo cualitativa, por lo general de nivel nominal.


Cada modalidad debe ser
OPERARIO GENERAL 145
OPERADOR DE M AQUINA
AUTOM ATICA
10 
DES PACHADOR DE PRODUCTO
TERM INADO LOCAL
8
proporcional a la
frecuencia.
OPERADOR DE DOBLE FILO 4

Para graficarla, la variable debe haberse resumido OPERADOR DE M AQUINA S T


OPERADOR DE S ERVICIOS
12

1
GENERALES

previamente en una tabla de frecuencias... OPERADOR GRAL. ALM ACEN


M ATERIA PRIM A Y PRODUCTOS
TERM INADOS
5

Titulo 203 operarios clasificados segùn tipo


160
145
140

Escalas 120
Número de operarios

100
Cuerpo
80

60

40

20
10 8 12
4 1 5
0
OPERARIO GENERAL OPERADOR DE MAQUINA DESPACHAD OR DE OPERADOR DE DOBLE OPERADOR DE MAQUINA OPERADOR DE OPERADOR GR AL.
AUTOMATICA PRODUCT O TERMINAD O FILO ST SERVICIOS GENERALES ALMACEN MAT ERIA
LOCAL PRIMA Y PRODUCTOS

Fuente TERMINAD OS

XXX Tipo de ope rario

Las barras están separadas entre si, y el ancho de las mismas no es representativo

Gráficos para variables cualitativas


Gráficos para variables cuantitativas
Gráficos circulares (tortas, sectores, pie)
VARIABLES CUANTITATIVAS DISCRETAS
Al igual que los gráficos de barra, se utilizan para representar variables de tipo
cualitativa, generalmente para representar distribuciones porcentuales GRAFICO DE BARRAS (diferencial) GRAFICO INTEGRAL
respecto a una clasificación.
203 operadores según tipo

OPERARIO GENERAL
2% 1%

3%
OPERADOR DE MAQUINA ST
4%
5%
OPERADOR DE MAQUINA AUTOMATICA
7%
DESPACHADOR DE PRODUCTO T ERMINADO
LOCAL
OPERADOR GRAL . ALMACEN MATERIA PRIMA
Y PRODUCT OS T ERMINADOS
OPERADOR DE DOBLE FILO
78%

OPERADOR DE SERVICIOS GENERALES


BIOESTADÍSTICA 1 Nuevo Pag. 10 USAMEDIC 2019

VARIABLES CUANTITATIVAS CONTINUAS Ojiva


Histograma También se vincula a los histogramas, ya que usa la información de la
tabla de frecuencia (frecuencia acumulativa) para generar un gráfico
Se utilizan para representar un conjunto de datos cuantitativos continuos. En muy usado para hacer estimaciones y generar respuestas
general se requiere previamente el cálculo de una tabla de frecuencia, y su
posterior representación.
Ojiva
Resultado Evaluación
Resultado Evaluación
1,2
70 1

Operadores
60 0,8
Operadores

50 0,6
40 0,4
30 0,2
20 0
10 11,53 12,17 12,81 13,45 14,08 14,72 15,36 16,00 16,64
0 Salarios en miles de Bs.
10.89 11.55 12.22 12.88 13.54 14.21 14.87 15.53 16.20
Salarios en miles
Asimismo permite comparar varios conjunto de datos

Polígonos de frecuencia Otros tipos de Gráficos


Gráficos de cajas
Están vinculados al histograma porque trabajan con la misma (Diagrama de Tuckey)
información.
• Son gráficos muy simples que ayudan, entre otras cosas, a comparar la
dispersión de dos o mas grupos de datos.
Resultado Evaluación Con dos pequeños
• Se utilizan principalmente para variable cuantitativas, excepcionalmente
cambios se puede
cualitativas ordinales.
60
convertir un
50
histograma en este
Operadores

40
polígono. Cuartil 1 Cuartil 3
30
20 máximo
mínimo 25% 25% 25% 25%
10 No es un gráfico muy
0 difundido a pesar de
11.21 11.85 12.49 13.13 13.77 14.40 15.04 15.68 16.32 sus ventajas sobre el
Salarios en miles histograma. Mediana
(Cuartil 2)

Permite comparar varios conjunto de datos cuantitativos continuos


BIOESTADÍSTICA 1 Nuevo Pag. 11 USAMEDIC 2019

Diagramas de dispersión
(gráfico de puntos o nube) Gráficos temporales
 Son gráficos muy simples que sirven para comparar la Se utilizan para representar series de datos donde el eje horizontal
relación que existe entre variables cuantitativas. está representado por el tiempo, es decir la variable evoluciona en
el tiempo.

Energía Consumida Mensual

8.000
7.500
7.000

GWh
6.500
Peso - Talla
6.000
5.500
5.000
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35
Meses

Estos gráficos son útiles para explorar datos donde no


Peso - Velocidad Edad - Talla
hay relaciones causales conocidas con otras variables

BIOESTADISTICA 3
ESTADISTICA DESCRIPTIVA I
Diagrama de Tallos y Hojas
Es un diagrama donde 1. Centralización (Tendencia central)
cada valor de datos es • Indican valores con respecto a los que los datos parecen agruparse.
• Media, mediana y moda
dividido en una “hoja”
(normalmente el último 2. Medidas de Posición
• Dividen un conjunto ordenado de datos en grupos con la misma cantidad
dígito) y un “tallo” (los de individuos.
otros dígitos). Por ejemplo • Cuantiles, percentiles, cuartiles, deciles,...
el valor 32 seria dividido 3. Medidas de Dispersión
en “3” (tallo) y “2” (hoja). • Indican la mayor o menor concentración de los datos con respecto a las
medidas de centralización.
• Desviación típica, coeficiente de variación, rango, varianza
Se aplica para variables 4. Formas de la Distribución
cuantitativas discretas. • 4.1 Simetría
• 4.2 Apuntamiento o curtosis
BIOESTADÍSTICA 1 Nuevo Pag. 12 USAMEDIC 2019

MEDIDAS DE TENDENCIA CENTRAL LA MEDIA (promedio)


• La media o media aritmética, usualmente se le llama promedio o
Son medidas estadísticas que se usan para resumir la localización de «esperanza matemática».
los datos. • Se obtiene sumando todos los valores de los datos y dividiendo el
Ubican e identifican UN VALOR alrededor del cual se centran o resultado entre la cantidad de datos.
agrupan los datos. Las medidas de tendencia central nos indican • Si los datos proceden de una muestra, el promedio se representa con X
hacia donde se inclinan o se agrupan más los datos. (estadístico). Si los datos proceden de la población, se utiliza la letra
griega µ (parámetro).
Las más utilizadas son: la media, la mediana y la moda. • La Media es un valor que “depende” directamente de las magnitudes de
Es un valor de resumen que pretende “representar” a los valores cada dato del conjunto.
del conjunto.
. .
. . .. . . .
. . .
.
. .
..
. . . . . . ..
.
. . .
. .
.
.. .
. .

. . . .
.
. .
.
.. . . . . MTC.
.
.
. .... . .

Ventajas y desventajas de la media aritmética

MEDIDAS DE TENDENCIA CENTRAL Ventajas:

ä Concepto familiar para muchas personas


MEDIA ä Es única para cada conjunto de datos

MEDIANA ä Es posible comparar medias de diferentes muestras

MODA Desventajas

ä Se ve afectada por los valores extremos


PERCENTILES
ä Si la muestra es grande y los datos no están
CUARTILES
agrupados, su cálculo es tedioso

ä Si los datos están agrupados en clases con extremos abiertos,


no es posible calcular la media.
BIOESTADÍSTICA 1 Nuevo Pag. 13 USAMEDIC 2019

LA MEDIANA Reglas

1º Si la serie es impar, la mediana corresponde a un valor del conjunto de


• Se le llama también media posicional, porque datos que ocupa el lugar central de la serie previamente ordenada.
queda exactamente en el medio de un grupo de
datos, luego de que los datos se han colocado de Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24
forma ordenada.
2º Si la serie es par, la mediana se obtiene de la semisuma de los dos valores
• En este caso, la mitad (50%) de los datos estará centrales de la serie previamente ordenada.
por encima del valor central (la mediana) y la otra Ejemplo:
mitad (50%) estará por debajo de ella. 8, 10, 14, 18, 23, 24, 32, 34

18  23
• La mediana es el valor que se ubica en el medio de mediana   20,5
los valores de los datos previamente ordenados. 2

3º Sea la serie par o impar, la mediana ocupa el lugar,


 n  1
• Se puede aplicar para variables cuantitativas y de la serie previamente ordenada.  2 
cualitativas ordinales.

Calculo de la mediana Ventajas y desventajas de la mediana


Obtención: Se obtiene ordenando la serie de datos (en forma Ventajas:
ascendente o descendente) y ubicando el dato central.
ä Los valores extremos no afectan a la mediana como en el caso de la media
Ejemplo: aritmética.
Los siguientes datos se refieren al número de niños atendidos durante ä Es fácil de calcular, interpretar y entender.
los últimos 11 días en un Servicio de Emergencia Pediátricas del ä Es única para cada conjunto de datos
Hospital de Huacho. Calcule e interprete la mediana.
ä Se puede determinar para datos cualitativos.
12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16 Desventajas:

Primero se ordenan los datos: ä Como valor central, se debe ordenar primero la serie de datos.
ä Para una serie amplia de datos no agrupados, el proceso de ordenamiento
5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17 de los datos demanda tiempo y usualmente provoca equivocaciones.

5 datos menores 5 datos mayores

mediana

Interpretación: Durante 5 días (50% del tiempo), se atendieron a menos de 11


pacientes por día, y durante 5 días se atendieron a más de 11 pacientes por día.
Altura mediana
BIOESTADÍSTICA 1 Nuevo Pag. 14 USAMEDIC 2019

Calculo de la moda
¿Cuando elegir la Media o la Mediana?
Obtención: se obtiene organizando la serie de datos y seleccionando el o los
¿La serie de datos tiene datos que más se repiten.
valores extremos? Ejemplo:
(muy altos o muy bajos respecto a
la mayoría de datos) 4, 5, 7, 8, 8 , 10, 12, 15

SI NO
4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

ASIMETRIA SIMETRIA
7, 12, 15, 18, 25, 30, 31, 38

El modo
Cuando la muestra
x x es grande, los datos
se agrupan en intervalos
y obtenemos el
Intervalo modal

LA MODA MEDIDAS DE POSICION


(fractiles, cuantiles)
• La moda es el dato que más se repite o el
dato que ocurre con mayor frecuencia.
MEDIA

• Un grupo de datos puede tener más de MEDIANA


una moda.
MODA
• Se puede aplicar para variables
cuantitativas y cualitativas nominales.
PERCENTILES

• Veamos el siguiente ejemplo: se tiene CUARTILES


una muestra con valores 20, 23, 20, 24,
25, 25, 26 y 30. El 20 y 25 son la moda
entonces, se dice que es bimodal.
BIOESTADÍSTICA 1 Nuevo Pag. 15 USAMEDIC 2019

DEFINICIONES Y EQUIVALENCIAS
100%

• Las medidas de posición nos permiten


dividir a una distribución en 2 o mas VALORES
partes, iguales.
• Según el número de partes, éstas 50% M 50%
divisiones tendrán distintos nombres:

• Percentiles: Cuando dividimos una Q1 Q2 Q3


distribución en100 partes. 25% 25% 25% 25%

• Deciles: Cuando dividimos una


distribución en 10 partes. 20% 20% 20% 20% 20% 1 2 3 4 5 6 7

• Cuartiles : Cuando dividimos una


distribución en 4 partes. D5
10% 10%

• Mediana: Cuando dividimos una CADA POSICION CORRESPONDE A UN PERCENTIL


distribución en 2 partes.
P25 P50 P75
 Se aplica para Variables cuantitativas, 1% 1% 1% 1% Posición (i) = Percentil X
excepcionalmente ordinales.

PERCENTILES PASOS PARA CACULAR EL PERCENTIL


• Los percentiles dividen a los datos en cien partes iguales, cada una de • Para calcular la posición del percentil, debe seguir los siguientes pasos:
ellas contiene el 1% de los elementos del conjunto.
• Más o menos el (p) por ciento de los datos tienen valores menores que Paso 1. Ordene los datos de manera ascendente.
el percentil y aproximadamente (100-p) por ciento de los datos tienen
Paso 2. Calcule un índice (i) que indica la
valores mayores que el percentil.
posición del percentil que se busca i   P  n
• Un percentil nos provee información de como se distribuyen los valores  
de los datos desde el menor hasta el mayor. en la serie de datos ordenados.  100 
en donde (p) es el percentil de interés y (n) es el número de datos u
observaciones del conjunto o serie.
Un percentil divide en dos partes las observaciones. Por ejemplo, el
percentil X, P(X) , es el valor que deja por debajo un X % y por encima un Paso 3.
(100 – X) % de las observaciones a) Si (i) no es entero, utilizando las reglas de redondeo, se lleva al
próximo numero entero. El valor entero inmediato mayor que (i)
(X) % (100-X)% indica la posición donde se encuentra el percentil. Esto significa que
si (i) = 3.5, el percentil se encuentra en la posición 4 de los datos
ordenados.
Mínimo Percentil X Máximo
b) Si (i) es entero, la posición del percentil es el promedio de los valores
(PX) de los datos ubicados en los lugares i e (i + 1). Veamos como se aplica
BIOESTADÍSTICA 1 Nuevo Pag. 16 USAMEDIC 2019

EJEMPLO
PASOS PARA CALCULAR LOS CUARTILES
• Como ejemplo de este procedimiento, determina el percentil 75 de
los datos sobre las edades del siguiente un grupo de ciudadanos: 25, • A continuación se presenta un conjunto de datos con los siguientes valores;
20, 26, 21, 19, 23, 22, 30, 28, 27.
5, 12, 8, 14, 11, 15, 20, 18, 30 y 25.
Paso 1. Ordene los datos en orden ascendente:
19 20 21 22 23 25 26 27 28 30
posición 1 2 3 4 5
¿ Cómo identificamos los cuartiles en este ejemplo?
6 7 8 9 10
Utilizarás los mismos pasos para identificar los percentiles:
Paso 2. Calcule el índice (i):  P   75 
i n i 10  7.5
 100   100  Primero, ordenamos los datos
Paso 3. Como (i) no es entero, redondeamos al próximo entero mayor que 7.5, o
sea, el lugar 8. Al referirnos a los datos del ejemplo, vemos que el percentil 75 es
el valor del dato ubicado en la posición número 8, que en este caso es 27. 5 8 11 12 14 15 18 20 25 30
1 2 3 4 5 6 7 9 10
19 20 21 22 23 25 26 27 28 30 8

posición 1 2 3 4 5 6 7 9 10
8
Segundo, determinamos (i) para cada cuartil:
Nota. Recuerda que (i) nos indica el lugar del dato donde se encuentra el
percentil que estamos buscando.
Q1 = primer cuartil, o percentil 25
Q2 = segundo cuartil, o percentil 50 (también la mediana)
 Significa que el 75% de las edades son menores de 27
años y el 25% restante (100-p) es mayor de 27 años. Q3 = tercer cuartil, o percentil 75

PASOS PARA CALCULAR LOS CUARTILES


CUARTILES
• Primer cuartil:
• Los cuartiles dividen los datos en cuatro partes iguales. Q1 = primer cuartil, o percentil 25
 25 
• Cada una de las partes representa una cuarta parte, o el 25% de las i 10 = 2.5
 100 
observaciones. Como(i) no es un número entero, se redondea al próximo entero mayor que 2.5, o sea
3. Al referirnos a los datos vemos que el primer cuartil está ubicado en la posición 3
• Los cuartiles son percentiles específicos; por consiguiente, los pasos para de los datos que este caso es 11. El primer cuartil en los datos se divide de la siguiente
calcular los percentiles los podemos emplear para calcular los cuartiles. forma:
• El primer cuartil Q1 es un valor que deje por debajo de él 25% de las y por 5 8 11 12 14 15 18 20 25 30 Q1=11
encima 75% de las observaciones (equivale al P 25). El Q2 es la mediana 1 2 3 4 5 6 7 8 9 10

(50%) (equivale al P50) y Q3 deja por debajo 75% y por encima 25% de
las observaciones (equivale al P75)  Segundo cuartil:
Q2 = segundo cuartil, o percentil 50 (también la mediana)
75% 25%  50 
i 10 = 5
25% 75%  100 
Como (i) es un número entero, el segundo cuartil es el promedio de los valores de los
25% 25% 25% 25% datos que están en las posiciones i e (i+1), que en este caso es, (14+15)÷2=14.5,
entonces, el segundo cuartil en los datos se divide así:

Cuartil 1 Mediana Cuartil 3 Máximo 5 8 11 12 14 15 18 20 25 30 Q1=11 ; Q2=14.5


Mínimo Cuartil 2 1 2 3 4 5 6 7 9 10
Q1 Q3 8
Q2
BIOESTADÍSTICA 1 Nuevo Pag. 17 USAMEDIC 2019

PASOS PARA CALCULAR LOS CUARTILES Ejercicios


• El 5% de los recién nacidos tiene un peso demasiado bajo.
• Tercer cuartil: ¿En que percentil se encuentra el peso por debajo del cual
Q3 = tercer cuartil, o percentil 75
se considera “demasiado bajo”?

i
 75 
10
◦ ¿En que percentil se encuentra el peso que es superado sólo
 100  = 7.5 por el 25% de los recién nacidos?
Como (i) no es un número entero, se redondea al próximo entero
mayor que 7.5, o sea 8. Al referirnos a los datos , vemos que el tercer
cuartil está ubicado en posición 8 de los datos que en este caso es el
◦ El colesterol se distribuye simétricamente en la población.
20. Finalmente, los cuartiles en este caso se presentan de la siguiente Si se consideran patológicos los valores extremos. El 90%
forma: de los individuos son normales ¿Entre qué percentiles se
encuentran los valores que incluyen a los individuos
5 8 11 12 14 15 18 20 25 30
normales?
1 2 3 4 5 6 7 8 9 10
◦ ¿Entre qué percentiles se encuentran los valores en los que
está la mitad de los individuos “más normales” de una
Q1=11 Q2=14.5 Q3=20 población?

Ejemplos
En el Hospital Dos de Mayo los pesos de RN durante el año 2009
EJERCICIOS DE PRÁTICA
variaron entre los 1500 gr hasta los 4,500 gr. Diga usted que
Resuelve los siguientes ejercicios:
porcentaje de niños tuvieron un peso mayor de 3000 gr si se
sabe que este peso corresponde al percentil 80 de la serie total
de RN durante el 2009? Se ha obtenido una muestra del salario de los Bomberos. Los datos
recopilados fueron los siguientes:
p80
1500 $1400 $1600 $2100
1200 1300 1900 1800
1500 gr 4500 gr 2000 1200 1200 1500
3000 gr
2200 2300 1500 1400

a. determine el salario promedio


b. calcule la mediana y la moda.
c. calcule el percentil 65. Explique el resultado.
d. determine los cuartiles.
BIOESTADÍSTICA 1 Nuevo Pag. 18 USAMEDIC 2019

ESTADISTICA DESCRIPTIVA II
RANGO
3. MEDIDAS DE DISPERSIÓN • Es también llamado: Amplitud, intervalo, recorrido o alcance.
• Es la medida de dispersión más sencilla.
Llamadas también medidas de variabilidad, variación
• Se determina restando el valor mayor de los datos, del valor menor.
Son útiles porque:
ä Permiten juzgar la confiabilidad de la medida de tendencia central.
Ejemplo: Se tienen los siguientes valores de datos:
ä Miden la variabilidad de los datos y reflejan la tendencia de los datos de
alejarse entre si o de la media, ya que caracterizar una distribución solamente
20, 25, 10, 5, 30, 35, 31, 23.
a través de una medida central no es apropiado.

ä Es posible comparar dispersión de diversas muestras. Rango = valor mayor – valor menor
ä Son importantes debido a que dos muestras de observaciones con el mismo
valor central pueden tener una variabilidad muy distinta. 35 – 5 = 30
Interpretación
Miden el grado de dispersión (variabilidad) de los datos,
independientemente de su causa. La diferencia entre el valor mayor y el menor es de 30.

MEDIDAS DE DISPERSIÓN RANGO INTERCUARTILICO

RANGO También se denomina


Alcance intercuartilico.

RANGO INTERCUARTIL
Permite ubicar 50% de los
datos que se encuentran
DESVIACION MEDIA
en el centro de la
distribución, es decir, 25%
VARIANZA de los datos son menores
al primer cuartil y también
25% de los datos son
DESVIACIÓN ESTÁNDAR mayores al tercer cuartil.

COEFICIENTE DE VARIACION

RI  Q3  Q1
BIOESTADÍSTICA 1 Nuevo Pag. 19 USAMEDIC 2019

Veamos el siguiente ejemplo:


DESVIACION MEDIA
Determine el rango intercuartil para los datos siguientes (pesos de pacientes pediátricos);
Permite calcular la desviación media de todos los datos respecto a su media
30, 40, 35, 5, 10, 20, 15, 30 y 45: aritmética.

Paso 1. Ordenar los datos de forma ascendente. A cada dato se le resta la Media Aritmética sin hacer caso de los signos negativos
(valor absoluto), y se divide luego por el número total de términos.
5 10 15 20 30 30 35 40 45
posición 1 2 3 4 5 6 7 8 9

Paso 2. Calcular los cuartiles Q3 y Q1: (Xi – X)



DM =
-----------
Q3 = 75 percentil
n
Q1 = 25 percentil
Ejemplo
Nota: Utiliza el mismo procedimiento para calcular los percentiles. Calcular la desviación media de la distribución:
 Cuartil uno: Q1 = 25 percentil 9, 3, 8, 8, 9, 8, 9, 18

 P   25 
i n = i   9 = 2.25
 100   100 
Como (i) no es un entero, redondeamos al próximo entero mayor que 2.25, o sea 3. Así,
que Q1 está ubicado en la posición tres (3) de los datos, que en este ejemplo es 15.

 Cuartil tres: Q3 = 75 percentil


VARIANZA
 P   75 
i n = i 9 = 6.75 • La varianza es otra medida de dispersión que se basa en la
 100   100  diferencia entre el valor de cada dato (Xi) y la media ( x ).
Como (i) no es un entero, redondeamos al próximo entero mayor que 6.75, o sea 7. Así,
que Q1 está ubicado en la posición siete (7) de los datos, que en este ejemplo es 35.
• La diferencia entre cada dato (Xi) y su media ( x ) para una
5 10 15 20 30 30 35 40 45
posición 1 2 3 4 5 6 7 8 9
muestra se llama desviación con respecto a la media o
promedio y se expresa con
n
la siguiente fórmula:
 (X  x )
2
• Paso 3. Ahora, podemos sustituir los valores de los cuartiles en la fórmula.
i

2 i 1
S n 1
• Para calcular la varianza, las desviaciones respecto a la
Rango Intercuartil = Q3 – Q1
media se elevan al cuadrado y se dividen entre (N – 1).
• Este indicador nos muestra las variaciones al cuadrado
Interpretación: respecto al promedio.
El 50% de los pacientes pediátricos pesan entre 15 y 25 Kilos.
• No se puede interpretar
El rango intercuartilico de pesos de los pacientes pediátricos es de 20 Kilos.
BIOESTADÍSTICA 1 Nuevo Pag. 20 USAMEDIC 2019

Ejemplo:
La siguiente información se refiere al número de quejas recibidas en un
Centro Médico durante una semana. Calcule la varianza de 8, 10, 5, 12, 10, 15. Ejemplo:
Elaboramos un cuadro de la forma siguiente
La siguiente información se refiere al número de quejas recibidas en
un Centro Médico durante una semana. Calcule la desviación
x Xi  x X i  x
2
estándar.
8 8 - 10 = - 2 4
8, 10, 5, 12, 10, 15
60
x
10 10 - 10 = 0 0
Ya sabemos por el ejemplo anterior que S2 = 11,6 quejas2.
5 5 - 10 = - 5 25 6 Entonces:
12 12 - 10 = 2 4

S
10 10 - 10 = 0 0 2

15 15 - 10 = 5 25 x  10 s
 X  60  Xi  x   0  Xi  x   58
2

S  11,6 quejas 2 La unidad de medida de


 X i  x   58
2 la DS es igual a la de las
variables del conjunto
 (Xi  x )
2
2 58
2
 S   11,6 quejas 2 S  3,4 quejas
S n 1 6 1

DESVIACION ESTANDAR COEFICIENTE DE VARIACION R


•También llamado COEFICIENTE DE VARIACION DE PEARSON.
• También llamada DESVIACION TIPICA, es la RAÍZ CUADRADA DE LA
VARIANZA.
• Es una medida de la variabilidad de un conjunto de datos respecto a •Es una medida de variabilidad relativa de los datos, permite
la MEDIA. comparar la variabilidad de dos o más conjuntos de datos
• Se calcula sacando la raíz cuadrada de la varianza. Nos indica cuánto expresados en unidades diferentes (peso; kg. y libras).
tienden a alejarse los datos del promedio. Si los datos son de una
muestra, la desviación estándar se representa como:
Cálculos a partir de datos no agrupados
n
 (Xi  x)2
i 1
S  s2  s 100
n 1 Para la muestra: CV 
x

• Para poder interpretar los datos debemos regresarlos a la escala


original (sacar la raíz cuadrada de la varianza).
BIOESTADÍSTICA 1 Nuevo Pag. 21 USAMEDIC 2019

Ejercicio: Ejemplos de diferentes formas de distribución


Diga usted cual de los siguientes conjuntos de
variables es la que tiene mayor variabilidad: Distribuciones simétricas
X = media
a) glicemia poblacional: media = 120 mg% y DS= 3 mg% S = Desviación
estándar
b) colesterolemia: media 150 mg% y DS = 10 mg%

c) talla: media =160 cm y DS = 5 cm Distribuciones asimétricas


Md = mediana
d) peso: media = 65 kg y DS = 6 kg RI = Rango inter cuartil

e) edad: media = 45 años y DS = 3 años


Sesgo positivo Sesgo negativo
Asimétrica Positiva Asimétrica Negativa

PROPIEDADES DE LA DISTRIBUCION NORMAL


4. FORMAS DE DISTRIBUCION
(GRAFICOS) 1. Tiene forma de campana, es
asintótica al eje de las abscisas.
2. Es simétrica respecto a la media.
4.1 SIMETRIA DE LOS DATOS 3. La media, la mediana y la moda Puntos
tienen el mismo valor. de
inflexión
4. Toda curva normal se determina por
Otra característica de un conjunto de datos es la forma, es decir, la la media (X) y la desviación estándar
manera en que están distribuidas las observaciones. (S)
La distribución de los datos puede ser o no simétrica. Si la 5. Los puntos de inflexión tienen como
distribución de los datos no es simétrica, se llama asimétrica, No abscisas los valores X  S
Normal o sesgada. 6. Independientemente de la X y S, el 
S S
área total bajo la curva normal es +
Para describir la forma se puede comparar la media y la mediana. 1,00 (100%).  X-S X+S 
X
También puede observarse a través del coeficiente de asimetría Mide el 7. Regresión a la media, es decir la
grado de Simetría / Asimetría de la distribución mayoría de datos están cerca a la
media aritmética.
BIOESTADÍSTICA 1 Nuevo Pag. 22 USAMEDIC 2019

Coeficiente de Asimetría de Pearson:


7. Regla Empírica “Teorema de Chebyshev”
Fácil de calcular e interpretar.
• Cálculo:

ASP 

3 X  Md 
s
o Interpretación:
-1 1 = 0, X=Md Simétrica
-2 2
68% ASP > 0, X>Md Asimétrica Positiva
-3 95% 3
< 0, X<Md Asimétrica Negativa
99.9%

4.2 KURTOSIS
APLICACIÓN EN ESTADISTICA DESCRIPTIVA La Forma de la distribución
Otra manera de apreciar la forma de una distribución es observar el
• Diga ud. ¿cual es el intervalo de peso en Kg. en el que se nivel de apilamiento o llanura de la curva
encontrará el 68% de individuos de un marco muestral, en el
cual la media de peso es de 78Kg con una DS de + - 6 Kg.? .

• En que rango de Talla se encontrará el 95% de la población en la


que se sabe que la media de talla es de 160 cm con una DS de +
- 15 cm?

• En que rango de edades se encontrará el 99% de individuos de leptocúrtica Platicúrtica mesocúrtica


una muestra (marco), cuya media aritmética fue de 35 años con . (menor dispersión) (mayor dispersión)
una DS de +- 3 años.
El coeficiente de kurtosis mide el grado de apuntamiento de la curva

Anda mungkin juga menyukai