Anda di halaman 1dari 16

BIOESTADÍSTICA 1 Pag.

1 USAMEDIC 2015

LAS FUNCIONES DE LA BIOESTADISTICA

1. Primer Acto : Recopilar datos


BIOESTADISTICA 1 2. Segundo Acto : Organizar los datos

3. Tercer Acto : Procesar los datos


INTRODUCCION Y
CONCEPTOS GENERALES 4. Cuarto Acto : Interpretar resultados

DEFINICION
La Estadística en Medicina, nace por la necesidad de “MEDIR” y 1. RECOPILAR DATOS (RECOGER / RECOLECTAR)
conocer el comportamiento de la Población en relación a aspectos
relacionados con la salud y la enfermedad. FUENTE PRIMARIA
Es la matemática aplicada a las ciencias de la salud.
Cuando se registran
Funciones: características mediante la
- Recolección de datos.
- Organización datos. medición, observación y
- Procesamiento y análisis de datos.
- Interpretar resultados conteo, para lo cual utiliza
FUENTE SECUNDARIA
Para la toma de decisiones. Fuentes primarias o
secundarias.
 Sus fines son describir al conjunto de datos obtenidos y tomar
decisiones o realizar generalizaciones acerca de las características de
todas las observaciones bajo consideración.

TIPOS DE ESTADISTICA
• Una vez que se
ha realizado la
recolección de
los datos, se
obtienen
datos en
bruto, los
cuales rara
vez son
significativos
sin una
organización y
tabulación.

LA APLICACIÓN DE LA BIOESTADISTICA EN LA
MEDICINA ASISTENCIAL Y LA SALUD PUBLICA
2. ORGANIZAR DATOS (ORDENAR)
Cuando se ordenan para una mejor comprensión y
facilitar sus análisis.(tablas, gráficos y figuras)

Tabla de Distribución Diagrama Circular

Edad N° Pacientes

30 - 34 6
35 - 39 12
40 - 44 8
45 - 49 2
BIOESTADÍSTICA 1 Pag. 2 USAMEDIC 2015

LA VARIABLE (característica a estudiar)


3. PROCESAR DATOS (ANALISIS) • Es una dimensión o característica de la unidad de análisis, que permite
su clasificación.
• propiedad, atributo, rasgos o cualidades de las Unidades de Análisis
(individuos), que es materia de interés del estudio.
E. DESCRIPTIVA
Cuando se calculan promedios y
medidas de variabilidad entres
otros cálculos. Es lo que se quiere conocer de la unidad de análisis.
Ejemplo
En la familia: numero de componentes, ingresos, el grado de educación, gastos
E. ANALITICA mensuales, etc.
cuando se establecen Lo importante en una
EDAD
TALLA COLOR
PISOS

relaciones entre las


PESO MIEMBROS
variable es:

variables (regresión y
VENTANAS
a. Que se derive siempre de COLOR DE
CABELLO
PROFESION

una unidad de análisis. AREA

correlación). b. Que admita un rango IDIOMA

mínimo de variación
PRESION
ARTERIAL

VALOR
4. INTERPRETAR RESULTADOS Un valor es la magnitud, rango o atributo a través del cual se
expresa la variable.
La variable edad puede tomar los
Cada uno de estos siguientes valores:
rangos son valores de – 1 a 10 años
la variable – 11 a 20 años
Cuando se le otorga un – 21 a 30 años

sentido práctico a los


– 31 a 40 años

La variable sexo admite dos valores


resultados obtenidos en el • Hombre
análisis • Mujer

La variable educación puede ser construida mediante


tres valores
• Educación alta
• Educación media
• Educación Baja

1. ¿Qué es un DATO?
Ejemplo de dato:

Toda unidad Estructura a partir de la cual


de el investigador genera sus
estudios e indagaciones Características (Variable) Valor Unidad de medida
Información

Peso 75 Kg.
Estatura 1,80 mts.
Profesión Médico ----

Las tres partes del “dato”:


• La unidad de análisis. INDIVIDUO

• La variable o variables
Si el DATO es útil para tomar decisiones se convierte en
• El valor o magnitud. INFORMACIÓN.

LA UNIDAD DE ANALISIS (individuo) 2. POBLACION Y MUESTRA


• Es el elemento mínimo de estudio, observable o medible en relación La POBLACION o Universo, es un concepto estadístico que hace referencia al
con un conjunto de elementos que son de su mismo tipo. conjunto total de elementos a estudiar, el cual es inaccesible e inabordable de
• Se denomina también INDIVIDUO, UNIDAD ELEMENTAL o manera directa, por lo tanto, se recomienda trabajar con una parte de ella , es
decir, la MUESTRA.
ESTADISTICA.

Es la persona, animal o cosa de la que se quiere


conocer algo.
Ejemplos ESTADÍSTICA
MUESTRA DESCRIPTIVA
• En ciencia sociales: la familia, el obrero, la empresa, los grupos, las naciones, POBLACIÓN
etc.

INFERENCIA ESTADÍSTICA
BIOESTADÍSTICA 1 Pag. 3 USAMEDIC 2015

5. Parámetros y estadísticos
3. MARCO POBLACIONAL Y POBLACION ESTADISTICA
MARCO POBLACIONAL: Es el conjunto total de individuos, elementos o unidades
• Parámetro: Valor representativo de una POBLACION. Se
simboliza por letras griegas. Sólo hay un parámetro en cada población.
de análisis.
 Media poblacional
2 Varianza poblacional
 Desviación estándar poblacional
 Proporción poblacional

TODAS las Unidades de análisis


• Estadístico: Valor representativo de una MUESTRA. Se
simboliza por letras latinas. Existen tantos estimadores como
(Individuos) muestras se extraigan de una población. Sinónimo: Estimador-
Estadígrafo.
POBLACION (UNIVERSO): Es el conjunto total de VARIABLES (características) de
interés del estudio que se encuentran en un marco poblacional.
x Media muestral.

s2 Varianza muestra.
Cada población tiene el mismo número de VARIABLES que número de INDIVIDUOS
tiene el marco poblacional. s Desviación estándar muestral.

De cada Marco Poblacional se podrán extraer tantas poblaciones como características p Proporción muestral.
de interés se deseen investigar.

RELACION ENTRE PARAMETRO Y ESTIMADOR


4. MARCO MUESTRAL Y MUESTRA ESTADISTICA
POBLACION MUESTRAS
n1
MARCO MUESTRAL: subconjunto de individuos extraído de un marco poblacional. x1 Promedio de peso = 55 Kg.

Todas los pesos


n2 x2 Promedio de peso = 65 Kg.
de los alumnos n3
Sub conjunto de Unidades de análisis
de USAMEDIC x3 Promedio de peso = 62 Kg.
(Individuos) . .
. .
MUESTRA: subconjunto de variables, extraído del marco muestral. nm
•Una muestra tiene el mismo número de variables que número de individuos tiene el
x m Promedio de peso = 58 Kg.
marco muestral.
•De cada marco muestral se podrán extraer tantas muestras como características se
deseen investigar. PARÁMETRO ESTIMADORES
Promedio del peso= 60 Kg Varios promedios

Ejemplo: Unidad de análisis = Paciente del hospital


6. TIPOS DE DATOS (INFORMACION)
MARCO POBLACIONAL
Unidad de Análisis (1200 pacientes de un Hospìtal)
¬ DATO CONSTANTE: Si el registro de la
característica toma un sólo valor en todas las
unidades elementales.
Enfer.
Característica Edad Peso Anteriores Estado Civil
(VARIABLE) Ejemplo:

• Profesión de los integrantes del Colegio


Población Población Población
Registro de la
Médico del Perú
característica
P1 P2 P3 ... Pn
(1200 datos) (1200 datos)

Las constantes no son de mayor interés en Estadística.

Marco Poblacional Técnicas Marco Muestral


1200 pacientes de un hospital de muestreo 75 pacientes de un hospìtal
- DATO VARIABLE: Si el registro de la
característica toma diversos valores en las
Característica
unidades elementales.
Edad Peso Énf. Ant. Estado civil

Edad Peso Enf. Ant. Estado civil


MUESTRA MUESTRA MUESTRA MUESTRA

m1 m2 m3 mn

75 datos
Ejemplo:

Registro • Edad de los pacientes.


de la POBLACIÓN POBLACIÓN POBLACIÓN POBLACIÓN
• Profesión de los profesores de la
carac-
terística.
Universidad Daniel Alcides Carrión

P1 P2 P3 ... Pn
Los datos variables son los de mayor interés en Estadística.
A estos se les denomina comúnmente “VARIABLES”.
BIOESTADÍSTICA 1 Pag. 4 USAMEDIC 2015

7. CLASIFICACIÓN DE VARIABLES Tipos de escalas de medición


  CONTÍNUAS a) Escala Nominal o Intensiva: variables cualitativas nominales
 
 NUMÉRICAS 
 cuantitativas  b) Escala Ordinal: variables cualitativas ordinales
  DISCRETAS
 c) Escala de Intervalo
VARIABLES 
 d) Escala de Proporción o Razón

 DICOTOMICAS
 
 CATEGORICAS  ORDINALES
 cualitativas 
  NOMINALES

CLASIFICACIÓN DE VARIABLES
1.- Variables Numéricas o Cuantitativas : Aquellas variables que a) Escala Nominal:
se expresan por números los que se obtienen a través de un
(variables cualitativas nominales)
conteo o una medición. Las operaciones posibles entre estas • La escala de medida nominal, consiste en la asignación arbitraria de
variables son los promedios y las medidas de dispersión, números o símbolos a cada una de las diferentes categorías en las cuales
podemos dividir el carácter que observamos, sin que puedan
entre otras. Se reconocen porque tienen unidades de establecerse relaciones entre dichas categorías.
medida. – consiste en clasificar los objetos de estudio según las categorías de una
variable. El alcance de esta escala es el conteo.
Las variables cuantitativas pueden ser:
Ejemplo
- DISCRETA : Cuando la variable sólo puede tomar valores enteros
dentro de una escala de valores. Proviene de un conteo. Sexo 1:Masculino 2:Femenino
Ejemplo: Número de emergencias médicas por día.
Especialidad 1:Clínico 2:Cirugía

- CONTINUA : Cuando la variable puede tomar cualquier valor


(entero fracción), dentro de una escala de valores. Provienen de
una medición.
Ejemplo: Tiempo de permanencia de un paciente en un consultorio
externo

CLASIFICACIÓN DE VARIABLES b) Escala Ordinal:


(variables cualitativas ordinales y cuantitativas)
2.-Variables Cualitativas : Aquellas variables que no se pueden • En caso de que puedan detectarse diversos grados de un atributo, la medida
expresar por números sino por cualidades o categorías que ordinal es la indicada, puesto que puede recurrirse a la propiedad de "orden"
de los números asignándolo a los objetos en estudio de modo que, si la cifra
representen sus atributos. Solo se pueden registrar asignada al objeto A es mayor que la de B, puede inferirse que A posee un
mediante el conteo. mayor grado que B.
• Hay variables cuantitativas que se pueden convertir a la escala ordinal por
ejemplo, la glicemia se puede expresar en: Hipoglicemia, Normoglicemia e
Las operaciones posibles son: la tasa porcentual, Hiperglicemia.
proporciones y la moda. No tienen unidades de medida. Ejemplo:
• Calificación : A,B,C,D A>B
Ejemplo: • Lugar : 1º , 2º , 3º 1º > 2º
• Grado de deshidratación : I, II, III, IV I>II
Profesión de los participantes a un curso. • APGAR, Silverman, Glasgow.
• 80% son médicos (tasa porcentual). • Escala del dolor
• 8 de cada 10 participantes son médicos (proporción). • Satisfacción de usuarios

Las variables cualitativas pueden ser:

a) Dicotómicas o Binarias (si o no)


b) Ordinales (orden creciente o decreciente)
c) Nominales (Profesiones, Estado Civil, etc.)

c) Escalas de intervalos iguales:


8. ESCALAS DE MEDIDA O MEDICION: (variables cuantitativas)

• Se basa en la afirmación de la existencia de un continuo, seccionable en


DEFINICION partes iguales, en donde cada parte seccionada contiene la misma
cantidad de unidades que cualquier otra sección.
• Es importante destacar que el punto cero en las escalas de intervalos
iguales es arbitrario, y no refleja en ningún momento ausencia de la
Una escala es un patrón magnitud que estamos midiendo.
convencional de medición, y • Esta escala, además de poseer las características de la escala ordinal,
básicamente consiste en un encontramos que la asignación de los números a los elemento es tan
precisa que podemos determinar la magnitud de los intervalos
instrumento capaz de representar (distancia) entre todos los elementos de la escala.
con gran fidelidad verbal, gráfica o
simbólica, el estado de una variable Ejemplo:
Año 0
Hora 00:00
Temperatura 0ºC
BIOESTADÍSTICA 1 Pag. 5 USAMEDIC 2015

d) Escala de coeficientes o Razones:


(Variables cuantitativas)
• El nivel de medida más elevado es el de coeficientes o razones, y se La muestra : Registro diario de procesos
diferencia de las escalas de intervalos iguales únicamente por poseer un deficientes durante los 10 días
punto cero propio como origen; es decir que el valor cero de esta escala elegidos al azar.
significa ausencia de la magnitud que se mide.
• Además, siendo que cero ya no es arbitrario, sino un valor absoluto, Tipo de dato : Variable cuantitativa discreta
podemos decir que A. Tiene dos, tres o cuatro veces la magnitud de la
propiedad presente en B. Un valor registrado : 32
Ejemplo:
Ingreso mensual : S/.00. La unidad de medida : Procesos
Nº de hijos : 0
Procesos deficientes : 0
El estimador : Media aritmética muestral ( x)
El parámetro : Media aritmética poblacional (µ)

Ejercicio Aplicativo 1 BIOESTADISTICA 2


En un programa para la detección de hipertensión en un marco muestral
de 30 hombres en edades entre 30 y 40 años, la distribución de la presión PRESENTACION DE DATOS
diastólica (mínima) en mm Hg fue la siguiente:

70 85 85 75 65 90 110 95 90 70 Tabulación y Graficación


60 75 80 120 85 95 90 70 100 65

80 90 95 90 95 110 100 85 80 75 Todo análisis estadístico es una estrategia para traducir la


cantidad de información obtenida en la recolección de datos, a
Cual es el Marco Poblacional: índices o formas que sean interpretables y que representen
Cual es la Población: alguna dimensión del comportamiento de las variables
Cual es el Marco Muestral:
Cual es la Muestra:
Cual es el individuo o unidad de análisis
La estrategia más sencilla es mostrar la información en un
Cual es un valor
formato visual (gráficos) o en un esquema sintetizado (tablas)
Que tipo de variable es:
Cual es la Unidad de Media..

39

Ejercicio Aplicativo 2 TABLAS (tabulación)


En un Centro Médico se desea estimar el
número promedio diario de procesos que no
cumplen las normas de calidad. Con este fin
se elige por sorteo 10 días laborales del Las tablas deben incluir todos los puntajes registrados
último mes. En uno de los días elegidos se
registraron 32 procesos médicos Deben respetar las características de la variable
deficientes.
Llevan un título representativo del contenido (sobre la
tabla, numerado)

En esta situación, identifique:


PARTES DE UNA TABLA
La característica : Número de procesos deficientes por día.  TITULO
 TALON
 CUERPO
La unidad elemental : Un día (laboral).  NOTAS EXPLICATIVAS (Fuente)
TITULO
El marco poblacional : Número de días (laborales) que
viene funcionando el Centro Médico. TALON

Registro diario de procesos médicos CUERPO


La población :
deficientes en todo el tiempo que
viene funcionando el Centro Médico.

El marco muestral : Diez días laborales (elegidos al azar) NOTAS EXPLICATIVAS


BIOESTADÍSTICA 1 Pag. 6 USAMEDIC 2015

TABLAS ESTADISTICAS (de frecuencia) Gráficos de barras


CARGO

Exponen la información recogida en la muestra:


OPERARIO GENERAL

• OPERADOR DE MAQUINA
AUTOMATICA

Se utilizan para representar la frecuencia de variables DESPACHADOR DE PRODUCTO


TERMINADO LOCAL

– La forma más sencilla de presentar la información obtenida en un de tipo cualitativa, por lo general de nivel nominal.
OPERADOR DE DOBLE FILO
OPERARIO GENERAL

estudio es contabilizar el número de veces que aparece cada OPERADOR DE DOBLE FILO

VARIABLE. Este indicador se conoce como la frecuencia de


aparición da cada respuesta.
CARGO Frec

Para graficarla, la variable debe haberse resumido OPERARIO GENERAL


OPERADOR DE M AQUINA
145

– Cuando presentamos una variable indicando la frecuencia de


10
AUTOM ATICA

previamente en una tabla de frecuencias... DESPACHADOR DE PRODUCTO


8

aparición de cada uno de sus valores, tenemos una tabla de


TERM INADO LOCAL
OPERADOR DE DOBLE FILO 4
OPERADOR DE M AQUINA ST 12

frecuencia. OPERADOR DE SERVICIOS


GENERALES
OPERADOR GRAL. ALM ACEN
1

M ATERIA PRIM A Y PRODUCTOS 5


TERM INADOS
203 operarios clasificados segùn tipo
– Frecuencias absolutas: Contabilizan el número de variables de cada
modalidad o clase (intervalo).
160
145
140

120

Número de operarios
– Frecuencias relativas (porcentajes unitarios): Ídem, pero dividido 100

por el total, normalizadas. 80

60

– Frecuencias acumuladas absolutas y relativas: Acumulan las


40

frecuencias absolutas y relativas. Son especialmente útiles para


20 10 8 12
4 1 5

calcular cuantiles (como veremos más adelante).


0
OPERARIO GENERAL OPERADOR DE MAQUINA DESPACHAD OR DE OPERADOR DE DOBLE OPERADOR DE MAQ UINA OPERADOR DE OPERADOR GR AL.
AUTOMATICA PRODUCT O TERMINAD O FILO ST SERVICIOS GENERALES ALMACEN MAT ERIA
LOCAL PRIMA Y PRODUCTOS
TERMINAD OS

Tipo de ope rario

Las barras están separadas entre si, y el ancho de las mismas no es representativo

TABLA DE FRECUENCIAS

Variable Frecuencia Frecuencia Frecuencia Frecuencia Gráfico o Diagrama de Pareto


Normalizada acumulada acumuada normalizada
(relativa) (relativa)
x f fr F Fr Se trata de una variante del gráfico de barras, en el que la tabla de
frecuencias está ordenada de mayor a menor ...
60 - 69 3 0.1 3 0.1

6 0.2 • Este gráfico


70 - 79 9 0.3 permite identificar
80% aquellas causas
80 - 89 7 0.23 16 0.53 que explican el
80% de los efectos,
90 - 99 9 0.3 25 por lo que también
0.83
se le conoce como
100 - 109 2 0.07 27 0.90 un gráfico de
PRIORIZACION.
110 - 119 2 0.07 0.97 • Para su
29
elaboración se
120 - 129 0.03 requiere de la
1 30 1.00 frecuencia
acumulada relativa
total 30 1.0 (porcentual).

Ejemplo de Tabla para variables cualitativas nominales Gráficos circulares (tortas, sectores, pie)
Al igual que los gráficos de barra, se utilizan para representar variables de tipo
cualitativa, generalmente para representar distribuciones porcentuales
respecto a una clasificación.

203 operadores según tipo

Ejemplo de Tabla para variables cuantitativas discretas 2% 1%


OPERARIO GENERAL
3%
4%
5% OPERADOR DE MAQUINA ST

7% OPERADOR DE MAQUINA AUTOMATICA

DESPACHADOR DE PRODUCTO TERMINADO


LOCAL

OPERADOR GRAL. ALMACEN MATERIA


PRIMA Y PRODUCTOS TERMINADOS

OPERADOR DE DOBLE FILO


78%

OPERADOR DE SERVICIOS GENERALES

OJO: Todo tipo de variables (cuanti y cuali) se pueden tabular.

44
Otros gráficos para variables cualitativas

GRAFICOS (graficación) Pictogramas

 Fáciles de entender.
 Cada modalidad debe
ser proporcional a la
Son complementos a la tabulación frecuencia.

Representan la distribución de la variable

Deben ser fáciles de interpretar

Deben llevar un título representativo (bajo el gráfico y numerado)


BIOESTADÍSTICA 1 Pag. 7 USAMEDIC 2015

Ojiva
Gráficos para variables cuantitativas

VARIABLES CUANTITATIVAS DISCRETAS También se vincula a los histogramas, ya que usa la información de la tabla de
frecuencia (frecuencia acumulativa) para generar un gráfico muy usado para
GRAFICO DE BARRAS GRAFICO INTEGRAL hacer estimaciones y generar respuestas
(diferencial)
Ojiva
Resultado Evaluación

1,2
1

Operadores
0,8
0,6
0,4
0,2
0
11,53 12,17 12,81 13,45 14,08 14,72 15,36 16,00 16,64
Salarios en miles de Bs.

Asimismo permite comparar varios conjunto de datos

VARIABLES CUANTITATIVAS CONTINUAS Otros tipos de Gráficos

Histograma Gráficos de cajas


Se utilizan para representar un conjunto de datos cuantitativos continuos. En general se (Diagrama de Tuckey)
requiere previamente el cálculo de una tabla de frecuencia, y su posterior
representación. • Son gráficos muy simples que ayudan, entre otras cosas, a comparar la dispersión
de dos o mas grupos de datos.
Resultado Evaluación • Se utilizan principalmente para variable cuantitativas, excepcionalmente
cualitativas ordinales.
70
60 Cuartil 1 Cuartil 3
Operadores

50
máximo
40
30 mínimo
20
10 Mediana
0 (Cuartil 2)
10.89 11.55 12.22 12.88 13.54 14.21 14.87 15.53 16.20
Salarios en miles

Histograma Diagramas de dispersión


• Es una gráfica de barras de una distribución de frecuencias.  Son gráficos muy simples que sirven para comparar la relación que existe entre
variables cuantitativas.
Clase
Curva de frecuencia
fx
Frecuencia

Tipos de
Clases
Clases
Limite superior de clase

Limite inferior de Clase

Polígonos de frecuencia
Diagrama de Tallos y Hojas
Están vinculados al histograma porque trabajan con la misma información.
Es un diagrama donde cada
valor de datos es dividido en
Resultado Evaluación Con dos pequeños una “hoja” (normalmente el
cambios se puede último dígito) y un “tallo” (los
60
convertir un
50
histograma en este otros dígitos). Por ejemplo el
Operadores

40
polígono. valor 32 seria dividido en “3”
30
20 (tallo) y “2” (hoja).
10 No es un gráfico muy
difundido a pesar
0
11.21 11.85 12.49 13.13 13.77 14.40 15.04 15.68 16.32 de sus ventajas
Se aplica para variables
Salarios en miles sobre el histograma. cuantitativas discretas.

Permite comparar varios conjunto de datos cuantitativos continuos


BIOESTADÍSTICA 1 Pag. 8 USAMEDIC 2015

Gráficos temporales BIOESTADISTICA 3

Se utilizan para representar series de datos donde el eje horizontal está representado
por el tiempo, es decir la variable evoluciona en el tiempo. ESTADISTICA DESCRIPTIVA I
Energía Consumida Mensual

8.000
7.500
7.000
GWh

6.500
6.000
5.500
5.000
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35
Meses

Estos gráficos son útiles para explorar datos donde no


hay relaciones causales conocidas con otras variables

Diagrama máximo – mínimo


1. Centralización (Tendencia central)
Útil para visualizar movimientos en el valor de cierta variable, dentro de un – Indican valores con respecto a los que los datos parecen agruparse.
periodo de tiempo establecido • Media, mediana y moda

Ejemplo: Variación en el número de emergencias diarias por semana. Julio 2. Medidas de Posición
1998 – Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
100
90
• Cuantiles, percentiles, cuartiles, deciles,...
80
3. Medidas de Dispersión
70
60 – Indican la mayor o menor concentración de los datos con respecto a
50 las medidas de centralización.
40 • Desviación típica, coeficiente de variación, rango, varianza
30
20 4. Formas de la Distribuciòn
10 – 4.1 Simetría
0 – 4.2 Apuntamiento o curtosis
1ra. Semana 2da. Semana 3ra. Semana 4ta. Semana

Fuente: Hoja de registro, julio 1998

MEDIDAS DE TENDENCIA CENTRAL

 Son medidas estadísticas que se usan para describir como se


puede resumir la localización de los datos.
 Ubican e identifican el punto alrededor del cual se centran los
datos. Las medidas de tendencia central nos indican hacia donde se
inclinan o se agrupan más los datos.
 Las más utilizadas son: la media, la mediana y la moda.
 Es un valor de resumen que pretende “representar” a los valores
del conjunto.
. .
. . .. . . .
.
.
. .
.
.
.. . . .
. . . . . . ..
.
. .
.
.. .
. .

. . . .
.
. .
.

.. . . . . MTC.
.
.
. .... . .

RESUMEN DE GRAFICAS ESTADISTICAS MEDIDAS DE TENDENCIA CENTRAL

MEDIA

MEDIANA

MODA

PERCENTILES

CUARTILES
BIOESTADÍSTICA 1 Pag. 9 USAMEDIC 2015

Ventajas y desventajas de la media aritmética


LA MEDIA (promedio) Ventajas:

ä Concepto familiar para muchas personas


• La media o media aritmética, usualmente se le llama promedio.
• Se obtiene sumando todos los valores de los datos y dividiendo ä Es única para cada conjunto de datos
el resultado entre la cantidad de datos.
ä Es posible comparar medias de diferentes muestras
• Si los datos proceden de una muestra, el promedio se representa
con X. Si los datos proceden de la población, se utiliza la letra
griega µ. Desventajas
• Este valor “depende” de las magnitudes de cada dato del
conjunto. ä Se ve afectada por los datos extremos
ä Si la muestra es grande y los datos no están

agrupados, su cálculo es tedioso

ä Si los datos están agrupados en clases con extremos


abiertos, no es posible calcular la media.

Calculo de la media o promedio


• La fórmula matemática para calcular la media o promedio es
la siguiente: LA MEDIANA
donde;
• La segunda medida de tendencia central que
x
x = promedio analizaremos es la mediana, en ocasiones se le
N = signo de sumatoria llama media posicional, porque queda
N = numero de datos exactamente en la mitad de un grupo de datos,
X
 luego de que los datos se han colocado de
forma ordenada.

Otro Ejemplo:
• En este caso la mitad (50%) de los datos estará
por encima de la mediana y la otra mitad (50%)
La siguiente tabla muestra el número de reclamos y quejas presentadas por pacientes de una clínica a lo estará por debajo de ella.
largo de una semana. Calcule e interprete la media.

Día/Semana Lun Mar Mier Jue Vier Sab • La mediana es el valor intermedio cuando los
Reclamos/día 8 10 5 12 10 15 valores de los datos se han ordenado.

Media aritmética =
8  10  5  12  10  15

60 • Se puede aplicar para variables cuantitativas y
6 6 cualitativas ordinales.
x = 10 reclamos

Interpretación: si elige al azar un día de la semana, se


espera que los pacientes de esta clínica
realicen 10 reclamos por día (función de representación).

La media aritmética ponderada ( xp ) Calculo de la mediana


Ejemplo: El Hospital del Callao atiende 2,800 consultas diarias, cobrando Obtención: Se obtiene ordenando la serie de datos (en forma ascendente o
tres tipos de tarifas: social, diferenciada y por convenio. El número de descendente) y ubicando el dato central.
pacientes y el valor de cada nivel tarifario se muestra a continuación.
Calcule e interprete la tarifa media por consulta. Ejemplo:
Los siguientes datos se refieren al número de niños atendidos durante
Tipo de Tarifa los últimos 11 días en un Servicio de Emergencia Pedriáticas del
Pacientes
Tarifa S/. Hospital de Huacho. Calcule e interprete la mediana.
Social 5 60%
12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16
Diferenciada 15 30%
Por convenio 40 10% Primero se ordenan los datos:
5(0,60)  15(0,30)  40(0,10)
xp  5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17
0,60  0,30  0,10
11,5 5 datos menores 5 datos mayores
xp   S / .11,50
1,0
mediana

Interpretación: Durante 5 días iempo)(50% del se atendieron a menos de 11 pacientes por


día, y durante 5 días se atendieron a más de 11 pacientes por día.

La media geométrica ( ) xg Reglas


se usa para encontrar el promedio de porcentajes, razones, índices o tasas, como la tasa 1º Si la serie es impar, la mediana ocupa el lugar central de la serie
media de crecimiento poblacional, la tasa media de inflación mensual, la tasa media de previamente ordenada.
mortalidad, entre otros.
Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24
a) Obtención: se obtiene extrayendo la raíz enésima del producto de los n valores de una
serie.

xg  n X1  X2  X3  ...  Xn
2º Si la serie es par, la mediana se obtiene de la semisuma de los dos
valores centrales de la serie previamente ordenada.
xh Ejemplo:
Se utiliza para calcular variables como productividades, velocidades, rendimiento, aceleración media, cambios o
8, 10, 14, 18, 23, 24, 32, 34
variaciones como el tiempo medio para realizar un proceso médico.
18  23
mediana   20,5
2
a) Obtención: se obtiene calculando el inverso de la media aritmética de los inversos de una serie.

1
xh  3º Sea la serie par o impar, la mediana ocupa el lugar,
n 1  n  1
 de la serie previamente ordenada.  2 
i 1
X
i
n
BIOESTADÍSTICA 1 Pag. 10 USAMEDIC 2015

Ventajas y desventajas de la moda.


• Ejemplo:
Ventajas:
Los salarios de siete empleados fueron Supongamos que se agrega al grupo el ä Se puede utilizar tanto para datos cualitativos como cuantitativos.
los siguientes (en 1000s) : Salario de un empleado más ($31,000).
28, 60, 26, 32, 30, 26, 29. ¿Cuál es la mediana? ä No se ve afectada por los valores extremos
¿Cuál es la mediana?
ä Se puede calcular, a pesar de que existan una o más clases abiertas.
Nro. de observaciones es impar Nro. de observaciones es par
Primero, ordenar los salarios. Primero, ordenar los salarios.
Luego, localizar el valor en el medio. Luego, localizar el valor en el medio. Desventajas:
ä No tiene un uso tan frecuente como la media.
ä Muchas veces no existe moda (distribución amodal).
26,26,28,29,30,32,60 26,26,28,29,29.530,31,
26,26,28,29, 32,60
,30,31,32,60 ä En otros casos la distribución tiene varias modas, lo que
73
dificulta su interpretación.
Hay dos valores en el medio!

Ventajas y desventajas de la mediana


Relación entre: Media, Mediana y Moda
Ventajas:

ä Los valores extremos no afectan a la mediana como en el caso de la media aritmética. • Si una distribución es simétrica, la media,
ä Es fácil de calcular, interpretar y entender. mediana y modo coinciden
ä Se puede determinar para datos cualitativos.

Desventajas: • Si una distribución no es simétrica, las tres medidas


ä Como valor central, se debe ordenar primero la serie de datos. difieren.
ä Para una serie amplia de datos no agrupados, el proceso de ordenamiento Asimetría hacia la derecha Asimetría hacia la izquierda
de los datos demanda tiempo y usualmente provoca equivocaciones. (asimetría positiva) (asimetría negativa)

Media Media Modo


Modo
Mediana Mediana
Altura mediana

LA MODA MEDIDAS DE POSICION


(fractiles, cuantiles)
• La moda es el dato que más se repite o el
dato que ocurre con mayor frecuencia.
MEDIA
• Un grupo de datos puede tener más de
una moda.
MEDIANA
• Se puede aplicar para variables
cuantitativas y cualitativas nominales. MODA

• Veamos el siguiente ejemplo: se tiene una PERCENTILES


muestra con valores 20, 23, 20, 24, 25, 25,
26 y 30. El 20 y 25 son la moda entonces,
se dice que es bimodal. CUARTILES

Calculo de la moda DEFINICIONES Y EQUIVALENCIAS


Obtención: se obtiene organizando la serie de datos y seleccionando el o los datos
• Las medidas de posición nos permiten Equivalencias
que más se repiten.
dividir a una distribución en 2 o mas Como todas las medidas se refieren
Ejemplo: partes iguales. al mismo grupo de datos, se pueden
• Según el número de partes, éstas
divisiones tendrán distintos nombres: hacer equivalentes entre sí
4, 5, 7, 8, 8 , 10, 12, 15
– Percentiles: Cuando dividimos una
4, 7, 12,12 , 15, 16, 20, 20 , 24, 27 distribución en100 partes.
50% M 50%
– Deciles: Cuando dividimos una
7, 12, 15, 18, 25, 30, 31, 38 distribución en 10 partes.
25% Q1 25% Q2 25% Q3 25%
– Cuartiles : Cuando dividimos una
distribución en 4 partes.
20% 20% 20% 20% 20%
El modo – Mediana: Cuando dividimos una
Cuando la muestra distribución en 2 partes.
es grande, los datos 10
%
10
%
10
%
10
%
10
% D5
10
%
10
%
10
%
10
%
10
%
se agrupan en intervalos  Se aplica para Variables cuantitativas,
y obtenemos el excepcionalmente cualitativas ordinales.
Intervalo modal
P25 P50 P75
BIOESTADÍSTICA 1 Pag. 11 USAMEDIC 2015

PERCENTILES CUARTILES
• Los percentiles dividen a los datos en cien partes iguales, cada una de • Los cuartiles dividen los datos en cuatro partes iguales.
ellas contiene el 1% de los elementos del conjunto. • Cada una de las partes representa una cuarta parte, o el 25% de las observaciones.
• Más o menos el (p) por ciento de los datos tienen valores menores que • Los cuartiles son percentiles específicos; por consiguiente, los pasos para calcular los
el percentil y aproximadamente (100-p) por ciento de los datos tienen percentiles los podemos emplear para calcular los cuartiles.
valores mayores que el percentil. • El primer cuartil Q1 es un valor que deje por debajo de él 25% de las y por encima 75%
• Un percentil nos provee información de como se distribuyen los de las observaciones (equivale al P 25). El Q2 es la mediana (50%) (equivale al P50) y
Q3 deja por debajo 75% y por encima 25% de las observaciones (equivale al P75)
valores de los datos desde el menor hasta el mayor.

Un percentil divide en dos partes las observaciones. Por ejemplo, el


percentil 20, P20, es el valor que deja por debajo un 20% y por encima un 75% 25%
80% de las observaciones
25% 75%

20% 80% 25% 25% 25% 25%

Mínimo Máximo Cuartil 1 Mediana Cuartil 3 Máximo


Percentil 20 Mínimo Cuartil 2
Q1 Q3
Q2
(P20)

PASOS PARA CACULAR EL PERCENTIL PASOS PARA CALCULAR LOS CUARTILES


• Para calcular la posición del percentil, debe seguir los siguientes pasos:
• A continuación se presenta un conjunto de datos con los siguientes valores;
Paso 1. Ordene los datos de manera ascendente. 5, 12, 8, 14, 11, 15, 20, 18, 30 y 25.

Paso 2. Calcule un índice (i) que indica la ¿ Cómo identificamos los cuartiles en este ejemplo?
posición del percentil que se busca  P  Utilizarás los mismos pasos para identificar los percentiles:
i n
en la serie de datos ordenados.  100  Primero, ordenamos los datos

en donde (p) es el percentil de interés y (n) es el número de datos u 5 8 11 12 14 15 18 20 25 30


observaciones del conjunto o serie.
Segundo, determinamos (i) para cada cuartil:
Paso 3.
a) Si (i) no es entero, utilizando las reglas de redondeo, se lleva al próximo Q1 = primer cuartil, o percentil 25
numero entero. El valor entero inmediato mayor que (i) indica la posición Q2 = segundo cuartil, o percentil 50 (también la mediana)
donde se encuentra el percentil. Esto significa que si (i) = 3.5, el percentil Q3 = tercer cuartil, o percentil 75
se encuentra en la posición 4 de los datos ordenados.

b) Si (i) es entero, la posición del percentil es el promedio de los valores de


los datos ubicados en los lugares i e (i + 1). Veamos como se aplica

EJEMPLO PASOS PARA CALCULAR LOS CUARTILES


• Como ejemplo de este procedimiento, determina el percentil 75 • Primer cuartil:
de los datos sobre las edades del siguiente un grupo de
Q1 = primer cuartil, o percentil 25
ciudadanos: 25, 20, 26, 21, 19, 23, 22, 30, 28, 27.
 25 
Paso 1. Ordene los datos en orden ascendente: i 10 = 2.5
 100 
19 20 21 22 23 25 26 27 28 30 Como(i) no es un número entero, se redondea al próximo entero mayor que 2.5, o sea
3. Al referirnos a los datos vemos que el primer cuartil está ubicado en la posición 3
Paso 2. Calcule el índice (i): de los datos que este caso es 11. El primer cuartil en los datos se divide de la siguiente
 P   75  forma:
i n i 10  7.5 5 8 11 12 14 15 18 20 25 30
 100   100 
Q1=11
Paso 3. Como (i) no es entero, redondeamos al próximo entero mayor que 7.5, o sea, el
lugar 8. Al referirnos a los datos del ejemplo, vemos que el percentil 75 es el valor del dato  Segundo cuartil:
ubicado en la posición número 8, que en este caso es 27. Q2 = segundo cuartil, o percentil 50 (también la mediana)
19 20 21 22 23 25 26 27 28 30  50 
i 10 = 5
Nota. Recuerda que (i) nos indica el lugar del dato donde se encuentra el  100 
percentil que estamos buscando.
Como (i) es un número entero, el segundo cuartil es el promedio de los valores de los
datos que están en las posiciones i e (i+1), que en este caso es, (14+15)÷2=14.5,
entonces, el segundo cuartil en los datos se divide así:

 Significa que el 75% de las edades son menores de 27 5 8 11 12 14 15 18 20 25 30


años y el 25% restante (100-p) es mayor de 27 años. Q1=11 ; Q2=14.5

PASOS PARA CALCULAR LOS CUARTILES

VALORES
• Tercer cuartil:
Q3 = tercer cuartil, o percentil 75

 75 
i 10 = 7.5
 100 
Como (i) no es un número entero, se redondea al próximo entero mayor que
7.5, o sea 8. Al referirnos a los datos , vemos que el tercer cuartil está ubicado
en posición 8 de los datos que en este caso es el 20. Finalmente, los cuartiles en
este caso se presentan de la siguiente forma:

5 8 11 12 14 15 18 20 25 30

POSICION Q1=11 Q2=14.5 Q3=20


BIOESTADÍSTICA 1 Pag. 12 USAMEDIC 2015

Ejemplos
3. MEDIDAS DE DISPERSIÓN
En el Hospital Dos de Mayo los pesos de RN durante el año 2009 variaron
entre los 1500 gr hasta los 4,500 gr. Diga usted que porcentaje de niños
tuvieron un peso mayor de 3000 gr si se sabe que este peso corresponde
Llamadas también medidas de variabilidad, variación
al percentil 80 de la serie total de RN durante el 2009? Son útiles porque:
p80 ä Permiten juzgar la confiabilidad de la medida de tendencia central.

ä Miden la variabilidad de los datos y reflejan la tendencia de los datos de cómo


se desvían de la media, ya que caracterizar una distribución solamente a
1500 gr 4500 gr través de una medida central no es apropiado.
3000 gr
ä Es posible comparar dispersión de diversas muestras.

ä Son importantes debido a que dos muestras de observaciones con el mismo


valor central pueden tener una variabilidad muy distinta.

Miden el grado de dispersión (variabilidad) de los


datos, independientemente de su causa.

Ejercicios
• El 5% de los recién nacidos tiene un peso demasiado bajo. ¿En que percentil se
encuentra el peso por debajo del cual se considera “demasiado bajo”?
Medidas de dispersión
Ejemplo de dos conjuntos de datos con igual media
◦ ¿En que percentil se encuentra el peso que es superado sólo por el 25% de los
recién nacidos?

◦ El colesterol se distribuye simétricamente en la población. Si se consideran


patológicos los valores extremos. El 90% de los individuos son normales ¿Entre
qué percentiles se encuentran los valores que incluyen a los individuos
normales?

◦ ¿Entre qué percentiles se encuentran los valores en los que está la mitad de los
individuos “más normales” de una población?

Datos con baja dispersión Datos con alta dispersión

EJERCICIOS DE PRÁTICA MEDIDAS DE DISPERSIÓN


Resuelve los siguientes ejercicios:

Se ha obtenido una muestra del salario de los Bomberos. Los datos recopilados
RANGO
fueron los siguientes:
1500 $1400 $1600 $2100
1200 1300 1900 1800 RANGO INTERCUARTIL
2000 1200 1200 1500
2200 2300 1500 1400 DESVIACION MEDIA

a. determine el salario promedio VARIANZA


b. calcule la mediana y la moda.
c. calcule el percentil 65. Explique el resultado.
DESVIACIÓN ESTÁNDAR
d. determine los cuartiles.

COEFICIENTE DE VARIACION

BIOESTADISTICA 4
RANGO
• Es también llamado: Amplitud, intervalo, recorrdio o Alcance.
• Es la medida de dispersión más sencilla.
• Se determina restando el valor mayor de los datos del valor menor.

Ejemplo: Se tienen los siguientes valores de datos:

20, 25, 10, 5, 30, 35, 31, 23.

Rango = valor mayor – valor menor

35 – 5 = 30

ESTADISTICA DESCRIPTIVA II

Interpretación
La diferencia entre el valor mayor y el menor es de 30.
BIOESTADÍSTICA 1 Pag. 13 USAMEDIC 2015

DESVIACION MEDIA
Ventajas y desventajas del rango
Permite calcular la desviación media de todos los datos respecto a su media
aritmética.
Ventajas
fácil de calcular A cada dato se le resta la Media Aritmética sin hacer caso de los signos negativos
(valor absoluto), y se divide luego por el número total de términos.
fácil de entender e interpretar
(Xi – X)

DM =
-----------
Desventajas n

sólo considera los valores extremos Ejemplo


no toma en cuenta ni el número de datos ni el valor de Calcular la desviación media de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
éstos
no es posible de calcular en tablas con extremos abiertos.

RANGO INTERCUARTILICO VARIANZA


• La varianza es otra medida de dispersión que se basa en la diferencia entre
el valor de cada dato (Xi) y la media ( ).
x
También se denomina • La diferencia entre cada dato (Xi) y su media ( ) para una muestra se llama
Alcance intercuartilico. desviación con respecto a la media o promedioxy se expresa con la siguiente
fórmula:
n
Permite ubicar 50% de los
 (X i  x )
2

datos que se encuentran en


S 
2 i 1
el centro de la distribución,
es decir, 25% de los datos n 1
• Para calcular la varianza, las desviaciones respecto a la media se elevan al
son menores al primer cuadrado y se dividen entre (N – 1).
cuartil y también 25% de los
datos son mayores al tercer • Este indicador nos muestra las variaciones al cuadrado respecto al
cuartil. promedio.
• No se puede interpretar

RI  Q3  Q1

Ejemplo:
La siguiente información se refiere al número de quejas recibidas en un Centro
Veamos el siguiente ejemplo: Médico durante una semana. Calcule la varianza de 8, 10, 5, 12, 10, 15.

Determine el rango intercuartil para los datos siguientes (pesos de pacientes pediátricos);
Elaboramos un cuadro de la forma siguiente
30, 40, 35, 5, 10, 20, 15, 30 y 45:
x Xi  x Xi  x  2

Paso 1. Ordenar los datos de forma ascendente.


5 10 15 20 30 30 35 40 45 8 8 - 10 = - 2 4
Paso 2. Calcular los cuartiles Q3 y Q1: 60
x
10 10 - 10 = 0 0
Q3 = 75 percentil
Q1 = 25 percentil
5 5 - 10 = - 5 25 6
12 12 - 10 = 2 4
Nota: Utiliza el mismo procedimiento para calcular los percentiles.
10 10 - 10 = 0 0
 Cuartil uno: Q1 = 25 percentil 15 15 - 10 = 5 25 x  10
 X  60  Xi  x   0  Xi  x   58
2
 P  =  25  = 2.25
i n i   9
 100   100 
 Xi  x   58
2

Como (i) no es un entero, redondeamos al próximo entero mayor que 2.25, o sea 3. Así,
 (X i  x )
2
2 58
que Q1 está ubicado en la posición tres (3) de los datos, que en este ejemplo es 15. 2
 S   11,6 quejas2
S n 1 6 1

 Cuartil tres: Q3 = 75 percentil


DESVIACION ESTANDAR
 P   75  = 6.75
i n = i 9
 100   100  • También llamada DESVIACION TIPICA, es la RAÍZ CUADRADA DE LA
Como (i) no es un entero, redondeamos al próximo entero mayor que 6.75, o sea 7. Así, VARIANZA.
que Q1 está ubicado en la posición siete (7) de los datos, que en este ejemplo es 35. • Es una medida de la variabilidad de un conjunto de datos respecto a la
5 10 15 20 30 30 35 40 45 MEDIA.
• Se calcula sacando la raíz cuadrada de la varianza. Nos indica cuánto
tienden a alejarse los datos del promedio. Si los datos son de una
muestra, la desviación estándar se representa como:
• Paso 3. Ahora, podemos sustituir los valores de los cuartiles en la fórmula.

n
 (Xi  x)2
Rango Intercuartil = Q3 – Q1 i 1
• S  loss 2datos
Para poder interpretar  debemos regresarlos a la escala original
(sacar la raíz cuadrada de la varianza). n 1
Interpretación:
El 50% de los pacientes pediátricos pesan entre 15 y 25 Kilos.
El rango intercuartilico de pesos de los pacientes pediátricos es de 20 Kilos.
BIOESTADÍSTICA 1 Pag. 14 USAMEDIC 2015

Ejemplo:
Farmacia I n
La siguiente información se refiere al número de quejas recibidas en  Xi
un Centro Médico durante una semana. Calcule la desviación 393
estándar.
x  i 1
  56,14
n 7

8, 10, 5, 12, 10, 15 x Xi  x Xi  x  2

40 -16,14 260,50
Ya sabemos por el ejemplo anterior que S2 = 11,6 quejas2.
70 13,86 192,10
Entonces:
60 3,86 14,90
S
2
48 -8,14 66,26
s
52 -4,14 17,14
65 8,86 78,50
S  11,6 quejas2
La unidad de medida de la DS es
igual a la de las variables del 58 1,86 3,46
 Xi  x   0  Xi  x 
conjunto
 X  393 2
 632,86
S  3,4 quejas

Si  Xi  x 2  632,86
Propiedades del desviación estándar
n
• Mide la dispersión respecto a la media. Debe emplearse solo
 ( Xi  x )
2
cuando se escoge la media como medida central de la 632,86
i 1
distribución. S   10,27
n 1 7 1
• S = 0; solo ocurre cuando no hay dispersión: todas las
observaciones toman el mismo valor. De lo contrario S > 0.
• Cuanto más dispersión hay entre las observaciones, mayor es S. S
CV  100
• Al igual que la media, la desviación estandar se encuentra x
fuertemente influenciado por las observaciones extremas.
10,27
CV   100  18,29
56,14
106

Farmacia II
COEFICIENTE DE VARIACION R n
 Xi
847
x  i 1   105,87
•También llamado COEFICIENTE DE VARIACION DE PEARSON. n 8
•Es una medida de variabilidad relativa de los datos, permite comparar la x Xi  x Xi  x  2

variabilidad de dos o más conjuntos de datos expresados en unidades 70 -35,87 1286,6569


diferentes (peso; kg. y libras).
35 -70,87 5022,5569

Cálculos a partir de datos no agrupados 150 44,13 1947,4569


140 34,13 1164,8569

Para la muestra:
s
CV  100
82 -23,87 569,7769
x 110 4,13 17,0569
140 34,13 1164,8569

Para la población: CV  100 120 14,13 199,6569
  
 X  847  Xi  x  0,04 
 Xi  x 
2
 11372,88

Ejemplo:
Si  Xi  x   11372,88
n 2
A continuación se presentan las ventas (en unidades i 1
monetarias) logradas durante una semana por dos farmacias.
La farmacia I vende en soles y la farmacia II en dólares ¿Cuál n
 ( Xi  x )
2
de ellos tiene un desempeño más estable, en cuanto a nivel de 11372,88
i 1
ventas?. S   40,30
n 1 8 1
Farmacia I (soles) Farmacia II (dólares)
S 40,30
40,70,60,48,52,65,58 70,35,150,140,82,110,140,120
CV  100 CV  100  30,06
x 105,87
Calculamos la media y desviación estándar para cada una de
las farmacias
La farmacia II presenta una mayor variabilidad en el volumen de
ventas.
BIOESTADÍSTICA 1 Pag. 15 USAMEDIC 2015

4. FORMAS DE DISTRIBUCION APLICACIÓN EN ESTADISTICA DESCRIPTIVA


(GRAFICOS)

4.1 SIMETRIA DE LOS DATOS • Diga ud. ¿cual es el intervalo de peso en Kg. en el que se encontrará
el 68% de individuos de un marco muestral, en el cual la media de
peso es de 78Kg con una DS de + - 6 Kg.? .
Otra característica de un conjunto de datos es la forma, es decir, la
manera en que están distribuidas las observaciones. • En que rango de Talla se encontrará el 95% de la población en la que
La distribución de los datos puede ser o no simétrica. Si la
se sabe que la media de talla es de 160 cm con una DS de + - 15 cm?
distribución de los datos no es simétrica, se llama asimétrica o
sesgada. • En que rango de edades se encontrará el 99% de individuos de una
muestra (marco), cuya media aritmética fue de 35 años con una DS
Para describir la forma se puede comparar la media y la mediana.
de +- 3 años.
También puede observarse a través del coeficiente de asimetría Mide
el grado de Simetría / Asimetría de la distribución

11
4

Ejemplos de diferentes formas de


4.2 KURTOSIS
distribución
Distribuciones simétricas Mide el grado de apuntamiento de la curva
Interpretación:
=0 Mesocúrtica
CK >0 Leptocúrtica

<0 Platicúrtica
Distribuciones asimétricas
En la distribución Normal es 0 mesocúrtica

Si es + indicará un grado de apilamiento mayor que en la normal leptocúrtica


(menor dispersión)

Sesgo positivo Sesgo negativo Si es – indicará que es más aplanada que la normal platicúrtica (mayor
dispersión)
Asimétrica Positiva Asimétrica Negativa

11
5
Relación entre la media, la mediana y la moda La Forma de la distribución
Frecuencia
Frecuencia

Otra manera de apreciar la forma de una distribución es observar el


nivel de apilamiento o llanura de la curva

moda promedio promedio moda

Relación entre los cuartiles y la simetria

Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
(M) (M) (M)
leptocúrtica Platicúrtica mesocúrtica
• Si la mediana está muy cerca del Q1, se dice que existe un sesgo positivo.
. (menor dispersión) (mayor dispersión)
• Si la mediana está muy cerca del Q3, se dice que existe un sesgo negativo
• Si la mediana está en el centro entre Q1 y Q3, se dice que la distribución es simetría en el 50% de los
datos centrales El coeficiente de kurtosis mide el grado de apuntamiento de la
curva
Cuando los datos son sesgados es mejor emplear la Mediana

Coeficiente de Asimetría de Pearson:


Regla Empírica “Teorema de Chebyshev”
(para distribuciones simétricas) Fácil de calcular e interpretar.
• Cálculo:

ASP 

3 X  Md 
s

o Interpretación:
-1 1 = 0, X=Md Simétrica
-2 2
68% ASP > 0, X>Md Asimétrica Positiva
-3 95% 3
< 0, X<Md Asimétrica Negativa
99.9%
BIOESTADÍSTICA 1 Pag. 16 USAMEDIC 2015

Anda mungkin juga menyukai