1 USAMEDIC 2019
FUENTE PRIMARIA
de una unidad de DE
CABELLO AREA
análisis. IDIOMA
VALOR O VARIABLE b. Que admita un rango PRESION
ARTERIAL
MAGNITUD (CARACTERISTICA)
mínimo de variación
VALOR
LA UNIDAD DE ANALISIS (sujeto o individuo estadístico)
Un valor es la magnitud, rango o atributo a través del cual se
• Es el elemento mínimo de estudio, observable o medible en relación expresa la variable.
con un conjunto de elementos que son de su mismo tipo.
La variable edad puede tomar los
• Se denomina también UNIDAD ELEMENTAL o ESTADISTICA. siguientes valores: • 1 a 10 años
Cada uno de estos • 11 a 20 años
rangos son valores de • 21 a 30 años
«Es la persona, animal o cosa de la que se quiere la variable • 31 a 40 años
Peso 75 Kg.
Estatura 1,80 mts.
Profesión Médico ---- Sub conjunto de Unidades de análisis
(Individuos)
m1 m2 m3 mn
75 datos
4. PARAMETROS y ESTADISTICOS
• Parámetro: Valor representativo de
ESTADISTICO
- DATO VARIABLE: Si la característica
una POBLACION. Se simboliza por de interés puede adoptar diversos valores
letras griegas. Sólo hay un parámetro
por cada población. Muestra en las unidades estadísticas (individuos
Media poblacional
Muestra estadísticos).
POBLACION
2 Varianza poblacional
Desviación estándar poblacional Ejemplo:
Proporción poblacional
• Edad de los pacientes: 20 años, 54 años, 43 años, etc.
• Estadístico: Valor representativo de una ESTADISTICO
MUESTRA. Se simboliza por letras latinas. ESTADISTICO • Profesión de los profesores de la Universidad Daniel
Existen tantos estimadores como muestras Alcides Carrión: médicos, abogados, economistas, etc.
se extraigan de una población. Sinónimo: PARAMETRO
Estimador- Estadígrafo.
x Media muestral.
Varianza muestra.
Los datos variables son los de mayor interés en Estadística.
s2
s Desviación estándar muestral.
A estos se les denomina comúnmente “VARIABLES”.
p Proporción muestral.
CLASIFICACIÓN DE VARIABLES
1.- Variable Numérica o Cuantitativa : 7. ESCALAS DE MEDIDA O MEDICION:
Las que se expresan por números los que se obtienen por
conteo o medición.
Las operaciones posibles con estas son los promedios y
DEFINICION
medidas de dispersión, entre otras.
CLASIFICACIÓN DE VARIABLES
2.-Variable Cualitativa : Tipos de escalas de medición
Es la que no se pueden expresar mediante números, sino por
cualidades o categorías que representen sus atributos.
a) Escala Nominal o Intensiva: variables cualitativas nominales
Solo se pueden registrar mediante el conteo.
En casos especiales se puede expresar por un número pero
b) Escala Ordinal: variables cualitativas ordinales
este se reconoce porque carece de unidad de medida.
Matemáticamente las operaciones posibles con estas son: la
tasa porcentual (porcentaje), proporciones y la moda. c) Escala de Intervalo
• consiste en clasificar los objetos de estudio según las • Esta escala, además de poseer las características de la escala ordinal,
categorías de una variable. El alcance de esta escala es el encontramos que la asignación de los números a los elemento es tan
conteo. precisa que podemos determinar la magnitud de los intervalos
(distancia) entre todos los elementos de la escala.
Ejemplo
ESCALA
Ejemplo: Año 0
Sexo 1: Masculino 2: Femenino
Hora 00:00
Especialidad 1: Clínico 2: Cirugía
Temperatura 0ºC
Título
PRESENTACION DE DATOS Resultados de la votación distrital
Tabulación y Graficación
Talón Cuerpo
Todo análisis estadístico es una
estrategia para traducir la cantidad
de información obtenida en la Fuente
recolección de datos, a índices o XXXX
formas que sean interpretables y que Ejemplo de Tabla para variables cuantitativas discretas
representen alguna dimensión del
comportamiento de las variables
OPERARIO GENERAL
OPERADOR DE M AQUINA
1
GENERALES
Escalas 120
Número de operarios
100
Cuerpo
80
60
40
20
10 8 12
4 1 5
0
OPERARIO GENERAL OPERADOR DE MAQUINA DESPACHAD OR DE OPERADOR DE DOBLE OPERADOR DE MAQUINA OPERADOR DE OPERADOR GR AL.
AUTOMATICA PRODUCT O TERMINAD O FILO ST SERVICIOS GENERALES ALMACEN MAT ERIA
LOCAL PRIMA Y PRODUCTOS
Fuente TERMINAD OS
Las barras están separadas entre si, y el ancho de las mismas no es representativo
OPERARIO GENERAL
2% 1%
3%
OPERADOR DE MAQUINA ST
4%
5%
OPERADOR DE MAQUINA AUTOMATICA
7%
DESPACHADOR DE PRODUCTO T ERMINADO
LOCAL
OPERADOR GRAL . ALMACEN MATERIA PRIMA
Y PRODUCT OS T ERMINADOS
OPERADOR DE DOBLE FILO
78%
Operadores
60 0,8
Operadores
50 0,6
40 0,4
30 0,2
20 0
10 11,53 12,17 12,81 13,45 14,08 14,72 15,36 16,00 16,64
0 Salarios en miles de Bs.
10.89 11.55 12.22 12.88 13.54 14.21 14.87 15.53 16.20
Salarios en miles
Asimismo permite comparar varios conjunto de datos
40
polígono. Cuartil 1 Cuartil 3
30
20 máximo
mínimo 25% 25% 25% 25%
10 No es un gráfico muy
0 difundido a pesar de
11.21 11.85 12.49 13.13 13.77 14.40 15.04 15.68 16.32 sus ventajas sobre el
Salarios en miles histograma. Mediana
(Cuartil 2)
Diagramas de dispersión
(gráfico de puntos o nube) Gráficos temporales
Son gráficos muy simples que sirven para comparar la Se utilizan para representar series de datos donde el eje horizontal
relación que existe entre variables cuantitativas. está representado por el tiempo, es decir la variable evoluciona en
el tiempo.
8.000
7.500
7.000
GWh
6.500
Peso - Talla
6.000
5.500
5.000
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35
Meses
BIOESTADISTICA 3
ESTADISTICA DESCRIPTIVA I
Diagrama de Tallos y Hojas
Es un diagrama donde 1. Centralización (Tendencia central)
cada valor de datos es • Indican valores con respecto a los que los datos parecen agruparse.
• Media, mediana y moda
dividido en una “hoja”
(normalmente el último 2. Medidas de Posición
• Dividen un conjunto ordenado de datos en grupos con la misma cantidad
dígito) y un “tallo” (los de individuos.
otros dígitos). Por ejemplo • Cuantiles, percentiles, cuartiles, deciles,...
el valor 32 seria dividido 3. Medidas de Dispersión
en “3” (tallo) y “2” (hoja). • Indican la mayor o menor concentración de los datos con respecto a las
medidas de centralización.
• Desviación típica, coeficiente de variación, rango, varianza
Se aplica para variables 4. Formas de la Distribución
cuantitativas discretas. • 4.1 Simetría
• 4.2 Apuntamiento o curtosis
BIOESTADÍSTICA 1 Nuevo Pag. 12 USAMEDIC 2019
. . . .
.
. .
.
.. . . . . MTC.
.
.
. .... . .
MODA Desventajas
LA MEDIANA Reglas
18 23
• La mediana es el valor que se ubica en el medio de mediana 20,5
los valores de los datos previamente ordenados. 2
Primero se ordenan los datos: ä Como valor central, se debe ordenar primero la serie de datos.
ä Para una serie amplia de datos no agrupados, el proceso de ordenamiento
5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17 de los datos demanda tiempo y usualmente provoca equivocaciones.
mediana
Calculo de la moda
¿Cuando elegir la Media o la Mediana?
Obtención: se obtiene organizando la serie de datos y seleccionando el o los
¿La serie de datos tiene datos que más se repiten.
valores extremos? Ejemplo:
(muy altos o muy bajos respecto a
la mayoría de datos) 4, 5, 7, 8, 8 , 10, 12, 15
SI NO
4, 7, 12,12 , 15, 16, 20, 20 , 24, 27
ASIMETRIA SIMETRIA
7, 12, 15, 18, 25, 30, 31, 38
El modo
Cuando la muestra
x x es grande, los datos
se agrupan en intervalos
y obtenemos el
Intervalo modal
DEFINICIONES Y EQUIVALENCIAS
100%
EJEMPLO
PASOS PARA CALCULAR LOS CUARTILES
• Como ejemplo de este procedimiento, determina el percentil 75 de
los datos sobre las edades del siguiente un grupo de ciudadanos: 25, • A continuación se presenta un conjunto de datos con los siguientes valores;
20, 26, 21, 19, 23, 22, 30, 28, 27.
5, 12, 8, 14, 11, 15, 20, 18, 30 y 25.
Paso 1. Ordene los datos en orden ascendente:
19 20 21 22 23 25 26 27 28 30
posición 1 2 3 4 5
¿ Cómo identificamos los cuartiles en este ejemplo?
6 7 8 9 10
Utilizarás los mismos pasos para identificar los percentiles:
Paso 2. Calcule el índice (i): P 75
i n i 10 7.5
100 100 Primero, ordenamos los datos
Paso 3. Como (i) no es entero, redondeamos al próximo entero mayor que 7.5, o
sea, el lugar 8. Al referirnos a los datos del ejemplo, vemos que el percentil 75 es
el valor del dato ubicado en la posición número 8, que en este caso es 27. 5 8 11 12 14 15 18 20 25 30
1 2 3 4 5 6 7 9 10
19 20 21 22 23 25 26 27 28 30 8
posición 1 2 3 4 5 6 7 9 10
8
Segundo, determinamos (i) para cada cuartil:
Nota. Recuerda que (i) nos indica el lugar del dato donde se encuentra el
percentil que estamos buscando.
Q1 = primer cuartil, o percentil 25
Q2 = segundo cuartil, o percentil 50 (también la mediana)
Significa que el 75% de las edades son menores de 27
años y el 25% restante (100-p) es mayor de 27 años. Q3 = tercer cuartil, o percentil 75
(50%) (equivale al P50) y Q3 deja por debajo 75% y por encima 25% de
las observaciones (equivale al P75) Segundo cuartil:
Q2 = segundo cuartil, o percentil 50 (también la mediana)
75% 25% 50
i 10 = 5
25% 75% 100
Como (i) es un número entero, el segundo cuartil es el promedio de los valores de los
25% 25% 25% 25% datos que están en las posiciones i e (i+1), que en este caso es, (14+15)÷2=14.5,
entonces, el segundo cuartil en los datos se divide así:
i
75
10
◦ ¿En que percentil se encuentra el peso que es superado sólo
100 = 7.5 por el 25% de los recién nacidos?
Como (i) no es un número entero, se redondea al próximo entero
mayor que 7.5, o sea 8. Al referirnos a los datos , vemos que el tercer
cuartil está ubicado en posición 8 de los datos que en este caso es el
◦ El colesterol se distribuye simétricamente en la población.
20. Finalmente, los cuartiles en este caso se presentan de la siguiente Si se consideran patológicos los valores extremos. El 90%
forma: de los individuos son normales ¿Entre qué percentiles se
encuentran los valores que incluyen a los individuos
5 8 11 12 14 15 18 20 25 30
normales?
1 2 3 4 5 6 7 8 9 10
◦ ¿Entre qué percentiles se encuentran los valores en los que
está la mitad de los individuos “más normales” de una
Q1=11 Q2=14.5 Q3=20 población?
Ejemplos
En el Hospital Dos de Mayo los pesos de RN durante el año 2009
EJERCICIOS DE PRÁTICA
variaron entre los 1500 gr hasta los 4,500 gr. Diga usted que
Resuelve los siguientes ejercicios:
porcentaje de niños tuvieron un peso mayor de 3000 gr si se
sabe que este peso corresponde al percentil 80 de la serie total
de RN durante el 2009? Se ha obtenido una muestra del salario de los Bomberos. Los datos
recopilados fueron los siguientes:
p80
1500 $1400 $1600 $2100
1200 1300 1900 1800
1500 gr 4500 gr 2000 1200 1200 1500
3000 gr
2200 2300 1500 1400
ESTADISTICA DESCRIPTIVA II
RANGO
3. MEDIDAS DE DISPERSIÓN • Es también llamado: Amplitud, intervalo, recorrido o alcance.
• Es la medida de dispersión más sencilla.
Llamadas también medidas de variabilidad, variación
• Se determina restando el valor mayor de los datos, del valor menor.
Son útiles porque:
ä Permiten juzgar la confiabilidad de la medida de tendencia central.
Ejemplo: Se tienen los siguientes valores de datos:
ä Miden la variabilidad de los datos y reflejan la tendencia de los datos de
alejarse entre si o de la media, ya que caracterizar una distribución solamente
20, 25, 10, 5, 30, 35, 31, 23.
a través de una medida central no es apropiado.
ä Es posible comparar dispersión de diversas muestras. Rango = valor mayor – valor menor
ä Son importantes debido a que dos muestras de observaciones con el mismo
valor central pueden tener una variabilidad muy distinta. 35 – 5 = 30
Interpretación
Miden el grado de dispersión (variabilidad) de los datos,
independientemente de su causa. La diferencia entre el valor mayor y el menor es de 30.
RANGO INTERCUARTIL
Permite ubicar 50% de los
datos que se encuentran
DESVIACION MEDIA
en el centro de la
distribución, es decir, 25%
VARIANZA de los datos son menores
al primer cuartil y también
25% de los datos son
DESVIACIÓN ESTÁNDAR mayores al tercer cuartil.
COEFICIENTE DE VARIACION
RI Q3 Q1
BIOESTADÍSTICA 1 Nuevo Pag. 19 USAMEDIC 2019
Paso 1. Ordenar los datos de forma ascendente. A cada dato se le resta la Media Aritmética sin hacer caso de los signos negativos
(valor absoluto), y se divide luego por el número total de términos.
5 10 15 20 30 30 35 40 45
posición 1 2 3 4 5 6 7 8 9
P 25
i n = i 9 = 2.25
100 100
Como (i) no es un entero, redondeamos al próximo entero mayor que 2.25, o sea 3. Así,
que Q1 está ubicado en la posición tres (3) de los datos, que en este ejemplo es 15.
Ejemplo:
La siguiente información se refiere al número de quejas recibidas en un
Centro Médico durante una semana. Calcule la varianza de 8, 10, 5, 12, 10, 15. Ejemplo:
Elaboramos un cuadro de la forma siguiente
La siguiente información se refiere al número de quejas recibidas en
un Centro Médico durante una semana. Calcule la desviación
x Xi x X i x
2
estándar.
8 8 - 10 = - 2 4
8, 10, 5, 12, 10, 15
60
x
10 10 - 10 = 0 0
Ya sabemos por el ejemplo anterior que S2 = 11,6 quejas2.
5 5 - 10 = - 5 25 6 Entonces:
12 12 - 10 = 2 4
S
10 10 - 10 = 0 0 2
15 15 - 10 = 5 25 x 10 s
X 60 Xi x 0 Xi x 58
2
ASP
3 X Md
s
o Interpretación:
-1 1 = 0, X=Md Simétrica
-2 2
68% ASP > 0, X>Md Asimétrica Positiva
-3 95% 3
< 0, X<Md Asimétrica Negativa
99.9%
4.2 KURTOSIS
APLICACIÓN EN ESTADISTICA DESCRIPTIVA La Forma de la distribución
Otra manera de apreciar la forma de una distribución es observar el
• Diga ud. ¿cual es el intervalo de peso en Kg. en el que se nivel de apilamiento o llanura de la curva
encontrará el 68% de individuos de un marco muestral, en el
cual la media de peso es de 78Kg con una DS de + - 6 Kg.? .