ESTADÍSTICA DESCRIPTIVA
Introducción. Conceptos básicos:
Población y muestra. Parámetro y Estadígrafo
Variable estadística, clasificación. Escalas de medición.
Organización de datos:
Distribución de frecuencias y representaciones gráficas.
Medidas de tendencia central.
Medidas de dispersión. Diagramas de Cajas.
Detección de datos extremos.
Organización y presentación de datos
Introducción
Después de la recopilación de los datos, es necesario, clasificarlos,
resumirlos y presentarlos en forma tal, que faciliten su comprensión y
su posterior análisis y utilización. Para ello se ordenan en una tabla de
distribución de frecuencias, luego se presentaran en gráfico.
Organización y presentación de datos
¿De qué depende la forma de organización y
presentación de un conjunto de datos más adecuada?
Variables Variables
CUALITATIVAS CUANTITATIVAS
• Tabla de frecuencias
• Gráfico de barras Discretas Continuas
• Gráfico de columnas
• Gráfico circular • Tabla de frecuencias • Tabla de frecuencias
• Gráfico de Pareto • Diagrama de varas o bastones • Histograma
• Frecuencias Acumuladas • Polígono de frecuencias
• Ojiva
Tablas y Gráficos para datos de variables
cualitativas Nominales u
Ordinales!
Gráfico de barras Gráfico de Pareto
Tipos de problemas de TI
(Cantidad y Porcentaje acumulado)
140 129 120%
89% 92%
120 81% 86%
76% 100%
100 65% 71%
84 80%
57%
80 49%
39% 56 60%
60 44 43
40 23% 32 31 27 40%
25 19 16 20%
20
0 0%
Gráfico circular
Inca Kola Otras Coca Cola Coca Cola Inca Kola Kola Real Sprite Coca Cola Kola Real
Kola Real Kola Real Inca Kola Inca Kola Sprite Inca Kola Inca Kola Otras Coca Cola
Kola Real Kola Real Sprite Inca Kola Inca Kola Inca Kola Otras Kola Real Coca Cola
Inca Kola Coca Cola Otras Kola Real Coca Cola Coca Cola Coca Cola Inca Kola Kola Real
Inca Kola Coca Cola Inca Kola Inca Kola Coca Cola Inca Kola Inca Kola Sprite Coca Cola
Ejercicio
La empresa IGK tomó una muestra de personas y les preguntó por su bebida
gaseosa preferida. Los resultados se muestran a continuación. Construya la
distribución de frecuencias de la variable en estudio.
Gaseosa Preferida
Inca Kola 16
Inca Kola 16 Número de
Coca Cola 12 Coca Cola 12 personas que
prefiere la
Kola Real 9 Kola Real 9 gaseosa
Sprite 4 Sprite 4
Otras 4 Otras 4
Total 45
0 4 8 12 16 20 Fuente: Empresa IGK
Número de Personas
Gráficos para datos de variables cualitativas
Gráfico circular o de pastel
Cuando se utiliza el gráfico circular, cada sector circular representa la
frecuencia observada de una clase o categoría.
El sector circular que representa a una determinada clase o
categoría de la variable tiene un ángulo en el centro proporcional a
la frecuencia relativa de dicha clase.
El ángulo que le corresponde a cada clase se obtiene multiplicando
360º por la respectiva frecuencia relativa.
Ejemplo – Servicios de mesa de ayuda
Los siguientes datos muestran el número de veces que un equipo de mesa de
ayuda atiende diferentes problemas de tecnología.
p
Grafico circular Monitor: problema
Tipos de Problemas n p N P Impresora: No
de imagen
imprime
Software: Instalación Software:
Desktop: traslados
Configuración 129 23% 129 23% Instalación
Desktop: Instalación- Desktop: travando- Configuración
Configuración 84 15% 213 39% lento
SW: Auxilio al
usuario 56 10% 269 49%
SW: Mantenimiento 44 8% 313 57% Desktop: no prende
SW: configuración de
e-mail 43 8% 356 65%
Impresora: Impresora:
Instalación 32 6% 388 71% Instalación
Desktop: no prende 31 6% 419 76%
Desktop: travando-
lento 27 5% 446 81%
SW: configuración Desktop:
Desktop: traslados 25 5% 471 86% Instalación-
de e-mail
Impresora: No Configuración
imprime 19 3% 490 89%
Monitor: problema SW: Mantenimiento
de imagen 16 3% 506 92% SW: Auxilio al
usuario
Ejemplo – Servicios de mesa de ayuda
Los siguientes datos muestran el número de veces que un equipo de mesa de
ayuda atiende diferentes problemas de tecnología.
Grafico Pareto
Tipos de Problemas n p N P Tipos de problemas de TI
Software: Instalación (Cantidad y Porcentaje acumulado)
Configuración 129 23% 129 23% 140 129 120%
92%
Desktop: Instalación- 120 81% 86% 89% 100%
Configuración 84 15% 213 39%
100 71% 76%
SW: Auxilio al 84 65% 80%
57%
usuario 56 10% 269 49% 80 49%
39% 56 60%
SW: Mantenimiento 44 8% 313 57% 60 44 43
40 23% 32 31 27 40%
SW: configuración de 25 19 16 20%
e-mail 43 8% 356 65% 20
Impresora: 0 0%
Instalación 32 6% 388 71%
Desktop: no prende 31 6% 419 76%
Desktop: travando-
lento 27 5% 446 81%
Desktop: traslados 25 5% 471 86%
Impresora: No
imprime 19 3% 490 89%
Monitor: problema
de imagen 16 3% 506 92% Número de atendimientos Porcentaje acumulado de atendimientos
Otros 44 8% 550 100%
Ejemplo – Calidad del aire
Unidades estadísticas:
30 días del mes
Ejemplo – Calidad del aire Distribución de los días según la
Calidad del Aire
Muy Malo
Bueno
3%
10% Bueno
Calidad del Aire nj pj Moderado
Bueno 3 10.0% Malo
Malo
Moderado 14 46.7% 40%
Muy Malo
Malo 12 40.0%
Moderado
Muy Malo 1 3.3% 47%
Total general 30 100.0%
Frecuencia acumulada
Unidad estadística:
día del mes
Ejemplo – Accidentes de transito por día
Distribución de días de un mes
según las cantidad de accidentes ocurridos
15
10
Cantidad de
5
accidentes 𝒏𝒊 𝒇𝒊 𝒑𝒊 𝑷𝒊
por día 0
0 8 0.27 26.7% 26.7% 0 1 2 3 4
1 11 0.37 36.7% 63.3%
2 7 0.23 23.3% 86.7%
3 2 0.07 6.7% 93.3% Frecuencia acumuladade días
4 2 0.07 6.7% 100.0% según las cantidad de accidentes ocurridos
35
30
25
20
15
10
5
0
0 1 2 3 4
Tablas y Gráficos para variables cuantitativas
continuas
Histograma
Ojiva
Porcentaje acumulado
80% 99.02%
86.63%
60% 65.85%
40% 27.80%
20%
0%
0 4 8 12 16 20
Experiencia laboral (en años)
Polígono de frecuencias Fuente: Empresa A. Encuesta RRHH 2013
Número de alumnos
14
La altura es proporcional a la
12
10 8
7 7
frecuencia correspondiente 8
6 5
4
3
(absoluta, relativa o porcentual); 4
2
0
Los rectángulos adyacentes se [ 7.8, 8.5 ] ] 8.5 , 9.2 ] ] 9.2 , 9.9 ] ] 9.9 , 10.6 ] ] 10.6 , 11.3 ] ] 11.3 , 12.0 ] ] 12,0, 12.7 ]
Tiempo de resolución de una prueba (en minutos)
tocan entre sí.
Ejemplo – Experiencia Laboral
A partir de la tabla, Experiencia Laboral de los Obreros de la Fábrica XYZ
construya Ud. un histograma Experiencia
Fi:
fi: Ni: Número
utilizando las proporciones. mi: marca ni: número proporción
laboral proporción acumulado
de clase de obreros acumulada
(en años) de obreros de obreros
Histograma de obreros
[0;4] 2 57 0,2780 57 0,2780
Este gráfico se construye a partir de ]4;8] 6 78 0,3805 135 0,6585
una distribución de frecuencias por ] 8 ; 12 ] 10 43 0,2098 178 0,8683
intervalos. ] 12 ; 16 ] 14 25 0,1220 203 0,9903
]16 ; 20 ] 18 2 0,0098 205 1
Cada frecuencia de clase se
representa trazando un
rectángulo;
La base es el intervalo de clase
sobre el eje horizontal;
La altura es proporcional a la
frecuencia correspondiente
(absoluta, relativa o porcentual);
Los rectángulos adyacentes se
tocan entre sí.
Polígono de frecuencias
Es la representación por medio
de una figura poligonal cerrada
de una distribución de
frecuencias absolutas, relativas
o porcentuales.
Se obtiene uniendo con segmentos
de recta las marcas de clase como
abscisa y la correspondiente
frecuencia absoluta o relativa como
ordenada;
Los polígonos de frecuencias se
cierran en los puntos del eje
horizontal correspondientes al límite
inferior del primer intervalo y al
límite superior del último intervalo.
Ojiva
Es la gráfica de una distribución de Experiencia laboral de los obreros de la empresa A 100.00%
frecuencias acumuladas (absolutas, 100%
Porcentaje acumulado
60% 65.85%
abscisa y a cero como ordenada.
50%
Se obtiene uniendo con segmentos de
40%
recta los puntos con el límite superior 27.80%
30%
de cada intervalo como abscisa y la
frecuencia acumulada respectiva como 20%
ordenada. 10%
corresponden a un intervalo
determinado
Ejemplo - Anchovetas
La anchoveta es el pez más importante del ecosistema de la Corriente de Humboldt. Su
abundancia ha permitido el desarrollo y sustento de muchas otras especies de peces, aves,
mamíferos e invertebrados que hoy en día habitan en nuestro mar. Una muestra de 250
anchovetas de un año de edad ha dado una longitud mínima de 6 cm. Los datos se
muestran organizados en la tabla siguiente.
Complete la distribución de frecuencias por intervalos de las longitudes de las anchovetas.
Distribución de frecuencias del tamaño de las anchovetas
de un año de edad
Tamaño
mii nii fii Nii Fii
(centímetros)
[6,8] 7 25 0.10
0,10 25 0.10
] 8 , 10 ] 9 40 0.16 65 0.26
] 10 , 12 ] 11 115 0.46 180 0.72
] 12 , 14] 13 30 0.12 210 0.84
] 14 , 16 ] 15 30 0.12 240 0.96
0,96
] 16 , 18 ] 17 10 0.04
0,04 250 1.00
Total
Total 250 1.00
Ejemplo - Anchovetas
Histograma
½ (84 + 72) = 78 %
13
84 + ¾ (96 - 84) = 93 %
21 %
72 %
12
15.5
84 + ¾ (96 - 84) - 72 = 93 - 72 = 21 %
Ejemplo - Anchovetas
(x , y) = (x , 90)
(x1 , y1) = (14 , 84)
(x2 , y2) = (16 , 96)
90 %
90%
y-y1 y2-y1 𝑥−𝑥1 𝑥2−𝑥1
=
𝑦−𝑦1 𝑦2−𝑦1
x-x1 (𝑥2−𝑥1)(𝑦−𝑦1)
x 𝑥 = 𝑥1 +
𝑦2−𝑦1
x2-x1
2×6
𝑥 = 14 + = 15
12
3. Determine, aproximadamente, la longitud mínima que debería Respuesta: una anchoveta debe tener por lo
tener una de estas anchovetas para estar considerada dentro menos 15 centímetros para estar considerada
de las 10% más grandes. dentro de las 10% más grandes.
Problema - Prueba
800 estudiantes realizaron una prueba cuyos resultados pueden ser valores enteros de 0 a
100 puntos. A continuación, se presenta el gráfico de frecuencias acumuladas del puntaje
obtenido por los 800 estudiantes:
a. Identifique la cantidad de alumnos que
obtuvieron más de 70 puntos.
b. Identifique la mediana.
c. Si [a,b] es el intervalo que contiene
50% de los datos centrales, halle a y b
d. Construya la tabla de distribución de
frecuencias, considerando 5 intervalos.
e. Si el cuarenta por ciento de alumnos no
aprobó el examen, calcule
aproximadamente el puntaje mínimo
para aprobación.
f. Calcule el promedio aproximado del
puntaje obtenido por los 800 alumnos.