Anda di halaman 1dari 52

Estadı́stica Descriptiva

Unidad 2

Ing. Christian Mejı́a E., MSc.


cimejia@uce.edu.ec

Abril, 2017

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Contenido

1 Tablas y gráficas
2 Tabla de distribución de frecuencias
3 Gráficas de la teorı́a estadı́stica
1 Gráfica de distribución de frecuencias
1 Histograma
2 Polı́gono de frecuencias
3 Ojiva
2 Gráfica de dispersión
4 Gráficas de uso general
1 Gráfica de barras
2 Gráfica de lı́neas
3 Gráfica circular
4 Pictograma
5 Indicadores descriptivos
1 De posición
2 De dispersión
3 De forma
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Tablas y gráficas

La presentación de información, basada en datos estadı́sticos, se


puede realizar de varias formas, ya sean aisladas o combinadas:
Textual: simple, limitada y datos intercalados o dispersos
Cuadros o tablas: buen complemento y concentra los datos
Gráficas: mejor visualización, casi instantánea y es universal

Ejemplo:
En Estadı́stica, el procesamiento de los datos recolectados genera
información que puede ser resumida mediante la combinación de
texto, tablas y gráficas.

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Tablas y gráficas

Tabla o cuadro
Arreglo de los datos en filas y columnas.

Gráfica o diagrama
Composición de figuras geométricas de una, dos o tres dimensiones
ó imágenes pictóricas.

Propiedades:
Son herramientas útiles para organizar, resumir, ordenar y
presentar información ya sea inicial o final.
Nos permiten manejar grandes cantidades de información en
espacios reducidos.
Se pueden complementar o presentar en conjunto.

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Elaboración de tablas o cuadros

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Elaboración de tablas o cuadros

Cuadro No. 1
Encuesta sobre la Atención Telefónica a Usuarios de Pichincha
según Sector, mayo 2016.

Fuente: Departamento de Soporte Técnico


Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Elaboración de tablas o cuadros

Recomendaciones:
Debe ser lo más sencillo posible.
Si existen demasiados detalles, la tabla debe ser dividida en
dos o más, cada una enumerada.
Incluir un tı́tulo claro y conciso, separado en la parte superior
y que responda: Qué? Cómo? Dónde? Cuándo? se hizo.
El encabezamiento contiene tı́tulos y subtı́tulos de las
columnas, deben diferenciarse en su tipologı́a.
En caso de ser necesario: totales y subtotales.
Colocar un guión cuando se desconoce el dato.

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Tabla de Distribución de Frecuencias

Definición
Una Tabla de Distribución de Frecuencias (TDF) permite
ordenar y clasificar los valores que toma una variable o
caracterı́stica, indicando el número de veces que se repiten
(ocurrencia).

Tipos:
TDF para variables nominales
TDF para variables discretas
TDF para variables continuas

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Tabla de Distribución de Frecuencias

Cómo se elabora una TDF?

1 Datos originales (en 4 Contar determinar la


bruto): datos recolectados cantidad de datos que
sin organizar. Ej. Las pertenece a cada clase
estaturas de 100 (frecuencia de clase).
estudiantes. 5 Tabular los datos en clases
2 Ordenación: datos con sus respectivas
originales dispuestos en frecuencias en una TDF.
orden creciente o
Estatura (in) Cantidad de estudiantes
decreciente de magnitud. 60-62 5
63-65 18
3 Organizar distribución en 66-68 42
69-71 27
clases o categorı́as. 72-74 8

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Tabla de Distribución de Frecuencias

Definiciones
La frecuencia absoluta de un dato, ni , es el número de veces
que dicho dato se repite en el conjunto de la muestra.

La frecuencia relativa de un dato, hi , es el número de veces


que dicho dato se repite en el conjunto de la muestra,
comparado con el número total de datos, n,
ni
hi =
n
Propiedades:
1 n ≥ 0
i
Pk
2 n + n + ··· + n =
1 2 k i=1 ni = n
3 0 ≤ h ≤ 1
i
Pk
4 h + h + ··· + h =
1 2 k i=1 hi = 1
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Tabla de Distribución de Frecuencias

Sea un conjunto de datos ordenado: x1 , x2 , . . . xk . Con frecuencias


absolutas y relativas respectivas:

n1 , n2 , . . . , nk . Y h1 , h2 , . . . , hk .

Definiciones
Las frecuencias absoluta acumulada y relativa acumulada de
un dato xi se definen, respectivamente, como:
i
X i
X
Ni = nj Y H i = hj
j=1 j=1

Propiedades:
1 n = N ≤ N ≤ N ··· ≤ N
1 1 2 3 k−1 ≤ Nk = n
2 h = H ≤ H ≤ H ··· ≤ H
1 1 2 3 k−1 ≤ Hk = 1 ó 100 %
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Tabla de Distribución de Frecuencias

TDF de Variable Cualitativa Nominal

Por ejemplo se lanzan 20 agujas al azar en el fondo de un rı́o y se


registra la roca en la cual toca la aguja. Los resultados son:
Cuarzo, Cuarzo, Feldespato, Mica, Mica, .........., Cuarzo.

Variable (X) ni hi
Cuarzo 11 0.55
Feldespato 6 0.3
Mica 3 0.15
Tabla 1: Distribución de frecuencia del tipo de roca.

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Tabla de Distribución de Frecuencias

Tabla de Distribución de Frecuencias de Variable Discreta

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Tabla de Distribución de Frecuencias

TDF de Variable Cuantitativa Discreta

Por ejemplo en una mina se le pregunta a cada empleado de una


muestra de 130, el número de hijos que posee. Los resultados son:
1; 2, 0; 5; 7; 3; 1; 1; 3; . . . ; 4.

Tabla 2: Distribución de frecuencias de la variable número de hijos.

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Tabla de Distribución de Frecuencias

Tabla de Distribución de Frecuencias de Variable Continua

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Tabla de Distribución de Frecuencias

TDF de Variable Cuantitativa Continua

Por ejemplo se tomaron 68 porciones de roca para estudiar la


distribución del cobre en una mina. Los resultados (en g/tn) son:
423, 07; 452, 23; ......; 561, 34.

Tabla 3: Distribución de frecuencias de la variable ley de Cobre.

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Tabla de Distribución de Frecuencias

Resumen de los elementos de una TDF y su simbologı́a:


Tamaño poblacional ó muestra: N ó n
Valor o dato de la caracterı́stica: Xi ó xi
Frecuencia absoluta: ni
Frecuencia relativa: hi
Frecuencia absoluta acumulada: Ni
Frecuencia relativa acumulada: Hi
Número de valores de la variable o intervalos: k
Intervalo de clase i-ésimo: Xi−1 − Xi
Lı́mite inferior del intervalo: Xi−1
Lı́mite superior del intervalo: Xi
X +X
Marca de clase: Xi0 = i−12 i
Amplitud del intervalo: ci = Xi − Xi−1
Recorrido o rango de la variable: R = Xmax − Xmin
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Gráficas o diagramas

Por qué usar gráficas?


Cuando la cantidad de datos es considerable, las tablas
pueden resultar confusas.
En ocasiones los cuadros y tablas no son suficientes por sı́
solas, es necesario complementarlas con gráficas.
Permiten ver con mayor ligereza la información que se ha
querido mostrar mediante cuadros o tablas.
Son más intuitivas, aunque contengan la misma información
que la tabla.
Permiten visualizar mejor la información.
Traducen los números en gráficos o imágenes.

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Gráficas o diagramas

Importancia de las gráficas


La gráfica es considerada como el medio de expresión de la
estadı́stica más llamativo, vistoso, sugestivo, duradero en la
memoria, y que ocupa un menor tiempo de lectura e interpretación.

Observaciones:
No sustituyen al cuadro, lo complementan.
No es algo decorativo, ayuda a mostrar la información más
agradable y rápidamente.
La mejor gráfica es la más simple: tan sencilla y clara que sea
comprensible sin la ayuda de descripciones textuales.
Las lı́neas y sı́mbolos usados deben ser los estrictamente
indispensables.
En toda gráfica debe citarse la fuente de donde se obtuvieron
los datos.
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Tipos de Gráficas

Hemos dividido las gráficas en dos grupos:

1 Aquellas para el desarrollo de la teorı́a estadı́stica:


Gráfica o diagrama de distribución de frecuencias
Histogramas
Polı́gonos de frecuencias
Ojivas
Gráfica o diagrama de dispersión
2 Gráficas que vemos generalmente en diversas publicaciones
(informes, periódicos, revistas, publicidad, etc.):
Barras
Lı́neas
Circulares
Pictogramas

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Tipos de Gráficas

Gráfica de Distribución de Frecuencias:


Representa las frecuencias absolutas y relativas, incluyendo las
acumuladas con respecto a una variable nominal, discreta ó
continua.

Qué contiene?
La lı́nea vertical (ordenada) representa las frecuencias, y se debe
comenzar de cero. Las variables cualitativas ó cuantitativas van en
la lı́nea horizontal (abscisa).

Recomendaciones:
Tı́tulo que indique con claridad el contenido.
Lectura de la escala: Eje horizontal: izq. a der. Eje vertical: abajo
hacia arriba.
Si la gráfica presenta más de una variable, diferenciar por medio de
leyendas, notas o signos convencionales.
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Tipos de Gráficas

Gráfica de Distribución de Frecuencias (absoluta y relativa)


de Variable Discreta

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Tipos de Gráficas

Gráfica de Distribución de Frecuencias Acumuladas (absoluta


y relativa) de Variable Discreta

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Tipos de Gráficas

Gráfica de Distribución de Frecuencias (absoluta y relativa)


de Variable Continua

En el caso de una variable continua las gráficas de distribución de


frecuencias tienen nombre especı́fico:
Histograma: se puede analizar y estimar la tendencia de los
datos y es la primera aproximación a la
forma de distribución poblacional del conjunto de datos.
Polı́gono de frecuencias: considera la marca de clase y
permite estudiar la forma de la distribución y de frecuencias,
pudiéndose inferir la simetrı́a con relación al centro del
conjunto de datos.
Ojiva: considera cada lı́mite de clase y permite obtener de
manera aproximada el valor de la mediana.

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Histograma

Histograma
Gráfica de distribución de frecuencias donde se levantan
rectángulos proporcionales a las frecuencias de clases sobre los
intervalos del eje horizontal. Es utilizado para representar variables
continuas con amplitud constante.

Observaciones:
Las bases de los diversos intervalos deben ser iguales, por lo
que es preciso dividir (fórmula).
La apariencia cambia si se modifica el número de clases (se
√ √
recomienda n, 2 n, ó 1 + 3,3 log n)
Conviene observar: zonas de concentración de datos (una o
varias), variabilidad de los datos, simetrı́a, posibles cortes,
valores atı́picos.
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Histograma

Histograma: intervalos de clase vs. frecuencias absoluta y


relativa

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Ojiva

Ojiva: valores menores o iguales

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Ojiva

Ojiva: valores mayores o iguales

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Ojiva

Estimación de la mediana a partir de la ojiva

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Curvas de frecuencias

Curvas de frecuencia para una variable continua

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Gráfica de dispersión

Gráfica de dispersión
Denominada también como nube de puntos, utilizada para el
análisis de regresión.

Variables Peso y Estatura de una muestra

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Gráficas generales: Gráfica de barras

Gráfica o diagrama de barras


La variable está representada por un rectángulo cuya altura
corresponde a su frecuencia absoluta o relativa.

Vehı́culos fabricados en la UE en 2015

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Gráfica circular

Gráfica circular, sectores o pastel


Se dibuja sobre un cı́rculo sectores donde el ángulo central es
proporcional al valor que represente.

Vehı́culos fabricados en la UE en 2015

Nota: conveniente para variables cualitativas y que no presentan numerosos aspectos.

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Pictograma

Pictograma
La variable está representada por un dibujo alusivo a su significado
y magnitud.

Vehı́culos fabricados en la UE en 2015

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Gráfica de lı́neas

Gráfica de lı́neas
Útiles para las denominadas series de tiempo o cronológicas,
donde se representa una o más variables en función del tiempo
(años, meses, dı́as, etc.)

Serie de tiempo de nuevos casos de diabetes por año

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Indicadores estadı́sticos descriptivos

Definición
Los indicadores estadı́sticos o medidas numéricas de un conjunto
de datos son números calculados a partir de los mismos, y que
resumen el propio conjunto. Estos indicadores reciben el nombre de
estadı́sticos de la muestra.

Se clasifican en:
Medidas de posición
Tendencia central: media, mediana, moda
No centrales: percentiles, cuartiles, quintiles
Medidas de dispersión
Varianza
Desviación estándar
Coeficiente de variación
Medidas de forma
Coeficiente de asimetrı́a
Curtosis
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Medidas de posición: tendencia central

Media aritmética
Suma de los valores observados dividida por el número total de
observaciones.
Pn
x1 + x2 + x3 + ... + xn i=1 xi
x= =
n n
Propiedades:
Es única.
Sólo tiene sentido para datos cuantitativos.
No tiene que ser un valor del conjunto de datos.
En su cálculo intervienen todos los datos.
Pn
i=1 (xi − x) = 0

Inconvenientes:
Es sensible a la presencia de valores atı́picos.
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Medidas de posición: tendencia central

La media aritmética para datos agrupados de una variable


continua:
Pk 0
Pk 0 k
i=1 ni xi i=1 ni xi
X
x̄ag = Pk = = hi xi0
i=1 ni
n
i=1

El cálculo de la media a través de la tabla de frecuencias genera un


error en relación a la media de los datos originales, puesto que la
marca de clase es un representante de cada intervalo. Dicho error
se denomina error de agrupación:

x̄ − xag
|Eag | = | | ∗ 100 %

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Medidas de posición: tendencia central

Mediana: Me
Es un valor central, divide el conjunto ordenado de los datos en
dos grupos con el mismo número de elementos. Para obtener la
mediana los datos se ordenan en forma creciente o decreciente.

Me = x n+1 , si n es impar
2

X n +X n +1
Me = 2
2
2
, si n es par

Propiedades:
Es única.
Siempre es un valor observado de la variable.
En su cálculo no intervienen todos los datos.
Más robusta frente a la presencia de valores atı́picos.
Se puede hallar en variables cuantitativas y cualitativas.
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Medidas de posición: tendencia central

Moda o valor modal: Mo


Es aquel valor de la variable de mayor frecuencia, es decir, que
más veces se repite.

Propiedades:
No es única, si es dos (bimodal), más de dos (multimodal).
Siempre es un valor observado de la variable.
Puede utilizarse para datos cualitativos y cuantitativos.
En su cálculo no intervienen todos los datos.

Ventaja:
Indica el punto de mayor concentración, algunos la consideran
como la mejor medida de tendencia central.

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Medidas de posición: no centrales

Percentiles
Son los valores de la variable que dividen en cien partes iguales a
la distribución.

Cuartiles
Son los valores de la variable que dividen la distribución en cuatro
partes iguales.

Deciles
Son los valores de la variable que dividen la distribución en diez
partes iguales.

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Medidas de posición: no centrales

Ejemplos:
La mediana de un conjunto de datos es el percentil 50.
Los percentiles 25, 50, y 75 conforman los cuartiles, y junto
con el mı́nimo y máximo dividen a los datos en cuatro grupos
que contienen, cada uno de ellos, el 25 % de los mismos.
El percentil 40 es aquel valor que xupera el 40 % de los datos
y a la vez es superado por el 60 %.
El 1er cuartil es aquel valor que supera el 25 % de los datos y
a la vez es superado por el 75 %.
El 2do cuartil es aquel valor que supera el 50 % de los datos y
a la vez es superado por el 50 % (es la mediana).
El 7mo decil es aquel valor que supera el 70 % de los datos y
a la vez es superado por el 30 %.
El 2do cuartil, el 5to decil y el percentil 50 en una misma
distribución equivalen al mismo valor: la mediana.
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Medidas de dispersión

Varianza
Es un promedio de los cuadrados de las distancias de todos los
datos a la media.
Media aritmética de los cuadrados de las diferencias (desviaciones)
entre los valores que toma la variable y su media aritmética.

Simbologı́a:
Pn 2
i=1 (xi −x)
Muestra: s 2 = n ; Población: σ 2

Propiedades:
Es la más utilizada de las medidas de variación.
En su cálculo intervienen todos los datos.
Más robusta frente a la presencia de valores atı́picos.
No es fácil su interpretación debido a sus unidades.
s2 ≥ 0
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Medidas de dispersión

La varianza para datos agrupados de una variable continua:

Pk 0 2
Pk 0 k
i=1 ni (xi − x̄ag ) − x̄ag )2 X
i=1 ni (xi
s 2
ag = Pk = ≈ hi (xi0 −x̄ag )2
( i=1 ni ) − 1 n−1
i=1

El error de agrupación para la varianza:

s 2 − s 2 ag
|Eag | = | | ∗ 100 %
s2

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Medidas de dispersión

Desviación estándar
La desviación estándar o tı́pica es la raı́z cuadrada de la varianza.


r Pn
i=1 (xi − x)2
s= s2 =
n
Propiedades:
Tiene las mismas unidades que la variable analizada
Para su cálculo previamente se requiere la varianza
A > varianza > dispersión
A > desviación estándar > dispersión
Ambas son mayor o igual a cero

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Medidas de dispersión

La desviación estándar para datos agrupados de una variable


continua:
q
sag = s 2 ag

El error de agrupación para la desviación estándar:

s − sag
|Eag | = | | ∗ 100 %
s

Se puede decir que los datos están bien agrupados si el error de


agrupación presenta valores menores al 30 %, medianamente bien
agrupados si éste se encuentra entre 30 % y 70 %, y un deficiente
agrupamiento para errores mayores a 70 %.

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Medidas de dispersión

Coeficiente de variación: CV
Permite estimar la relación porcentual entre el valor de la media y
la desviación estándar.

En la Muestra:
s
CV = ∗ 100 %

En la Población:
σ
CV = ∗ 100 %
µ
Siempre que x̄ 6= 0 y µ 6= 0

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Medidas de dispersión

Como una guı́a para la interpretación del CV se tiene que:

CV ≤ 30 %: el conjunto de datos es poco variable u


homogéneo con relación a la media.
30 % < CV ≤ 70 %: el conjunto de datos es variable o
heterogéneo con relación a la media.
CV > 70 %: el conjunto de datos es muy variable o
muy heterogéneo con relación a la media.

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Medidas de forma

Coeficiente de asimetrı́a
Denominado también como sesgo. Indica el grado de simetrı́a o
falta de simetrı́a de la distribución.

x − Mo
As =
s
Propiedades:
As = 0: simetrı́a perfecta (distribución normal)
As < 0: distribución ligeramente asimétrica
As > 0: asimetrı́a notoria
El signo positivo indica asimetrı́a con cola a la derecha
El signo negativo indica asimetrı́a con cola hacia la izquierda

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Medidas de forma

Opciones de asimetrı́a en la distribución de frecuencias

(a) Asimetrı́a perfecta, distribución normal


(b) Asimetrı́a positiva, cola hacia la derecha, sesgo positivo
(c) Asimetrı́a negativa, cola hacia la izquierda, sesgo negativo

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Medidas de forma

Coeficiente de curtosis
Es el grado de apuntamiento de una distribución.

Pn
i=1 (xi − x)4
k=
ns 4

Propiedades:
k = 0,263: distribución mesocúrtica o normal
k > 0,263: distribución leptocúrtica
k < 0,263: distribución platicúrtica

Estadı́stica 2. Estadı́stica Descriptiva


Estadı́stica Descriptiva
Medidas de forma

Opciones del coeficiente de curtosis

Estadı́stica 2. Estadı́stica Descriptiva

Anda mungkin juga menyukai