Unidad 2
Abril, 2017
1 Tablas y gráficas
2 Tabla de distribución de frecuencias
3 Gráficas de la teorı́a estadı́stica
1 Gráfica de distribución de frecuencias
1 Histograma
2 Polı́gono de frecuencias
3 Ojiva
2 Gráfica de dispersión
4 Gráficas de uso general
1 Gráfica de barras
2 Gráfica de lı́neas
3 Gráfica circular
4 Pictograma
5 Indicadores descriptivos
1 De posición
2 De dispersión
3 De forma
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Tablas y gráficas
Ejemplo:
En Estadı́stica, el procesamiento de los datos recolectados genera
información que puede ser resumida mediante la combinación de
texto, tablas y gráficas.
Tabla o cuadro
Arreglo de los datos en filas y columnas.
Gráfica o diagrama
Composición de figuras geométricas de una, dos o tres dimensiones
ó imágenes pictóricas.
Propiedades:
Son herramientas útiles para organizar, resumir, ordenar y
presentar información ya sea inicial o final.
Nos permiten manejar grandes cantidades de información en
espacios reducidos.
Se pueden complementar o presentar en conjunto.
Cuadro No. 1
Encuesta sobre la Atención Telefónica a Usuarios de Pichincha
según Sector, mayo 2016.
Recomendaciones:
Debe ser lo más sencillo posible.
Si existen demasiados detalles, la tabla debe ser dividida en
dos o más, cada una enumerada.
Incluir un tı́tulo claro y conciso, separado en la parte superior
y que responda: Qué? Cómo? Dónde? Cuándo? se hizo.
El encabezamiento contiene tı́tulos y subtı́tulos de las
columnas, deben diferenciarse en su tipologı́a.
En caso de ser necesario: totales y subtotales.
Colocar un guión cuando se desconoce el dato.
Definición
Una Tabla de Distribución de Frecuencias (TDF) permite
ordenar y clasificar los valores que toma una variable o
caracterı́stica, indicando el número de veces que se repiten
(ocurrencia).
Tipos:
TDF para variables nominales
TDF para variables discretas
TDF para variables continuas
Definiciones
La frecuencia absoluta de un dato, ni , es el número de veces
que dicho dato se repite en el conjunto de la muestra.
n1 , n2 , . . . , nk . Y h1 , h2 , . . . , hk .
Definiciones
Las frecuencias absoluta acumulada y relativa acumulada de
un dato xi se definen, respectivamente, como:
i
X i
X
Ni = nj Y H i = hj
j=1 j=1
Propiedades:
1 n = N ≤ N ≤ N ··· ≤ N
1 1 2 3 k−1 ≤ Nk = n
2 h = H ≤ H ≤ H ··· ≤ H
1 1 2 3 k−1 ≤ Hk = 1 ó 100 %
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Tabla de Distribución de Frecuencias
Variable (X) ni hi
Cuarzo 11 0.55
Feldespato 6 0.3
Mica 3 0.15
Tabla 1: Distribución de frecuencia del tipo de roca.
Observaciones:
No sustituyen al cuadro, lo complementan.
No es algo decorativo, ayuda a mostrar la información más
agradable y rápidamente.
La mejor gráfica es la más simple: tan sencilla y clara que sea
comprensible sin la ayuda de descripciones textuales.
Las lı́neas y sı́mbolos usados deben ser los estrictamente
indispensables.
En toda gráfica debe citarse la fuente de donde se obtuvieron
los datos.
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Tipos de Gráficas
Qué contiene?
La lı́nea vertical (ordenada) representa las frecuencias, y se debe
comenzar de cero. Las variables cualitativas ó cuantitativas van en
la lı́nea horizontal (abscisa).
Recomendaciones:
Tı́tulo que indique con claridad el contenido.
Lectura de la escala: Eje horizontal: izq. a der. Eje vertical: abajo
hacia arriba.
Si la gráfica presenta más de una variable, diferenciar por medio de
leyendas, notas o signos convencionales.
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Tipos de Gráficas
Histograma
Gráfica de distribución de frecuencias donde se levantan
rectángulos proporcionales a las frecuencias de clases sobre los
intervalos del eje horizontal. Es utilizado para representar variables
continuas con amplitud constante.
Observaciones:
Las bases de los diversos intervalos deben ser iguales, por lo
que es preciso dividir (fórmula).
La apariencia cambia si se modifica el número de clases (se
√ √
recomienda n, 2 n, ó 1 + 3,3 log n)
Conviene observar: zonas de concentración de datos (una o
varias), variabilidad de los datos, simetrı́a, posibles cortes,
valores atı́picos.
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Histograma
Gráfica de dispersión
Denominada también como nube de puntos, utilizada para el
análisis de regresión.
Pictograma
La variable está representada por un dibujo alusivo a su significado
y magnitud.
Gráfica de lı́neas
Útiles para las denominadas series de tiempo o cronológicas,
donde se representa una o más variables en función del tiempo
(años, meses, dı́as, etc.)
Definición
Los indicadores estadı́sticos o medidas numéricas de un conjunto
de datos son números calculados a partir de los mismos, y que
resumen el propio conjunto. Estos indicadores reciben el nombre de
estadı́sticos de la muestra.
Se clasifican en:
Medidas de posición
Tendencia central: media, mediana, moda
No centrales: percentiles, cuartiles, quintiles
Medidas de dispersión
Varianza
Desviación estándar
Coeficiente de variación
Medidas de forma
Coeficiente de asimetrı́a
Curtosis
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Medidas de posición: tendencia central
Media aritmética
Suma de los valores observados dividida por el número total de
observaciones.
Pn
x1 + x2 + x3 + ... + xn i=1 xi
x= =
n n
Propiedades:
Es única.
Sólo tiene sentido para datos cuantitativos.
No tiene que ser un valor del conjunto de datos.
En su cálculo intervienen todos los datos.
Pn
i=1 (xi − x) = 0
Inconvenientes:
Es sensible a la presencia de valores atı́picos.
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Medidas de posición: tendencia central
x̄ − xag
|Eag | = | | ∗ 100 %
x̄
Mediana: Me
Es un valor central, divide el conjunto ordenado de los datos en
dos grupos con el mismo número de elementos. Para obtener la
mediana los datos se ordenan en forma creciente o decreciente.
Me = x n+1 , si n es impar
2
X n +X n +1
Me = 2
2
2
, si n es par
Propiedades:
Es única.
Siempre es un valor observado de la variable.
En su cálculo no intervienen todos los datos.
Más robusta frente a la presencia de valores atı́picos.
Se puede hallar en variables cuantitativas y cualitativas.
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Medidas de posición: tendencia central
Propiedades:
No es única, si es dos (bimodal), más de dos (multimodal).
Siempre es un valor observado de la variable.
Puede utilizarse para datos cualitativos y cuantitativos.
En su cálculo no intervienen todos los datos.
Ventaja:
Indica el punto de mayor concentración, algunos la consideran
como la mejor medida de tendencia central.
Percentiles
Son los valores de la variable que dividen en cien partes iguales a
la distribución.
Cuartiles
Son los valores de la variable que dividen la distribución en cuatro
partes iguales.
Deciles
Son los valores de la variable que dividen la distribución en diez
partes iguales.
Ejemplos:
La mediana de un conjunto de datos es el percentil 50.
Los percentiles 25, 50, y 75 conforman los cuartiles, y junto
con el mı́nimo y máximo dividen a los datos en cuatro grupos
que contienen, cada uno de ellos, el 25 % de los mismos.
El percentil 40 es aquel valor que xupera el 40 % de los datos
y a la vez es superado por el 60 %.
El 1er cuartil es aquel valor que supera el 25 % de los datos y
a la vez es superado por el 75 %.
El 2do cuartil es aquel valor que supera el 50 % de los datos y
a la vez es superado por el 50 % (es la mediana).
El 7mo decil es aquel valor que supera el 70 % de los datos y
a la vez es superado por el 30 %.
El 2do cuartil, el 5to decil y el percentil 50 en una misma
distribución equivalen al mismo valor: la mediana.
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Medidas de dispersión
Varianza
Es un promedio de los cuadrados de las distancias de todos los
datos a la media.
Media aritmética de los cuadrados de las diferencias (desviaciones)
entre los valores que toma la variable y su media aritmética.
Simbologı́a:
Pn 2
i=1 (xi −x)
Muestra: s 2 = n ; Población: σ 2
Propiedades:
Es la más utilizada de las medidas de variación.
En su cálculo intervienen todos los datos.
Más robusta frente a la presencia de valores atı́picos.
No es fácil su interpretación debido a sus unidades.
s2 ≥ 0
Estadı́stica 2. Estadı́stica Descriptiva
Estadı́stica Descriptiva
Medidas de dispersión
Pk 0 2
Pk 0 k
i=1 ni (xi − x̄ag ) − x̄ag )2 X
i=1 ni (xi
s 2
ag = Pk = ≈ hi (xi0 −x̄ag )2
( i=1 ni ) − 1 n−1
i=1
s 2 − s 2 ag
|Eag | = | | ∗ 100 %
s2
Desviación estándar
La desviación estándar o tı́pica es la raı́z cuadrada de la varianza.
√
r Pn
i=1 (xi − x)2
s= s2 =
n
Propiedades:
Tiene las mismas unidades que la variable analizada
Para su cálculo previamente se requiere la varianza
A > varianza > dispersión
A > desviación estándar > dispersión
Ambas son mayor o igual a cero
s − sag
|Eag | = | | ∗ 100 %
s
Coeficiente de variación: CV
Permite estimar la relación porcentual entre el valor de la media y
la desviación estándar.
En la Muestra:
s
CV = ∗ 100 %
x̄
En la Población:
σ
CV = ∗ 100 %
µ
Siempre que x̄ 6= 0 y µ 6= 0
Coeficiente de asimetrı́a
Denominado también como sesgo. Indica el grado de simetrı́a o
falta de simetrı́a de la distribución.
x − Mo
As =
s
Propiedades:
As = 0: simetrı́a perfecta (distribución normal)
As < 0: distribución ligeramente asimétrica
As > 0: asimetrı́a notoria
El signo positivo indica asimetrı́a con cola a la derecha
El signo negativo indica asimetrı́a con cola hacia la izquierda
Coeficiente de curtosis
Es el grado de apuntamiento de una distribución.
Pn
i=1 (xi − x)4
k=
ns 4
Propiedades:
k = 0,263: distribución mesocúrtica o normal
k > 0,263: distribución leptocúrtica
k < 0,263: distribución platicúrtica