DESCRIPTIVA
Estadística Descriptiva: Es la parte de la estadística que trata solamente de
describir y analizar un grupo dado sin sacar conclusiones o inferencias de un
grupo mayor, a partir de ella. La estadística descriptiva incluye las técnicas que
se relacionan con el resumen y la descripción de datos numéricos. Estos datos
pueden ser gráficos o pueden incluir análisis computacional.
Parámetro y estadístico
Un parámetro es una característica específica de una
población.
Un estadístico es una característica específica de
una muestra.
CARACTERISTICAS VENTAJAS INCONVENIENTES
Sencillo y de fácil
Requiere que se posea de
comprensión.
antemano un listado
Se selecciona una muestra de Cálculo rápido de medias y completo de toda la
tamaño n de una población de N varianzas. población. Cuando se
Aleatorio simple unidades, cada elemento tiene trabaja con muestras
Se basa en la teoría
una probabilidad de inclusión pequeñas es posible que
estadística, y por tanto
igual y conocida de n/N. no represente a la
existen paquetes
población
informáticos para analizar
adecuadamente.
los datos
Donde:
N = Población
n= muestra
p= nivel de confianza
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) ¿Cuál es el estadístico?
d) ¿Es el valor de 6,1 horas un parámetro o un estadístico?
ESTADÍSTICA DESCRIPTIVA
Todo estudio estadístico debe considerar
diferentes tipos de variables:
Variables
Variables cualitativas
Variables Cuantitativas
ESTADÍSTICA DESCRIPTIVA
Variables cualitativas:
Relacionadas con
características no numéricas
de un individuo (por ejemplo:
atributos de una persona,
nacionalidad, color de la piel,
sexo).
ESTADÍSTICA DESCRIPTIVA
Variables Cuantitativas: Relacionadas
con características numéricas del
individuo por ejemplo: edad, precio
de un producto, ingresos anuales.
Las variables cuantitativas se dividen
en discretas (aquellas que pueden
tomar solo algunos valores en un
intervalo y no valores intermedio,
ejemplo: edad, número de hermanos
que puede ser 1, 2, 3....,etc, pero,
por ejemplo, nunca podrá ser 3,45) o
continuas (aquellas que pueden
tomar cualquier valor en un intervalo
real, ejemplo: alturas, la velocidad
de un vehículo puede ser 80,3 km/h,
94,57 km/h...etc.).
ESTADÍSTICA DESCRIPTIVA
ESCALA DE MEDICIÓN DE VARIABLES
ESCALA DEFINICIÓN EJEMPLO
Redondeando:
2 4 1 3 2 5
3 1 3 4 1 1
1 5 3 1 2 3
2 1 5 3 4 2
3 4 1 2 5 5
Tipo III.- Se crea una tabla de intervalos ya que el tamaño de la
población o muestra es grande y el rango de la variable también.
Ejemplo:
Consideremos los siguientes datos, expresados en
metros, correspondientes a las estaturas de 50
estudiantes de Cuarto año de Educación Media.
67 72 81 72 74 83 84
88 92 75 84 86 73 84
87 83 81 77 73 75 78
77 67 83 83 72 71 85
93 82 69 70 81 66 76
75 80 79 84 86 80 77
80 76 88 75 79 87 79
77
ESTADÍSTICA DESCRIPTIVA
Ordenando la Información
Al ordenar datos muy numerosos, es
usual agruparlos en clases o categorías.
Al determinar cuántos pertenecen a
cada clase, establecemos la frecuencia.
Construimos así una tabla de datos
llamada tabla de frecuencias.
Es el tercer proceso es la distribución de datos ó de frecuencias la cual
es la presentación de cuadros o tablas estadísticas. El objetivo principal
de una distribución de frecuencias consiste en presentar los datos de un
modo que facilite su comprensión e interpretación.
Frecuencia Absoluta.
Frecuencia Absoluta Acumulada
Frecuencia Relativa.
Frecuencia relativa Acumulada
Frecuencia Porcentual.
Frecuencia Acumulada.
Marca de Clase
VARIABLE FRECUENCIA
ABSOLUTA
La frecuencia absoluta, es el número de
AHORRO F
veces que se repite un determinado valor
09-12 18 o una determinado atributo de la variable.
13-15 26 Está influida por el tamaño de la muestra,
16-18 7 al aumentar el tamaño de la muestra
19-21 4 aumentará también el tamaño de la
22-24 1
frecuencia absoluta y la suma de las
frecuencias absolutas debe ser igual al
25-27 4 . número total de los datos en estudio.
Total 60
Tabla de Datos de la encuesta
del ahorro mensual de acuerdo
al salario que perciben los
trabajadores.
La frecuencia relativa consiste en la proporción del número total de
datos que aparece en cada intervalo, la suma de la frecuencia es
siempre la unidad (1).
Se obtiene al dividir la frecuencia absoluta de cada intervalo entre el
número total de datos o elementos del conjunto.
La frecuencia relativa también se expresa, en ocasiones, en tanto por
ciento
PORCENTAJE = ( F / N ) X 100
Ó
PORCENTAJE = FR X 100
FRECUENCIA FRECUENCIA
VARIABLE
ABSOLUTA ACUMULADA La frecuencia acumulada, indica cómo se
AHORRO F FA van concentrando los datos de un valor de
09-10 18 18 cada intervalo o una determinada modalidad
13-15 26 44 del atributo. Puede incluir a cualquiera de las
frecuencias: absoluta, relativa o porcentual;
16-18 7 51
sugiriendo se calcule sólo la que sea
19-21 4 55 necesaria para los fines de la investigación.
22-24 1 56
25-27 4 60
Total 60
Tabla de Datos de la encuesta
del ahorro mensual de acuerdo
al salario que perciben los
trabajadores.
Ejemplo de Tablas de tipo II (Variable cuantitativa continua)
Frecuencia Frecuencia
Frecuencia Frecuencia
absoluta Relativa
Variables Absoluta Relativa
acumulada Acumulada
(fi) (hi)
(Fi) (Hi)
X1 f1 F1 = f1 hi = H1=h1
X2 f2 F2 = f1 + f2 hi = H2 = h1 + h2
… … … … …
Xi fi Fi = hi = Hi =
… … … … …
Xk fk Fk = Hk = Hk =
Total N 1
La marca de clase, solo es aplicable a datos agrupados y es:
9 - 12 10.5
Marca
Intervalos de clase
de Clase
Con clasificación continua
X
Ejemplo de Tablas de tipo III (Variable Cuantitativa Discreta)
Marca de
clase Frecuenc Frecuencia Frecuencia
Frecuenci
Variable X ia absoluta Relativa
MC a Relativa
s Absoluta acumulada Acumulada
(hi)
(fi) (Fi) (Hi)
X1 =
[a0, a1 ) f1 F1 = f1 hi = H1=h1
X2 =
[a1, a2 ) f2 F2 = f1 + f2 hi = H2 = h1 + h2
… … … … … …
Xi =
[ai-0, ai) fi Fi = hi = Hi =
… … … … …
[ak-1, ak) Xk= fk Fk = Hk = Hk =
Total N 1
FRECUEN FRECUEN FRECUEN FRECUEN FRECUEN
MARCA CIA CIA CIA CIA CIA
VARIABLE DE REL.
CLASE ABSOLUT ABS.ACU PORCENT
RELATIVA ACUMULA
A MULADA UAL
DA
AHOR
MC fi Fi hi Hi %
RO
9-12 10,5 18 18 0,3 0.3 30
13-15 14 26 44 0,43 0.73 42
16-18 17 7 51 0,12 0.85 12
19-21 20 4 55 0,07 0.92 7
22-24 23 1 56 0,02 0.94 2
25-27 26 4 60 0,07 1 7
Se ha realizado
MARCAuna encuesta a 60 personas a las que se les
haTotal DE
preguntado 60 1 100
CLASE cuanto dinero ahorran mensualmente de
acuerdo al salario que perciben, obteniéndose los siguientes
resultados
Ejercicios: Con las siguientes tablas Completar la Distribución de
Frecuencias.
1.- El número de calificaciones sobre 5 de los estudiantes de Estadística
obtenidas durante el presente módulo son las siguientes:
Realice la tabla de distribución de frecuencias.
2 4 1 3 2 5
3 1 3 4 1 1
1 5 3 1 2 3
2 1 5 3 4 2
3 4 1 2 5 5
Frecuencia Frecuencia
Frecuencia Frecuencia
absoluta Relativa
Variables Absoluta Relativa
acumulada Acumulada
(fi) (hi)
(Fi) (Hi)
Total 1
2.- Las notas obtenidas por los estudiantes de la carrera de Educación Básica
de la Universidad Indoamérica son las siguientes:
2 3 4 1 8 4 10 8
5 3 8 7 4 1 3 1
8 2 5 10 8 7 8 3
5 7 4 6 10 6 7 4
5 7 2 10 7 6 9 5
Total 1
Las gráficas se basa por completo en una tabla de datos y sirve
para visualizar la forma de distribución de los datos, porque
permite mostrar, explicar, interpretar y describir de manera
sencilla, clara y efectiva, los datos estadísticos mediante formas
geométricas tales como líneas, áreas, volúmenes.
POLIGONOS DE
HISTOGRAMA FRECUENCIA
DIAGRAMA DE OJIVA
BARRAS SECTORIAL
Se considera uno de las más sencillas y útiles de representar
los datos cuantitativos (numéricas)
Representa a los niveles de medición ordinal, de intervalo o
de razón
Se puede graficar con la frecuencia: absoluta, porcentual ó
relativa, según los objetivos de la investigación
F
Fig. No. 1 Histograma Ahorro (pesos mexicanos)
r
e 30
c 20
u 10 Cuantitativa
e 0
n 1
i
a
Intervalo
Es una gráfica más utilizada por su sencillez, para representar las
características cuantitativas (numérica) y cualitativas (no numérica)
Representa a los niveles de medición nominal u ordinal
Se puede graficar con la frecuencia: absoluta, porcentual o relativa
30
25
Fig. No. 2 Diagrama de
20
15 Barras Percepción del ahorro
10 (pesos mexicanos)
5
0
Baja Muy Regular Alta Muy alta
baja
Cualitativa
Categor ia
Se utilizada para representar principalmente variables
cualitativas (no numéricas)
Representa al nivel de medición nominal
Se puede graficar con la frecuencia: porcentual o relativa
Resultan adecuado cuando hay pocos valores
MUY BAJO
Fig. No. 3 Gráfica sectorial
BAJO
Ahorro (pesos mexicanos)
REGULAR
ALTO
MUY ALTO Cualitativas
Porcentajes
Se utiliza para representar principalmente variables
cuantitativas (numéricas)
Representa al nivel de medición de intervalo o de razón
Se puede graficar con la frecuencia: marca de clase
F
r
0,50
e
0,40
c Fig. No. 4 Polígono de
0,30
u Frecuencia
0,20
e Ahorro (pesos mexicanos)
0,10
n 0,00
c 9-12 13-15 16-18 19-21
i 22-24 25-27
a
Los polígonos de frecuencia pueden emplearse
asimismo para representar frecuencia acumulada
que en tal caso resulta designar como ojiva.
Es aplicable a variables ordinales.
Representa a la distribución de frecuencias
acumuladas, sean absolutas, porcentuales o relativas.
Es una gráfica ascendente.
70
60
50 Fig. No. 5 Ojiva
40
Ahorro (pesos mexicanos)
30
20
10
0
9 * 12 13 * 15 16 * 18 19 * 21 22 * 24 25 - 27
Nivel de colesterol en la sangre de una muestra de hombres
estadounidenses que tienen entre 25 y 34 años de edad , que fueron
atendidos en centros médicos de New York y sufren de hipertensión
arterial , en el año 2001
¿Qué se mide?
160-200 44
200-240 29
240-280 9
Para calcular la media aritmética de un conjunto de datos, se suma cada uno de los
valores y se divide entre el total de casos.
Sea X una variable estadística que toma los valores , con frecuencias absolutas ,
respectivamente, la media viene dada por:
n
x1 f 1 x 2 f 2 ... x n f n
x
i 1
i fi
x
f 1 f 2 ... f n n
f
i 1
i
Propiedades de la Media aritmética
10 18 25 32 12 5 7 7
10 18 25 32 12 5 7 7
x
8
CALIFICACIÓN FRECUENCIA
Xi . f i
Xi fi
1 8 8
2 6 12
3 7 21
4 4 16
5 5 25
TOTAL 30 82
Xifi
X i 1
= 2.73
Xmci. fi
i 1
X
n
= 28.5
Sea X una variable por lo menos ordinal y sea x1, x2,…xn una muestra de
tamaño n de observaciones de la variable, se define como Mediana "Me" un
valor tal que supera a no más del 50% de las observaciones y es superado
por no más del 50% de las observaciones, cuando estas han sido
ordenadas según magnitud.
5 7 7 10 12 18 25 32
Como la cantidad de datos es par, entonces la mediana
corresponde al promedio de los datos centrales, por lo tanto la
mediana es 11.
Propiedades de la mediana
-No utiliza todos los elementos
-Se puede calcular con datos ordinales
-Se ve menos afectada por datos atípicos que la media
aritmética.
-Minimiza la suma de diferencias en valor absoluto
(recordad que la media aritmética minimizaba la suma de
diferencias en términos cuadráticos)
Ejemplo uso de la mediana
Los 9 empleados de una nueva empresa viven al
lado de la Nacional 340 en diferentes kilómetros:
Núm. Emp. 3 2 1 2 1
Km 1 4 5 6 26
Dado que todos viajan en coche, y sabiendo que quieres minimizar el coste
en gasolina, ¿en qué lugar pondrías la empresa para minimizar tal coste?
MEDIANA PARA DATOS TABULADOS
P= n/2 TIm = 29 - 21
P = 30/2 TIm = 8
P= 15
X = Lmin +
X = 21 +
X = 26.333
Moda o Modo (Mo) para datos no tabulados
La moda se identifica al observar el valor que se presenta con más
frecuencia en la distribución.
Si consideramos el ejemplo del peso de una muestra de
personas:
65 76 48 48 68 78 90 87 67 72 78
Mo = 48 kilos
Mo = 78 kilos.
Esto significa que la mayoría de estas personas pesa 48 kilos y 78 kilos.
Esta distribución es bimodal.
Cuartiles:
Se llaman cuartiles a tres valores que dividen a la serie de datos en cuatro partes
iguales.
( cuartil primero, cuartil segundo y cuartil tercero )
Quintiles:
Se llaman quintiles a cuatro valores que dividen a la serie en cinco partes iguales.
( quintil primero,... )
Deciles:
Nueve valores iguales que dividen la distribución en 10 partes iguales.
( decil primero,...)
Percentiles:
Noventa y nueve valores que dividen la serie en 100 partes iguales.
( percentil primero,... )
i = np / 100
MEDIDAS DE TENDENCIA CENTRAL
Si la distribución es
asimétrica cola a la
izquierda :
MEDIDAS DE VARIABILIDAD
• LA VARIANZA
Es una medida del grado de dispersión o
variación de los valores de una variable con
respecto a su media aritmética.
MEDIDAS DE VARIABILIDAD
• Varianza de Datos No n
_ 2
agrupados xi x
i 1
s
2
n 1
• Varianza de Datos _ 2
k
Agrupados ni X i x
s 2 i 1
n
MEDIDAS DE VARIABILIDAD
• LA DESVIACION ESTANDAR
• Desviación Estándar de 2
n
_
Datos No agrupados i
x x
s i 1
n 1
• Desviación Estándar de
Datos Agrupados 2
k
_
ni i
x x
s i 1
n
MEDIDAS DE VARIABILIDAD
• COEFICIENTE DE VARIACION
Proporciona una estimación de la magnitud de
las desviaciones con respecto a la media
Es útil para comparar la variabilidad de dos o
mas series de datos que tengan distintas
unidades de medida y/o distintas medias
aritméticas.
MEDIDAS DE VARIABILIDAD
• COEFICIENTE DE VARIACION
S S
C.V. o C.V. x100%
X X