Se denominan así ciertos valores dentro de una información, que permiten dividirla en
partes iguales. Los cuantiles más usados son: Los Cuartiles (Q), los Deciles (D) y los
Percentiles (P).
Se utilizan para dividir la información en cuatro (4) partes iguales, cada una de las cuales
contiene un 25 % del total de los datos. Son 4 cuartiles notados como:
Q1 Q2 Q3 y Q4 .
Se usan para dividir una información en diez (10) partes iguales, cada una de las cuales
contiene un 10 % de los datos. Son 10 Deciles denotados como: D1 D2 D10 .
Se usan para dividir una información en cien partes iguales, cada una de las cuales
contiene un 1 % de los datos. Son cien percentiles notados como: P1 P2 P3 P100
Q1 P25 ; Q3 P75
D1 P10 ; D2 P20 ;...; D9 P90
Observación: Otro cuantil menos común es el Quintil: Se utiliza para dividir las
informaciones en cinco (5) partes iguales, cada una de las cuales contiene un 20 % de los
datos.
3.1.5. Cálculo de los Cuantiles en informaciones con datos sin agrupar:
El cálculo de los cuantiles, al igual que la mediana, requiere la previa ordenación de los
datos, la misma que usualmente se hace en forma ascendente, es decir del dato menor al
mayor; luego se aplica la siguiente ecuación:
kN
Ck ; Donde: Ck =Cuantil buscado; k = De 1 a 100; N =Total de datos;
NoC
NoC = 4 Para Cuartiles; 10 para Deciles y 100 para Percentiles; con la cual se identifica la
posición en la que se encuentra el cuantil buscado y a continuación se determina el valor
correspondiente con la ayuda de la Frecuencia Acumulada.
Ejemplo
Determinar e interpretar el cuartil uno (Q3) para las edades (en años) de 7 estudiantes de
un grupo, si ellas son: 27, 34, 25, 35, 29, 30, 27.
Solución
Primero ordenamos los datos: 25, 27, 27, 29, 30, 34, 35. Ahora se ubica la posición:
P[(3x7)/4] = P[21/4] =P[5,25]; la posición 5,25 corresponde a una ubicación más allá del
dato 30 años, lo que significa que el verdadero valor del cuartil estaría entre 30 y 34 años;
la mejor manera sería establecer una ponderación entre los dos datos de acuerdo con su
frecuencia, que en este caso es 1 para cada uno, por lo que el valor más acertado del Q3,
para este caso sería [(30*1)+(,34*1)] / 2 = 32 años.
El 25% de los estudiantes con mayor edad tiene entre 32 y 35 años; o también,
El 75% de los estudiantes más jóvenes en este grupo, tiene entre 27 y 32 años.
Ejemplo
Determinar e interpretar el decil 4 (D4) para las estaturas (en cms.) de 8 estudiantes de
un grupo, si ellas son (Tomadas en cms): 174; 170, 168, 178, 175, 160, 192, 173.
Solución
Se ordenan los datos: 160, 168, 170, 173, 174, 175, 178, 192
El 40% de los estudiantes con menos estatura en este grupo, miden entre 160 y 171.5 cm.;
o también;
El 60% de los estudiantes con mayor estatura en este grupo, miden entre 171,5 y 192 cm.
Ejemplo
Determinar los percentiles veinticinco (p25) y noventa (p90) para los datos de la siguiente
tabla, que contiene la cantidad de dinero (en pesos) que llevan los estudiantes de un
grupo para los gastos diarios en la institución:
En casos como estos en los que la información está distribuida y ordenada, la frecuencia
acumulada (Fa), resulta muy apropiada para la obtención de los cuantiles, en cualquiera
de las siguientes dos formas:
El 25% de los estudiantes que menos dinero llevan diario para gastos en la
institución, llevan entre $5000 y $6000. O también,
El 75% de los que más dinero llevan, gastan entre $6000 y $10000.
El 90% de los estudiantes que menos dinero llevan diario para gastos en la
institución, llevan entre $5000 y $8500. O también,
El 10% de los que más dinero llevan, gastan entre $8500 y $10000.
3.2. Los Gráficos de Cajas y Extensiones:
tres ( Q3 ) y los datos extremos de la información. Consiste de una caja limitada por los
cuartiles mencionados, a partir de los cuales se trazan dos segmentos para unir los
extremos de la información; por razones obvias, la mediana estará siempre dentro de la
caja, o en el peor de los casos se confundirá con uno de tales cuartiles. Estos gráficos se
utilizan, entre otras aplicaciones, para comparar dos o más muestras en relación con una
misma variable, particularmente para inferir diferencias entre sus respectivas medias; y
también para la identificación de valores extraños.
Son valores numéricos que me dan información sobre lo esparcidos o aglutinados que se
encuentran los datos correspondientes a una variable cuantitativa dentro de un estudio
estadístico. Las medidas de dispersión más usadas son:
Los Rangos: Hay varios rangos, el tradicional o común; el rango intercuartil; y el rango
percentil.
La Varianza ( 2 )
El rango común: Se define coma la diferencia entre los datos extremos de una
variable cuantitativa, así: Dato Mayor - Dato menor.
El rango intercuartil: Q3 - Q1; proporciona información sobre el 50 % central de la
variable.
El rango percentil: P90 - P10; se utiliza cuando se quieren excluir algunos datos
extremos de una información; recoge información sobre el 90 % central de los
datos.
3.3.2. La Varianza
Proporciona información global sobre la forma como varían los datos; juega un papel
trascendental en la estadística inferencial cuando de hacer estimaciones se trata, ya que
del análisis de la varianza de una información cuantitativa se pueden deducir muchos
resultados sobre el comportamiento general de los parámetros de una población.
Var ( x)= 2
( xi x ) 2 f i .
n
Como fórmula alterna de la varianza que se emplea comúnmente está:
Var (x) =
x 2
fi
x f = x
i i 2 2
- x
2
n n
Una desviación se define como la diferencia entre el valor del dato y alguna medida
estadística; por lo general las desviaciones más comunes se toman con respecto a la
media aritmética, pero se pueden tomar desviaciones respecto a la moda, a la mediana, o
a uno cualquiera de los cuantiles.
x xf
i i
DM
n
SD =
(x x ) 2
fi
, para datos sin agrupar.
n
3.3.4.Coeficiente de variación
3.3.5.Momentos Adimensionales:
Se definen los momentos adimensionales respecto de la media como:
mr mr mr
ar ; donde s m2 es la desviación típica y m2 s 2 es la
sr m2
r
m r
2
3.4. Sesgo
3 ( X Med )
multimodales: S
s
Q3 2Q2 Q1
Coeficiente cuartil de Sesgo: S
Q3 Q1
3.5. La Curtosis
La curtosis mide el grado de concentración de los datos alrededor de la media.
Geométricamente se refiere a lo empinada o plana que puede ser la gráfica de una
distribución en comparación con la gráfica de la distribución normal. Si la gráfica es muy
empinada, se dice que la distribución es leptocúrtica; si es semejante a la Distribución
Normal, se dice que es mesocúrtica y si es más achatada que la normal, se dirá
planocúrtica.
si b2 3 0 mesocúrtica
si b2 3 0 Planocúrti ca
Q3 Q1
2 Q3 Q1
Coeficiente percentil de curtosis: ; bajo esta definición,
P90 P10 2 ( P90 P10 )
BIBLIOGRAFÍA
El material aquí propuesto está debidamente autorizado para su uso. Para esta semana se
propone complementar la información en los textos:
Bhattacharyya, Gouri K.; Johnson, Richard A. (1977) Statistical Concepts and
Methods. Ed. John Wiley and Sons Inc. Singapur
Aparecida B., Denise; Alvarenga P., Gilberto; Galvao L., José; Kaiserlian C.
Lisbeth, Nocoes de estatística, com apoio computacional, Istituto de
Matemática e estatística – USP, Sao Paulo, Brasil, 1996.
Daniel, Wayne W., Bioestadística. Base para el análisis de las ciencias de la
salud, UTEHA, Noriega Editores, México, 1995.