Anda di halaman 1dari 9

MATERIAL FUNDAMENTAL.

3.1. Los Cuantiles

Se denominan así ciertos valores dentro de una información, que permiten dividirla en
partes iguales. Los cuantiles más usados son: Los Cuartiles (Q), los Deciles (D) y los
Percentiles (P).

3.1.1. Los Cuartiles (Q):

Se utilizan para dividir la información en cuatro (4) partes iguales, cada una de las cuales
contiene un 25 % del total de los datos. Son 4 cuartiles notados como:
Q1  Q2  Q3  y  Q4 .

3.1.2. Los Deciles (D):

Se usan para dividir una información en diez (10) partes iguales, cada una de las cuales
contiene un 10 % de los datos. Son 10 Deciles denotados como: D1  D2    D10 .

3.1.3. Los Percentiles (P):

Se usan para dividir una información en cien partes iguales, cada una de las cuales
contiene un 1 % de los datos. Son cien percentiles notados como: P1  P2  P3    P100

3.1.4. Características generales de los Cuantiles:

 Q4 ; D10 ; y P100 ; Corresponden al último dato de la Información.

 Q2 ; D5 , y P50 : Son iguales a la Mediana de la información.

Q1  P25 ; Q3  P75

D1  P10 ; D2  P20 ;...; D9  P90

Observación: Otro cuantil menos común es el Quintil: Se utiliza para dividir las
informaciones en cinco (5) partes iguales, cada una de las cuales contiene un 20 % de los
datos.
3.1.5. Cálculo de los Cuantiles en informaciones con datos sin agrupar:

El cálculo de los cuantiles, al igual que la mediana, requiere la previa ordenación de los
datos, la misma que usualmente se hace en forma ascendente, es decir del dato menor al
mayor; luego se aplica la siguiente ecuación:

kN
Ck  ; Donde: Ck =Cuantil buscado; k = De 1 a 100; N =Total de datos;
NoC

NoC = 4 Para Cuartiles; 10 para Deciles y 100 para Percentiles; con la cual se identifica la
posición en la que se encuentra el cuantil buscado y a continuación se determina el valor
correspondiente con la ayuda de la Frecuencia Acumulada.

Ejemplo

Determinar e interpretar el cuartil uno (Q3) para las edades (en años) de 7 estudiantes de
un grupo, si ellas son: 27, 34, 25, 35, 29, 30, 27.

Solución

Primero ordenamos los datos: 25, 27, 27, 29, 30, 34, 35. Ahora se ubica la posición:
P[(3x7)/4] = P[21/4] =P[5,25]; la posición 5,25 corresponde a una ubicación más allá del
dato 30 años, lo que significa que el verdadero valor del cuartil estaría entre 30 y 34 años;
la mejor manera sería establecer una ponderación entre los dos datos de acuerdo con su
frecuencia, que en este caso es 1 para cada uno, por lo que el valor más acertado del Q3,
para este caso sería [(30*1)+(,34*1)] / 2 = 32 años.

La interpretación, también puede darse en una de las siguientes formas:

El 25% de los estudiantes con mayor edad tiene entre 32 y 35 años; o también,

El 75% de los estudiantes más jóvenes en este grupo, tiene entre 27 y 32 años.
Ejemplo

Determinar e interpretar el decil 4 (D4) para las estaturas (en cms.) de 8 estudiantes de
un grupo, si ellas son (Tomadas en cms): 174; 170, 168, 178, 175, 160, 192, 173.

Solución

Se ordenan los datos: 160, 168, 170, 173, 174, 175, 178, 192

Luego se ubica la posición: P[(4x8)/10] = P[32/10] =P[3,2]; la posición 3,2 corresponde a


una ubicación entre las estaturas 170 y 173; por lo tanto, procediendo como en el ejemplo
anterior, el decil 4 será 171,5 cms.

La interpretación puede hacerse de una de las siguientes formas:

El 40% de los estudiantes con menos estatura en este grupo, miden entre 160 y 171.5 cm.;
o también;

El 60% de los estudiantes con mayor estatura en este grupo, miden entre 171,5 y 192 cm.

Ejemplo

Determinar los percentiles veinticinco (p25) y noventa (p90) para los datos de la siguiente
tabla, que contiene la cantidad de dinero (en pesos) que llevan los estudiantes de un
grupo para los gastos diarios en la institución:

Dinero en pesos fi Fa Fa%


5000 7 7 14,6%
6000 9 16 33,3%
6500 11 27 56,3%
7000 13 40 83,3%
8500 5 45 93,8%
10000 3 48 100%
Solución

En casos como estos en los que la información está distribuida y ordenada, la frecuencia
acumulada (Fa), resulta muy apropiada para la obtención de los cuantiles, en cualquiera
de las siguientes dos formas:

 De forma inmediata: Se calcula la frecuencia acumulada en forma porcentual y se


ubica el porcentaje correspondiente al cuantil buscado; para el caso el P(25)
corresponderá al dato que cubra el 25%, que es $6000; y el P(90) será el dato que
cubra el 90% de la información, es decir $8500, para este ejemplo.
 Para la segunda forma, también apoyada en la frecuencia acumulada (Fa), se debe
ubicar el dato en la posición indicada por la fórmula del literal 2.5; así: Para el
percentil veinticinco: P(25): P[(25*48)/100] = P[12], el cual corresponde a $6000,
como se puede apreciar en la columna de frecuencia acumulada (Fa) de la tabla.
Así que el percentil 25 de esta información es $6000, y coincide con el cálculo del
mismo percentil en a.
Para el percentil 90: P[(90*48)/100] = P[43,2], el cual corresponde a $8500, como
se puede apreciar en la columna de frecuencia acumulada (Fa) de la tabla. Así que
el percentil 90 de esta información es $8500, y también coincide con el cálculo del
mismo percentil en a.

La interpretación de los percentiles anteriores puede ser de las siguientes formas:

 El 25% de los estudiantes que menos dinero llevan diario para gastos en la
institución, llevan entre $5000 y $6000. O también,
 El 75% de los que más dinero llevan, gastan entre $6000 y $10000.
 El 90% de los estudiantes que menos dinero llevan diario para gastos en la
institución, llevan entre $5000 y $8500. O también,
 El 10% de los que más dinero llevan, gastan entre $8500 y $10000.
3.2. Los Gráficos de Cajas y Extensiones:

Son gráficos fundamentados en el conocimiento de la mediana, los cuartiles uno ( Q1 ) y

tres ( Q3 ) y los datos extremos de la información. Consiste de una caja limitada por los

cuartiles mencionados, a partir de los cuales se trazan dos segmentos para unir los
extremos de la información; por razones obvias, la mediana estará siempre dentro de la
caja, o en el peor de los casos se confundirá con uno de tales cuartiles. Estos gráficos se
utilizan, entre otras aplicaciones, para comparar dos o más muestras en relación con una
misma variable, particularmente para inferir diferencias entre sus respectivas medias; y
también para la identificación de valores extraños.

3.3. Las Medidas de Dispersión:

Son valores numéricos que me dan información sobre lo esparcidos o aglutinados que se
encuentran los datos correspondientes a una variable cuantitativa dentro de un estudio
estadístico. Las medidas de dispersión más usadas son:

Los Rangos: Hay varios rangos, el tradicional o común; el rango intercuartil; y el rango
percentil.

La Varianza (  2 )

Las Desviaciones: La Desviación media y la Desviación típica o Standar

3.3.1. Los Rangos

 El rango común: Se define coma la diferencia entre los datos extremos de una
variable cuantitativa, así: Dato Mayor - Dato menor.
 El rango intercuartil: Q3 - Q1; proporciona información sobre el 50 % central de la
variable.
 El rango percentil: P90 - P10; se utiliza cuando se quieren excluir algunos datos
extremos de una información; recoge información sobre el 90 % central de los
datos.
3.3.2. La Varianza

Proporciona información global sobre la forma como varían los datos; juega un papel
trascendental en la estadística inferencial cuando de hacer estimaciones se trata, ya que
del análisis de la varianza de una información cuantitativa se pueden deducir muchos
resultados sobre el comportamiento general de los parámetros de una población.

La varianza se denota como s 2 cuando se trata de muestras, y  2 cuando se trata de una


población.

 Var ( x)=  2 
 ( xi  x ) 2 f i .
n
 Como fórmula alterna de la varianza que se emplea comúnmente está:

Var (x) =
x 2
fi

x f  = x
i i 2 2
-  x
 2

n n

3.3.3. Las Desviaciones

Una desviación se define como la diferencia entre el valor del dato y alguna medida
estadística; por lo general las desviaciones más comunes se toman con respecto a la
media aritmética, pero se pueden tomar desviaciones respecto a la moda, a la mediana, o
a uno cualquiera de los cuantiles.

La Desviación Media: Se define como el promedio de las desviaciones de una variable,


tomadas en valor absoluto, con respecto a la media aritmética de la variable; en fórmula:


x xf
i i
DM 
n

La Desviación Típica o Standar: Se define como la raíz cuadrada de la varianza; se denota


como s cuando se trata de muestras, y  cuando se trata de poblaciones.

SD =  
 (x  x ) 2
fi
, para datos sin agrupar.
n

3.3.4.Coeficiente de variación

Es un valor que da información global sobre el grado de dispersión de la medida


SD
estadística utilizada, se define como : Cv =  , cuando la medida empleada es la media
x
aritmética.

3.3.5.Momentos Adimensionales:
Se definen los momentos adimensionales respecto de la media como:
mr mr mr
ar    ; donde s  m2 es la desviación típica y m2  s 2 es la
sr  m2 
r
m r
2

varianza. El momento m1 es la desviación media

3.4. Sesgo

Se define como el grado de asimetría de una distribución respecto de algún estadístico, en


particular el Sesgo más usado es el grado de asimetría respecto de la media de una
distribución. Gráficamente el sesgo se evidencia y se clasifica como positivo, si la curva
suavizada deja ver una cola a la derecha; y negativo, si la cola queda del lado izquierdo. De
otro modo, el sesgo tiene que ver con la mayor concentración de datos hacia un lado u
otro de la media.

3.4.1. Cálculo del Sesgo


Hay varias formas para determinar el sesgo, de las cuales las más comunes son:
m3 m3
 Coeficiente momento de Sesgo: a3  
s3  m2 
3
 Primer coeficiente de Sesgo de Pearson, se emplea cuando las distribuciones son
__
x  Mo
unimodales: S 
s
 Segundo coeficiente de Sesgo de Pearson, se emplea en distribuciones bimodales o

3 ( X  Med )
multimodales: S 
s
Q3  2Q2  Q1
 Coeficiente cuartil de Sesgo: S 
Q3  Q1

P90  2 P50  P10


 Coeficiente percentil de Sesgo: S 
P90  P10

3.5. La Curtosis
La curtosis mide el grado de concentración de los datos alrededor de la media.
Geométricamente se refiere a lo empinada o plana que puede ser la gráfica de una
distribución en comparación con la gráfica de la distribución normal. Si la gráfica es muy
empinada, se dice que la distribución es leptocúrtica; si es semejante a la Distribución
Normal, se dice que es mesocúrtica y si es más achatada que la normal, se dirá
planocúrtica.

3.5.1. Cálculo de la Curtosis


Al igual que el sesgo la curtosis puede calcularse de varias formas; así:
m4 m4
 Coeficiente momento de curtosis: a 4    b2 para D..Normal  3
s 4 m22

La interpretación de la curtosis bajo esta relación es la siguiente: si b2  3  0 leptocúrti ca

si b2  3  0 mesocúrtica

si b2  3  0 Planocúrti ca

Q3  Q1
2 Q3  Q1
 Coeficiente percentil de curtosis:    ; bajo esta definición,
P90  P10 2 ( P90  P10 )

la curtosis de la distribución normal corresponde a 0.263; lo que permite la


siguiente interpretación para los demás resultados:
K > 0.263; corresponderá a una distribución Leptocúrtica
K = 0.263; será una distribución normal o mesocúrtica
K < 0.263; la distribución será planocúrtica.

BIBLIOGRAFÍA

1. Montgomery, D. y Runger, George C. (2010). Probabilidad y Estadística aplicadas a la


ingeniería. 2ª. Ed. México. McGraw-Hill Interamericana.
2. Spiegel, Murray. (1992). Probabilidad y Estadística McGraw -Hill.
3. Walpole, Ronald E. y Myers, Raymond H., Probabilidad y estadística, McGraw-Hill,
México, 1992.
Se invita a los estudiantes para que no sólo se apoyen en el material aquí propuesto si no
también hacer uso de la bibliografía dada y otros materiales que sean útiles en el
aprendizaje de estos temas. Todo este material puede ser encontrado en la biblioteca
universitaria, además de los libros online a los cuales se puede tener acceso desde sus
viviendas por medio de una clave que puede ser obtenida por medio del personal de la
Biblioteca Central Universitaria.

El material aquí propuesto está debidamente autorizado para su uso. Para esta semana se
propone complementar la información en los textos:
 Bhattacharyya, Gouri K.; Johnson, Richard A. (1977) Statistical Concepts and
Methods. Ed. John Wiley and Sons Inc. Singapur
 Aparecida B., Denise; Alvarenga P., Gilberto; Galvao L., José; Kaiserlian C.
Lisbeth, Nocoes de estatística, com apoio computacional, Istituto de
Matemática e estatística – USP, Sao Paulo, Brasil, 1996.
 Daniel, Wayne W., Bioestadística. Base para el análisis de las ciencias de la
salud, UTEHA, Noriega Editores, México, 1995.

Anda mungkin juga menyukai