Anda di halaman 1dari 2

130 Capítulo 3 Estadística descriptiva: medidas numéricas

Se definieron la media, la mediana y la moda como medidas de la posición central. Luego


se utilizó el concepto de percentiles para describir otras posiciones en el conjunto de datos. A
continuación se presentaron el rango, el rango intercuartílico, la varianza, la desviación están-
dar y el coeficiente de variación como medidas de variabilidad o dispersión. Nuestra medida
principal de la forma de una distribución de datos fue el sesgo. Los valores negativos indican
una distribución de datos sesgada a la izquierda; los valores positivos indican una distribución
de datos sesgada a la derecha. Luego se describió cómo se usan la media y la desviación estándar
al aplicar el teorema de Chebyshev y la regla empírica para proporcionar más información sobre
la distribución de los datos e identificar observaciones atípicas.
En la sección 3.4 se muestra cómo elaborar un resumen de cinco números y un diagrama de
caja para proporcionar información simultánea sobre la ubicación, la variabilidad y la for- ma
de la distribución. En la sección 3.5 se introdujeron la covarianza y el coeficiente de co- rrelación
como medidas de asociación entre dos variables. En la sección final se explicó cómo calcular
una media ponderada, así como la media, la varianza y la desviación estándar para datos
agrupados.
Los estadísticos descriptivos estudiados pueden obtenerse por medio de software para esta-
dística y hojas de cálculo. En los apéndices del capítulo se explica cómo se usan Minitab, Excel
y StatTools para elaborar los estadísticos descriptivos que se trabajaron en este capítulo.

Glosario

Coeficiente de correlación Medida de la asociación lineal entre dos variables que toma los
valores entre "1 y #1. Los valores cercanos a #1 indican una relación lineal positiva sólida;
los valores cercanos a "1 indican una relación lineal negativa sólida, y los valores cercanos a
cero, la falta de una relación lineal.
Coeficiente de variación Medida de variabilidad relativa calculada al dividir la desviación
estándar entre la media y multiplicar por 100.
Covarianza Medida de la asociación lineal entre dos variables. Los valores positivos indican
una relación positiva; los valores negativos indican una relación negativa.
Cuartiles Los percentiles 25, 50 y 75, conocidos como primer cuartil, segundo cuartil (me-
diana) y tercer cuartil, respectivamente. Los cuartiles se usan para dividir un conjunto de datos
en cuatro partes, con cada parte conteniendo aproximadamente 25% de los datos.
Datos agrupados Datos disponibles en intervalos de clase según se resumen por una distribu-
ción de frecuencia. Los valores individuales de los datos originales no están disponibles.
Desviación estándar Medida de variabilidad calculada al tomar la raíz cuadrada positiva de
la varianza.
Diagrama de caja Resumen gráfico de los datos basado en un resumen de cinco números.
Estadístico muestral Valor numérico usado como medida de resumen para una muestra
(por ejemplo, la media muestral, x, la varianza muestral, s 2, y la desviación estándar de la
muestra, s).
Estimador puntual Los estadísticos muestrales, como x, s 2 y s, cuando se utilizan para esti-
mar el parámetro poblacional correspondiente.
Media Medida de la ubicación central calculada al resumir los valores de datos y dividir entre
el número de observaciones.
Media ponderada La media obtenida al asignar a cada observación un peso que refleje su
importancia.
Mediana Medida de la posición central proporcionada por el valor de en medio cuando los
datos se acomodan en orden ascendente.
Moda Medida de la posición, definida como el valor que ocurre con mayor frecuencia.
Observación atípica Valor de datos inusualmente pequeño o inusualmente grande.
Parámetro poblacional Valor numérico utilizado como una medida de resumen para una
población (por ejemplo, la media poblacional, µ, la varianza poblaciónal, σ 2, y la desviación
estándar de la población, σ).
Fórmulas clave 131

Percentil Valor tal que por lo menos p por ciento de las observaciones es menor o igual que
este valor, y como mínimo (100 " p) por ciento de las observaciones son mayores o iguales
que este valor. El percentil 50 es la mediana.
Rango Medida de la variabilidad definida para ser el valor mayor menos el valor menor.
Rango intercuartílico (RIC) Medida de variabilidad definida como la diferencia entre el ter-
cer y el primer cuartiles.
Regla empírica Se usa para calcular el porcentaje de valores de datos que deben estar dentro
de una, dos y tres desviaciones estándar de la media para los datos que exhiben una distribución
con forma de campana.
Resumen de cinco números Técnica de análisis exploratorio de datos que usa cinco números
para resumir los datos: valor menor, primer cuartil, mediana, tercer cuartil y valor más grande.
Sesgo Medida de la forma de una distribución de datos. Los datos sesgados a la izquierda dan
como resultado un sesgo negativo; una distribución de datos simétrica genera un sesgo de cero,
y los datos sesgados a la derecha producen un sesgo positivo.
Teoremoa de Chebyshev Se utiliza para hacer enunciados sobre la proporción de los valo-
res de datos que deben estar dentro de un número especificado de desviaciones estándar de la
media.
valor z Valor calculado al dividir la desviación con respecto a la media (xi " x) entre la des-
viación estándar s. Una puntuación z se conoce como un valor estandarizado y denota el número
de desviaciones estándar xi a partir de la media.
Varianza Medida de variabilidad basada en las desviaciones cuadradas de los valores de da-
tos con respecto a la media.

Fórmulas clave
Media muestral

!x i
x! (3.1)
n

Media poblacional

!xi
µ! (3.2)
N

Rango intercuartílico

RIC ! Q3 " Q1 (3.3)

Varianza poblacional
!(x i" !)2
σ2 ! (3.4)
N

Varianza muestral
!(x " i x) 2
s2 ! (3.5)
n"1

Desviación estándar
Desviación estándar muestral ! s ! "s 2 (3.6)
Desviación estándar poblacional ! σ ! "σ 2
(3.7)

Anda mungkin juga menyukai