Anda di halaman 1dari 3

Divulgación

Media, varianza y desviación estándar

Pedro Cervantes-Hernández *

2
La media ( X en adelante) y la varianza (ó en Dentro de su estructura matemática, la
adelante) son estadísticos que se estiman a ecuación 1 no proporciona información acerca
partir de una o varias muestras obtenidas del por qué X es una medida de posición
de una población (Sharon 1999). La X es central. Para abordar lo anterior, se utilizó la
clasificada según Pérez (2002), como una Figura 1, que muestra una dispersión espacial
2
medida de posición central y la ó como una de datos hipotéticos y que en este caso, cada
medida de dispersión. uno de éstos con respecto al total, serán
2
La mayoría de las funciones estadísticas descritos en términos de X , ó y ó. Para
(univariadas, multivariadas y bayesianas) que realizar lo antes mencionado, inicialmente
se utilizan para describir y modelar datos, se plantea la siguiente pregunta: ¿a partir de
frecuentemente consideran dentro de su qué sitio en la Figura 1 se procederá con la
2
estructura matemática a X y ó , resaltando la descripción de lo datos?
importancia de éstas en el ámbito estadístico. La respuesta a la pregunta anterior, está en
Sin embargo, lo anterior, en ocasiones, no es asociación a la manera de cómo en 1607 los
bien reconocido y comprendido a plenitud, ingleses, desde la diminuta aldea de
debido a una falta de claridad e interpretación Jamestown, Virginia, Estados Unidos (un sitio
que se tiene de sus conceptos. Una de las económico estratégico), comenzaron a
causas, que han propiciado lo anterior, se debe explorar las tierras interiores de América del
a que en la mayoría de los libros estadísticos Norte, para detectar y seleccionar las más
dichos conceptos, al igual que la desviación fértiles y prosperas, culminando en 1733, con
estándar (ó en adelante), son abordados el establecimiento de las 13 colonias a lo largo
únicamente a nivel de función, sin considerar de la costa del Atlántico, desde New
una explicación alterna que permita aclarar su Hampshire hasta Georgia (Anónimo 2008).
importancia y aplicabilidad filosófica. La relación entre el ejemplo anterior y la
En este trabajo se utilizaron los conceptos Figura 1, se halla a que para el primero caso,
de X , ó2 y ó descritos en Pérez (2002), los fue necesario establecer un sitio estratégico
cuales fueron complementados, añadiendo mediante el cual se organizaron y ejecutaron
una breve explicación concerniente a la las exploraciones a las tierras interiores de
importancia y aplicación de las funciones América del Norte. Este sitio estratégico se
respectivas. equiparó a establecer un punto de referencia 2008, XII (34): 29-36
Para una población de tamaño N, X se dentro de la dispersión espacial, en el segundo
define como la suma de todos los valores o caso, con base en el cual y de manera ordenada,
datos (Xi) dividida por el número total de éstos se procederá a realizar la descripción de todos
ó Ni, la función que cuantifica a X es: y cada uno de los datos con respecto al total.
Este punto de referencia se estima con base en
n
la función 1 y su posición dentro de la
å
X
Ciencia y Mar

i
i=
1
(1) dispersión espacial (Fig. 1), está confinado al
X=
N

* Universidad del Mar, Instituto de Recursos, Ciudad Universitaria, campus Puerto Ángel, Apdo. Postal 47, Puerto Ángel, Oaxaca, 70902,
México.
Correo electrónico: pch@angel.umar.mx

29
sitio en donde se concentra la mayor cantidad con respecto a X , la ecuación que cuantifica a
de datos; por tanto, debido a las características ó2 es:
antes señaladas, a X se le clasifica como una
medida de posición central según Pérez (2002). n
La descripción de los datos consiste en 2

estimar el valor de la distancia que existe entre 2 i=


1
å
(X -
X) i
(2)
s =
cada Xi con respecto a X (Fig. 2). La razón N
práctica de este cálculo, radica en conocer
cuáles y cuántos de los Xi están cercanos y/o
alejados de X . Sin embargo, debido a que La Figura 2 muestra la explicación alterna,
algunos de estos pueden estar mucho más que permite aclarar el concepto implícito en la
cercanos y/o alejados que otros con respecto ecuación 2. El valor particular de una distancia
a X . Se presenta un problema de posición, o desviación entre Xi con respecto a X , se
ocasionado por la relatividad de la distancia. estima con base en el numerador ( X i - X) ,
(ecuación 2), en este caso, representado por
una línea recta en la Figura 2. Meyer (1973)
señaló que una de las propiedades de ó2 es ser
positiva, razón por la que el residuo anterior
X ) 2 . Dado
es elevado al cuadrado, esto es: ( X i -
que se debe estimar el total de las distancias
para obtener el promedio de dispersión, se
aplica al numerador la sumatoria desde x= i a n
y finalmente, éste se divide entre N datos
(ecuación 2).

Figura 1. Dispersión espacial de datos hipotéticos.


Círculos pequeños = datos ó Xi, círculo
negro = X , círculo mayor (zona con mayor
cantidad de datos).

Para solucionar el problema anterior, es


2008, XII (34): 29-31

preferible considerar un promedio de


Figura 2. Dispersión espacial de datos hipotéticos.
dispersión de todos los Xi con respecto a X ; Líneas = distancias o desviaciones.
de manera que, a partir de éste, se cuantifique
un porcentaje de datos cercanos y/o alejados
2
de X . A este promedio de dispersión se ó en la ecuación 1 toma valores entre cero y
le conoce como ó 2 y de acuerdo con Meyer uno, un valor cercano o igual a cero, indica que
(1973), el proceso por el cual es estimado se le en promedio los datos se encuentran más
Ciencia y Mar

denomina “análisis de las desviaciones” o cercanos a X ; mientras que, un valor cercano


“análisis de dispersión”. o igual a uno, indica que en promedio éstos se
Para una poblacion de tamaño N, ó2 es una encuentran lejanos a X . Sin embargo, en la
medida de dispersión de los valores o datos Xi, práctica, estos valores no ocurren

30 Cervantes-Hernández
comúnmente, predominando valores un intervalo de confianza se estima de la
intermedios; razón por la cual, persiste la siguiente manera: X ± (k ó), donde k es el
incertidumbre de cuáles y cuántos de estos número de veces que ó se aleja de X . Para un
datos están más cercanos y/o alejados de X . valor de k = 1.3, el intervalo de confianza
La solución al problema anterior, tiene es: X ± (1.3 ó) y de acuerdo con Tchebysheff,
su fundamento en el concepto de la desviación éste incluye el 41% de los datos; esto es:
2 2
estándar ( ó ) o la raíz cuadrada de ó según (1-1/1.3 )=0.408.
Mendenhall & Reinmuth (1981). La ó se utiliza Por acuerdo internacional, el intervalo de
para cuantificar un intervalo de confianza o confianza se debe de cuantificar
límite de dispersión, dentro del cual los Xi unificadamente o de manera estándar (de ahí
incluidos se consideran cercanos a X , el término desviación estándar), con un valor
mientras que fuera de éste se les considera de k= 1.96, esto es: X ± (1.9 ó), que genera un
alejados (Fig. 3). De acuerdo con esto, los intervalo al 95%. Este acuerdo es considerado
2
límites de confianza se colocan sobre de ó , en todos los software de aplicación estadística,
para describir lo antes señalado. con opciones a modificar, según las
Los límites de confianza se cuantifican con necesidades que se requieran en el análisis y
descripción de los datos.

Agradecimientos

Se agradecen los comentarios y sugerencias de


Margarito Álvarez Rubio (ICMyL, UNAM).
(a)
Referencias

Anónimo. 2008. Trece Colonias. Consultado en junio de


2008: http://es.wikipedia.org/wiki/13_colonias
Mendenhall, W. & J.E. Reinmuth. 1981. Estadística para
administración y economía. Grupo Editorial
(b) Iberoamericana, México, 707 pp.
Meyer, P.L. 1973. Probabilidad y aplicaciones
Intervalo de confianza estadísticas. 2a ed., Addison Wesley Iberoamericana,
ó México, 480 pp.
Promedio de dispersión Pérez, C. 2002. Estadística aplicada a través de Excel.
ó2 Prentice Hall, Madrid, 616 pp.
Sharon, L. 1999. Muestreo, diseño y análisis.
International Thomson Editores, México, 480 pp.
Figura 3. Dispersión espacial de datos hipotéticos
con proyección a un diagrama estadístico de 2008, XII (34): 29-31
caja (a), señalando al intervalo de confianza (b) y
2
el promedio de dispersión ó . Círculo negro =X

base en el teorema de Tchebysheff en


Mendenhall & Reinmuth (1981). Esto es: dado
un número k mayor o igual a 1 y un conjunto
Ciencia y Mar

2
de observaciones X1, X2, ... Xn, al menos (1-1/k )
de éstas caen dentro de k desviaciones
estándar de la media.
La definición anterior hace referencia a que

Media, varianza y desviación estándar... 31