Anda di halaman 1dari 12

1

Introduccin

El presente trabajo hace referencia a la estadstica en el anlisis de datos


de negocios, que concierne a la materia. La estadstica se refiere a las tcnicas,
mediante las cuales se recopilan, organizan y analizan daros cuantitativos.

Por otra parte segn Samuelson, Koopmans y Stone econometra es: El anlisis
cuantitativo de fenmenos econmicos actuales, basado en el desarrollo
congruente de teora y observaciones, y relacionado por mtodos apropiados de
inferencia.' Esto implica matemtica, estadstica y economa cuantitativa.

Los cuatro conceptos indispensables en la descripcin de un conjunto de datos


son: Medidas de Tendencia Central, Medidas de Posicin, Medidas de Dispersin
y Variabilidad, y Forma de la Distribucin.

Lo que vamos a mostrar y desarrollar en el trabajo son las Medidas de


variabilidad que son valores numricos que describen el grado de dispersin, o
variabilidad de los datos, y por lo tanto, ellas toman valores ms altos cuanto ms
disgregados o esparcidos estn los datos. Estas medidas de variabilidad se dan,
una vez determinada la posicin central de las observaciones.
2

Medidas de Variabilidad

1. Medidas de variabilidad en conjuntos de datos.-

Las medidas de tendencia central son tiles para identificar el valor tpico en un
conjunto de datos. En contraste, las medidas de variabilidad se ocupan de
describir la variabilidad entre los valores. Estn disponibles diversas tcnicas para
medir la magnitud de la variabilidad en conjunto de datos. Las que se describen en
este tema son: rango, rangos modificados, desviacin media, varianza, desviacin
estndar y coeficiente de variacin.

2. El Rango.-

El rango, R, es la diferencia entre los valores mayor y menor del conjunto de


datos. As, cuando My representa el mayor valor del grupo y Mn representa el
menor, el rango de los datos no agrupados es:

R = My Mn

Ejemplo 1.- Durante un mes determinado del verano, los ocho vendedores de
aparatos elctricos de una empresa vendieron el siguiente nmero de
ventiladores: 8, 11, 5, 14, 8, 11, 16, 11. El rango del nmero de unidades vendidas
es:
R = My Mn = 16 5 = 11.0 unidades

3. Rangos Modificados.-

Un rango modificado es un rango para el cual se elimina cierto porcentaje de los


valores en cada uno de los extremos de la distribucin. Algunos rangos
modificados son: el 50% central, el 80% central y el 90% central.

El procedimiento mediante el cual se determina un rango modificado consiste,


primero, en ubicar los dos puntos percentiles adecuados para, despus calcular la
diferencia entre los valores que se encuentran en esos puntos. Por ejemplo, para
el rango del 80% central, los puntos percentiles apropiados son el dcimo percentil
y el nonagsimo percentil, porque el 80% central de esos valores se ubica entre
esos dos puntos.

Ejemplo 2.- Los datos de las ventas de aparatos elctricos que se presentaron en
el ejemplo 1, son, en orden ascendente: 5, 8, 8, 11, 11, 11, 14, 16. Para calcular el
rango del 50% central, en primer lugar se determinan los valores de los puntos
percentiles adecuados y despus se resta el valor menor del mayor.

P75 =X[(75 n/100)+(1/2)] = X[6+(1/2)] =X6.5 = 12.5


P25 =X[(25 n/100)+(1/2)] = X[2+(1/2)] =X2. = 8.0
R 50% central = P75 P25 =12.5 8.0 = 4.5 unid.
3

4. La desviacin media.-

La desviacin media DM se basa en la diferencia entre el valor absoluto de cada


uno de los elementos conjuntos de datos y la media del grupo. Despus, se
calcula la meia de esas desviaciones. Si se calculara la media por la suma de las
diferencias positivas y negativas entre cada valor y la media aritmtica, la
respuesta sera, siempre igual a 0. Por esta razn, son los valores absolutos de
las diferencias lo que se suma.

DM poblacional = | X |
N

DM muestral = | X X |
N
Ejemplo 3.- Para los datos de ventas de aparatos elctricos que se dieron en el
ejemplo 1, la media aritmtica es 10.5. Utilizando los clculos de la tabla 4.1, se
determina la desviacin media de la siguiente manera:

DM = | X | =
21.0
= 2.625 = 2.6 unid
N 8

Tabla 4.1 Hoja de trabajo para calcular la desviacin media de los datos de ventas

X Xu IXu]
5 -5.5 5.5
8 -2.5 2.5
8 -2.5 2.5
11 0.5 0.5
11 0.5 0.5
11 0.5 0.5
14 3.5 3.5
16 3.5 5.5
------
Total 21.0

As, puede decirse que, en promedio, las ventas de aparatos elctricos por
vendedor difieren en 2.6 unidades de la media del grupo, en cualquier direccin.

5. La varianza y la desviacin estndar.

La varianza es similar a la desviacin media porque se basa en la diferencia entre


cada uno de los valores del conjunto de datos y la media del grupo. La diferencia
consiste en que, antes de sumarlas, se eleva la cuadrado cada una de las
diferencias. Para una poblacin, se representa la varianza mediante v(X) , en
forma ms tpica, mediante la letra 2 (que se lee sigma cuadrada); la frmula
es:
V (X) = 2 = (( X ) )
2

N
4

A diferencia de otras estadsticas muestrales que se han analizado, la varianza de


una muestra no es, en trminos de clculo, completamente equivalente a la
varianza de la poblacin. Para este caso, el denominador de la frmula de la
varianza muestral es ligeramente diferente. En esencia, lo que se incluye en la
frmula es un factor de correccin, para que la varianza muestral sea un estimador
insesgado para la varianza de la poblacin. La varianza muestral se representa
mediante s^2; su frmula es:

s2 = (( X ) ) 2

Por lo general, resulta difcil interpretar el significado del valor de una varianza
porque las unidades en las que se expresa son valores al cuadrado. En parte por
esta razn, se utiliza con mayor frecuencia la raz cuadrada de la varianza
representada mediante la letra griega o ( s para una muestra) y se le denomina
desviacin estndar. Las frmulas son:

Desviacin estndar poblacional:

= ( X ) ) 2

Desviacin estndar muestral:

s = (X X ) 2

n 1

La desviacin estndar es especialmete til cuando se le utiliza junto con la


denominada distribucin normal.

Ejemplo 4.- Para los datos de ventas de aparatos elctricos dados en ejemplo 1, la
media aritmtica es 10.5 unidades. Considerando que estos datos mensuales de
ventas son la poblacin estadstica de inters, se determina la desviacin estndar
con base en los clculos de la Tabla 4.2, de la manera siguiente:

= ( X ) ) 2

=
86
= 10.75 = 3.3
N 8
5

Tabla 4.2 Hoja de trabajo para calcular la desviacin estndar poblacional para los
datos de ventas.

X X-u (X u)^2
5 -5.5 30.25
8 -2.5 6.25
8 -2.5 6.25
11 0.5 0.25
11 0.5 0.25
11 0.5 0.25
14 3.5 12.25
16 5.5 30.25
------------
Total 86.00

6. Clculos abreviados de la varianza y la desviacin estndar.-

A las frmulas del anterior subttulo se les denomina frmulas de desviaciones


porque, en cada caso, se deben determinar las desviaciones de los valores
individuales con respecto a la media grupal. Existen formas alternativas ya que
son matemticamente equivalentes, pero que no requieren del clculo de cada
una de las desviaciones. Debido a que, por lo general, es ms fcil utilizar estas
frmulas para realizar clculos, se les denomina frmulas abreviadas.

Las frmulas abreviadas son:

Varianza poblacional:

=
2 X 2
N 2
N

Desviacin estndar poblacional:

= X 2
N 2
N

Varianza muestral:

s2 = X nX 2
2

n 1

Desviacin estndar muestral:

s = X 2
nX 2
n 1
6

Ejemplo 5. Enseguida, se calcula la desviacin estndar de la poblacin de datos


de ventas de aparatos elctricos que se presentaron en el ejemplo 1, utilizando la
frmula abreviada alternativa y la tabla 4.3 para ilustrar que la respuesta es la
misma que se obtuvo mediante la frmula de desviacin en el ejemplo 4. La media
para esos datos es 10.5 unidades.

= X 2
N 2 = 968 8(10.5) 2 = 10,75
= 3.3 unidades
N 8

Tabla 4.3 Hoja de trabajo para calcular la desviacin estndar poblacional para los
datos de ventas

X X^2
5 25
8 64
8 64
11 121
11 121
11 121
14 196
16 256
----------
Total 968

7. Uso de la desviacin estndar.-

La desviacin estndar es la medida de dispersin ms importante, ya que se le


utiliza junto con varios de los mtodos de inferencia estadstica. En anlisis
estadstico a una curva de frecuencias con estas caractersticas se le denomina
curva normal. Para una distribucin que tiene distribucin normal, se sabe que
aproximadamente el 68% de las mediciones se encuentran a no ms de una
desviacin estndar de la media y que aproximadamente 95% de las mediciones
se encuentran a no ms de dos desviaciones estndar de la media. Esas
observaciones se presentan en los diagramas de las figuras 4 1 (a) y (b),
respectivamente.
7

Ejemplo 6. Se observa que las cuentas por energa elctrica en un rea


residencial, para un mes determinado, tienen una distribucin normal. Si se
determina que la media de los consumos es de $8 400, con una desviacin
estndar de $2 400, entonces puede conclurse que el 68% de las cuentas por
consumo de energa elctrica se encuentran a no ms de $2400 de la media, lo
que es lo mismo, entre $6 000 y $10 800. Tambin puede conclurse que
aproximadamente 95% de las cuentas se encuentran a no ms de $4 800 de la
media entre $3 600 y $13 200.

F F

68%
95%

X
X
- 1 + 1 - 2 + 2

Fig 4- 1

8. Coeficiente de Variacin.

El coeficiente de variacin, CV, indica la magnitud relativa de la desviacin


estndar con respecto a la media de la distribucin, as, las frmulas son:

Poblacin:

CV =

Muestra: s
CV= X

El coeficiente de variacin es til cuando se desea comparar la variabilidad de 2


conjuntos de datos con respecto al nivel general de los valores de cada conjunto.
8

Ejemplo 7. Para dos acciones comunes de empresas de la industria electrnica, el


precio promedio de cierre en el mercado de valores durante un mes fue, para la
accin A, de $1500, con desviacin estndar de $500. Para la accin B, el precio
promedio fue de $ 5000 con desviacin estndar de $300. Haciendo una
comparacin absoluta, result ser superior la variabilidad en el precio de la accin
A debido a que muestra una mayor desviacin estndar. Pero, con respecto al
nivel de precios, deben compararse los respectivos coeficientes de variacin:

500
CV(A) = = = 0.033
1500

300
CV(B) = = 0.060
1500

Por ello, puede concluirse que el precio de la accin B ha sido 2 veces ms


variable de la accin A.

9. Coeficiente de asimetra de Pearson.-

El coeficiente de asimetra de Pearson mide la desviacin de la simetra,


expresando la diferencia entre la media y la mediana con respecto a la desviacin
estndar del grupo de mediciones. Las frmulas son:

Asimetra poblacional = 3( Med )


3( X * Med )
Asimetra de la muestra = s

Para una distribucin simtrica, el valor del coeficiente de asimetra es siempre 0,


porque la media y la mediana son iguales. Para una distribucin con asimetra
positiva, la media es siempre mayor que la mediana y, por ello, el valor del
coeficiente es positivo. Para una distribucin con asimetra negativa, la media es
siempre menor que la mediana y, por ello, el valor del coeficiente es negativo.

Ejemplo 8. Para los datos de ventas de aparatos elctricos del ejemplo 1, la media
es 10.5 unidades, la mediana es 11.0 unidades y la desviacin estndar es 3.3
unidades. El coeficiente de asimetra es:

3( Med ) 3(10.5 11.0)


Asimetra = = = - 0.45
3.3
9

As, la distribucin de las unidades vendidas tiene una ligera asimetra negativa,
es decir, est sesgada hacia la izquierda.

10. El rango y los rangos modificados para datos agrupados.-

Para datos agrupados en una distribucin de frecuencias, por lo general se define


el rango como la diferencia entre el lmite exacto superior de la clase ms alta,
Ls(A), y el lmite inferior de la clase ms baja, Li(B). As, el rango para los datos
agrupados es:

R = Ls (A) - L1 (B)

Ejemplo 9. Los datos agrupados de la tabla 4.4 provienen de la distribucin de


frecuencias de los salarios diarios de 100 trabajadores no calificados. El rango es:

R = Ls (A) - L1 (B) C = $3599.50 2399.50 = $ 1200

Tabla 4.4 Salarios diarios para 100 trabajadores no calificados.

Salario diario Lmites exactos de Nmero de Frecuencia


clase trabajadores (f) acumulada (fa)
$ 2400-2599 $2399.50-2599.50 7 7
$2600-2799 $2599.50-2799.50 20 27
$2800-2999 $2799.50-2999.50 33 60
$3000-3199 $2999.50-3199.50 25 85
$3200-3399 $3199.50-3399.50 11 96
$3400-3599 $3399.50-3599.50 4 100
--------
Total 100

11. La desviacin media para datos agrupados.-

Para los datos agrupados en una distribucin de frecuencias, se asume que el


punto medio de cada clase representa a todas las mediciones incluidas en esa
clase. Este es el mismo enfoque que se utiliz al determinar la media aritmtica
para datos agrupados.

As:

DM poblacional = ( f | X |)
N

DM muestral = ( f | X X |)
n
10

Ejemplo 11. Para los datos de salarios diarios que se presentan en la tabla 4.4, la
media aritmtica es $2 949.50

La desviacin media se determina de la siguiente manera, a partir de los clculos


de la Tabla 4.5

DM = ( f | X X |) =
19600
= $ 196
n 100

Tabla 4.5 Hoja de trabajo para calcular la desviacin media para datos agrupados

Salario diario Punto medio Nmero de IXXI fIXXI


de clase (X) trabajadores (f)
$2400-2599 $2499.50 7 $450 $3150
$2600-2799 $2699.50 20 $250 $5000
$2800-2999 $2899.50 33 $50 $1650
$3000-3199 $3099.50 25 $150 $3750
$3200-3399 $3299.50 11 $350 $3850
$3400-3599 $3499.50 4 $550 $2200
------- ----------
Total 100 Total $19600

12. La varianza y la desviacin estndar para datos agrupados.-

Para datos agrupados en una distribucin de frecuencias, se asume que el punto


medio de cada clase representa a todas las mediciones includas en esa clase.
Este es el mismo enfoque que se utiliz al calcular la desviacin media en el punto
11. Por ello, las frmulas para datos de muestras y de poblaciones agrupados,
son:

f (X )2
Varianza poblacional: 2 = N

Varianza muestral: s =
2 f (X X ) 2*

n 1
Las frmulas para la desviacin estndar de datos muestrales y poblacionales
agrupados son:

Desviacin estndar poblacional:


= f ( X ) 2

N
11

Desviacin estndar muestral:


f (X X ) 2

s= n 1

Ejemplo 12. Para los datos de salarios diarios que se presentan en el ejemplo 9, la
media muestral es $2 949.50. De la tabla 4.6, la desviacin estndar muestral para
estos datos agrupados se determina de la siguiente manera:

Tabla 4.6 Hoja de trabajo para calcular la desviacin estndar muestral para datos
agrupados.

Salario Punto medio Nmero de X-X (X X)^2 f(X X)^2


diario de clase (X) trabajadores
2400-2599 2499.50 7 -450 202 500 1 417 500
2600-2799 2699.50 20 -250 62 500 1 250 000
2800-2999 2899.50 33 -50 2 500 82 500
3000-3199 3099.50 25 150 22 500 562 500
3200-3399 3299.50 11 350 122 500 1 347 500
3400-3599 3499.50 4 550 302 500 1 210 000
------- --------------
Total 100 5 870 000

Entonces:
s= f (X X ) 2
= 5870000 = $ 243.50
n 1 99

Para datos agrupados, las frmulas de clculo abreviadas son:

Varianza poblacional: 2 = f (X )2
N

Varianza muestral: s2 = f (X X ) 2*

n 1

Desviacin estndar poblacional: = f ( X ) 2

Desviacin estndar muestral: s= f (X X ) 2

n 1
12

Conclusiones

Al tratar de describir un conjunto de datos nos encontramos con el problema


de decidir cules de las medidas deben usarse para caracterizar su distribucin.
Un criterio para la eleccin de estas medidas ser el nivel de medicin de la
variable. Las medidas de variacin o dispersin nos ayuda a describir la
variabilidad entre valores segn tcnicas.

Aunque las frmulas de datos agrupados son tiles si los datos obtenidos de
fuentes secundarias estn disponibles slo en forma de distribuciones de
frecuencias, al agrupacin de datos para simplifica clculos para estos conjuntos
grandes de datos ya no es necesario debido a la disponibilidad de computadoras.
Existen programas de cmputo que permiten calcular diversas medidas de
variabilidad.

Bibliografa

- Estadstica aplicada a la Administracin y Economa

Segunda Edicin

Leonard Kazmier

Alfredo Daz Mata

Anda mungkin juga menyukai