Una variable estadstica es una caracterstica que puede fluctuar y cuya variacin es
susceptible de adoptar diferentes valores, los cuales pueden medirse u observarse.
Las variables adquieren valor cuando se relacionan con otras variables, es decir, si
forman parte de una hiptesis o de una teora. En este caso se las denomina constructos
o construcciones hipotticas.
Cualitativa Nominal
Cualitativa Ordinal
Cuantitativa Continua
Cuantitativa Discreta
Variables cualitativas
Son el tipo de variables que como su nombre lo indica expresan distintas cualidades,
caractersticas o modalidad. Cada modalidad que se presenta se denomina atributo o
categora, y la medicin consiste en una clasificacin de dichos atributos.
Las variables cualitativas pueden ser dicotmicas cuando slo pueden tomar dos valores
posibles, como s y no, hombre y mujer o ser politmicas cuando pueden adquirir tres o
ms valores. Dentro de ellas podemos distinguir:
Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a
un criterio de orden, como por ejemplo los colores.
Variables cuantitativas
Son las variables que toman como argumento cantidades numricas, son variables
matemticas. Las variables cuantitativas adems pueden ser:
Tipos de frecuencias
Frecuencia Absoluta
Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula)
que se lee suma o sumatoria.
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
mximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30,
31, 30, 31, 34, 33, 33, 29, 29.
27 1
28 2
29 6
30 7
31 8
32 3
33 3
34 1
31
Frecuencia Acumulada
Ejemplo
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29,
30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
xi fi Fi
27 1 1
28 2 3
29 6 9
30 7 16
31 8 24
33 3 30
34 1 31
31
Frecuencia Relativa
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes
temperaturas mximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29,
30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
xi fi ni
27 1 0.032
28 2 0.065
29 6 0.194
30 7 0.226
31 8 0.258
32 3 0.097
33 3 0.097
34 1 0.032
31 1
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes
temperaturas mximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29,
30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
xi fi Fi Ni
27 1 1 0.032
28 2 3 0.097
29 6 9 0.290
30 7 16 0.0516
31 8 24 0.774
32 3 27 0.871
33 3 30 0.968
34 1 31 1
31
Grfico de Barras
Ejemplo:
Ejemplo
Ejemplo
Sencillo
Agrupado
Apilado
Ejemplo:
Ejemplo:
Ejemplo
En uno de los ejes se posicionan las clases de la variable continua (los intervalos
o las marcas de clase que son los puntos medios de cada intervalo) y en el otro
eje las frecuencias. No existe separacin entre las barras.
Ejemplo:
Ejemplo:
Ejemplo:
En cada eje se representa cada una de las variables cuya relacin se quiere
observar (en el ejemplo, en el eje horizontal los meses y en el eje vertical la media
mensual del IPC correspondiente a esos meses).
Ejemplo:
Si se unen los puntos medios de las bases superiores de las barras en los grficos
de barra se obtiene el polgono de frecuencias.
Ejemplo:
Grfico de sectores
Ejemplo:
Moda
Ejemplo:
Hallar la moda de la distribucin: 2, 3, 3, 4, 4, 4, 5, 5 Mo = 4
Ejemplo:
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
Ejemplo:
2, 2, 3, 3, 6, 6, 9, 9
Ejemplo:
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
Ejemplo
[60, 63) 5
[63, 66) 18
[66, 69) 42
[69, 72) 27
[72, 75) 8
100
Ejemplo
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado,
notable y sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la
moda.
fi hi
[0, 5) 15 3
[5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
50
Es el valor que ocupa el lugar central de todos los datos cuando stos estn
ordenados de menor a mayor.
Clculo de la mediana
Ejemplo:
2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5
Ejemplo:
7, 8, 9, 10, 11, 12 Me= 9.5
Donde:
Li es el lmite inferior de la clase donde se encuentra la mediana.
N/2 es la semisuma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
[60, 63) 5 5
[63, 66) 18 23
[66, 69) 42 65
[69, 72) 27 92
100
100 / 2 = 50
Clase modal: [66, 69)
Media aritmtica
xi fi x i fi
[10, 20) 15 1 15
[30,40) 35 10 350
[50, 60 55 8 440
[60,70) 65 4 260
42 1.820
Ejemplo:
8 7.6 + 3 7.6 + 5 7.6 +12 7.6 +10 7.6= 0. 4 4.6 2.6 + 4. 4 +
2. 4= 0
Ejemplo
Ejemplo:
xi fi
[72, ) 8
100
Medidas de dispersin
Las medidas de dispersin nos informan sobre cunto se alejan del centro los
valores de la distribucin.
Rango o recorrido
Di = x - x
La desviacin media es la media aritmtica de los valores absolutos de las
desviaciones respecto a la media.
Ejemplo
Varianza
Ejercicios de varianza
Calcular la varianza de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18
x i f i xi fi xi2 fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5.000
[30,40) 35 10 350 12.250
[40, 50) 45 9 405 18.225
[50, 60 55 8 440 24.200
[60,70) 65 4 260 16.900
[70, 80) 75 2 150 11.250
42 1.820 88.050
2. En los casos que no se pueda hallar la media tampoco ser posible hallar la
varianza.
Desviacin tpica
La desviacin tpica es la raz cuadrada de la varianza.
Para simplificar el clculo vamos a utilizar las siguientes expresiones que son
equivalentes a las anteriores.
xi fi xi fi xi2 fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5.000
[30,40) 35 10 350 12.250
[40, 50) 45 9 405 18.225
[50, 60) 55 8 440 24.200
[60,70) 65 4 260 16.900
[70, 80) 75 2 150 11.250
42 1.820 88.050
2. En los casos que no se pueda hallar la media tampoco ser posible hallar la
desviacin tpica.
Medidas de posicin
Para calcular las medidas de posicin es necesario que los datos estn
ordenados de menor a mayor.
Cuartiles
Los cuartiles son los tres valores de la variable que dividen a un conjunto de
datos ordenados en cuatro partes iguales.
Donde:
Ejercicio de cuartiles
Calcular los cuartiles de la distribucin de la tabla:
f i F i
[50, 60) 8 8
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Clculo del primer cuartil
Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez partes
iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los
datos.
Donde:
Li es el lmite inferior de la clase donde se encuentra la mediana.
N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
f i F i
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Percentiles
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes
iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los
datos.
Donde:
Ejercicio de percentiles
Calcular el percentil 35 y 60 de la distribucin de la tabla:
f i F i
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Percentil 60
Estas son las distribuciones disponibles para distintas herramientas que crean
valores aleatorios. Las distribuciones transforman los valores aleatorios de 0-1 que
se crearon a partir de la transmisin especfica (identificada a nivel mundial en el
entorno de anlisis o a nivel local con la herramienta) en la distribucin especfica.
Distribucin uniforme
La distribucin uniforme es una distribucin de probabilidad continua donde todos
los valores de un intervalo especfico tienen la misma probabilidad.
Donde
a es el valor mnimo para el intervalo con igual probabilidad.
b es el valor mximo para el intervalo con igual probabilidad.
x son las observaciones.
Distribucin de entero
La distribucin de entero es una distribucin de probabilidad donde todos los
valores discretos de un intervalo especfico tienen la misma probabilidad.
La distribucin de entero es la versin discreta de la distribucin uniforme (vea
arriba). La distribucin de entero se utiliza para modelar la probabilidad de
ocurrencia de cada nmero al tirar un dado (cada nmero tiene una probabilidad
de ocurrencia de un sexto), para modelar eventos aleatorios en un modelo de
simulacin, o seleccionar ubicaciones de muestra para un estudio biolgico.
Donde
a es el valor mnimo para el intervalo con igual probabilidad.
b es el valor mximo para el intervalo con igual probabilidad.
x son las observaciones.
Distribucin normal
La distribucin normal modela variables aleatorias continuas que ocurren con
frecuencia.
Donde
es el valor medio.
es la desviacin estndar (un nmero positivo).
Distribucin exponencial
La distribucin exponencial es una distribucin de probabilidad continua.
En general, se utiliza para modelar el tiempo entre los eventos que ocurren a una
tasa promedio constante, o la distribucin se puede utilizar para modelar la
ocurrencia de eventos en una distancia por unidad. El tiempo hasta que ocurre el
prximo accidente automovilstico en una interseccin, el tiempo entre que se ven
dos estrellas fugaces en el cielo y la distancia entre dos baches en una calle,
representan ejemplos de cmo se puede utilizar la distribucin exponencial. Con
cada uno de estos ejemplos, a medida que el tiempo o la distancia aumenta, hay
una probabilidad exponencialmente mayor de que cambie el estado u ocurra el
evento. Las ocurrencias de los eventos son independientes entre s.
Donde:
e es el logaritmo natural.
x es la cantidad de posibles ocurrencias para el evento (valores enteros
positivos).
Distribucin Poisson
La distribucin Poisson es una distribucin de probabilidad discreta.
Donde:
e es el logaritmo natural.
k es la cantidad de posibles ocurrencias para el evento (valores enteros
positivos).
k! es un factorial de k.
(o el valor medio) es un nmero positivo que representa la cantidad
esperada de ocurrencias en un intervalo especfico. Si el evento ocurre
cada 10 minutos en una hora (60 minutos), la lambda ser de 6.
Distribucin Gamma
La distribucin Gamma es una distribucin de probabilidad continua.
Las variables resultantes son mayores o iguales a 0,0. Los valores de alfa y beta
deben ser superiores a 0,0.
Distribucin binomial
La distribucin binomial modela la cantidad de ocurrencias de un evento al
observar una secuencia de productores potenciales del evento. Por ejemplo, la
distribucin binomial captura la cantidad de personas de un estudio clnico que
fallecieron por una enfermedad coronaria, la cantidad de personas que descienden
en el segundo piso de un ascensor repleto, o la cantidad de animales de una
poblacin con un rasgo gentico determinado.
Donde:
n es la cantidad de observaciones.
p es la probabilidad de ocurrencia.
x es la cantidad de xitos que varan de 0 a n.
Todos los ensayos son independientes, y cada ensayo tiene un resultado de xito
o error.
Distribucin geomtrica
La distribucin geomtrica es una distribucin de probabilidad discreta.
Existen dos tipos principales de fenmenos que modela:
(1) la probabilidad de la cantidad de veces que conlleva un xito (por ejemplo, la
cantidad de veces que se tira el dado para que salga el nmero 6)
(2) la probabilidad de la cantidad de errores antes del xito (por ejemplo, la
cantidad de senderos que hay en un camino hasta ver un venado).
Donde:
p es la probabilidad de xito.
n es la cantidad de ensayos.
Donde:
r es la cantidad de errores.
p es la probabilidad de xito.
k es la cantidad de xitos que varan de 0 a n.