Modelos estadísticos:
Es nuestra costumbre crear modelos para entender o predecir lo que
observamos. Si alguien llega por primera vez a Quito y ve que muchas
personas entran coladas al Trole-bus en la estación de la Universidad Central
su modelo puede establecer que no es necesario pagar el pasaje para ingresar
al sistema (entonces, él tratará de hacer lo mismo la próxima vez que vaya a
una estación). Un ingeniero puede hacer una maqueta (modelo) de un edificio
que está diseñando para evaluar algunos aspectos de la forma o de la
estructura de la construcción. Un clínico estará atento a la función renal de un
paciente diabético con hipertensión arterial.
1
Una función es una relación entre dos magnitudes. Esta relación supone que a cada valor de una de
estas magnitudes (variable independiente) le corresponde un valor de la otra magnitud (variable
dependiente). Una función puede representarse mediante una fórmula, un gráfico o una tabla. Dicho en
otras palabras, una función es una máquina que recibe unas entradas, las procesa y las convierte en
unas salidas.
Esto nos indica que la mayoría de personas toman siete cucharadas de azúcar
diaria y que esta variable tiene una forma simétrica.
Mirando este gráfico podemos calcular la probabilidad de tomar más de 12
cucharadas de azúcar al día. Esto lo hacemos de la siguiente forma:
Algunos gráficos útiles para evaluar las características de una distribución son
el de cajas, el de puntos, el histograma y el de picos. Los siguientes gráficos
muestran las características de la variable “consumo de azúcar” medida en
cuatro hospitales diferentes (el hospital cero es el que ya se ilustró atrás):
1. Son cuantitativas.
2. Tienen sesgo igual a cero.
3. Tienen apuntalamiento igual a 3.
En general, cuando una variable cumple con estas características se dice que
la distribución es
NORMAL. En una variable con distribución normal el 95% de los datos se
encuentra entre 1,96 desviaciones estándar hacia arriba y hacia debajo de la
media. El 99% de los datos se encuentra entre 2,576 desviaciones estándar
hacia arriba y hacia debajo de la media (memorizar el valor 1,96: es clave!).
Otro punto para memorizar: En una distribución normal el valor esperado es la
media (μ).
1,96 desviaciones estándar son 1,96 × 2,85 = 5,58. Entonces el 95% de las
observaciones estará entre (7‐5,58) y (7+5,58).
Se ha construido una tabla para una distribución normal que tiene promedio
igual a cero y desviación estándar igual a uno. Dicha distribución se llama
distribución Z, o normal estándar, y se usa como parámetro para calcular
probabilidades en cualquier otra distribución normal, no importa qué promedio o
que desviación estándar tenga, siempre y cuando su sesgo sea 0 y su
apuntalamiento sea 3.
Las herramientas gráficas más utilizadas son los gráficos de caja y bigote, los
histogramas, los gráficos de puntos y los de picos. En estos gráficos se evalúa
fundamentalmente simetría y presencia de valores extremos en alguna de las
colas. Existe otro gráfico útil para evaluar si una distribución es normal: se trata
del gráfico cuantil normal: en estos gráficos se busca si la mayoría de los
valores observados caen sobre una línea que representa los valores esperados
si la variable tuviera una distribución normal. Este tipo de gráfico se ilustra a
continuación: