Alexis Vergara
Anlisis de Frecuencias.
Es un procedimiento para estimar la frecuencia o probabilidad de ocurrencia de ciertos
eventos hidroclimticos (Monsalve, 2008).
Por ello, y como sucede en la mayora de las ciencias, con mucha frecuencia, la estadstica
es la va obligada en la solucin de los problemas. En particular, la probabilidad y la
estadstica juegan un papel de primer orden en el anlisis hidrolgico.
Anlisis de Frecuencias.
El anlisis de frecuencia permite un tratamiento
cientfico (estadstico) a los datos hidrolgicos para la
toma de decisiones financieras, tcnicas, ambientales y
de diseo de las obras hidrulicas, atendiendo los
siguientes casos:
Anlisis de Frecuencias.
En forma general, la mayora de los problemas hidrolgicos se pueden agrupar en tres
categoras principales de acuerdo al objetivo principal del proyecto:
En cada una de las tres categoras mencionadas se presentan diferentes tipos de problemas,
dependiendo de la simplicidad o complejidad de la solucin; del tipo, cantidad y calidad de
la informacin disponible, as como de la magnitud del proyecto.
Hidrologa Ing. Alexis Vergara
Estadstica Hidrolgica.
Para extraer conclusiones estadsticas a partir de series de datos de precipitaciones o
aforos, es necesario disponer de series histricas de ms de 20 30 valores, cuanto mayor
sea la serie de datos, mayor ser la confiabilidad de las deducciones extradas.
Valores medios. Ejemplo: de una serie de aos se dispondr del caudal o precipitacin
medio de cada ao.
Valores extremos. Ejemplo: de una serie de aos se extraer el caudal o precipitacin
del da ms caudaloso o lluvioso de cada ao.
Hidrologa Ing. Alexis Vergara
Estadstica (Repaso).
Variable aleatoria.
Una variable aleatoria (v.a.) es una funcin que asocia a cada resultado del espacio
muestral un nmero real. De esta forma se cubre la necesidad de asociar a un suceso un
nmero real. Las v.a. pueden ser discretas o continuas.
Ejemplo: Si se tienen 5 posible sitios de aforos, de los cuales se van a estudiar slo dos.
Cmo se definen estos dos puntos para poder aplicar el mtodo estadstico?
El mtodo determinstico donde una persona decida los 2 puntos de aforo, ya no sera
aleatoria y no se podran aplicar con confianza los conceptos probabilsticos.
La distribucin de probabilidad de una v.a. es una funcin que asigna a cada valor posible
de dicha v.a. una probabilidad.
Hidrologa Ing. Alexis Vergara
Estadstica (Repaso).
Variable aleatoria.
Entre los procesos probabilsticos es necesario distinguir los probabilsticos a secas de los
probabilsticos estocsticos. Se denomina proceso estocstico a aqul en el que las
caractersticas de las variables aleatorias varan con el tiempo. En un proceso
probabilstico, independiente de la variable tiempo, la secuencia de las variables no
interesa y se supone que ellas siguen un determinado comportamiento dado por el modelo
probabilstico o distribucin de frecuencias.
Dada pues una variable aleatoria, interesar describir la probabilidad de ocurrencia de los
distintos estados. Esto se consigue gracias a un modelo matemtico de su comportamiento o
modelo probabilstico.
Hidrologa Ing. Alexis Vergara
Estadstica (Repaso).
Variable aleatoria.
Una vez que el ingeniero, en base a su experiencia, escoge el modelo probabilstico que va a
usar debe proceder a calcular los parmetros de su modelo y despus revisar si este modelo
es consistente con la realidad. Ambas cosas las hace con los datos observados (registro o
muestra).
Hidrologa Ing. Alexis Vergara
Estadstica (Repaso).
Poblacin y muestra.
Poblacin.
Es el conjunto total de datos que se quieren estudiar. A veces se dispone de medidas de
toda la poblacin estudiada, pero generalmente, esto sera muy difcil (por ejemplo, medir
la estatura de todos los panameos) o imposible (estudiando el caudal de un ro se tendran
que medir los caudales de todos los aos pasados y futuros). En estos casos el anlisis se
limita a medir una parte de la poblacin (una muestra). A partir de la muestra, se intenta
extraer estimaciones vlidas para toda la poblacin.
Muestra.
Es una pequea parte de la poblacin que debera ser representativa del total de la
poblacin. Si se midiera la estatura de todos los alumnos de este curso de Hidrologa para
conocer la estatura media de todos los estudiantes de Hidrologa de la UTP, tal vez ellos
seran toda la poblacin estudiada. Pero si, a partir de ellos, se quiere extraer conclusiones
sobre la estatura de toda la juventud panamea, estos alumnos seran solamente una
muestra representativa de la poblacin estudiada.
Hidrologa Ing. Alexis Vergara
Estadstica (Repaso).
Frecuencias.
Al observar una serie de datos numricos (caudales anuales de un ro, estatura de personas,
etc.) se comprueba que los valores intermedios son ms frecuentes, mientras que los
valores elevados o pequeos (extremos) se presentan con menor frecuencia.
Estadstica (Repaso).
Frecuencias.
x 2
1
f ( x) e 2 2
2
Hidrologa Ing. Alexis Vergara
Estadstica (Repaso).
Densidad y Distribuciones.
Si en lugar de considerar cuantas personas quedan incluidas dentro de cada intervalo (Fig.
1), se considera cuntas personas quedan incluidas hasta ese intervalo (es decir, en ese y
en todos los anteriores), se obtendra la Figura 3 (Frecuencias Acumuladas). y al disminuir
el tamao de los intervalos y aumentar el nmero de sujetos medidos, se obtendra la
Figura 4:
Estadstica (Repaso).
Densidad y Distribuciones.
Estadstica (Repaso).
Densidad y Distribuciones.
Estadstica (Repaso).
Media y Desviacin Standard.
Para indicar la tendencia central, normalmente se utiliza la media aritmtica, tan intuitiva
y que todos conocen: sumar valores y dividir por el nmero de casos. Pero a veces la media
aritmtica proporciona una informacin equivocada: Supongamos que un multimillonario
reside en una aldea de 100 vecinos pobres. Los ingresos medios anuales (por persona) de esa
aldea seran muy elevados, pero ese valor nos engaara respecto a la pobreza de la
mayora de los vecinos. En estos casos es ms significativa la mediana, que es un valor que
deja por encima a la mitad de los casos y por debajo a la otra mitad. En las distribuciones
simtricas, la media y la mediana coinciden o estn muy cerca; en las asimtricas positivas
(pico a la izquierda) la mediana es inferior a la media.
sn
n
Hidrologa Ing. Alexis Vergara
Estadstica (Repaso).
Media y Desviacin Standard.
Por ejemplo, las dos series de datos siguientes tienen la misma media pero obviamente son
muy distintas, en la segunda los datos estn ms dispersos respecto de la media:
La desviacin estndar no slo indica de un vistazo la dispersin de los datos a ambos lados
de su media, sino que es especficamente til para realizar ciertos clculos que se
repasarn ms adelante.
La frmula anterior se aplica a la poblacin (es decir, si se han podido medir todos los datos
de la poblacin estudiada, y con ellos se aplica la frmula). Pero lo habitual es que se
disponga slo de los datos de una muestra, y la desviacin estndar de esa muestra puede
no coincidir con la de toda la poblacin; para moderar este error se utiliza el estimador de
la desviacin estndar:
x x
2
sn 1
n 1
Hidrologa Ing. Alexis Vergara
Estadstica (Repaso).
Media y Desviacin Standard.
Cuando el nmero de datos (n) es grande ambas frmulas proporcionan valores casi
idnticos.
Estadstica (Repaso).
Clculo de Desviacin Standard.
Con la calculadora el proceso se limita a introducir todos los datos, y luego solicitar la
media y la desviacin estndar con las teclas correspondientes. Aparecen las teclas n y n-1
que se refieren respectivamente a las dos frmulas que se han repasado: con los datos de la
poblacin (dividir por n) y con los datos de la muestra (dividir por n-1)
Estadstica (Repaso).
Coeficiente de Variacin.
Si dos series tienen la misma media, su desviacin estndar nos indica en cual de las dos los
valores est ms dispersos a ambos lados de la media. Pero si las medias son distintas, la
comparacin de las desviaciones estndar ya no es til. Supongamos que se desea saber cul
de las dos series siguientes est ms dispersa a ambos lados de su media:
Aparentemente, la segunda serie presenta una mayor dispersin (s = 64.8 parece muy alta
comparada con s = 3.0 de la primera). Pero s=3.0 en valores que rondan la media de 23 es
mayor que s = 64.8 en una poblacin de media 1,365. Esta idea se cuantifica mediante el
Coeficiente de Variacin (C.V.) = Desviacin standard / media.
Estadstica (Repaso).
Normalizacin de datos.
En los siguientes clculos, en lugar de trabajar con datos brutos, se debe utilizar datos
normalizados (estandarizados). Los datos normalizados indican cuntas desviaciones
estndar se encuentra un valor individual por encima o por debajo de la media.
Ejemplo 1.
Se han calculado la media y la desviacin estndar de los caudales de un ro: caudal medio =
97 m3/seg; desviacin estndar 13.4 m3/seg. En un ao hmedo el caudal fue de 112
m3/seg. Convierta ese valor en puntuacin estndar (normal).
Solucin: El valor 112 m3/s supera a la media en: 112 - 97 = 15 m3/s. Se calcula cuntas
desviaciones estndar est por encima de la media. El caudal del ro super a su media en :
112 97
1.12 desv. std .
13.4
Por tanto, si hablamos de un caudal 0 (valor estandarizado) no significa que el ro est
seco, sino que su caudal es igual a la media. La puntuacin estandarizada o normalizada se
representa generalmente como u o z. La expresin general es:
xx
z
sx
Hidrologa Ing. Alexis Vergara
Estadstica (Repaso).
Curvas de Probabilidad Normalizadas.
Si se utiliza una campana de Gauss (Figura 2), para evaluar precipitaciones anuales, en el
eje de las abscisas estaran precipitaciones anuales en mm o caudales en m3/s. Ahora que se
conocen los valores normalizados, es preferible utilizar la misma curva de la Figura 2
representando en el eje de abscisas valores normalizados (Figura 7) en lugar de datos
brutos. De este modo, el mismo grfico ser vlido para estaturas, precipitaciones,
caudales de un arroyo, etc. (en el eje de abscisas los valores variaran de 0.2 a 3 m3/s) o
caudales de un gran ro (valores de 500 a 8,000 m3/s).
Hidrologa Ing. Alexis Vergara
Estadstica (Repaso).
Clculo de Probabilidades.
Asumiendo que una serie de caudales se ajusta a la ley de Gauss, se pueden responder a dos
tipos de casos:
1. Cul es la probabilidad de que el caudal supere 40 m3/seg? O bien: Cada cuntos aos
se superar el caudal de 40 m3/seg?
Datos necesarios: Media aritmtica = 29.8 m3/seg; desv. estndar = 8.1 m3/seg
Estadstica (Repaso).
Clculo de Probabilidades.
2) Se calcula la probabilidad que z > 1.26. Como aplicar la ecuacin de Gauss no es simple,
esto puede hacerse de dos maneras: con Excel o mediante tablas de Distribucin Normal.
Estadstica (Repaso).
Clculo de Probabilidades.
Caso 2: De la probabilidad al valor.
Se trata de repetir el proceso anterior al revs:
1) Se calcula a qu valor de z corresponde la probabilidad 0.02 (o sea: 2%). De nuevo, esto
puede hacerse mediante Excel o las tablas de distribucin.
x 29.8
2.05 x 46.40 m 3 / s
8.1
Esto quiere decir que el valor que es superado un 2% de los aos (cada 50 aos) es 46.4
m3/seg
Hidrologa Ing. Alexis Vergara
Estadstica (Repaso).
Clculo de Probabilidades.
Se analizan ahora los casos inferiores a la media.
En los casos anteriores se analizaron caudales superiores a la media. Si se hacen previsiones
para aos secos, las preguntas (equivalentes a los casos 1 y 2) seran de este tipo:
Estadstica (Repaso).
Clculo de Probabilidades.
Estadstica (Repaso).
Clculo de Probabilidades.
Como ya fue presentado, una distribucin de probabilidad es una funcin que representa la
probabilidad de ocurrencia de una variable aleatoria. Mediante el ajuste a una distribucin
de un conjunto de datos hidrolgicos, una gran cantidad de informacin probabilstica en la
muestra puede resumirse en forma compacta en la funcin y en sus parmetros asociados.
Tal como se observa en la figura, si a cada uno de los valores de la informacin se le asigna
una masa hipottica igual a su frecuencia relativa (1/n) y si se imagina que este sistema
de masas rota alrededor del origen (x = 0), entonces el primer momento de cada
observacin xi alrededor del origen es el producto de su brazo de momento (xi) y de su
masa (1/n), y la suma de estos momentos es la media de la muestra.
Hidrologa Ing. Alexis Vergara
s 2 1
xi x 2
n 1
El divisor es n-1 en lugar de n para asegurar que la estadstica de la muestra no sea
sesgada; es decir, que no tenga una tendencia, en promedio, a ser mayor o menor que el
valor verdadero.
Hidrologa Ing. Alexis Vergara
n
n 1 n 2 s 3 i
Cs
3
x x
Hidrologa Ing. Alexis Vergara
Simetra de Distribuciones.
Muchas variables naturales se ajustan a la distribucin simtrica normal o de Gauss, pero no
todas. En ocasiones no hay la misma proporcin de valores pequeos que de grandes, eso
dar lugar a una distribucin asimtrica.
Simetra de Distribuciones.
En otras ocasiones, los valores no se ajustan a la distribucin de Gauss, pero sus logaritmos
s: se denomina entonces log-normal. En las distribuciones asimtricas el pico de la curva
puede estar desviado hacia la izquierda (como en la Figura 6) o hacia la derecha. Se
denominan respectivamente positivas y negativas, o se dice que tienen sesgo positivo o
negativo.
Simetra de Distribuciones.
Hidrologa Ing. Alexis Vergara
Las variables hidrolgicas, como la precipitacin anual, calculadas como la suma de los
efectos de muchos eventos independientes tienden a seguir la DN. Sin embargo, otras
variables no siguen este comportamiento, por lo tanto, las principales limitaciones de la DN
en la descripcin de variables hidrolgicas son:
x 2
1
f ( x) e 2 2
2
Hidrologa Ing. Alexis Vergara
La DLN tiene las ventajas sobre la DN de que est limitada (X > 0) y de que la
transformacin log tiende a reducir la asimetra positiva comnmente encontrada en
informacin hidrolgica, debido a que al tomar logaritmos se reducen en una proporcin
mayor los nmeros grandes que los nmeros pequeos.
y y 2
1 2 y 2
f ( x) e
2
Hidrologa Ing. Alexis Vergara
x 1 e x
f ( x)
Hidrologa Ing. Alexis Vergara
El sistema de distribuciones Pearson incluye siete tipos; todos son soluciones para f(x) en
una ecuacin de la forma:
d f x f x x d
dx C0 C1 x C2 x 2
Donde d es la moda de la distribucin, y los coeficientes C deben determinarse. Cuando
C2 = 0, la solucin es una DP3, con una funcin de densidad de probabilidad definida como:
x 1 e x
f ( x)
Cuando C1 = C2 = 0, la solucin es una distribucin normal. Por lo tanto, la DN es un caso
especial de la DP3 para describir una variable no asimtrica.
Hidrologa Ing. Alexis Vergara
y 1 e y
f ( x) Donde y = log x
x
Hidrologa Ing. Alexis Vergara
Ejercicios.
Los ejercicios resueltos y propuestos se encuentran en la gua
de Estadstica en Hidrologa.
Suministro y Recoleccin de Agua Ing. Alexis Vergara