Las diferentes disciplinas relacionadas con los recursos hidráulicos y medio ambiente
son ciencias que se basan, esencialmente, en observaciones imperfectas dentro de un
ámbito complejo y discontinuo espacial y temporalmente. Esta complejidad resulta de
la naturaleza propia del comportamiento espacial y temporal de los diferentes procesos
que es, en parte, predecible, definible, explicable o determinístico y en parte, aleatorio,
probabilístico o estocástico. Desde el punto de vista determinístico, cualquier evento o
proceso ambiental puede definirse en función de expresiones rigurosas de causa y
efecto. Sin embargo, para explicar determinísticamente muchos procesos ambientales
se requeriría infinidad de observaciones de la infinidad de variables involucradas, con
la consecuente impracticabilidad de su aplicación. Otros eventos o procesos, que por la
falta de un conocimiento preciso de su evolución en el tiempo y espacio, se consideran,
actualmente, inexplicables, pueden tratarse como puramente estocásticos.
2.1 V A R I A B L E A M B I E N T A L
Una variable ambiental es aquella que mide o define la magnitud o cantidad de algún
elemento en el medio ambiente. En este tipo de variables se incluyen:
2.2 V A R I A B L E A L E A T O R I A
Una variable aleatoria X es una variable que se describe mediante una distribución de
probabilidades. La distribución especifica la probabilidad con que una observación x de
la variable ocurra dentro de un rango especificado de X. Por ejemplo, si X es la
precipitación anual, P en un lugar específico, entonces la distribución especifica la
probabilidad de que la P observada en un año dado esté dentro de un rango definido,
digamos menor de 1000 mm, entre 1,000 y 1,500 mm. En otras palabras, cuando el
curso de un proceso ambiental o los resultados de observaciones se consideran como
consecuencia de variables aleatorias, todas las observaciones están sujetas a una
distribución de probabilidades.
Pag.2
ESTADISTICA: e.orozco
EJEMPLO 2.1:
Considerar la precipitación diaria P, observada en una localidad dada, como la variable aleatoria. Cualquier
valor específico de p es un número positivo expresado; por ejemplo, en mm. Este número es una realización
particular de un evento elemental que pertenece a Ω. En la Fig. 2.1 se muestra este número mediante la letra
p0. Si se toman 30 números, digamos las observaciones durante un mes, éste subconjunto A pertenece a Ω.
Otro subconjunto, B puede contener todas las observaciones menores que cierto valor, p 0.
Ω p0
EJEMPLO 2.2:
Ω = {S, H}
considerar ahora todos los posibles pares de días consecutivos SS, SH, HS, HH. El espacio muestral es
Pag.3
ESTADISTICA: e.orozco
2.5 PROBABILIDAD
“Probabilidad no es otra cosa que traducir el sentido común en cálculo” (L APLACE). La
probabilidad de un evento, P(A), se define como la frecuencia de su ocurrencia durante
la repetición de un número de observaciones. Si una muestra con N observaciones
tiene NA valores en el rango del evento A, la frecuencia relativa de A es NA/N. La
estimación de la P(A) a partir de la frecuencia relativa, mejora progresivamente al
aumentar de tamaño la muestra, matemáticamente,
NA
P( A ) = lim (2.1)
N→∞ N
P(A) ≥ 0 (2.2)
P( A ) = 1 − P( A ) (2.3)
P( A ∩ B)
P(B | A ) = (2.5)
P( A )
Pag.4
ESTADISTICA: e.orozco
N!
N!
(N − r )! r!
EJEMPLO 2.3:
En la práctica de control de calidad, solamente una fracción del producto se muestrea y examina, ya que sería
muy costoso y requería mucho tiempo para examinar todos los resultados. Suponer que existe un lote de N
ítems del cual se toma una muestra de tamaño r. Suponer, además, que el lote contiene k ítems defectuosos.
¿Cuál es la probabilidad que la muestra contiene exactamente m ítems defectuosos?
Este tipo de pregunta es relevante para establecer la eficacia de un esquema de muestreo, y el tamaño de
muestra más deseable puede determinarse calculando tales probabilidades para varios valores de r.
Pag.5
ESTADISTICA: e.orozco
k N − k
De tal manera que el número posible de maneras que D puede ocurrir es
m r − m
N
El número total de posibles muestras de tamaño r en el lote es
r
k N − k
m r − m
Por lo tanto, P(D) =
N
r
EJEMPLO 2.4:
Considerar el circuito de conductos de agua con tres válvulas. Si Vi indica el evento de que la válvula i funciona.
Asumiendo que P(Vi) = p y que las válvulas son mutuamente independientes. Si Q indica el evento de flujo a
través del circuito, entonces
Q = V3 ∪(V1∩V2)
1 2
Pag.6
ESTADISTICA: e.orozco
EJEMPLO 2.5:
Suponer que un sistema consiste de n componentes conectados en serie, de tal manera que el sistema falla si
cualquiera de sus componentes falla. Si los n componentes son mutuamente independientes y la probabilidad
de falla de cada uno es p, ¿Cuál será la probabilidad de que el sistema falle, P(F)?
Es más fácil calcular la probabilidad del complemento de este evento; o sea P( F ) (probabilidad de que el
sistema funcione). El sistema funciona solamente si todos sus componentes funcionan, esta situación tiene la
probabilidad
P( F ) = (1 – p )n
P(F) = 1 – (1 – p)n
Si se supone que los componentes están conectados en paralelo, de tal manera que el sistema fallará
solamente si todos fallan. En este caso, la probabilidad de que el sistema falle y funcione es, respectivamente:
EJEMPLO 2.6:
Los valores de precipitación anual en la Estación Observatorio Nacional, Ciudad de Guatemala, se muestra en
el Cuadro 2.2 y Fig. 2.1.
1937
1945
1953
1961
1969
1977
1985
1993
Cuadro 2.2 y Fig. 2.1 Precipitación anual (mm) en la Estación Observatorio Nacional, Guatemala.
En base a los datos anteriores calcular la probabilidad de que la precipitación, L, sea, en cualquier año menor a
los 1000 mm, mayor a los 1400 mm y entre 1000 y 1400.
Pag.7
ESTADISTICA: e.orozco
Existen N=68 datos. Sea A el evento de precipitación < 1,000 mm y B el evento de precipitación > 1400 mm. Se
puede observar que N A el número de valores menores a 1000 mm es de 12 y el número de valores mayores a
1400 es de 14.
Sea C el evento de L < 1000 para dos años sucesivos. Del cálculo anterior se tiene que P(L<1000) es 0.176 y
considerando independencia (Ec. 2.7).
Observando los datos del Cuadro 2.1, se tiene que existe solamente un par de años (1977 y 1978) sucesivos
cuya precipitación es menor a 1000 mm. El número posible de pares sucesivos es de 67 (N-1). De esa manera
puede estimarse que
EJEMPLO 2.7:
Durante un año se realizaron 350 observaciones diarias de la calidad del agua de un río en una estación dada.
Dicha calidad se define como:
Un resumen de las observaciones concernientes a dos días consecutivos se muestra en el siguiente Cuadro.
Pag.8
ESTADISTICA: e.orozco
NL 210 NS 140
P(L) = = = 0.6 y P(S) = = = 0. 4
N 350 N 350
Si el día i es tipo S, las probabilidades de que el siguiente día (i+1), sea del tipo L y del tipo S son,
respectivamente:
Es fácil verificar que los dos eventos Li+1|Si y Si+1|Si son complementarios; es decir que la suma de sus
probabilidades es igual a 1. De hecho, para cualquier tipo de día i (L o S), es seguro que el siguiente debe ser
Li+1 o Si+1.
UA i =Ω
i =1
entonces
m
P(A1)+P(A2)+…+P(Am ) = ∑ P( A ) = P(Ω) = 1
i (2.9)
i =1
Pag.9
ESTADISTICA: e.orozco
Ω A4
A1
A5
B
A2 A6
A3
P( A i ∩ B) P( A i )P(B | A i )
P( A i | B) = = m (2.11)
P(B)
∑ P(A i )P(B | A i )
i=1
En la Ec. 2.11, A1, A2, ..., Am son eventos mutuamente exclusivos y al
mismo tiempo complementarios; es decir, se cumple la Ec. 2.9.
Pag.10
ESTADISTICA: e.orozco
EJEMPLO 2.8:
Si se considera diferentes tipo de información, tal como fuentes de contaminación, actividades agrícolas en la
cuenca, geología y morfología de la cuenca, una estimación a priori de la calidad del agua en los grupos A1 y
A2 dio las siguientes probabilidades
P(A1) = 0.6
P(A2) = 0.4
Una conclusión cuantitativa para la calidad del agua puede obtenerse mediante análisis fisicoquímicos
específicos. Un índice I de calidad química del agua se deriva y se usa para clasificar el agua en dos grupos I1
e I2. Dado que, en realidad, la calidad del agua pertenece al grupo Aj, el siguiente Cuadro resume las
probabilidades para encontrar el índice de calidad Ii.
Suponer ahora que, después del muestreo se realiza un conjunto de análisis químico. Existen dos posibles
casos:
1) Que el índice de calidad química del agua tome el valor I1. Las probabilidades a posteriori P(A1|I1)
y P(A2|I1) pueden calcularse mediante el teorema de BAYES (Ec. 2.11):
P( A 1 )P(I1 | A 1 ) ( 0.6)( 0. 7)
P( A 1 | I1 ) = = = 0.91
∑ P(A i )P(I1 | A i ) (0.6)(0.7) + (0.4 )(0.1)
i
Pag.11
ESTADISTICA: e.orozco
P( A 2 )P(I1 | A 2 ) ( 0.4)( 0. 1)
P( A 2 | I1 ) = = = 0.09
∑ P(A i )P(I1 | A i ) (0.6)(0.7) + (0.4)(0.1)
i
Comparando estos resultados con las estimaciones anteriores: P(A1)=0.6 y P(A2)=0.4, puede
concluirse que el agua en el río es de mejor calidad que la estimada, porque P(A1|I1) > P(A1).
2) El índice de calidad química del agua tome el valor I2. Las probabilidades a posteriori P(A1|I2) y
P(A2|I2) se calculan también mediante el teorema de BAYES (Ec. 2.11):
P( A 1 )P(I 2 | A 1 ) ( 0.6)( 0. 3)
P( A 1 | I 2 ) = = = 0.33
∑ P(A i )P(I2 | A i ) (0.6)(0.3 ) + (0.4)(0.9)
i
Comparando estos resultados con las estimaciones a priori: P(A1)=0.6 y P(A2)=0.4, puede
concluirse que el agua en el río es de peor calidad que la estimada, porque P(A1|I2) < P(A1).
Pag.12
ESTADISTICA: e.orozco
EJERCICIOS:
PROBLEMA 1: En el disco adjunto, se incluye datos precipitación diaria (HOJA: P-DIARIA) de una estación climática, con
esa información, calcular:
Sea R la variable aleatoria de precipitación diaria. Considerar dos eventos característicos de R
S: si R ≤ 2.0 mm (día seco)
H: si R > 2.0 mm (día húmedo)
a) Determinar la probabilidad de día seco y la probabilidad de día húmedo
b) Considerar pares consecutivos y determinar la probabilidad de que:
Dos días consecutivos sean secos
Dos día consecutivos sean húmedos
Día i seco y día i+1 húmedo
Día i húmedo y día i+1 seco
Si día i+1 seco dado que el día i sea húmedo
Si día i+1 seco dado que el día i sea seco
Si día i+1 húmedo dado que el día i sea seco
Si día i+1 húmedo dado que el día i sea húmedo
c) Considerar todos los posibles subconjuntos de 7 días consecutivos y determinar el espacio muestral.
d) Considerar el evento D, como la semana seca, lo que significa 7 días secos consecutivos. Calcular P(D) y
P( D ).
e) ¿Son los eventos D y D mutuamente exclusivos?, ¿Porqué?
PROBLEMA 2: Este problema introduce un modelo meteorológico simple, versiones más complejas se encuentran en la
literatura. Considerar una secuencia de días donde Ri es la precipitación en el día i. Suponer que P(Ri|Ri-1) = α y
P( Ri | Ri −1 ) = β.Suponer además que, solamente la precipitación de hoy es relevante para predecir la precipitación de
mañana, o sea que P(Ri|Ri-1∩Ri-2∩...∩R0) es equivalente a P(Ri|Ri-1).
a) Si la probabilidad de lluvia el día de hoy es p, ¿Cuál es la probabilidad de lluvia mañana?
b) ¿Cuál es la probabilidad de lluvia pasado mañana?
c) ¿Cuál es la probabilidad de lluvia n días después de hoy?
d) ¿Qué pasa cuando n se aproxima al infinito?
e) Con los datos del problema anterior, considerar que el día húmedo Hi corresponde a Ri, Calcular la
probabilidad de que:
a. el día i sea húmedo (probabilidad p del inciso a) de este problema)
b. el día i+1 sea húmedo
c. el día i+2 sea húmedo
NOTA: α de este problema corresponde a P(Hi+1|Hi) del problema anterior, y p de este problema a P(Hi)
del problema anterior.
PROBLEMA 3: Suponer que N (10) componentes de un sistema están conectados en serie. Para cada unidad existe una
unidad de repuesto, y el sistema falla solamente si ambos la unidad y su repuesto fallan. Asumir que todas las unidades
son independientes y fallan con probabilidad p (0.05). ¿Cuál es la probabilidad de que el sistema funcione?
PROBLEMA 4: Determinar la probabilidad de que el siguiente sistema funcione si cada uno de sus componentes
funcionan independientes con probabilidad p.
Pag.13
ESTADISTICA: e.orozco
Un sistema de N componentes, cada uno de los cuales falla con probabilidad p. El sistema falla solamente si k o más de
sus componentes fallan. ¿Cuál es la probabilidad de que el sistema falle?
Pag.14