Anda di halaman 1dari 9




$SXQWHGH
*HRHVWDGtVWLFD

Preparado por: Xavier Emery


Julio de 2007

0,$*HRHVWDGtVWLFD  
&DStWXOR&RQFHSWRVJHQHUDOHVVREUHHO
PRGHODPLHQWRJHRHVWDGtVWLFRGHGDWRV

Para poder describir y entender un fenmeno regionalizado, es necesario elaborar una


representacin matemtica o PRGHOR. Una primera solucin consiste en utilizar un PRGHOR
GHWHUPLQtVWLFR. En general, este enfoque conduce a una evaluacin precisa de la variable
regionalizada a partir de un nmero limitado de observaciones, pero requiere conocer la
gnesis del fenmeno y las leyes fsicas o ecuaciones matemticas que rigen la distribucin
de la variable regionalizada. Entre otros dominios de aplicacin, citemos

la meteorologa: previsin climtica a corto plazo;

la geofsica: determinacin de la intensidad y orientacin del campo gravitacional y


del campo magntico terrestre en el espacio y el tiempo;

la teora de la seal: reconstitucin de una seal continua a partir de un conjunto de


mediciones, usando propiedades espectrales.

No obstante, en general, los fenmenos regionalizados en estudio son extremadamente


complejos y su comprensin puede ser tan parcial que un modelamiento determinstico es
imposible o ilusorio. Ejemplos tpicos son la evaluacin minera, la exploracin petrolfera,
la caracterizacin de una zona contaminada o de una parcela agrcola, la estimacin de los
recursos forestales de una regin, o la previsin meteorolgica de largo plazo. Estamos
entonces obligados a renunciar a una descripcin determinstica del fenmeno y recurrir a
un PRGHORSUREDELOtVWLFR. Este proceder resulta operatorio, pues permite formalizar tanto
los conocimientos como las incertidumbres que se tiene del fenmeno regionalizado.

/tPLWHVGHODHVWDGtVWLFDFOiVLFD

En estadstica clsica, se considera los datos como realizaciones LQGHSHQGLHQWHV de una


misma variable aleatoria, es decir, se supone que no tienen relaciones entre s y que siguen
la misma distribucin de probabilidad. Se busca estimar los parmetros en especial, la
esperanza y la varianza de esta distribucin, cuya forma a menudo est predeterminada
(normal, lognormal, etc.). Sin embargo, cuando los datos estn ubicados en el espacio
geogrfico, las hiptesis de la estadstica clsica son raramente aceptables. En particular, si
bien simplifica los clculos estadsticos, la hiptesis de independencia de las observaciones
resulta poco realista en el marco espacial. Intuitivamente, observaciones prximas tienen
valores cercanos, mientras que aquellas que estn ms alejadas entre s tienen una menor
relacin entre ellas.

0,$*HRHVWDGtVWLFD  
As pues, en general, no puede considerarse modelar las variables regionalizadas por
medio de funciones determinsticas, debido a su extrema complejidad. Tampoco se puede
asimilar los datos medidos a variables aleatorias independientes. La geoestadstica entrega
una representacin intermedia, a la vez aleatoria y funcional, al basarse en el concepto de
IXQFLyQDOHDWRULD.

1RFLyQGHIXQFLyQDOHDWRULD

Los modelos geoestadsticos consideran el valor ]([) de la variable regionalizada en un


sitio [ del campo D como una realizacin de una variable aleatoria =([)1. Cuando [ recorre
D, se obtiene un conjunto de variables aleatorias = = {=([), [ D} que constituye una
IXQFLyQDOHDWRULD (sinnimos: FDPSRDOHDWRULR, SURFHVRDOHDWRULR o HVWRFiVWLFR). As pues,
la variable regionalizada ] = {]([), [ D} es XQD realizacin de la funcin aleatoria =, pero
uno podra imaginar otras realizaciones que presentan caractersticas similares en cuanto a
cmo se distribuyen los valores en el espacio (Figura 1). Contrariamente al modelo de la
estadstica clsica, las variables aleatorias as definidas no son independientes; por el
contrario, existen interacciones o correlaciones entre ellas, las cuales reflejan la continuidad
espacial de la variable regionalizada (Figura 2).

)LJXUD. Realizaciones de dos modelos distintos de funcin aleatoria. Cada


modelo define la manera con la cual se distribuyen los valores en el espacio, lo que
origina el parentesco que se observa entre las realizaciones de un mismo modelo.

1
Para distinguir las variables determinsticas de aquellas aleatorias, denotaremos las primeras con PLQ~VFXOD
y las segundas con 0D\~VFXOD.

0,$*HRHVWDGtVWLFD  

)LJXUD. Nocin de correlacin para representar la continuidad espacial.
Ambos ejemplos presentan los mismos valores, pero distribuidos de forma
diferente en el espacio. Las variables aleatorias se modelarn con altas
correlaciones en el primer caso y bajas correlaciones en el segundo caso.

El recurrir al concepto de funcin aleatoria es una GHFLVLyQ, ni verdadera ni falsa, pues


dicha funcin aleatoria es un objeto terico que no existe en la realidad. Asimismo, la
determinacin de una funcin aleatoria a partir de una variable regionalizada no es una
operacin unvoca: varios modelos pueden resultar aceptables, en cuanto sean compatibles
con la informacin disponible sobre la variable regionalizada.

&DUDFWHUL]DFLyQGHXQDIXQFLyQDOHDWRULD

'LVWULEXFLyQHVSDFLDO

Consideremos una funcin aleatoria = = {=([), [ D} y una serie de sitios {[1,... [ }


en D. El grupo de variables aleatorias {=([1),... =([ )} est caracterizado por una IXQFLyQGH
GLVWULEXFLyQ multivariable que depende de N argumentos:

)! 1 ,...! ( ]1 ,...] ) = Prob{= ([1 ) < ]1 ,... = ([  ) < ] } ]1 ,...] R .

El conjunto de funciones de distribucin, para todos los enteros N y todas las elecciones
posibles de {[1,... [ } en D, constituye la GLVWULEXFLyQ HVSDFLDO de la funcin aleatoria.
Ahora, siendo finito el nmero de datos disponibles sobre la variable regionalizada, es
ilusorio querer inferir la distribucin espacial completa de la funcin aleatoria, que contiene
un nmero infinito de distribuciones de probabilidad. Por ende, la puesta en marcha de las
herramientas probabilsticas requiere simplificaciones.

0,$*HRHVWDGtVWLFD  
'LVWULEXFLRQHVXQLYDULDEOH\ELYDULDEOHV

Estas distribuciones corresponden a los casos particulares donde N = 1 y N = 2. En


general, los datos disponibles permiten inferir estas distribuciones. Es la razn por la cual la
determinacin de un modelo de distribucin espacial suele basarse en dichas distribuciones,
aunque las distribuciones de orden superior (trivariables, quadrivariables...) del modelo no
se respaldan en la informacin proporcionada por los datos.

'LVWULEXFLyQXQLYDULDEOH:

)" 1 ( ]1 ) = Prob{= ([1 ) < ]1} .

)# 1 corresponde a la funcin de distribucin de la variable aleatoria =([1) ubicada en [1


(Figura 3, izquierda).


)LJXUD. Ejemplo de funcin de distribucin y densidad de probabilidad univariable.
La densidad de probabilidad se obtiene al derivar la funcin de distribucin.

'LVWULEXFLyQELYDULDEOH:

)$ 1 ,$ 2 ( ]1 , ]2 ) = Prob{= ([1 ) < ]1 , = ([ 2 ) < ]2 } .

)# 1,# 2 corresponde a la funcin de distribucin conjunta del par de variables aleatorias


{=([1),=([2)} (Figura 4, izquierda).

0,$*HRHVWDGtVWLFD  
)LJXUD. Ejemplo de funcin de distribucin y densidad de probabilidad bivariable.
La densidad de probabilidad se obtiene al tomar las derivadas parciales de la
funcin de distribucin con respecto a cada uno de sus argumentos.

0RPHQWRV

En muchos problemas (como el de interpolacin por kriging), se puede simplificar aun


ms la caracterizacin de la funcin aleatoria, al considerar solamente algunos parmetros
descriptivos o PRPHQWRV de las distribuciones univariables y bivariables, que resumen la
informacin ms relevante.

Estos son:

El YDORUHVSHUDGR (esperanza, o momento de primer orden):

P ( [ ) = ( [ = ( [ )] .

En cada sitio [ dado, P([) representa la media alrededor de la cual se distribuyen los
valores tomados por las realizaciones de la funcin aleatoria.

La YDULDQ]D, o varianza DSULRUL, definida por:

2 ([) = var [ = ([)]


= ( {[ = ([) P([)]2 }
= ( [ = ( [) 2 ] P( [ ) 2

La varianza es una cantidad positiva. Su raz cuadrada se llama GHVYLDFLyQHVWiQGDU.


La varianza y la desviacin estndar constituyen medidas de la dispersin de =([) en
torno a su valor medio P([) y cuantifican, de esta forma, su carcter aleatorio .

0,$*HRHVWDGtVWLFD  
La FRYDULDQ]Dcentrada entre dos variables aleatorias =([1) y =([2):

& ([1 , [ 2 ) = cov [ = ([1 ), = ([ 2 )]


= ( {[ = ([1 ) P([1 )][ = ([ 2 ) P([ 2 )]}
= ( [ = ([1 ) = ([ 2 )] P([1 ) P([ 2 )

La covarianza da una visin elemental del vnculo o interaccin que existe entre =([1)
y =([2). La desigualdad de Cauchy-Schwarz relaciona la covarianza entre =([1) y =([2)
con las varianzas de =([1) y =([2):

| cov[ = ([1 ), = ([ 2 )]| var[ = ([1 )] var[ = ([ 2 )] .

El FRUUHORJUDPD (coeficiente de correlacin lineal) entre dos variables aleatorias =([1)


y =([2):

([1 , [ 2 ) = corr [ = ([1 ), = ([ 2 )]


cov [ = ([1 ), = ([ 2 )] .
=
var [ = ([1 )] var [ = ([ 2 )]

Al contrario de la covarianza, el correlograma es adimensional y toma sus valores en el


intervalo [1,1]. Un coeficiente nulo indica que las variables =([1) y =([2) no estn
correlacionadas (condicin necesaria para que sean independientes), mientras que un
coeficiente igual a 1 1 indica que son proporcionales.

El VHPLYDULRJUDPD entre dos variables aleatorias =([1) y =([2):

1
([1 , [ 2 ) = var[ = ([1 ) = ([ 2 )] .
2

En adelante, para aliviar la escritura, se omitir sistemticamente el prefijo semi y se


hablar solamente de variograma .

,QIHUHQFLDHVWDGtVWLFD+LSyWHVLVGHHVWDFLRQDULGDG

Para poner en marcha el formalismo probabilstico, es necesario poder determinar, por


lo menos parcialmente, la distribucin espacial de la funcin aleatoria a partir de los datos
disponibles sobre la variable regionalizada (etapa de LQIHUHQFLD HVWDGtVWLFD). Dos razones
impiden poder realizar la inferencia estadstica en su forma ms general: por una parte, la
variable regionalizada slo es XQD realizacin de la funcin aleatoria; por otra parte, esta
realizacin se conoce de manera fragmentaria, en algunos sitios de muestreo.

0,$*HRHVWDGtVWLFD  
Para salir de este problema algunas restricciones son necesarias. Recurren a la nocin
de HVWDFLRQDULGDG. La idea es permitir la inferencia estadstica, reemplazando la repeticin
sobre las realizaciones de la funcin aleatoria (inaccesibles, por disponer solamente de una
realizacin) por una repeticin en el espacio: se supone que los valores que se encuentran
en las diferentes regiones del campo presentan las mismas caractersticas y, por ende,
pueden considerarse como distintas realizaciones del mismo proceso aleatorio.

Del punto de vista matemtico, la hiptesis de estacionaridad consiste en postular que


la distribucin espacial de la funcin aleatoria es invariante por traslacin, es decir, que las
propiedades de un conjunto de datos no dependen de su posicin absoluta en el espacio,
sino que solamente de sus posiciones relativas. Esto implica las siguientes simplificaciones:

La GLVWULEXFLyQXQLYDULDEOH no depende del sitio considerado

) ( ]1 ) = Prob{= ([1 ) < ]1} .

En particular, la HVSHUDQ]D y la YDULDQ]D son constantes en el espacio:

P = ( [ = ( [ )]
2 = var[ = ([)]

La GLVWULEXFLyQELYDULDEOH slo depende de la separacin entre los sitios considerados:

)% ( ]1 , ]2 ) = Prob{= ([ + K) < ]1 , = ([) < ]2 } .

Lo mismo ocurre para los momentos de esta distribucin (FRYDULDQ]D, FRUUHORJUDPD y


YDULRJUDPD):

& (K) = cov[ = ([ + K), = ([)]


(K) = corr[ = ([ + K), = ([)]
1
(K) = var[ = ([ + K) = ([)]
2

Estos parmetros son ms importantes que la esperanza y la varianza, pues muestran la


interaccin existente entre dos valores, luego dan una descripcin sinttica de la
continuidad espacial de la variable regionalizada. La covarianza y el correlograma
indican qu tan VHPHMDQWHV son los valores entre dos sitios, mientras que el variograma
indica qu tan GHVHPHMDQWHV son. Siendo constante la esperanza, se tiene tambin:

1
(K) = ({[ = ([ + K) = ([)]2 } .
2

0,$*HRHVWDGtVWLFD  
LQWHUSUHWDFLyQ
9DULDEOHUHJLRQDOL]DGD )XQFLyQDOHDWRULD

FDUDFWHUL]DFLyQ

0RPHQWRV UHVXPHQ 'LVWULEXFLyQHVSDFLDO


esperanza, varianza distribucin univariable
covarianza, variograma distribuciones bivariables

VLPSOLILFDFLyQ
distribuciones multivariables

+LSyWHVLVGHHVWDFLRQDULGDG
esperanza y varianza son constantes
covarianza y variograma slo dependen de la separacin entre datos

)LJXUD. Esquema sinttico de los conceptos


e hiptesis que sustentan el modelo geoestadstico

5HODFLRQHVHQWUHPRPHQWRV

Bajo la hiptesis de estacionaridad, se tiene las siguientes relaciones:

La varianza es igual a la funcin de covarianza evaluada para el vector K = :

2 = & ( )

El correlograma es igual a la covarianza dividida por la varianza:

(K) = & (K) / & ()

El variograma es igual a la varianza menos la covarianza:

(K) = & () & (K) .

Cuando la norma del vector de separacin K se vuelve infinita, la covarianza tiende a 0


y el variograma es igual a la varianza:

( ) = & ( ) = 2 .

0,$*HRHVWDGtVWLFD