Anda di halaman 1dari 17

UNIVERSIDADE DE SÃO PAULO

ESCOLA SUPERIOR DE AGRICULTURA “LUIZ DE QUEIROZ”


DEPARTAMENTO DE CIÊNCIAS EXATAS
DISCIPLINA DE ANÁLISE MULTIVARIADA

GEOESTATÍSTICA MULTIVARIADA

ALINE MARQUES GENÚ

Piracicaba
Julho de 2004
GEOESTATÍSTICA MULTIVARIADA

1 INTRODUÇÃO

O avanço do conhecimento nas diversas áreas que compõem a ciência


agronômica tem evidenciado as limitações dos métodos tradicionais da
estatística, no tratamento da variabilidade espacial de variáveis do sistema solo
– planta – água – atmosfera.
As técnicas da estatística clássica assumem que todas as amostras são
aleatórias e independentes de uma distribuição de probabilidade simples - esta
suposição é chamada estacionaridade. Sua aplicação não envolve qualquer
conhecimento da posição atual das amostras ou do relacionamento entre
amostras. Já a geoestatística assume que a distribuição das diferenças de
variáveis entre dois pontos amostrados é a mesma para toda a área, e que isto
depende somente da distância entre eles e da orientação dos pontos (Clark,
1979).
Os métodos geoestatísticos, ou simplesmente geoestatística, foram
desenvolvidos graças aos estudos do engenheiro de minas Georges Matheron
na França no final da década de 50 e início da década de 60. Estes métodos
estão fundamentados na Teoria das Variáveis Regionalizadas, que foi
formalizada por Matheron, a partir de estudos práticos desenvolvidos por
Daniel G. Krige no cálculo de reservas nas minas de ouro do Rand na África do
Sul.
A geoestatística multivariada é a aplicação destes métodos matemáticos
e estatísticos a problemas das Ciências da Terra, com o objetivo principal de
estimar simultaneamente um conjunto de variáveis espacialmente
correlacionadas (variáveis corregionalizadas). A utilização desta técnica é mais
eficiente quando uma das variáveis não foi amostrada em quantidade suficiente
devido a dificuldades experimentais ou altos custos, proporcionando
estimativas de precisão aceitável.

2
2 GEOESTATÍSTICA

2.1 Teoria das variáveis regionalizadas

Na teoria das variáveis regionalizadas, Z(x) pode ser definida como uma
variável aleatória que assume diferentes valores Z em função da posição x
dentro de uma certa região S, e representa pares de coordenadas (xi, yi)
(Figura 1). O ponto de referencia para o sistema de coordenadas é arbitrário e
fixado a critério do interessado (Vieira, 2000). O conjunto de variáveis Z(x)
medidas em toda a área S pode ser considerada uma função aleatória Z(x)
uma vez que, segundo Isaaks e Srivastava (1989), são variáveis aleatórias,
regionalizadas e assume-se que a dependência entre elas é especificada por
algum mecanismo probabilístico.

Y
S

Yi •Z(x)

Xi X

Figura 1. Variável aleatória regionalizada Z(x).

A interpretação probabilística de que a variável regionalizada Z(x) é uma


particular realização de uma certa função aleatória Z(x) é consistente quando
se pode inferir toda ou pelo menos parte da lei de distribuição de probabilidade
que define esta função aleatória (Journel & Huijbregts, 1978). No entanto, em
problemas práticos, em cada ponto x tem-se apenas uma realização Z(x) e o
número de pontos é sempre finito. Isto torna usualmente impossível inferir
sobre a distribuição de Z(x). Em vista disto, certas hipóteses são necessárias,
as quais envolvem diferentes graus de homogeneidade espacial, sendo
comumente denominadas hipóteses de estacionaridade.

3
A hipótese de estacionaridade de primeira ordem é definida por
Trangmar et al. (1985) como sendo a hipótese de que o momento de primeira
ordem da distribuição da função aleatória Z(x) é constante em toda a área, ou
seja:

E [Z(x)] = E [Z(x+h)] = m

em que m é a média dos valores amostrais.


Decorre desta definição que se for tomado um vetor h de separação
entre dois pontos, o qual apresenta módulo e direção, para qualquer h tem-se:

E [Z(x) - Z(x+h)] = 0

Considerando-se que a diferença entre as duas v.a. {Z(x) - Z(x+h)} é uma


v.a., isto corresponde a afirmar que o primeiro momento desta v.a. é igual a
zero.
A estacionaridade de segunda ordem é definida quando, além de
atender à estacionaridade de primeira ordem, a função aleatória apresenta a
característica de, para cada par de valores {Z(x), Z(x+h)}, a covariância existe e
depende apenas da distância de separação h que pode ser definida por:

Cov ( x ,x + h ) = E [Z ( x ) * Z ( x + h ) ] − [E [Z ( x ) ]][E [Z ( x + h ) ]]

O segundo momento da variável aleatória correspondente à diferença


entre dois pontos, e então, dado por duas vezes a variância menos duas vezes
a covariância dos valores, sendo a sua metade um valor denominado função
de semivariância, que é definida como:

{
2γ ( x,x + h ) = E [Z ( x ) − Z ( x + h )]
2
}

Dentro da hipótese de estacionaridade de segunda ordem, a covariância


e a semivariância são ferramentas equivalentes para caracterizar a auto-
correlação entre duas variáveis Z(x) e Z(x+h), separadas pela distância h (Journel

4
& Huibregts, 1978). A primeira expressa a similaridade dos valores e a segunda
o afastamento relativo destes.
A estacionaridade de segunda ordem implica a existência da covariância
e, portanto uma variância finita Var(Z(x)) = Cov(0). Esta hipótese pode não ser
satisfeita para alguns fenômenos físicos, para tais situações, uma hipótese
menos restritiva, a hipótese intrínseca, pode ser aplicável (Vieira, 2000). Esta
hipótese requer apenas a existência e estacionaridade do variograma, sem
nenhuma restrição quanto à existência de variância finita, o que corresponde
ao fato de que para todo vetor h, a variância da diferença [Z(x) - Z(x+h)] é finita e
independente da posição na região, dependendo apenas do valor de h, ou seja:

Var[Z(x) - Z(x+h)] = E[Z(x) - Z(x+h)]2 = 2 γ(h)

Na qual a função 2 γ(h) é o semivariograma.

2.2 Semivariograma

A estimativa da dependência entre amostras vizinhas no espaço pode


ser realizada através da autocorrelação que é de grande utilidade quando se
está fazendo amostragem em uma direção. Quando a amostragem envolve
duas direções (x,y) o instrumento mais indicado na estimativa da dependência
entre amostras é o semivariograma (Silva, 1988).
O semivariograma analisa o grau de dependência espacial entre
amostras dentro de um campo experimental, além de definir parâmetros
necessários para a estimativa de valores para locais não amostrados, através
da técnica de krigagem (Salviano, 1996).
O variograma é a ferramenta básica, que permite descrever
quantitativamente a variação no espaço de um fenômeno regionalizado
(Huijbregts, 1975). A natureza estrutural de um conjunto de dados (assumido
pela variável regionalizada) é definida a partir da comparação de valores
tomados simultaneamente em dois pontos, segundo uma determinada direção.
A função de semivariância γ(h) é definida como sendo a esperança matemática

5
do quadrado da diferença entre os valores de pontos no espaço, separados por
uma distância h, conforme a seguinte equação:

γ(h)= (1/2) E {[Z(x) - Z(x+h)]2}

E pode ser estimado por:

2
1 N (h)
γ * (h) = ∑ [z( x i ) − z( x i + h)]
2N (h ) i =1

em que N(h) é o número de pares de valores medidos Z(xi), Z(xi+h), separados


por um vetor h (Journel & Huibregts, 1978).
O gráfico de (h) versus h representa o semivariograma, que permite
obter a estimativa do valor de semivariância para as diferentes combinações de
pares de pontos e assim analisar o grau de dependência espacial da variável
estudada e definir os parâmetros necessários para a estimativa de suas
características em locais não amostrados (Souza, 1999).
A medida que h aumenta (h) também aumenta pois é de se esperar
que amostras tiradas a uma pequena distância entre si apresentem Z(x)-Z(x+h)2
menores que aquelas tiradas a distâncias maiores (Silva, 1988; Camargo,
1997). O ajuste do modelo matemático aos dados no gráfico, ou seja, a uma
função, define os parâmetros do semivariograma, que são: efeito pepita (Co),
que é o valor de quando h=0; quando h aumenta freqüentemente, aumenta
até uma distância a, chamada de alcance (a) da dependência espacial; e a
partir da qual (h) neste ponto é chamado de patamar (C+Co), cujo valor é
aproximadamente igual à variância dos dados, se ela existe, e é obtido pela
soma do efeito pepita e a variância estrutural (C) (Figura 2).

6
2.0E-4
C + Co

semivariância Gama(h)
1.5E-4

1.0E-4

5.0E-5
Experimental
Co
a Modelo
0.0E+0
0.0 15.0 30.0 45.0 60.0

Distância de separação - h

Figura 2. Semivariograma experimental e modelo matemático ajustado.

Amostras separadas por distâncias menores do que o alcance são


espacialmente dependentes, enquanto aquelas separadas por distâncias
maiores, não são, ou seja, um semivariograma igual à variância dos dados
implica em variação aleatória. O alcance também é utilizado para definir o raio
de ação ("range") máximo de interpolação por krigagem, onde os pesos
utilizados na ponderação podem afetar os valores estimados (Souza, 1992).
No comportamento típico de um semivariograma ajustado, o valor de
semivariância aumenta à medida que aumenta a distância de separação entre
os pontos, até estabilizar-se, ou seja, atingir um patamar (Vieira, 2000). O
patamar ("sill") é atingido quando a variância dos dados se torna constante com
a distância entre as amostras. O valor de (h) nesse ponto é aproximadamente
igual a variância total dos dados. Ë um parâmetro importante, pois permite a
determinação da distância limite entre dependência e independência entre das
amostras (Silva, 1988).
O efeito pepita, que é um parâmetro importante do semivariograma,
reflete o erro analítico, indicando uma variabilidade não explicada (ao acaso)
de um ponto para o outro, que pode ser devida tanto a erros de medidas ou
microvariação não detectada em função da distância de amostragem utilizada,
sendo impossível quantificar a contribuição individual dos erros de medições ou
da variabilidade.

7
Dependendo do comportamento do semivariograma para grandes
valores de h, o modelo a ser usado pode ser classificado em duas categorias:
a) modelo sem patamar e b) modelo com patamar.
Os modelos com patamar normalmente são ajustes que representam a
estacionaridade de segunda ordem, onde a semivariância aumenta com o
aumento da distância entre amostras, até atingir o patamar, onde se estabiliza
(Machado, 1994). Já os modelos sem patamar satisfazem apenas a hipótese
intrínseca e os semivariogramas podem ser definidos, mas não se estabilizam
em nenhum patamar.

2.3 Krigagem

Conhecido o semivariograma da variável, e havendo dependência


espacial entre as amostras, podem-se interpolar valores em qualquer posição
no campo de estudo, sem tendência e com variância mínima (Vieira, 2000). O
método de interpolação chama-se krigagem e tem como base os dados
amostrais da variável regionalizada e as propriedades estruturais do
semivariograma obtido a partir destes dados o que permite visualizar o
comportamento da variável na região através de um mapa de isolinhas ou de
superfície.
Segundo Salviano (1996) o valor estimado da variável é dado pela
expressão:

n
Z * ( x 0 ) = λ0 + ∑ λi Z ( x i )
i =1

na qual N é o número de vizinhos medidos, Z(xi) utilizados na estimativa da


variável e i são os ponderadores aplicados a cada Z(xi), os quais são
selecionados de forma que a estimativa obtida seja não tendenciosa. Isto
implica em assumir duas condições:
{ }
E {Z * ( x 0 ) − Z ( x 0 )} = 0 e Var {Z * ( x 0 ) − Z ( x 0 ) = E [Z * ( x 0 ) − Z ( x 0 )] 2 = mínima.

8
Estas duas condições garantem que o estimador de krigagem seja o
melhor estimador linear não tendencioso (BLUE = Best Linear Unbiased
Estimator) pois apresenta variância mínima e não tendencioso por assegurar
que o somatório dos pesos é igual à unidade.

3 GEOESTATÍSTICA MULTIVARIADA

Algumas áreas das ciências agrárias, como a ciência do solo,


freqüentemente apresentam situações em que existe a correlação espacial
entre duas variáveis e, a estimativa de uma delas pode ser feita usando-se
informações de ambas expressas no semivariograma cruzado e no método
chamado co-krigagem (Vieira, 2000).

3.1 Semivariograma cruzado

De maneira semelhante ao estabelecido para uma única variável,


considera-se p variáveis, {Zj(x); j = 1,..., p } que foram medidas dentro da
mesma região S e nos mesmos pontos amostrais (pares de coordenadas [xi,
yi]). Estabelecendo-se 2 variáveis medidas na região S para os mesmos
pontos, temos {[Z1(x)] e [Z2(x)]} de tal forma que a covariância cruzada entre
elas seja:

Cov12 (h) = E{ Z1(x+h)Z2(x)} – m1m2


e
Cov21 (h) = E{ Z2(x+h)Z1(x)} – m2m1

Conseqüentemente, o semivariograma cruzado entre estas variáveis será:

1 N(h)
γ 12 * (h) = ∑ {[z1( x + h) − z1( x )][Z2 ( x + h) − Z2 ( x )]}
2N (h ) i =1
O semivariograma cruzado ideal teria a mesma aparência mostrada na
figura 1 porem, com significados diferentes pelo simples fato de envolver o
produto das diferenças de duas variáveis distintas. O alcance neste caso
representa o final ou a distância máxima de dependência espacial entre as

9
variáveis. O patamar, se existir, deve aproximar-se do valor da covariância
entre as duas variáveis. Assim, quando as duas forem de correlação inversa o
semivariograma cruzado será negativo.

3.2 Cokrigagem

A cokrigagem é um procedimento geoestatístico segundo o qual


diversas variáveis regionalizadas podem ser estimadas em conjunto, com base
na correlação espacial entre si. É uma extensão multivariada do método da
krigagem quando para cada local amostrado obtém-se um vetor de valores em
lugar de um único valor.
A aplicação da cokrigagem torna-se bastante evidente quando duas ou
mais variáveis são amostradas nos mesmos locais dentro de um mesmo
domínio espacial e apresentam significativo grau de correlação. Valores
ausentes não se tornam problemáticos, pois o método deve ser usado
exatamente quando uma das variáveis apresenta-se sub-amostrada em
relação às demais (Landim et al., 2002).
A estimativa de uma variável Z* para qualquer local x0 deve ser uma
combinação linear de Z1 e Z2, ou seja:

n1 n2
Z * ( x0 ) = ∑ λi Z1( xi ) + ∑ λi Z2 ( xi )
i =1 i =1

Em que N1 e N2 são os número de vizinhos medidos de Z1 e Z2,


respectivamente, e λ1 e λ2 são os ponderadores associados a Z1 e Z2 os quais
são distribuídos de acordo com a dependência espacial de cada uma das
variáveis entre si e com a correlação cruzada entre elas. Da mesma forma que
a krigagem, para que este estimador seja ótimo, ele também deve ter variância
mínima e ser não tendencioso.

4 EXEMPLO

O objetivo deste trabalho realizado por Carvalho & Assad (20030 foi
incorporar a altitude como variável auxiliar na determinação do mapa de

10
variabilidade espacial de precipitação pluvial para o Estado de São Paulo
através da utilização de um interpolador geoestatístico multivariado
(cokrigagem). Para tanto, foram utilizadas mil e vinte e sete observações de
precipitação pluvial anual média provenientes de estações climáticas
abrangendo todo Estado de São Paulo, representando uma área de
aproximadamente 248.808,82 km2 (2,91% do território nacional), no período de
1957 a 1997.
Os índices pluviométricos das estações localizadas no litoral (Figura 3),
devido ao relevo da região (Figura 4), apresentam resultados que seguem uma
ordem própria sendo discrepantes dos demais. Isto ocorre devido ao relevo
concordante (a Serra do Mar se dispõem paralelamente à linha da costa), as
vertentes a barravento (lado de onde sopra o vento) são mais expostas aos
ventos úmidos.

Figura 3. Precipitação pluviométrica anual média para o Estado de São Paulo.

11
Figura 4. Altitude de estações climáticas do Estado de São Paulo.

A geoestatística foi utilizada para avaliar a variabilidade espacial dos


atributos estudados. Para tanto, é necessário conhecer o grau de dependência
espacial entre as amostras, que pode ser avaliado pelo semivariograma,
possibilitando construir mapas de isolinhas ou tridimensionais para exame e
interpretação da variabilidade espacial.
Para os semivariogramas de precipitação (Figura 5) e altitude (Figura 6),
o grau de ajuste dos modelos foi verificado através do coeficiente de
determinação R2 cujos valores foram de 0,86 e 0,97 respectivamente. Os
dados dos modelos ajustados encontram-se na Tabela 1.

Tabela 1. Dados dos modelos ajustados aos semivariogramas de precipitação


e altitude.

Variável Modelo Efeito Pepita Patamar (%) Alcance (Km)


Precipitação Esférico 4533,46 5,6 37,19
Altitude Exponencial 1274,73 2,9 79,81

12
Figura 5. Semivariograma da variável precipitação.

Figura 6. Semivariograma da variável altitude.

Como a correlação entre precipitação anual e altitude foi altamente


significativa, mostrando que a precipitação é maior para menores altitudes
(especificamente no litoral), o semivariograma cruzado entre estas variáveis foi
examinado. O modelo ajustado foi o gaussiano (Figura 7), mostrando que a
relação espacial entre precipitação anual e altitude existe e é alto C = 0 (quanto
maior o efeito pepita, mais fraca é a dependência espacial do atributo em
questão). Conseqüentemente, a variável altitude pode ser usada como variável

13
auxiliar na obtenção de estimativas em lugares não amostrados para a
precipitação anual em toda a área em estudo, dentro do alcance.

Figura 7. Semivariograma cruzado entre as variáveis altitude e precipitação.

Dentre os métodos geoestatísticos de interpolação, os quais utilizam a


correlação espacial entre observações vizinhas para predizer valores em locais
não-amostrados, têm sido muito mais utilizados. A krigagem simples é o
método geoestatísticos univariados que têm sido usado por muitos autores no
estudo da distribuição espacial de precipitação pluvial. A extensão multivariada
da krigagem, conhecida como cokrigagem, é utilizada quando existe
dependência espacial para cada variável em estudo e também entre as
variáveis, sendo portanto possível utilizar esta técnica na estimativa de valores
não-amostrados
Os valores obtidos através da cokrigagem são não-viciados, têm
variância mínima e são ideais para a construção de mapas de isolinhas ou
tridimensionais para verificação e interpretação da variabilidade espacial. As
informações mostradas nestes gráficos de isolinhas são muito úteis para
melhor entender a variabilidade das propriedades da precipitação pluvial e para
identificar áreas que necessitam maiores ou menores cuidados, como pode ser
visto na Figura 8. Através da cokrigagem, a variância dos erros de estimativas

14
para precipitação é minimizada, explorando a correlação cruzada entre
precipitação e altitude.

Figura 8. Mapa de precipitação média anual obtido pelo interpolador de


cokrigagem.

Desta forma concluiu-se que o uso de altitude como variável auxiliar


numa maior uniformidade da distribuição espacial da precipitação e que as
observações são espacialmente dependente até um alcance de 37,19 Km, em
todas as direções.

5 REFERÊNCIAS BIBLIOGRÁFICAS

CAMARGO, E.C.G. Desenvolvimento, implementação e teste de


procedimentos geoestatísticos (krigeagem) no sistema de processamento
de informações georreferenciadas (Spring). São José dos Campos, 1997.
123p. Dissertação (Mestrado) - Instituto Nacional de Pesquisas Espaciais.

CARVALHO, J. R. P. de; ASSAD, E. D. Comparação de interpoladores


espaciais multivariados para precipitação pluvial anual no Estado de

15
São Paulo. Campinas: Embrapa Informática Agropecuária, 2003. (Embrapa
Informática Agropecuária. Comunicado Técnico 49).

CLARK, I. The semivariogram - Part I. Eng. & Min. J., 180(7):90-94, 1979.

HUIJBREGTS, C.J. Regionalized variables and quantitative analysis of spatial


data. In: Davis, J.C. & McCullagh, M.J. (ed) Display and anaysis of spatial
data. New York, John Wiley. p.38-53. 1975.

ISAAKS, E.H.; SRIVASTAVA, R.M. An Introduction to Applied Geostatistics.


New York: Oxford University Press, 1989. 561 p.

JOURNEL, A.G.; HUIJBREGTS, Ch.J. Mining Geostatistics. London:


Academic Press, 1978. 600 p.

LANDIM, P.M.B. STURARO, J.R. & MONTEIRO, R. C. Exemplos de


aplicação da cokrigagem . DGA, IGCE, UNESP/Rio Claro, Lab.
Geomatemática, Texto Didático 09, 17 pp. 2002. Disponível em
<http://www.rc.unesp.br/igce/aplicada/textodi.html>

MACHADO, R.V. Variabilidade espacial de atributos físico-hídricos em uma


hidrosequência de solos bem à muito mal drenados, 1994. 88p. Dissertação
(Mestrado), Escola Superior de Agricultura de Lavras.

SALVIANO, A.A.C. Variabilidade de atributos de solo e de Crotalaria juncea em


solo degradado do município de Piracicaba-SP. Piracicaba, 1996. 91p. Tese
(Doutorado) - Escola Superior de Agricultura "Luiz de Queiroz",
Universidade de São Paulo.

SILVA, A.P. Variabilidade espacial de atributos físicos do solo. Piracicaba,


1988, 105p. (Doutorado - Escola Superior de Agricultura “Luiz de
Queiroz/USP).

16
SOUZA, L.C. de. Variabilidade espacial da salinidade de um solo aluvial no
semi-árido paraibano. Campina Grande, 1999. 77p. Dissertação (Mestrado)
- Universidade Federal da Paraíba

SOUZA, L.S. Variabilidade espacial do solo em sistemas de manejo. Porto


Alegre, 1992. 162p. Tese (Doutorado) - Universidade Federal do Rio
Grande do Sul.

TRANGMAR, B.B.; YOST, R.S.; UEHARA, G. Application of geostatistics to


spatial studies of soil properties. Advances in Agronomy, 38: 45-94, 1985.

VIEIRA, S. R. Geoestatística em estudos de variabilidade espacial do solo. In:


NOVAIS, R. F. de; ALVAREZ V., V. H.; SCHAEFER, C. E. G. R. (Ed.).
Tópicos em ciência do solo. Viçosa: Sociedade Brasileira de Ciência do
Solo, 2000. v. 1, p. 1-54.

17

Anda mungkin juga menyukai