Anda di halaman 1dari 73

Anlise de Dados de rea

Parte 3 - Anlise
Exploratria
Anlise Exploratria
Definio
Conjunto de ferramentas estatsticas grficas e descritivas
direcionado ao descobrimento de padres em dados.

ESDA (Exploratory Spatial Data Analysis).
Coleo de tcnicas para descrever e visualizar distribuies
espaciais, identificar situaes atpicas, descobrir padres de
associao espacial, clusters e sugerir regimes espaciais ou
formas de heterogeneidade espacial (Anselin).

Tcnicas de Anlise Exploratria
Indicadores Globais de Autocorrelao
suposio: estacionariedade (funo da distncia).
Ex: variograma, correlograma, etc.
Indicadores Locais de Associao Espacial
Ressaltam as situaes atpicas (outliers ).
Ex: Mapa de LISA, grfico de espalhamento de Moran.
Indicadores multivariados da associao espacial
generalizao do variograma em mltiplas dimenses
Proximidade espacial






Proximidade espacial
Na geoestatstica: distncia euclidiana.





Proximidade espacial
Na geoestatstica: distncia euclidiana.
Principal diferena para objetos reas, na
formalizao da proximidade espacial!



Proximidade espacial
Na geoestatstica: distncia euclidiana.
Principal diferena para objetos reas, na
formalizao da proximidade espacial!
Qual distncia de So Jos Jacare?


Proximidade espacial
Na geoestatstica: distncia euclidiana.
Principal diferena para objetos reas, na
formalizao da proximidade espacial!
Qual distncia de So Jos Jacare?
10 mim, 15 km ou so colados .

Proximidade espacial
Na geoestatstica: distncia euclidiana.
Principal diferena para objetos reas, na
formalizao da proximidade espacial!
Qual distncia de So Jos Jacare?
10 mim, 15 km ou so colados .
Depende!


Exemplos de medidas
4 3 2 1
2
14
L L L L
L
w
+ + +
=







proporo da fronteira pelo permetro.

Exemplos de medidas
4 3 2 1
2
14
L L L L
L
w
+ + +
=
- w
ij
= w
ji


- mdia ponderada!

distncia linear entre centrides dos obejtos.
Exemplos de medidas
1
0
14
14
=
=
w
w
para d > limiar

para d s limiar
distncia linear entre centrides dos obejtos.
Exemplos de medidas
1
0
14
14
=
=
w
w
para d > limiar

para d s limiar
inverso da distncia linear.
d
w
1
14
=
Existncia de fronteira comum.
Exemplos de medidas
0
1
24
14
=
=
w
w
P1 faz fronteira com P4
P2 no tem fronteira com P4
Matriz de Proximidade
(
(
(
(

(






=
44 43 42 41
34 33 32 31
24 23 22 21
14 13 12 11
w w w w
w w w w
w w w w
w w w w
W
w
ij
: distncia do objeto i ao objeto j.
Matriz de Proximidade Espacial
Contedo
Matriz (n x n) W , cujos
elementos w
ij
representa uma
medida de proximidade entre
O
i
e O
j


Critrios:-
w
ij
=1, se O
i
toca O
j


w
ij

= 1,

se dist(O
i
,

O
j
) < h


w
ij
= l
ij
/l
i
, onde l
ij
o tamanho da
fronteira entre O
i
e O
j
e l
i
o
permetro de O
i


A
B
C
D
E
A B C D E
A 0 1 0 1 0
B 1 0 1 1 1
C 0 1 0 0 1
D 1 1 0 0 1
E 0 1 1 1 0
Mdia Espacial Mvel
O Mtodo de Mdia Espacial Mvel uma tcnica que
explora o valor mdio
i
do atributo na regio de estudo
(primeira ordem).

Seu estimador definido como:



onde:
W
ij
a matriz de proximidade.
y
i
o valor do atributo em cada rea.
n o nmero de polgonos (reas).
n i
n
j
ij
n
j
i ij
i
W
y W
..., , 2 , 1
1
1
=

=
=
=
Mdia Espacial Mvel
n i
n
j
ij
n
j
i ij
i
W
y W
..., , 2 , 1
1
1
=

=
=
=
A
B
C
D
5
24
15
20
(
(
(
(
(
(
(
(
(
(
(
(
(
(

(
(
(
(
(
(
(
(
(
(
(
(
(
(

=
(
(
(
(
(
(
(
(
(
(
(
(
(
(

5
24
15
20
3
1
3
1
3
1
0
4
1
4
1
4
1
4
1
4
1
4
1
4
1
4
1
0
3
1
3
1
3
1
66 , 14
00 , 16
00 , 16
66 , 19
19,66 (5x0) (24x1/3) (15x1/3) (20x1/3) = + + + =
A

16,0 (5x1/4) (24x1/4) (15x1/4) (20x1/4) = + + + =


B

14,66 (5x1/3) (24x1/3) (15x1/3) (20x0) = + + + =


D

16,0 (5x1/4) (24x1/4) (15x1/4) (20x1/4) = + + + =


C

Antes
A
B
C
D
14,66
16,0
16,0
19,66
Depois
Mdia Espacial Mvel




Agrupamento estatstico Mdia Espacial Mvel
Efeito de
suavizao
Mdia Espacial Mvel




Regies onde existe disparidade entre o valor
do atributo e o valor da mdia local indicam
pontos de transio entre regimes espaciais.
Atributo
Mdia local
Indicadores Globais de Autocorrelao
Espacial
Explorar a dependncia espacial
Autocorrelao espacial.
Mede o quanto o valor observado de um atributo numa
regio independente dos valores desta mesma varivel
nas localizaes vizinhas.
Indicadores Globais
Moran, Geary, Variograma
Indicadores Locais
Local Moran, Local Geary
Variabilidade Espacial: Variograma
Passo1: Transformar mapas poligonais em
amostras


h


h






h


h
o
Vetor distncia h
Variabilidade Espacial: Variograma
Passo2 : Medir a
Varincia no Espao

Para cada par Z(x) e
Z(x+h), separados por
um vetor distncia h,
medimos a varincia
entre eles
Variograma para Dados de rea
Gerar Centrides a partir de reas
Modelar o Variograma
Interpolar uma Superfcie (se desejar)
VARIOGRAMAS DO I.C.V.
VARIOGRAMAS DO I.C.V.
VARIOGRAMAS DO I.C.V.
VARIOGRAMAS DO I.C.V.
VARIOGRAMAS DO I.C.V.
DIC D CODIO D VIDA
ICV = 1
ICV = 0
VARIOGRAMAS DO I.D.H.
VARIOGRAMAS DO I.D.H.
VARIOGRAMAS DO I.D.H.
VARIOGRAMAS DO I.D.H.
VARIOGRAMAS DO I.D.H.
forma genrica:
Forma genrica dos ndices

ij
w

ij
a



= I
n
j
ij ij i
a w
I =
w a
ij ij
j
n
i
n
local
global
forma genrica:
Forma genrica dos ndices
onde:
ij
w
: medida de proximidade entre objetos i e j

ij
a :expresso que representa a associao
entre os atributos do objeto i com
os demais objetos de sua vizinhana.


= I
n
j
ij ij i
a w
I =
w a
ij ij
j
n
i
n
local
global
( ) ( )
x x x x
j i

z z
i j
( )
2
j i
x x

( )
2
j i
z z

( )
j i j
x x ou x
+
( ) z ou z z
j i j
+

= I
n
j
ij ij i
a w
I =
w a
ij ij
j
n
i
n
Forma genrica dos ndices


( ) ( )
x x x x
j i

z z
i j
( )
2
j i
x x

( )
2
j i
z z

( )
j i j
x x ou x
+
( ) z ou z z
j i j
+

= I
n
j
ij ij i
a w
I =
w a
ij ij
j
n
i
n
Forma genrica dos ndices
Quando aij da forma:

( ) ( )
x x x x
j i

z z
i j
Moran (covarincia)
( )
2
j i
x x

( )
2
j i
z z

( )
j i j
x x ou x
+
( ) z ou z z
j i j
+

= I
n
j
ij ij i
a w
I =
w a
ij ij
j
n
i
n
Forma genrica dos ndices
Quando aij da forma:

( ) ( )
x x x x
j i

z z
i j
Moran (covarincia)
( )
2
j i
x x

( )
2
j i
z z

Geary (varincia)
( )
j i j
x x ou x
+
( ) z ou z z
j i j
+

= I
n
j
ij ij i
a w
I =
w a
ij ij
j
n
i
n
Forma genrica dos ndices
Quando aij da forma:

( ) ( )
x x x x
j i

z z
i j
Moran (covarincia)
( )
2
j i
x x

( )
2
j i
z z

Geary (varincia)
( )
j i j
x x ou x
+
( ) z ou z z
j i j
+
G ou G* (mdia mvel)

= I
n
j
ij ij i
a w
I =
w a
ij ij
j
n
i
n
Forma genrica dos ndices
Quando aij da forma:
Indice Global de Moran





onde:
n corresponde ao nmero de reas,
y
i
o valor do atributo considerado na rea i,
representa o valor mdio do atributo na regio de estudo,
w
ij
so os pesos atribudos conforme a conexo entre as reas i e
j.
( )( )
( )

=
= =
= =


=
n
i
i
n
i
n
j
j i ij
n
i
n
j
ij
y y
y y y y w
w
n
I
1
1 1
1 1
2
y
Indicadores Globais Moran





Qual o significado do ndice global de Moran ( I ) ?
Como interpretar a equao acima ?
Qual sua siginificncia ou validade estatstica ? Como
avaliar ?

( )( )
( )

=
= =
= =


=
n
i
i
n
i
n
j
j i ij
n
i
n
j
ij
y y
y y y y w
w
n
I
1
1 1
1 1
2
ndice Globais de Moran





anlogo ao coeficiente de correlao convencional, porque
tm em seu numerador um termo que produto de momento.
Como um coeficiente de correlao, os valores de I tambm
variam de -1 a +1, quantificando o grau de autocorrelao
espacial existente.

-1 autocorrelao espacial negativa ou inversa.
0 significa aleatoriedade
+1 significa autocorrelao espacial positiva ou direta.
( )( )
( )

=
= =
= =


=
n
i
i
n
i
n
j
j i ij
n
i
n
j
ij
y y
y y y y w
w
n
I
1
1 1
1 1
2
Indicadores Globais de Autocorrelao
Espacial


Consideremos o exemplo que segue:
( )
( ) ( ) ( ) ( )
5 , 50
4
16 5 16 24 16 15 16 20
2 2 2 2
2
2
=
+ + +
=

=
n
y y
Varincia
n
i
i
1
o
16
4
5 24 15 20
=
+ + +
= y Mdia
1063 , 7 5 , 50
2
= = = o o Padro Desvio
A
B
C
D
5
24
15
20
A B C D
A 0 1 1 0
B 1 0 1 1
C 1 1 0 1
D 0 1 1 0
Matriz de Proximidade




A equao de I pode ser simplificada [N(=0 e o
2
=1)] e
alteramos W, de forma que a soma dos elementos de cada linha
seja igual a 1.
Indicadores Globais de Autocorrelao
Espacial
( )( )
( )

=
= =
= =


=
n
i
i
n
i
n
j
j i ij
n
i
n
j
ij
y y
y y y y w
w
n
I
1
1 1
1 1
2

=
= =
=
n
i
i
n
i
n
j
j i ij
z
z z w
I
1
1 1
2
( )
o
y y
z
i
i

=
A B C D
A 0 1 1 0
B 1 0 1 1
C 1 1 0 1
D 0 1 1 0
A B C D
A 0 1/2 1/2 0
B 1/3 0 1/3 1/3
C 1/3 1/3 0 1/3
D 0 1/2 1/2 0







Indicadores Globais de Autocorrelao
Espacial

=
= =
=
n
i
i
n
i
n
j
j i ij
z
z z w
I
1
1 1
2
A B C D
A 0 1/2 1/2 0
B 1/3 0 1/3 1/3
C 1/3 1/3 0 1/3
D 0 1/2 1/2 0
A
B
C
D
5
24
15
20
( )
o
y y
z
i
i

=
z
A

=
0,5628
z
C

=
1,1257
z
D

=
-1,5479
z
B

=
-0,1407
1063 , 7
0 , 16
=
=
o
y
(
(
(
(
(
(
(
(
(

=
(
(
(
(
(
(
(
(
(





(
(
(
(
(
(
(
(
(

0 8712 , 0 1088 , 0 00 , 0
5808 , 0 0 0527 , 0 2111 , 0
0725 , 0 0527 , 0 0 0264 , 0
0 3167 , 0 0396 , 0 0
3959 , 2 7424 , 1 2177 , 0 8711 , 0
7424 , 1 2672 , 1 1583 , 0 6335 , 0
2177 , 0 1583 , 0 0197 , 0 0792 , 0
8711 , 0 6335 , 0 0792 , 0 3167 , 0
*
0
2
1
2
1
0
3
1
0
3
1
3
1
3
1
3
1
0
3
1
0
2
1
2
1
0
9143 , 0
1 1 1 1
= =

= = = =
n
i
n
j
ij
n
i
n
j
j i ij
M z z w
4
1
2
=

=
n
i
i
z 288 , 0
4
9143 , 0
=

= I
w
ij
z
i
z
j
M
ij

*
=
Avaliao da siginificncia do ndice de Moran
(I).

Para estimar a significncia de I, ser preciso associar a
este uma distribuio estatstica, para tanto, duas
abordagens so possveis:
Teste de pseudo-significncia (experimento aleatrio).
Distribuio aproximada (hiptese da normalidade).
Significncia do ndice de Moran
A validade estatstica do ndice de Moran (I) sob o
teste de pseudo-significncia.






Se o ndice I efetivamente medido corresponder a um
extremo da distribuio simulada, ento trata-se
de evento com significncia estatstica.
Indicadores Globais de Autocorrelao
Espacial
Distribuio
simulada
e
x
t
r
e
m
o

e
x
t
r
e
m
o



Para um nmero suficiente de sub-regies o ndice I tem uma
distribuio amostral que aproximadamente normal, dada por:



onde:
n = nmero de regies,

I de Moran: Validade Estatstica
) 1 (
1
) (

=
n
I E
2 2
2
2 1
2
2
) 1 )( 1 (
2 ) 1 ( ) 1 (
o
o
S n n
S S n n S n n
+

= o
j i para w S
ij o
= =

( ) j i para w w S
ij ij
= + =

2
1
( ) j i para w w S
ij ij
= + =

2
2
0
Normal Padro
1,96 -1,96
95%
o
) (I E I
I
N

=
ndice Moran Normalizado
Km.
0 100 200
S
So Paulo
Minas Gerais
Esprito
Santo
Rio de Janeiro
N
L O
LEGENDA
classes (n de municpios)
0,95 a 1,906 (28)
1,906 a 2,862 (209)
2,862 a 3,818 (460)
3,818 a 4,774 (223)
4,774 a 5,73 (64)
0 bitos (448)
Capitais
Mapeando a Violncia: Dados de rea
Fonte: Carvalho, M. S., 1998.
FIOCRUZ - RJ
-0.2
0.0
0.2
0.4
0.6
ES
0 100 200 300 400 500 600
MG
RJ
-0.2
0.0
0.2
0.4
0.6
SP
0 100 200 300 400 500 600
distncia
a
u
t
o
-
c
o
r
r
e
l
a

o

Indicadores Globais de Autocorrelao
Espacial
Fonte: Carvalho, M. S., 1998.
FIOCRUZ - RJ
Diagrama de Espalhamento de Moran


Este diagrama relata espacialmente o relacionamento entre os valores do vetor de
desvios Z ( ) e os valores das mdias locais WZ, indicando diferentes regimes
espaciais presentes nos dados.

z z
i

I equivalente a tg o
0
0
z
WZ
o
Reta de regresso de WZ em Z
Q
3
Q
2

Q
1
Q
4

Z Z
WZ Z
I
t
t
=
Nesta formulao, I equivale ao
coeficiente de regresso linear, ou
seja a inclinao da reta de regresso.
Diagrama de Espalhamento de Moran
0
0
z
WZ
o
Q
3
Q
2

Q
1
Q
4

Q
1
(val. [+], mdias [+]) e Q
2
(val. [-], mdias [-])

Indicam pontos de associao espacial positiva, no
sentido que uma localizao possui vizinhos com
valores semelhantes.
Q
3
(val. [+], mdias [-]) e Q
4
(val. [-], mdias [+])

Indicam pontos de associao espacial negativa, no
sentido que uma localizao possui vizinhos com
valores distintos.
Nota:- os pontos localizados em Q
3
e Q
4
podem ser vistos
como extremos, tanto por estar afastados da reta de regres-
so linear, como por indicar regies que no seguem o mes-
mo processo de dependncia espacial das demais observa-
es. Estes pontos marcam regies de transio entre regi-
mes espaciais distintos.
Autocorrelao Espacial
O Diagrama de Espalhamento de Moran pode ser apresentado na forma de um mapa
coropltico bidimensional, no qual cada polgono apresentado indicando-se seu
quadrante no diagrama de espalhamento.


0
0
z
WZ
o
Q
3 =
HL Q
2=
LL
Q
1=
HH Q
4 =
LH
So Paulo
Atributo considerado
percentagem de idosos
Indicadores Locais de Associao
Espacial (LISA)
Como vimos anteriormente o estimador de autocorrelao
espacial, Moran (I), fornece um valor nico como medida
da associao espacial.

Por outro lado, muitas vezes necessrio examinar padres
numa escala maior.

Neste caso, preciso utilizar indicadores locais de
associao espacial que possam ser associados a diferentes
localizaes de uma varivel distribuda espacialmente.

A utilizao destes indicadores em conjunto com os
indicadores globais, refinam nosso conhecimento sobre o
processos que do origem a dependncia espacial.










Introduo
ndices locais (LISA):









Introduo
ndices locais (LISA):
Permitem avaliar diferentes regimes espaciais
existentes na rea de estudo.







Introduo
ndices locais (LISA):
Permitem avaliar diferentes regimes espaciais
existentes na rea de estudo.
Medem a associao espacial entre uma observao i e
sua vizinhana.





Introduo
ndices locais (LISA):
Permitem avaliar diferentes regimes espaciais
existentes na rea de estudo.
Medem a associao espacial entre uma observao i e
sua vizinhana.
Requisitos (Anselin)
A soma dos ndices locais deve ser proporcional ao ndice
global.
Indicar a significncia da associao espacial para cada
observao.

Introduo
Indicadores Locais de Associao
Espacial (LISA)
Os indicadores locais de associao espacial, produzem um
valor especfico para cada objeto.
Isto acarreta a identificao de:
Clusters: objetos com valores de atributos semelhantes,
Outliers: objetos anmalos,
A presena de mais de um regime espacial.
Tem que atender a dois objetivos:
Permitir a identificao de padres de associao espacial
significativos;
Ser uma decomposio do ndice global de associao
espacial.
ndice local de Moran
I I
i
i
n

Formulao:
ndice local de Moran
I I
i
i
n

Formulao:
I
w z z
z
n
i
ij i j
j
n
j
j
n
=
=
=

1
2
1
ndice local de Moran
I I
i
i
n

Formulao:
I
w z z
z
n
i
ij i j
j
n
j
j
n
=
=
=

1
2
1
I
z wz
m
i
i i
=
2
ndice local de Moran
I I
i
i
n

Formulao:
I
w z z
z
n
i
ij i j
j
n
j
j
n
=
=
=

1
2
1
I
z wz
m
i
i i
=
2
I
I
n
i
i
n
=



Indicadores locais I
i
de Moran (Anselin, 1996)
Indicadores locais G
i
e

G
i
*
(Getis e Ord, 1992)

O indicador local de Moran I
i
assim definido:

I
i
> 0 clusters de valores similares (altos ou baixos).

I
i
< 0 clusters de valores distintos (Ex: uma
localizao
com valores altos rodeada por uma vizinhana de
valores baixos).
Normalizando as variveis o indicador reduz-se a:
Indicadores Locais de Associao
Espacial (LISA)
( ) ( )
( )
n
y y
y y w y y
I
n
i
i
n
j
j ij i
i

=
=


=
1
1
2

=
=
n
j
j ij i i
z w z I
1
Indicadores Locais de Associao
Espacial (LISA)
De forma similiar aos indicadores globais, a significncia do
ndice local de Moran (I
i
) deve ser avaliado, utilizando hiptese de
normalidade ou simulao de distribuio por permutao
aleatria nos valores dos atributos (Anselin, 1995).

Uma vez determinada a significncia estatstica de Moran (I
i
)
muito til gerar um mapa indicando as regies que apresentam
correlao local significativamente diferente do resto dos dados.

Este mapa denominado por Anselin (1995) de LISA MAP.

Na gerao do LISA MAP, os ndices locais I
i
so classificados
como:
no significantes
com significncia de 95% (1,96o), 99% (2,54o) e 99,9% (3,2o).
Os indicadores locais G
i
e

G
i
*
(Getis e Ord, 1992):





onde:
w
ij
valor na matriz de proximidade para regio i com a regio j em funo da
distncia.
x
i
e x
j
so os valores dos atributos considerados nas reas i e j.
d distncia entre pontos
n o nmero de reas (polgonos)

NOTA: a estatstica G
i
, inclui no numerador a soma de todos os valores de
todos vizinhos dentro de uma distncia d do ponto considerado. G
i
*
difere de
G
i
por incluir a localizao visitada.
Indicadores Locais de Associao
Espacial (LISA)
( )
i j
x
x d w
d G
n
i
j
n
j
i ij
i
= =

=
=
, ) (
1
1
( )
i j
x
x d w
d G
n
i
j
n
j
i ij
i
= =

=
=
, ) (
*
1
1
Os indicadores locais G
i
e

G
i
*
(Getis e Ord, 1992):



onde:
w
ij
valor na matriz de proximidade para regio i com a regio
j em funo da distncia.
x
i
e x
j
so os valores dos atributos considerados nas reas i e j.
d distncia entre pontos
n o nmero de reas (polgonos)

Indicadores Locais de Associao
Espacial (LISA)
( )
i j
x
x d w
d G
n
i
j
n
j
i ij
i
= =

=
=
, ) (
1
1
( )
i j
x
x d w
d G
n
i
j
n
j
i ij
i
= =

=
=
, ) (
*
1
1
Indicadores Locais de Autocorrelao
Espacial
Bolses de excluso/incluso social em So Paulo


no signif.
95% sign.
99% sign.
Indicadores Locais de Associao
Espacial (LISA)
Uma outra forma de anlise atravs do mapa denominado
Moran Map (Anselin, 1999). Neste caso, os ndices locais I
i
so
associados ao diagra-ma de espalhamento de Moran.

no significantes
Q1 [HH]
Q2 [LL]
% I d o s o s
Nota: este resultado apresenta somente as
regies para os quais os valores de I
i
,foram
considerados significantes (com intervalo >95%).

Anda mungkin juga menyukai