Anda di halaman 1dari 61

Estatstica Espacial Aplicada

Renato M. Assuncao
LESTE - Laborat
orio de Estatstica Espacial
Departamento de Estatstica - UFMG
assuncao@est.ufmg.br

http://www.est.ufmg.br/~assuncao

Introduo
Instrutor: Renato Assuno
Professor da UFMG, Departamento de Estatstica.
Coordenador do Laboratrio de Estatstica Espacial - LESTE
Vice-diretor do CRISP - Centro de Estudos de Criminalidde e Segurana
Pblica
Pblico-Alvo:
Alunos de ps-graduao em Analise e Modelagem de Sistemas Ambientais do IGC
Alunos de ps-graduao, exceto estatstica
Alunos de graduao de estatstica e aturia

Aulas toda quarta-feira, de 13:30 as 17:30, sala 1019 no ICEx

Plano da Apresentao
Introduo genrica
Tipologia dos dados espaciais
GIS e algoritmos geomtricos
Dados de rea
Dados de processos pontuais
Dados de superfcies aleatrias
Dados de interao espacial

Um curso extra muito bom


http://www.dpi.inpe.br/cursos/ser301/

O que Estatstica Espacial?


Toda observao possui referncia temporal e espacial.
Dados obtidos por entrevista sobre indivduo que vive em Belo Horizonte.
Dados sobre certo municpio de Minas.
Dados sobre rebanho em certa regio do Pantanal.
Dados sobre extrao de minrio de ferro numa mina nos arredores de Belo Horizonte
Dados sobre telefonemas entre municpios

Muitos estudos no fazem uso da informao espacial. NO entanto, em


alguns casos, essas referncias espaciais so importantes na anlise.
Estatstica Espacial o conjunto de mtodos de anlise de dados em que
a localizao geogrca usada explicitamente na anlise.

Est Esp s se USAR o espao


Assim, no basta que o dado seja espacial, pois todos os dados, de uma
forma ou de outra, possuem uma referncia geogrca.
Por exemplo, a regresso linear do nvel de arrecadao de ICMS versus a renda per capita
municipal NO parte de estatstica espacial.
Embora os municpios possuam localizao espacial, esta localizao no usada na regresso.

O que determina se algo faz parte da estatstica espacial uma propriedade do mtodo de anlise, e NO do dado utilizado na anlise.

Estatstica Espacial: quando usar


Se todo dado estocstico possui referncia geogrca ...
necessrio usar estatstica espacial?

sempre

Resposta: Deve ser usada se existirem perguntas ou hipteses sobre o


mecanismo gerador dos dados que envolvam alguma caracterstica espacial
ou geogrca.
'E ineciente no us-la? (Veremos o signicado de ecincia mais tarde)
Resposta: Deve ser usada se a correlao espacial aparece como rudo
(nuisance) em modelo usual de regresso causados por efeitos de variveis no-observadas, efeitos de transbordamento (spill-over) por causa
do mismatching entre unidades geogrcas de mensurao e as unidades
geogrcas onde o fenmeno ocorre.

Exemplos: Crimes
Crimes no acontecem totalmente ao acaso. preciso um ofensor, uma
vtima potencial e uma oportunidade. Existem grandes diferenas no risco
de ser vtima de um crime dependendo da idade, do sexo, da hora do dia,
dia da semana, ms no ano, etc.
Existem tambm grandes diferenas geogrcas dentro de uma cidade.
Estas diferenas dependem do tipo de crime: crimes contra o patrimnio
atingem mais as reas ricas enquanto que crimes contra a pessoa atingem
mais as reas pobres.
Todos os dados de crimes registrados pela Polcia Militar dentro de Belo
Horizonte e Juiz de Fora hoje em dia so georeferenciados ao nvel da
localizao exata (coordenadas latitude-longitude) do evento.

Exemplo: Crimes em BH

Homicdios ocorridos em BH em 1997, regio central

Exemplos: Linchamentos raciais nos EUA


Os linchamentos de negros no sul dos EUA nas dcadas de 40-50 seguiam
algum padro no espao e no tempo?
Duas teorias para explicar este comportamento violento de massa:
um efeito de contgio (real ou aparente). Isto :
. um linchamento ocorrendo aqui e agora estimula ou est associado ocorrncia de
outros linchamentos nos arredores nos momentos seguintes
Um efeito de associao negativa. Isto :
. um linchamento inibe a ocorrncia de outros linchamentos nos arredores nos momentos
seguintes
. a reao seria de procurar no dar motivos para violncia adicional ou haveria um maior
controle dos mais violentos

Exemplos: Linchamento de Negros nos EUA

Centrides dos condados onde ocorreram linchamento. REF??

Exemplos: Processos Ecolgicos


Processos de colonizao por plantas de reas devastadas.
rvores tendem a inibir ou a estimular a presena de outras rvores ao
seu redor ?
Se existe competio entre as plantas, at que distncia esta competio
pode alcanar ?
Este padro espacial depende da idade da oresta ?
rvores pequenas (mais jovens) tendem a estar prximas de rvores
grandes (mais velhas) ?
E se as espcies so diferentes, como o seu relacionamento ? De competio tambm ?

Plantas adultas (acima) e Plntulas (abaixo)

Note a interao bvia entre elas: onde h muita planta adulta, poucas
plntulas aparecem. REF??

Exemplos: Epidemiologia Espacial


A distribuio dos casos de uma doena forma um padro no espao ?
Descrevendo o desenvolvimento de uma epidemia no espao e no tempo:
sugere formas de controlar e combater.
Caracterizando a localizao de servios de sade: a demanda pelos
servios est sendo atendida adequadamente ?
Poderia ser feita uma nova alocao geogrca de recursos que seja mais
eciente ?
H alguma associao entre a localizao dos casos de uma doena e a
posio de alguma fonte suspeita (rio, estao nuclear, fbrica,..) ?

Exemplos: Cncer de Pulmo nos EUA


Publicao do National Institute of Health / National Institute of Cancer

Mapa do Atlas de Mortalidade por Cncer de Pulmo nos EUA,


1950/1994

Exemplos: Geoestatstica
Moura et al (2006) estudaram um surto de toxomoplasmose em Santa
Isabel do Ivai, no sul do Paran. A suspeita era que gua era o modo de
diseminao de Toxoplasma gondii.
Foi realizado um estudos de caso-controle.
Dois reservatrios de gua serviam a cidade, cobrindo r egies distintas.
Era signicativamente mais comum que casos consumissem gua do reservatrio A e que consumissem mais sorvetes que controles.
Odds-ratio = 3.72 com p-valor = 0.016
Reservatrio Casos Controle Total
A
152
198
350
B
4
22
26
Total
156
220
376

Exemplos: Geoestatstica
Como estimar o volume total de um depsito mineral numa regio ?
Conhecemos apenas a densidade num pequeno nmero de amostras localizadas em alguns poucos pontos do terreno.
Como prever a precipitao pluviomtrica (ou a temperatura) num dado
ponto do mapa ?
Possuimos medies apenas em algumas poucas estaes espalhadas pelo
mapa.
Onde colocar uma nova estao de coleta de medies de forma tima ?

Exemplos: Reconstruo de depsitos minerais


Superfcie de densidade de minrio de ferro reconstruda por interpolao

Exemplos: Reconstruo - 2
Superfcie de curvas de nveis superimposta imagem do terreno

Exemplos: Espao, no s geograa


Em um experimento para entender o cncer de colon, todos os animais
foram expostos a um carcinoma.
Metade deles foram tambm expostos radiao.
Espacialmente foi medida a existncia de focos precursores de cnceres.
A questo de interesse saber se as localizaes desses focos esto espacialmente prximas.
Se sim, ento os danos ao colon causado pelo carcinoma e pela radiao
so localizados e devem ser tratado levando isto em conta.
H diferenas nos padres espaciais de irradiados e no irradiados?

Exemplos: Imagens

Exemplos: Imagens
Imagens de satlite ou fotogrcas devem ser "limpas"para obter uma
visualizao melhor.
A partir das imagens, objetos devem ser identicados e "recortados".
Como fazer isto de forma automtica e eciente?

Exemplos: Espao no geogrco


Chen e Conley (2001, Journal of Econometrics): A new semiparametric
spatial model for panel time series
n agentes econmicos. Para cada agente i, uma srie temporal Xit, t =
1, . . . , T

Em cada instante t, os valores X1t, . . . , Xnt das sries so correlacionados


Correlao entre sries depende da distncia econmica entre os agentes.
Esta distncia pode mudar no tempo.
Exemplos:
Agentes: setores econmicos; proximidade entre i e j : distncia euclidiana entre entre vetores
de propores dos inputs dos setores i e j
Agentes: rmas; proximidade entre i e j : overlap das reas de mercado
Agentes: estados/pases/municpios; proximidade entre i e j : volume de transaes comerciais ou custo de transporte

Exemplos: interao/competio/redes sociais


Indivduos interagem de formas variadas, entre as quais interaes no
mercado
Um conjunto de indivduos que so os ns de uma rede
os arcos ou arestas da rede reetem as relaes entre os indivduos
Indivduos fazem escolhas e agem a partir de um conjunto de alternativas
Existe incerteza sobre os ganhos obtidos de cada ao
Eles usam informao prpria e informao obtida de seus vizinhos, os
indivduos ligados a eles de alguma forma.
Escolhem ao que maximiza utilidade individual
A estrutra da rede (SUA TOPOLOGIA) inuencia as decises individuais
e sociais.
A topologia da rede induz distribuies de probabilidade que levam em
conta essa congurao espacial de interrelaes.

Exemplos: redes
Escolha de produtos por consumidor:
Deciso sobre que marca comprar
no possui conhecimento completo sobre alternativas
preo, caractersticas e ... informao de conhecidos

Inovao mdica:
Mdicos decidem recomendar produtos sem conhecimento completo
buscam informao na literatura prossional e de amigos
ceteris paribus, os mdicos mais conectados so aqueles que passam a recomendar produtos
melhores mais rapidamente

Exemplos: WWW

Conectividade da Internet: principais backbone ISPs (Internet Service Provider) coloridos separadamente

Exemplos: Sociedade Adolescente

Topologia: Grafo de amizade recproca entre meninos de uma escola


americana

Exemplos: Sociedade Adolescente - 2

Grafo de amizade recproca entre meninas de uma escola americana

Tipos de Dados Espaciais

Taxonomia dos Dados Espaciais


O fundamental identicar o que o componente aleatrio em cada tipo
de dado.
Este componente aleatrio que ser modelado com distribuies de probabilidade.
Os 4 Tipos de Dados Espaciais:
Dados de Superfcie aleatria
Dados de Processos Pontuais
Dados de rea
Dados de Interao Espacial

Dados de Superfcie aleatria

Dado tpico de estudos ambientais, geolgicos e de cincias naturais.


Superfcie Y (s) DEFINIDA em todo ponto s = (s1, s2) de uma regio
do plano.
Exemplos: Temperatura, Ph de gua de lago, acidez do solo...

Uma superfcie aleatria: temperatura

Amostrando uma Superfcie Aleatria


Superfcie Y (s) DEFINIDA em todo ponto s = (s1, s2) da regio.
Mas... OBSERVADA apenas em alguns locais: n estaes de coleta ou
monitoramento.
Estaes i = 1, . . . , n em posies FIXAS e CONHECIDAS (noaleatrias).
Estao i est localizada em si = (s1i, s2i) e Y (si) o valor da superfcie
na estao.
Interesse em Y (s) onde s localizao no monitorada.
Aleatrio o valor da superfcie.

Problemas tpicos
predizer superfcie em posies novas
interpolao
escolher posio para instalar uma nova estao.
Krigagem o mtodo chave: regresso com erros correlacionados por
distncia.
Correlao de erros denida pelo variograma (ou correlograma): funo
(d) que mede o grau de independncia (correlao) entre os erros de
acordo com distncia d entre posies.
A funo de correlao (d) deve satisfazer restries severas para que,
dado qualquer conjunto de n posies no plano, a matriz de correlao
n n resultante seja denida positiva
Mostra-se que (d) deve ser representada como uma integral de uma
funo de Bessel generalizada

Mapa topogrco de vulco na Nova Zelndia. Pontos so os locais onde


existe uma medio aproximada.

Imagem a partir do mapa topogrco de vulco na Nova Zelndia.

Padres de Pontos Aleatrios


Num padro espacial de pontos, o que aleatrio ? A prpria posio dos
pontos ou eventos.
Modelo estocstico deve explicar a congurao espacial dos eventos: h
interao entre os eventos tal como atrao ou inibio ?
Problemas Tpicos
Existe aglomerao de casos ou eles esto dispostos ao acaso (proporcional populao sob
risco) ?
Estar prximo ao rio aumenta o risco de tornar-se um caso?
Interao espao-temporal: Eventos esto em 3 dimenses incluindo o tempo. Casos prximos
no espao tendem a estar prximos no tempo tambm ?
Eventos de dois tipos diferentes. Por exemplo: casos e controles ou homicdios e roubo. Anlise
compara os padres espaciais de cada tipo e testa se eles so similares.

Processo Pontuais na prtica - TEMPO


Caso uni-dimensional: "espao" a reta representando o tempo.
Processos pontuais no tempo: eventos aleatrios no tempo. Muita teoria
E muitas aplicaes em diversas reas.
Teoria moderna usa a estrutura ordenada do tempo e as ferramentas so
martingalas, ltragens, etc.
Valores Extremos ou Sinistros no tempo: abordagem de processos pontuais em Finanas, seguros, hidrologia, estudos ambientais, etc.
Ocorrncias raras em muitas pessoas: estudos de dados longitudinais.
Demograa: tempos entre sucessivos nascimentos de mulheres de uma
populao. Anlise com base numa amostra de mulheres.
Economia: perodos de alternncia entre emprego e desemprego.
Epidemiologia: tempos entre reinternaes sucessivas.

Processo Pontuais na prtica - espao


No espao: Produo terica menor que no tempo: implica em menos
aplicaes tambm.
anlise ambiental: previso e controle de queimadas em orestas.
Previso de terremotos, enchentes ao longo de rios ...
Anlise reas de maior incidncia de crimes.
Epidemiologia: padro espacial de uma doena. Existem reas de maior
incidncia? Comparao de dois padres.

HTLV (esq) e controles (dir) em BH

Os casos de HTLV possuem a mesma disperso espacial que os controles

HTLV (esq) e controles (dir) em BH

Os casos de HTLV possuem a mesma disperso espacial que os controles

Dados de Interao Espacial


Exemplos:
Migrao de mo de obra
Fluxo de bens entre centros urbanos
Trfego de comunicao Web numa rede
Rede social trafegando informao, status, etc.

Muito comum em Economia Urbana, Economia Regional, etc.


De Origem i ui para Destino j
Fluxo aleatrio Yij entre posies i e j
Cada medio Yij refere-se a um PAR ORDENADO de posies (i, j) e
NO apenas a um local especco i

Topologia um grafo: vizinhana dos bairros de Belo Horizonte

Interao Espacial
Problemas tpicos:
Que caractersticas de i e j determinam o volume do uxo?
Como os uxos podem afetar caractersticas do local i ?
Onde colocar novo centro para minimizar custo ?
Como um tipo de uxo afeta outros tipos de uxos ?

Modelo tpico o gravitacional


E(Yij ) g(xi) g(xj )/d
ij
onde xi so as caractersticas de i
g(xi) uma funo das caractersticas da rea i
dij a distncia entre i e j .

Outra abordagem possvel mas pouco usada: Campos aleatrios de


Markov

Dados de rea
Regio R particionada em n reas
Em cada rea feita uma observao aleatria Yi
Exemplos:
PIB per capita no municpio i
nmero de desempregados no municpio i
preo mdio de imvel de certo perl no bairro i
nmero de crimes no bairro i

Este o tipo de dado mais comum em econometria espacial


Restante desse curso s trata desse tipo de dado

Cncer de pulmao:EUA

Idosos por setor censitario em BH

Natal: % com 15 ou mais anos de escolaridade

Velocidade da Queda de Fecundidade: mais negativo, mais rapido

Dados de rea - 2
Regio R =

Sn

i=1 Ai

com Ai Aj = se i 6= j

Em cada rea feita uma observao aleatria Yi


Via de regra, Yi uma agregao, uma soma ou uma integral sobre a
rea Ai
Medies referem-se a toda a rea Ai, no a um ponto particular dentro
dela
No faz sentido "interpolar" entre reas
Problema tpico: regresso de Yi em variveis explicativas xi mas variveis
Yi so correlacionadas
Estrutura de correlao do vetor Y determinada pela topologia: posio
no plano, indicadores binrios de vizinhana espacial, ou distncia entre
todos os possveis pares de reas.

Exemplos com dados de rea: preos hednicos


Preos Hednicos em mercado imobilirio e mercado de trabalho: ambos
possuem um forte componente espacial
Existem trs coisas que inuenciam o preo de um imvel: localizao.
Salrios e aluguis ou valores imobilirios variam bastante dentro de uma
cidade. Um mesmo tipo de imvel (idade, tamanho, qualidade de acabamento, etc.) ter preos muito diferentes no Meyer, em Botafogo, no
Leblon e na Barra. Tudo o mais igual, reas vizinhas tendem a ter preos
parecidos.
Controlando por fatores conhecidos, preos tero erros espacialmente correlacionados.
O uso de espao ajuda a controlar variveis no mensuradas que possuem
uma estrutura espacial: crime, poluio do ar, acesso/transporte, e outras
externalidades.
Ver, por exemplo, Basu e Thibodeau (1998) Analysis of Spatial Autocorrelation in House Prices. Journal of Real Estate Finance and Economics, 17, 61-85.

Econometria com dados de rea: loteria


Coughlin, Garrett e Hernandez-Murillo (2003) Spatial probit and the geographic patterns of state lotteries Working Papers from Federal Reserve Bank
Alguns estados americanos correm uma loteria e outros no
O que diferencia uns dos outros ?
Modelo Probit espacial
algumas variveis explicativas:
evidnvia de superdisperso (efeito misto): variabilidade extra binomial
Esta variao extra-binomial tem estrutura espacial: reas prximas tendem a ter probabilidades desviando-se do preditor linear de forma similar

Regionalizao
Em economia regional, um problema constante agrupar reas que sejam
similares ou homogneas com respeito a um certo nmero de variveis
Problema dual: idenicar fronteiras entre regies homogneas
Assuno et al. (2001) propuseram mtodo baseado em teoria de grafos.
Implementado no software SKATER: Spatial K-lustering Analysis
Through Edge Removal
Disponvel em www.est.ufmg.br/leste

Exemplo de Regionalizao

So Joo do Meriti - RJ. Setores Censitrios agregados com base em 15 variveis


sociais e econmicas do Censo Demogrco, 1991

Anda mungkin juga menyukai