Tpicos
Introduo Bases de dados das pesquisas domiciliares do IBGE Anlise de dados amostrais complexos Utilizao do R para anlise dos dados das pesquisas do IBGE Reproduo de tabelas de estimativas do IBGE
Pesquisa de Oramentos Familiares Pesquisa Nacional por Amostra de Domiclios Amostra do Censo Demogrco de 2010
Introduo
Nos ltimos anos o IBGE tem disponibilizado cada vez mais informaes de uso pblico, no somente em forma de dados tabulares, mas dando acesso direto aos microdados. Ou seja, o IBGE tem possibilitado que qualquer usurio tenha acesso aos dados no menor nvel de agregao da pesquisa, sempre preservando o sigilo das informaes fornecidas pelos entrevistados Isto permite uma melhor utilizao dos dados, mas impe que o usurio de microdados tenha acesso e domnio a softwares estatsticos Adicionalmente, supe o conhecimento sobre os conceitos e denies utilizados durante a coleta dos dados e o acompanhamento das mudanas destes ao longo dos anos
Introduo
A utilizao dos microdados das pesquisas do IBGE permite uma anlise mais detalhada e personalizada ao usurio. Muitas vezes, seu interesse est na produo de resultados baseados em variveis com categorizao ou domnios de estimao diferentes dos usados pelo IBGE Para isto o usurio dever ser capaz de reproduzir os resultados divulgados pela instituio: estimativas e suas respectivas medidas de preciso O objetivo deste curso apresentar as diculdades que um usurio externo enfrenta ao utilizar os microdados disponibilizados do IBGE, fornecendo ferramentas para contornar alguns problemas relacionados ao acesso, manipulao e o tratamento dos dados para seu uso correto usando o software R
Por possurem planos amostrais complexos e serem utilizadas por usurios de diferentes especialidades, no raro encontrar estudos nos quais as estimativas de preciso so calculadas de maneira equivocada
Bibliograa
DAMICO, A. - asdfree: analyze survey data for free. http://www.asdfree.com/. LUMLEY, T (2012) - "survey: analysis of complex survey samples". R package version 3.28-2. LUMLEY, T (2004) - Analysis of complex survey samples. Journal of Statistical Software 9(1): 1-19. PESSOA, D.G.C. e MOREIRA, G.G.M. (2003) - "adac: anlise de dados amostrais complexos". R package version 1-1. R Core Team - R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Version 3.0.2. http://www.R-project.org/.
Bibliograa
LOHR, S.L. (2009) - Sampling Design and Analysis. 2nd Edition. Brooks/Cole. SUDAAN (Software for Survey Data Analysis) - Research Triangle Institute, North Carolina. http://www.rti.org/sudaan/.
Introduo
A Pesquisa de Oramentos Familiares (POF) visa mensurar as estruturas de consumo, dos gastos, dos rendimentos e parte da variao patrimonial das famlias. Utilizada para atender, dentre outras coisas, a atualizao das estruturas de consumo dos ndices de Preos ao Consumidor produzidos pelo IBGE Investiga, tambm, a autopercepo da qualidade de vida e as caractersticas do perl nutricional da populao brasileira A edio de 2008-2009 foi a quinta pesquisa realizada pelo IBGE sobre oramentos familiares (ENDEF 1974-1975 e POF 1987-1988, 1995-1996 e 2002-2003) Microdados disponveis no website do IBGE (a partir da edio de 2002-2003)
Introduo
O post da POF no blog asdfree para analisar os microdados da pesquisa, contm 4 scripts:
1. Baixar os arquivos do ftp do IBGE e faz sua leitura utilizando o arquivo de layout em SAS. Os arquivos so salvos no formato `.rda' em uma pasta denida pelo usurio 2. Reproduzir estimativas de prevalncias de dcit de peso, excesso de peso e obesidade, bem como suas medidas de preciso, em uma subpopulao de interesse (Tabela 15) 3. Reproduzir estimativas de medianas de altura e peso, por situao do domiclio e sexo, segundo a idade e os grupos de idade e suas medidas de preciso (Tabela 1.1) 4. Reproduzir estimativas de despesas monetria e no monetria mdia mensal familiar, com alimentao por classes de rendimento total e variao patrimonial mensal familiar, segundo os tipos de despesa, com indicao do nmero e tamanho mdio das famlias (Tabela 1.1.12)
Introduo
Como exerccio, replicaremos as estimativas da Tabela 15 da publicao da POF:
ftp://ftp.ibge.gov.br/Orcamentos_Familiares/Pesquisa_de_ Orcamentos_Familiares_2008_2009/Antropometria_e_estado_ nutricional_de_criancas_adolescentes_e_adultos_no_Brasil/ tabtexto15.zip
# Carregar o arquivo de dados relativo s pessoas # Carrega a tabela de ps-estratificao # verifica se os dois objetos carregados esto no workspace
" t _ m o r a d o r _ s " %i n% l s () load (" p o s t s t r . r d a ") l o a d ( " t_morador_s.rda " )
[1] TRUE
" p o s t s t r " %i n% l s ()
[1] TRUE
# Fazendo o `merging ' destes dois arquivos de dados x m e r g e ( t_ mor ador_ s , p o s t s t r ) # E note que o nmero de registros no muda.
n r o w ( x ) == n r o w ( t _ m o r a d o r _ s )
[1] TRUE
transform (x ,
2) )
# Indivduos com imc alto - excesso de peso o v e r = i f e l s e ( bmi 2 5 , 1 , 0 ) , # Indivduos com imc muito alto - obeso o b e s e = i f e l s e ( bmi 3 0 , 1 , 0 )
)
svydesign (
c o n t r o l , = e s t r a t o _ u n i c o , w e i g h t s = f a t o r _ e x p a n s a o 1
id = strata data = x , nest ) = TRUE
Observe que o objeto sample.pof corresponde ao desenho original da amostra e no dever ser usado nos comandos de anlise. Este objeto ainda no foi apropriadamente ps-estraticado, como utilizado pelo IBGE para obter exatamente projees do censo de 2010.
Ps-estraticao
O bloco a seguir determina quais totais de ps-estraticao devem ser usados.
# Totais de ps-estratificao pop.totals data.frame (
pos_estrato ) = unique ( x$ pos_estrato ) , Freq = u n i q u e ( x $ tot_pop )
# Este bloco conduz ps-estratificao real do objeto de desenho sample.pof pof.design.pos postStratify (
sample.pof ,
p o s _ e s t r a t o
pop.totals )
Exemplos de estimao
Antes de reproduzir a Tabela 15, apresentamos comandos para gerar alguns exemplos de anlises de dados da POF.
# Contando o nmero total ( no-ponderado ) de registros da POF por sexo
svyby (
o n e , s e x o
pof.design.pos , unwtd.count )
01 02
Exemplos de estimao
# Estimando a populao do Brasil
svytotal (
o n e
)
pof.design.pos
o n e , s e x o
pof.design.pos , svytotal )
01 02
Exemplos de estimao
# Estimar a idade mdia ( varivel numrica )
svymean (
i d a d e _ a n o s
design ) =
pof.design.pos
i d a d e _ a n o s s e x o ,
design ) = svymean
pof.design.pos ,
01 02
Exemplos de estimao
Calculando a distribuio de uma varivel categrica.
# Percentual em cada categoria de raa
svymean (
c o r _ r a c a
design ) =
, pof.design.pos
Exemplos de estimao
# Percentual em cada categoria de sexo por faixa etria
svyby (
s e x o , i d a d e . c a t
design ) = svymean
pof.design.pos ,
[20 ,25) [25 ,30) [30 ,35) [35 ,45) [45 ,55) [55 ,65) [65 ,75) [75 , Inf ]
idade . cat sexo01 sexo02 se . sexo01 se . sexo02 [20 ,25) 0.503 0.497 0.00581 0.00581 [25 ,30) 0.496 0.504 0.00564 0.00564 [30 ,35) 0.479 0.521 0.00600 0.00600 [35 ,45) 0.473 0.527 0.00371 0.00371 [45 ,55) 0.467 0.533 0.00452 0.00452 [55 ,65) 0.465 0.535 0.00495 0.00495 [65 ,75) 0.454 0.546 0.00707 0.00707 [75 , Inf ] 0.416 0.584 0.00964 0.00964
Exemplos de estimao
i d a d e _ a n o s
design c (0 , ) = 0 .25 ,
, 0 .5 , 0 .75 , 1)
pof.design.pos ,
Exemplos de estimao
i d a d e _ a n o s s e x o ,
design c (0 .25 , ci ) =
pof.design.pos , 0 .75 ) ,
svyquantile , 0 .5 , = TRUE
01 02
sexo 0.25 0.5 0.75 se .0.25 se .0.5 se .0.75 01 14 28 45 0 0.255 0.000 02 15 30 47 0 0.000 0.255
Exemplos de estimao
Exemplo de domnio: restrinja o objeto pof.design.pos a mulheres no-grvidas e pessoas com idade de 20 anos ou mais.
pof.design.pos.npadults subset ( pof.design.pos , idade_anos )
20 & c o d _ g r a v i d a
!= " 0 1 "
Exemplos de estimao
Agora qualquer um dos comandos anteriores pode executado de novo usando o objeto pof.design.pos.npadults no lugar do objeto pof.design.pos para fazer anlises apenas sobre mulheres no-grvidas e pessoas com idade de 20 anos ou mais.
# Estimar a mdia da idade ( varivel numrica )
svymean (
i d a d e _ a n o s
design ) =
pof.design.pos.npadults
Exemplos de estimao
# Calcular um estimador de razo para determinar a prevalncia entre os indivduos nesta populao.
svyratio (
u n d e r o n e ,
)
pof.design.pos.npadults
Ratio estimator : svyratio . survey . design2 (under , one , pof . design . pos . npadults ) Ratios = one under 0.0272 SEs = one under 0.000684
Exemplos de estimao
Observe que no numerador so includos os indivduos da subpopulao considerada com dcit de peso, enquanto no denominador so includos todos os indivduos da subpopulao. Embora seja mais fcil usar a funo svyratio para estimar um nico valor da prevalncia, bem mais simples usar os comandos svymean e svyby para reproduzir a Tabela 15, que fornecero a tabela completa com muito menos trabalho.
Exemplos de estimao
Dena uma frmula que ser usada em vrios comandos subsequentes
formulas
u n d e r
over
+ obese
# Executar um `svyby ' que armazena resultados em um novo objeto e os imprime na tela , porque o comando foi encapsulado por () ( t o t a l svyby (
formulas ,
o n e
pof.design.pos.npadults , svymean ) )
one under over obese se . under se . over se . obese 1 0.0272 0.49 0.148 0.000684 0.00271 0.0019
Exemplos de estimao
# Guardar em trs outros objetos mais trs chamadas de svyby sexo svyby ( formulas , s e x o ,
pof.design.pos.npadults , svymean ) idade
svyby ( formulas ,
i d a d e . c a t
svymean ) idade.sexo
pof.design.pos.npadults ,
svyby ( formulas ,
i d a d e . c a t
svymean )
+ sexo ,
pof.design.pos.npadults ,
Exemplos de estimao
1: under 0.0272
cv ( t o t a l )
Exemplos de estimao
coef ( sexo )
Exemplos de estimao
Combinando os totais estimados de classes de idade com seus coecientes de variao numa s tabela
library ( xtable ) idade.result idade.result
cv ( i d a d e ) )
d a t a . f r a m e ( I d a d e= i d a d e . r e s u l t [ , 1 ] , 100 i d a d e . r e s u l t [ , 2 : 4 ] , 100 c v ( i d a d e ) )
muda
nam es ( i d a d e . r e s u l t ) c(" age.cat " , " obese " , " cv.obese ")
Exemplos de estimao
# Formatar sada
print ( xtable ( idade.result , caption = " Prevalncia obesidade ") , digits de = 1, fixed = TRUE , e subpeso , size sobrepeso = muda ,
sanitize.text.function = FALSE ,
include.rownames
Exemplos de estimao
Guardando os coecientes de variao das estimativas de totais de classes de idade por sexo em um novo data frame chamado cv.df
cv.df
d a t a . f r a m e ( cv ( i d a d e . s e x o ) )
Note que usamos sub em vez de gsub. Isto ocorre porque apenas a primeira instncia de `se' deve ser substituda por `cv' e no as capturas subsequentes
nam es ( c v . d f )
" cv " ,
na mes ( c v . d f ) )
Veja o help da funo usando: ?sub (sub substitui apenas a primeira ocorrncia de um padro enquanto gsub substitui todas as ocorrncia)
Exemplos de estimao
Guardando as estatsticas principais e desvios padres de idade por sexo em um segundo data.frame chamado idade.sexo.df.
idade.sexo.df
data.frame ( idade.sexo )
Junte este com o objeto cv.df para criar classes de idade por sexo de dcit de peso, excesso de peso e obesidade.
idade.sexo.result idade = sexo =
data.frame (
100 i d a d e . s e x o . d f [ , 3 : 5 ] , 100 c v . d f ) nam es ( i d a d e . s e x o . r e s u l t ) " under " , " over " , " cv.under " , " cv.over " ,
Exemplos de estimao
# Imprimindo na tela
print ( xtable ( idade.sexo.result , caption = " Prevalncia de obesidade ") , size include.rownames = muda , digits = 1, sobrepeso = TRUE , e subpeso ,
= FALSE , fixed
idade.cat [20,25) [25,30) [30,35) [35,45) [45,55) [55,65) [65,75) [75,Inf] [20,25) [25,30) [30,35) [35,45) [45,55) [55,65) [65,75) [75,Inf]
sexo 01 01 01 01 01 01 01 01 02 02 02 02 02 02 02 02
under 3.3 2.1 1.2 0.9 1.3 2.0 2.5 3.0 8.3 4.3 3.5 1.9 2.2 2.2 3.8 5.4
over 30.1 42.4 52.8 55.7 58.7 58.0 52.2 43.8 24.2 33.8 42.2 50.0 57.9 63.0 59.4 51.9
obese 5.1 9.3 12.5 13.6 16.7 15.9 12.5 11.9 6.1 10.0 13.3 17.4 21.5 26.0 22.5 18.6
cv.under 8.1 10.2 12.8 10.9 11.5 16.0 12.4 14.2 5.7 7.1 9.6 8.4 10.1 10.5 10.5 10.9
cv.over 2.7 2.2 1.7 1.3 1.2 1.6 2.3 4.0 3.1 2.5 2.1 1.4 1.2 1.4 1.9 2.9
cv.obese 7.0 6.0 4.8 3.7 3.7 4.7 6.5 10.7 6.5 5.3 4.6 3.0 2.7 3.1 4.3 6.5
Exemplos de estimao
Os cdigos da varivel cod_cor_raca esto em `pof 1.pdf' no arquivo zip do questionrio no site
ftp://ftp.ibge.gov.br/Orcamentos_Familiares/Pesquisa_de_ Orcamentos_Familiares_2008_2009/Microdados/questionarios.zip
Exemplos de estimao
Exemplos de estimao
01 02 03 04 05 09
cor_raca 01 02 03 04 05 09
Exemplos de estimao
Classe do objeto sex.by.race
class ( sex.by.race )
data.frame ( sex.by.race )
e ento imediatamente exportado como um arquivo csv no seu atual diretrio de trabalho
write.csv ( sex.by.race , " sex by race.csv ")
ou simplicado para conter apenas os valores que voc necessita. Eis aqui `percentual de homens' por raa, com desvios padres respectivos
male.by.race " ,
sex.by.race [ ,
" sexo01
Exemplos de estimao
Imprimir os novos resultados na tela
print ( xtable ( male.by.race ) )
01 02 03 04 05 09
cor_raca 01 02 03 04 05 09
Exemplos de estimao
Grco de barras
barplot ( male.by.race [ , main = " P e r c e n t u a l " Parda " , 2] , de ylim = c (0 , por cor 0 .6 ) , ou raa " , home ns " No
Branca
Preta
Amarela
Parda
Indgena
No sabe
25/10/2013
Introduo
A Pesquisa Nacional por Amostra de Domiclios (PNAD) uma das principais fontes de informao sobre a populao brasileira; Implementada em 1967; Tem como nalidade a produo de informaes bsicas para o estudo do desenvolvimento socioeconmico do Pas; Abrange a populao residente nas unidades domiciliares (domiclios particulares e unidades de habitao em domiclios coletivos); Investiga as caractersticas gerais, de migrao, de educao, de fecundidade, de trabalho e rendimento; Realizada nos anos que no ocorre o Censo Demogrco; Microdados disponveis no website do IBGE (a partir da edio de 2001).
Introduo
Adota um plano amostral estraticado e conglomerado com um, dois ou trs estgios de seleo, dependendo do estrato. Mtodo utilizado para a correo dos pesos baseado nas projees ociais do IBGE para o total populacional; Varivel de ps-estraticao est disponibilizada no arquivo de microdados; Os ps-estratos so denidos de acordo com a Unidade da Federao, Regio Metropolitana e situao do setor.
O script download all microdata.R contido no blog permite baixar os dados de vrios anos da pesquisa.
# bloco de comandos para leitura de dados da PNAD l i b r a r y ( downloader ) s e t w d ( "C : /My D i r e c t o r y /PNAD/ " ) years.to.download c (2001:2009 , 2011:2012) s o u r c e _ u r l ( " h t t p s : // ra w .g i th ub . co m / ajdamico / usgsd / m a s t e r / P e s q u i s a %20 N a c i o n a l %20 p o r %20Amostra%20de %20 D o m i c i l i o s / download%20 a l l %20 m i c r o d a t a . R " , prompt = FALSE , echo = TRUE)
Especique a opo da library survey para tratar do caso de estratos com um s psu
# produz estimativas conservadoras de varincias
options ( survey.lonely.psu = " adjust ")
# load pnad-specific functions ( to remove invalid # SAS input script fields and postStratify a # database-backed survey object )
s o u r c e _ u r l ( " h t t p s : // ra w .g i th ub . co m / ajdamico / usgsd / m a s t e r / P e s q u i s a N a c i o n a l p o r Amostra de D o m i c i l i o s / p n a d . s u r v e y . R " , prompt = FALSE )
Ps-estraticao
y pnad.postStratify ( design = sample.pnad , s t r a t a . c o l = ' v4609 ' , o l d w g t = ' pre_wgt ' )
O procedimento de leitura anterior cria uma base de dados na memria de disco, sendo adequado para os casos em que o usurio no dispe de um computador com muita memria ram No entanto, este procedimento possui algumas desvantagens:
exige conhecimento da linguagem sql (por exemplo, so utilizados comandos sql para recodicar variveis); algumas funes do pacote survey no esto disponveis para objetos de desenho criados a partir de bases do tipo SQLite;
Para no sobrecarregar a memria ram basta guardar as variveis que denem o plano amostral da PNAD:
# Filtrar base de dados x dbGetQuery ( db , ' s e l e c t v4618 , v4617 , pre_wgt , v4609 , . . . from pnad2012 ' )
Exemplos de anlise
Tamanho da amostra por regio
svyby ( one , r e g i o n , y, unwtd.count )
1 2 3 4 5
Exemplos de anlise
Estimativa da populao do pas na PNAD
s v y t o t a l (one , y)
1 2 3 4 5
region 1 2 3 4 5
se 1.60 e -11 1.63 e -11 7.67 e -11 0.00 e +00 1.70 e -11
Exemplos de anlise
Calcular a mdia da idade
svymean (v8005 , design = y)
1 2 3 4 5
region v8005 se 1 28.5 0.133 2 31.7 0.110 3 34.5 0.123 4 34.8 0.164 5 32.0 0.176
Exemplos de anlise
Distribuio de uma varivel categrica: percentagem de homens e mulheres no pas
svymean ( f a c t o r ( v0302 ) , design = y)
Por regio
s v y b y ( f a c t o r ( v0302 ) , r e g i o n , d e s i g n = y , svymean )
1 2 3 4 5
region 1 2 3 4 5
Exemplos de anlise
Calcular a mediana e outros percentis
# minimum , 25 th , 50 th , 75 th , maximum ages s v y q u a n t i l e (v8005 , d e s i g n = y , c (0 .25 , 0 .5 , 0 .75 ) ) v8005 0.25 0.5 0.75 16 31 48
# by region s v y b y (v8005 , r e g i o n , d e s i g n = y , s v y q u a n t i l e , c ( 0 . 2 5 , 0 . 5 , 0 . 7 5 ) , c i = TRUE) 1 2 3 4 5 region 0.25 0.5 0.75 se0 .25 1 12 26 42 0.255 2 14 29 46 0.255 3 17 33 50 0.000 4 17 33 50 0.000 5 16 30 46 0.255 se0 .5 se0 .75 0.255 0.255 0.255 0.255 0.255 0.000 0.255 0.255 0.000 0.255
Exemplos de anlise
Subpopulao: restringir o objeto s as mulheres
y . f e m a l e s u b s e t ( y , v0302 == 4 )
Qualquer um dos comandos pode ser rodado de novo para o objeto `y.female' Estimar a mdia de idades das mulheres:
svymean (v8005 , design = y.female )
v8005
mean SE 34 0.08
Exemplos de anlise
Calcular a distribuio de uma varivel categrica por regio e salvar os resultados em um novo objeto
gender.by.region s v y b y ( f a c t o r ( v0302 ) , r e g i o n , design = y , svymean )
1 2 3 4 5
region 1 2 3 4 5
Exemplos de anlise
1. M 2. M 3. M 4. M 5. M 1. F 2. F 3. F 4. F 5. F 0.50 0.48 0.48 0.49 0.49 0.50 0.52 0.52 0.51 0.51
Exemplos de anlise
Imprimir apenas do desvio padro
SE ( g e n d e r . b y . r e g i o n )
1 2 3 4 5
Imprimir apenas o cv
cv ( g e n d e r . b y . r e g i o n )
1 2 3 4 5
Exemplos de anlise
Exemplos de anlise
Imprimir os resultados na tela
f.by.region
1 2 3 4 5
region 1 2 3 4 5
Exemplos de anlise
Construir um grco de barras
barplot ( f . b y . r e g i o n [ , 2 ] , ylim = c (0 , 0 .52 ) , main = " Female by R e g i o n " , n a m e s . a r g = c ( " North " , " N o r t h e a s t " , " S o u t h e a s t " , " South " , " Center West " ) )
Female by Region
0.5 0.0 0.1 0.2 0.3 0.4
North
Northeast
Southeast
South
CenterWest
19 de novembro de 2013
Introduo
Desde 1960 o IBGE utiliza a tcnica de amostragem na coleta dos dados do Censo Demogrco do Brasil; No Censo 2010 os pesos foram ajustados por calibrao. Este mtodo permite que, dentro de uma determinada rea geogrca, ao se aplicar os pesos ajustados s variveis auxiliares, sejam obtidos totais j conhecidos para o universo da pesquisa, alm de melhorar a preciso dos estimadores e obter estimativas mais consistentes para as variveis pesquisadas somente pelo questionrio da amostra; A calibrao dos pesos foi realizada com base na metodologia utilizada no Censo 2000 (Bankier, Rathwell e Majkowski, 1992).
Seleo da amostra
O desenho amostral adotado compreende a seleo aleatria e com equiprobabilidade, dentro de cada setor censitrio, de uma amostra dos domiclios particulares e moradores em domiclios coletivos; O tamanho nal da amostra foi de:
6.192.332 domiclios; 20.635.472 pessoas
rea de ponderao
Unidade geogrca formada por agrupamento de setores censitrios; Utilizada para a aplicao dos procedimentos de expanso da amostra e obteno das estimativas referentes s caractersticas investigadas por amostragem no Censo Demogrco (menor nvel geogrco de divulgao); Seu tamanho, em termos de nmero de domiclios e de populao, no pode ser muito reduzido, sob pena de perda de preciso de suas estimativas; Em grandes municpios procurou-se formar reas que respeitem alguns agregados de interesse ao planejamento local (colaborao espontnea dos prprios municpios).
O conjunto de variveis auxiliares de calibrao ou restries, comuns aos questionrios bsico e da amostra, comporta informaes referentes a domiclios e pessoas; Compem a lista informaes sobre o total de pessoas e domicilios na rea de ponderao:
pessoas por sexo e faixa etria; pessoas por sexo e situao (urbana ou rural); responsveis por sexo; total de pessoas em domiclios particulares; tamanho dos domiclios; e situao dos domiclios
# Local da base de dados no FTP do IBGE ( Rondnia ) d a t a . f i l e paste0 ( f t p . p a t h , " RO.zip " ) # Download do arquivo d o w n l o a d . f i l e ( d a t a . f i l e , t f , mode = "wb" ) # Descompactar o arquivo num arquivo temporrio f i l e s unzip ( tf , e x d i r = td )
As variveis L000X foram includas no cdigo apenas para facilitar o processo de leitura e no sero utilizadas nos passos seguintes
# Excluir variveis auxiliares d a d o s s u b s e t ( dados , s e l e c t = c ( L0001 , L0002 , L0003 , L0004 ) ) # Salvar arquivo rda no diretrio de trabalho s a v e ( dados , f i l e = " d a d o s . r d a " )
# Total de domiclio na UF d a d o s $ Nuf11 sum ( d a d o s $ V0010 ) # Total de domiclio por rea de ponderao Nareapond t a p p l y ( d a d o s $V0010 , d a d o s $V0011 , sum ) d a d o s $ Nareapond Nareapond [ d a d o s $ V0011 ] a t t r i b u t e s ( d a d o s $ Nareapond ) NULL
# Linhas de pobreza : 70 , 80 , 90 , 100 , 140 , 272 .50 z c ( 7 0 , 8 0 , 9 0 , 1 0 0 , 1 4 0 , 272 . 5 ) # Nmero de moradores pobres para cada d a d o s t r a n s f o r m ( dados , NMORPOB1 = ( V6531 < NMORPOB2 = ( V6531 < NMORPOB3 = ( V6531 < NMORPOB4 = ( V6531 < NMORPOB5 = ( V6531 < NMORPOB6 = ( V6531 < linha de pobreza z [1]) z [2]) z [3]) z [4]) z [5]) z [6]) V0401 , V0401 , V0401 , V0401 , V0401 , V0401 )
# Calcular estimativas para o mtodo 1 Res1UF s v y r a t i o (NMORPOB1 + NMORPOB2 + NMORPOB3 + NMORPOB4 + NMORPOB5 + NMORPOB6, V0401 , des1UF.sub , n a . r m = TRUE) # Calcular estimativas para o mtodo 2 Res2UF s v y r a t i o (NMORPOB1 + NMORPOB2 + NMORPOB3 + NMORPOB4 + NMORPOB5 + NMORPOB6, V0401 , des2UF.sub , n a . r m = TRUE)
# Coeficientes Est1UF r o u n d ( 1 0 0 c o e f ( Res1UF ) , 2 ) NMORPOB1 NMORPOB2 NMORPOB3 NMORPOB4 NMORPOB5 NMORPOB6 8.94 9.66 10.67 11.25 17.10 37.60 Est2UF r o u n d ( 1 0 0 c o e f ( Res2UF ) , 2 ) NMORPOB1 NMORPOB2 NMORPOB3 NMORPOB4 NMORPOB5 NMORPOB6 8.94 9.66 10.67 11.25 17.10 37.60
Referncias
Bankier, M.B., Rathwell, S. e Majkowski, M. (1992) Two step generalized least squares estimation in the1991 canadian census. Srndal, C.E., Swensson, B. e Wretman, J. (1992) Model assisted survey sampling, Springer-verlag New York, Inc. New York. Vanderhoeft, C. (2001) Generalised Calibration at Statistics Belgium: SPSS R Module g-CALIB-S and Current Practices, disponvel em http://statbel.fgov.be/fr/binaries/ paper03[1]_tcm326-35412.pdf. Acesso em: 16/11/2011.