Anda di halaman 1dari 81

Modelo de equações

C oestruturais:
o r d e n auma ç ã o
deintrodução
Políticas aplicada
Públicas
Jorge Alexandre
Barbosa Neves

COLEÇÃO

Metodologias
de Pesquisa
Modelo de equações estruturais:
uma introdução aplicada
Enap Escola Nacional de Administração Pública
Presidente
Francisco Gaetani

Diretora de Formação Profissional e Especialização


Iara Cristina da Silva Alves

Diretor de Educação Continuada


Paulo Marques

Diretor de Inovação e Gestão do Conhecimento


Guilherme Alberto Almeida de Almeida

Diretor de Pesquisa e Pós-Graduação Stricto Senso


Fernando de Barros Filgueiras

Diretora de Gestão Interna


Camile Sahb Mesquita

Editor: Flávio Cireno Fernandes (Enap). Revisão: Luiz Augusto Barros de Matos
e Renata Fernandes Mourão. Projeto gráfico e editoração eletrônica: Ana Carla
Gualberto Cardoso.
Modelo de equações estruturais:
uma introdução aplicada

Jorge Alexandre Barbosa Neves

Brasília
Enap
2018
© 2018 Enap

Ficha Catalográfica por: Daiane da Silva Yung Valadares – CRB1/2802


N518m Neves, Jorge Alexandre Barbosa.
Modelo de equações estruturais: uma introdução aplicada./
Jorge Alexandre Barbosa Neves. – Brasília: Enap, 2018.
81 p. : il. –

Inclui bibliografia.
ISBN: 978-85-256-0089-9

1. Método de Pesquisa - Estatística. 2. Pesquisa Social.


I. Título.
CDU 311.2

Catalogado na fonte pela Biblioteca Graciliano Ramos da Enap

As opiniões emitidas nesta publicação são de exclusiva e inteira respon­­sabilidade


do(s) autor(es), não exprimindo, necessariamente, o ponto de vista da Escola
Nacional de Administração Pública (Enap). É permitida a reprodução deste texto
e dos dados nele contidos, desde que citada a fonte. Reproduções para fins
comerciais são proibidas.

Enap Fundação Escola Nacional de Administração Pública


SAIS – Área 2-A
70610-900 – Brasília, DF
Telefones: (61) 2020 3096 / 2020 3102 – Fax: (61) 2020 3178
Sítio: www.enap.gov.br
Tiragem: 500 exemplares
Sumário

1 Introdução..........................................................................................7
1.1 Os modelos de equações estruturais................................................ 7
1.2 Conceitos fundamentais.................................................................. 14

2 Fundamentos estatísticos e substantivos..........................................17

3 Modelos contendo apenas variáveis observadas...............................23


3.1 Primeiro exemplo: o modelo de realização
de status socioeconômico..................................................................... 23
3.1.2 Testes de hipóteses................................................................ 32
3.1.3 Análise da qualidade do ajuste.............................................. 35
3.2 Segundo exemplo: a estimação do IGD-M...................................... 40
3.2.1 Testes de hipóteses................................................................ 45
3.2.3 Análise da qualidade do ajuste.............................................. 46
3.3 Comentários finais do capítulo........................................................ 48

4 Modelos contendo apenas a análise de mensuração.........................49


4.1 Primeiro exemplo: a mensuração da origem socioeconômica.......50
4.2 Segundo exemplo: a mensuração do destino socioeconômico......54
4.3 Terceiro exemplo: mensurando a dependência do
município em relação ao Programa Bolsa Família................................ 57
4.4 Comentários finais do capítulo....................................................... 61
5 Modelos contendo variáveis observadas e construtos latentes.........63
5.1 Primeiro exemplo: o modelo de realização de status
socioeconômico contendo a mensuração de um construto................. 63
5.2 Segundo exemplo: modelo de determinação do IGD-M................. 71
5.3 Comentários finais do capítulo........................................................ 78

6 Conclusão.........................................................................................79

Referências bibliográficas....................................................................80
1 Introdução

1 Introdução

1.1 Os modelos de equações estruturais

A modelagem de equações estruturais, ou MEE, é uma técnica de


modelagem estatística multivariada de caráter geral, que é amplamente
utilizada nas Ciências Humanas e Sociais. Pode ser vista como uma
combinação de análise fatorial1 e regressão (ou a ampliação dessas para a
análise de trajetórias ou caminhos2). O interesse de muitos pesquisadores
e outros profissionais em MEE deriva, muitas vezes, das construções
teóricas que podem ser desenvolvidas a partir dos construtos latentes. As
relações entre as construções teóricas são representadas por coeficientes
de regressão ou coeficientes de trajetória entre variáveis observadas e/ou
latentes. O modelo de equações estruturais implica uma estrutura para as
covariâncias entre as variáveis observadas.
A modelagem de equações estruturais fornece uma estrutura
muito geral e conveniente para análises estatísticas que incluem vários
procedimentos multivariados tradicionais, em particular, análise fatorial,
análise de regressão, análise discriminante e correlação canônica, como
casos especiais. Os modelos de equações estruturais são, na maioria das
vezes, visualizados por um diagrama de trajetórias. O modelo estatístico
geralmente pode ser representado em um conjunto de equações
matriciais. No início da introdução dessa técnica nas pesquisas sociais e
comportamentais, os softwares normalmente demandavam configurações
que especificassem o modelo em termos dessas matrizes. Assim, os

1 Análise fatorial é uma técnica estatística multivariada (não determinística) que permite
a mensuração de variáveis latentes (construtos não observados de forma direta) a partir
de um conjunto de variáveis manifestas (observadas diretamente).
2 A análise de trajetórias ou de caminhos é uma extensão da análise de regressão linear
de mínimos quadrados. Essa extensão permite a decomposição de efeitos estatísticos
entre: efeito direto e efeitos indiretos.

7
Modelo de equações estruturais: uma introdução aplicada

pesquisadores tinham que destilar a representação da matriz a partir do


diagrama de trajetórias e fornecer aos softwares uma série de matrizes para
os diferentes conjuntos de parâmetros, como cargas fatoriais e coeficientes
de regressão. Isso não se faz mais necessário hoje, pois os modelos podem
ser definidos graficamente, a partir de um conjunto extremamente simples
de comandos. Atualmente, há alguns softwares que permitem a construção
de modelos de equações estruturais a partir do desenho de diagramas. Entre
esses softwares está o STATA3, que foi utilizado para o desenvolvimento dos
modelos que serão apresentados neste livro.
Modelos de equações estruturais são, portanto, particularmente
relevantes pelas seguintes vantagens: a) permitem que se trabalhe
simultaneamente com estimação e mensuração; b) permitem que sejam
estimados efeitos diretos e indiretos de variáveis explicativas sobre
variáveis respostas; c) são bastante robustos, em função do relaxamento
de pressupostos, quando comparados, por exemplo, com o modelo de
regressão de mínimos quadrados e; d) apresentam facilidade interpretativa
advinda de suas interfaces gráficas. Em função dessas vantagens, os MEE
conquistaram bastante espaço entre pesquisadores e profissionais das áreas
de ciências humanas e sociais, em particular nas análises psicométricas,
mas não apenas.
A modelagem de equações estruturais é, fundamentalmente, uma
técnica de análise estatística confirmatória. Ou seja, ela não se presta à
exploração de dados. Todavia, ela pode ser utilizada, em particular, de três
diferentes formas:
I. Abordagem estritamente confirmatória (AEC), na qual se testa
um modelo teórico previamente especificado, concluindo-se
por sua aceitação ou refutação.

II. Abordagem de modelos alternativos (AMA), na qual se faz uma


análise comparativa da qualidade de ajuste de dois ou mais
modelos teóricos previamente especificados.

3 Mais especificamente, foi utilizada a versão 12.1 do STATA.

8
1 Introdução

III. Abordagem de desenvolvimento de modelos (ADM), na qual


há um primeiro passo semelhante à AEC, porém, no caso da
refutação do modelo especificado, se parte para a busca de
um modelo com melhor qualidade de ajuste, em geral mais
parcimonioso do que o modelo original.
Como dito acima, os MEE combinam análise de regressão com a
análise fatorial. A análise de regressão é a técnica de análise multivariada
mais utilizada. Ela é uma técnica de análise determinística, na qual se
busca observar as covariâncias (ou “efeitos”) de uma ou mais variáveis
independentes sobre uma variável dependente.
A análise de regressão é uma metodologia estatística multivariada
que mede a mudança média que ocorre em uma variável dependente
que está associada às mudanças ocorridas em uma ou mais variáveis
independentes. Na regressão simples, estima-se a relação entre a variável
dependente e uma única variável independente, ao passo que na análise
de regressão múltipla, a variável dependente associa-se com mais de uma
variável independente.
O modelo de análise de regressão pode ser expresso a partir
de estruturas matriciais. Assim, na forma de matrizes, um sistema de
equações de regressão múltipla pode ser assim apresentado:

Isto quer dizer que as dimensões das matrizes e dos vetores


envolvidos são as seguintes:
Yg(n x 1), vetor coluna da observação da variável dependente;
X g(n x k), matriz das observações dadas “n” e de “k-1” variáveis X2
até Xk, também conhecida como matriz dos dados;
9
Modelo de equações estruturais: uma introdução aplicada

β g(k x 1), vetor coluna dos parâmetros desconhecidos β1, β2,


β3...... βk;
e g (n x 1), vetor coluna de n observações.

De maneira que a representação matricial geral de k variável é


dada por
Y = Xβ + ei
As equações normais de mínimos quadrados podem ser
apresentadas em notação matricial como está representado no Quadro
1.1 a seguir:
Quadro 1.1 – Modelo matricial de regressão múltipla, estatísticas e
parâmetros

Equações / Fórmulas Significado

Apresentação da forma matricial da regressão


Y = Xβ* + e
geral
β* = (X’X)-1 (X’Y) Estimativa dos parâmetros sob a forma matricial

Var-Cov (β*) = s2 (X’X)-1 Matriz de variâncias e covariâncias

e’e = (Y’Y) - b*(XY) Erro da regressão

Coeficiente de determinação múltipla sob a for-


β*(X’Y) – NY2
R² =______________
Y’Y –NY2 ma matricial

Forma matricial de teste da existência da regres-


(β*(X’Y) – NY2) / (k –1)
F =___________________ são linear geral, F com k-1 e n-k graus de liberdade
(Y’Y – β*(X’Y) / (N – k)
na hipótese de (β2 = β3 = β4 = ...= βk = 0)
Fonte: Gujarati (1995 p. 303).

Esse método matemático de definição do modelo de regressão é


conhecido como método dos mínimos quadrados ordinários (MQO). Ele
é assim denominado pois minimiza a soma dos quadrados dos erros,
tornando o estimador eficiente. Ou seja, respeitados os pressupostos da

10
1 Introdução

análise de regressão, uma estimação com base em MQO será eficiente,


indicando que terá um nível mínimo de erro.
O modelo de regressão de k-variáveis nas unidades de origem pode
ser resumido como se segue: E(Yi) = b0 + b1 X1i + b2 X2i + b3 X3i + b4 X4i, ...,
bkXk. Onde:

E(Yi) = valor esperado (ou esperança matemática) da variável


dependente;

b0 = intercepto (ou constante) independente dos fatores;


b1 = coeficiente de regressão referente à primeira variável
independente X1i;
b2 = coeficiente de regressão referente à segunda variável
independente X2i;
b3 = coeficiente de regressão referente à terceira variável
independente X3i;
b4 = coeficiente de regressão referente à quarta variável
independente X4i;
bk = coeficiente de regressão referente à última variável
independente Xki;

X1i = primeira variável independente;


X2i = segunda variável independente;
X3i = terceira variável independente;
X4i = quarta variável independente;
Xki = última variável independente;

Note-se que na equação acima os coeficientes da equação de


regressão aparecem representados por uma letra latina (“b”) e não por
uma letra grega (“β”). Isso indica que, nesse caso, tem-se uma equação
amostral de regressão. Ou seja, quando os dados são amostrais, os
coeficientes da equação de regressão são estimadores (representados
por letra latina) adequados dos parâmetros populacionais (representados
por letra grega). Para que os estimadores sejam adequados, eles precisam
atender aos seguintes pressupostos fundamentais:

11
Modelo de equações estruturais: uma introdução aplicada

a) Aleatoriedade, implicando que as variáveis incluídas na análise


são aleatórias, ou seja, não sofrem qualquer tipo de restrição
ou censura, em particular derivada de viés de seletividade
amostral.

b) Linearidade, implicando que o valor esperado da variável


dependente é uma função linear das variáveis independentes.

c) Não-tendenciosidade, implicando que o valor esperado do


estimador é igual ao parâmetro populacional, ou seja, E(b) = β.

d) Independência das observações, implicando que as observações


são independentes entre si.

e) Eficiência, implicando que a variância do estimador é mínima,


ou seja, que nenhum outro método de estimação poderia
prover estimações com menor variância.

f) Homoscedasticidade, implicando que a variância dos erros é


constante ao longo do contínuo da variável dependente.

g) Independência dos erros, indicando que a covariância entre o


erro e qualquer das variáveis independentes é nula, ou seja,
σ2(Xi,ei) = 0.
Se uma estimação por um modelo de regressão de MQO satisfaz
as propriedades acima, essa estimação pode ser chamada de estimação
de máxima verossimilhança. A função de verossimilhança indica quão
provável a amostra observada é como uma função de possíveis valores de
parâmetro. Portanto, maximizar a função de verossimilhança determina
os parâmetros que têm maior probabilidade de produzir os dados
observados. 
Os MEE, por sua vez, produzem estimações de máxima
verossimilhança, mesmo quando alguns dos pressupostos dos modelos
de MQO não são satisfeitos. Em particular, os MEE não precisam satisfazer

12
1 Introdução

o pressuposto da independência dos erros. Estimações com base em


MEE que não satisfazem o pressuposto da independência dos erros
são chamadas de modelos não-recursivos. Nesses casos, a existência
de endogeneidade não é um problema. Quando os MEE satisfazem o
pressuposto da independência dos erros, eles são chamados de modelos
recursivos. Ao longo deste livro introdutório, os exemplos apresentados
se basearão em casos de modelos recursivos.
Como dito acima, os MEE combinam a análise de regressão com a
análise fatorial para, assim, buscar conjugar modelos determinísticos com
modelos de mensuração. A análise fatorial confirmatória (AFC) é aplicada
nos MEE e tem elementos em comum com a análise de componentes
principais. Na AFC, a variação de cada variável é decomposta em duas
partes, sendo uma comum e uma parte única. A primeira diz respeito
à variação que é compartilhada com outras variáveis, ao passo que a
segunda é específica de uma única variável. Portanto, uma diferença entre
a ACP e a AFC diz respeito ao montante de variância analisada. Ao passo
que a ACP leva em consideração a variação total presente no conjunto das
variáveis utilizadas para a mensuração, a AFC só faz uso da variação comum
que é partilhada por todas as variáveis (Reis, 1997). O elemento comum
fundamental entre a AFC e a ACP é que as variáveis manifestas incluídas
na análise podem ser transformadas em combinações lineares de um
conjunto de fatores – ou construtos – hipotéticos ou latentes. As cargas
fatoriais são responsáveis por relacionar a associação específica entre
os fatores e as variáveis observadas diretamente (manifestas). Portanto,
tanto no caso da AFC quanto da ACP, o primeiro passo é encontrar as cargas
e a solução matemática para os fatores, que indicarão a associação entre
as variáveis observadas e os fatores ou construtos mensurados, sendo as
cargas fatoriais derivadas dos autovalores, que, por sua vez, se relacionam
às variáveis observadas. Assim, uma carga fatorial é um coeficiente que
indica o peso de cada variável observada para a mensuração do construto.
Os MEE fazem uso da AFC a partir de procedimentos de máxima
verossimilhança. Assim, como tanto a estimação do modelo de
regressão quanto a mensuração de construtos obtidos a partir da análise

13
Modelo de equações estruturais: uma introdução aplicada

fatorial confirmatória são feitas a partir de procedimentos de máxima


verossimilhança, a integração dos dois métodos se faz possível. Ao
contrário da ACP, a AFC não se presta a abordagens exploratórias. Isso
é mais um elemento em comum desta com à análise de regressão, ou
seja, ambas são estratégias confirmatórias de análise estatística. Assim,
para a realização de mensurações a partir da AFC se faz necessário que se
pense antecipadamente quais variáveis se espera que venham a convergir
para formar um mesmo construto. Da mesma forma, antes de se realizar
uma análise de regressão, se faz necessário ter, de antemão, hipóteses
consistentes sobre a relação entre as variáveis independentes e a variável
dependente que irão compor a equação.

1.2 Conceitos fundamentais

Finalmente, um elemento inicial importante é a sumarização de


termos centrais às MEE. Segue, abaixo, uma lista de termos com uma
curta descrição de cada um:
• Análise confirmatória: uso de técnica estatística multivariada
para testar (ou confirmar ou refutar) um conjunto pré-
estabelecido de relações. No caso dos MEE, a análise
confirmatória é aplicada tanto na estimação (análise de
regressão) quanto na mensuração (análise fatorial).
• Análise de trajetórias: conjunto de equações de regressão
que permite estimar efeitos diretos e indiretos de variáveis
independentes sobre variáveis dependentes.
• Causalidade: relação de causa e efeito entre variáveis, que pode
ser concluída a partir da satisfação de pressupostos somados à
consistência teórica da análise confirmatória proposta.
• Coeficiente de determinação: semelhante ao coeficiente de
determinação dos modelos de regressão de MQO (R2), indica
a proporção da variância total (de todas as variáveis incluídas)
explicada pelo modelo.

14
1 Introdução

• Efeito direto: coeficiente de regressão padronizado ou não-


padronizado.
• Efeito indireto: produto dos coeficientes de regressão
(padronizados ou não-padronizados) de uma estrutura
complexa de causalidade.
• Modelo padronizado: baseado na matriz de correlação.
• Modelo não-padronizado: baseado na matriz de covariância.
• Comunalidade: quantidade de variância que uma variável
observada tem em comum com um construto.
• Confiabilidade: nível de consistência interna do conjunto de
indicadores (variáveis observadas) na mensuração de um
construto, podendo ser entendida, ainda, como o inverso
do erro de mensuração (ou seja, confiabilidade = 1 – erro de
mensuração).
• Construto: conceito latente que não pode ser observado
de forma direta ou medido sem erro, dependendo, para sua
mensuração, da comunalidade entre duas ou mais variáveis
observadas.
• Diagrama de trajetórias: representação gráfica da relação
complexa (que inclui efeitos diretos e indiretos) entre um
conjunto de variáveis observadas ou mensuradas.
• Erro de estimação: diferença entre os valores estimados de uma
variável dependente (a partir de uma equação de regressão) e
os valores observados.
• Erro de mensuração: diferença entre a descrição real e a
descrição perfeita de um construto latente a partir das variáveis
observadas, podendo ser entendido, ainda, como o inverso da
confiabilidade (ou seja, erro de mensuração = 1- confiabilidade).
• Estatística da diferença entre coeficientes de qui-quadrado:
diferença entre os qui-quadrados de dois modelos alternativos,
sendo o grau de liberdade a diferença entre os graus de
liberdade de cada um dos modelos alternativos (Χ2Δ = Χ21 – Χ22;
GLΔ = GL1 – GL2), representa uma medida de qualidade do ajuste.

15
Modelo de equações estruturais: uma introdução aplicada

• Estimação de máxima verossimilhança: método de estimação


utilizado nos MEE.
• Matriz de covariância: matriz contendo a variância e a
covariância de todas as variáveis observadas do MEE.
• Modelo causal: conjunto de equações de regressão (equações
estruturais) que formam as relações de determinação a partir
de efeitos diretos e indiretos de variáveis independentes sobre
variáveis dependentes.
• Modelo de mensuração: análise fatorial confirmatória da
mensuração de cada construto do MEE.
• Modelo nulo: modelo hipotético no qual a relação entre as
variáveis é nula.
• Qualidade do ajuste: medida que indica o quão bem um modelo
especificado replica a matriz de covariância entre as variáveis
observadas.
• Qui-quadrado: medida estatística da diferença entre modelos.
• Relação espúria: relação falsa ou enganosa entre duas variáveis
que têm uma mesma causa.
• Resíduo (ou erro): diferença entre um valor real e um valor
estimado.
• Variável endógena: variável observada ou latente que é, em
algum momento, dependente de outras no MEE.
• Variável exógena: variável observada ou latente que nunca é
dependente de outras no MEE.
• Variável latente: variável mensurada (construto) por análise
fatorial confirmatória a partir de duas ou mais variáveis
observadas.
• Variável observada: variável que pode ser mensurada sem erro
(observada de forma direta).

16
2 Fundamentos estatísticos e substantivos

2 Fundamentos estatísticos e
substantivos
O modelo de equações estruturais (MEE) tem se tornado cada
vez mais importante entre os métodos estatísticos focados na análise
de relações entre variáveis. O método tem sido aplicado nas relações
que são observadas e estimadas, cujos modelos podem incluir dados
observados ou latentes. Os dados primários são usados para estimar a
variância e a covariância que explica a direção do modelo de equações
estruturais. Os métodos estatísticos tradicionais – tais como análise de
variância, análise de regressão múltipla e análise fatorial confirmatória
– são os métodos básicos na integração e estimação na modelagem
teórica das equações estruturais.
O desenvolvimento dos computadores e dos softwares
proporcionaram a generalização, integração e extensão dos modelos do
tipo análise de variância (Anova), análise de regressão múltipla e análise
fatorial confirmatória, processando, simultaneamente, a modelagem de
equações estruturais, que permite estimar, simultaneamente, as variáveis
dependentes e independentes e as correlações entre elas em um único
sistema de equações denominado estrutural. O MEE se consolidou,
assim, como uma contribuição pela busca do aperfeiçoamento de análises
causais, em particular nas ciências sociais e na Psicologia.
Se um pesquisador ou analista de dados busca um maior nível
de segurança em suas análises, ele desenvolverá indicadores válidos
e confiáveis dos seus conceitos teóricos substantivos. Para tanto, o
pesquisador ou analista deve se basear em boa teoria substantiva e
rigorosas definições operacionais de suas categorias conceituais. Isso é
dito pois é importante ressaltar que análises estatísticas corretas não têm
a capacidade de corrigir erros teóricos ou conceituais, como, por exemplo,
a omissão de variáveis centrais ou um conceito incorreto orientando a
mensuração de construtos. Se, do ponto de vista conceitual ou teórico,
em termos substantivos, a análise proposta é correta, a aplicação de

17
Modelo de equações estruturais: uma introdução aplicada

modelagens estatísticas multivariadas, como o MEE, é de grande valia


para a pesquisa científica ou a análise técnica de dados.
Portanto, quando alguém precisa desenvolver um MEE, o melhor a
fazer é começar com um modelo no qual se tenha forte confiança teórica.
Essa confiança deriva de fundamentos teóricos ou empíricos sobre as
ligações entre as variáveis. Por seu caráter confirmatório, o MEE requer
que se inicie a análise com um nível de confiança elevado no modelo a
ser estimado. Portanto, o MEE não é adequado quando se tem pouco
conhecimento ou confiança no modelo inicial, independentemente de se
o resultado final é teórica ou empiricamente plausível.
Um excelente exemplo de modelo teórico inicial é o de realização
de status, que será apresentado a partir do próximo capítulo. Esse modelo
tem uma longa tradição nas ciências sociais em nível internacional. Nele,
as condições da chamada teoria estatística clássica da causalidade são
atendidas, quais sejam:
a) Se uma variável X deve ser considerada uma causa de uma
variável Y, deve haver associação estatística entre elas (condição
da covariância).
b) Se uma variável X deve ser considerada uma causa de uma
variável Y, X deve preceder Y no tempo (condição da precedência
temporal).
c) Se uma variável X deve ser considerada uma causa de uma
variável Y, outras possíveis causas de Y devem ser mensuradas
e incluídas na análise (condição da eliminação de causas
concorrentes).
Em particular por causa da dificuldade em se obter certeza absoluta
de que a terceira condição foi atendida, faz-se necessário que o modelo
inicial a ser estimado seja teoricamente confiável4. Todavia, muitas vezes
há limitações objetivas à mensuração de variáveis, em particular se o

4
Um nível realmente elevado de confiança no atendimento da terceira condição só é
alcançado em pesquisas com dados experimentais. A utilização de variáveis instrumentais
é uma segunda opção, porém com um poder inferior à análise experimental.

18
2 Fundamentos estatísticos e substantivos

pesquisador ou analista faz uso de dados secundários. Portanto, com


dados observacionais haverá sempre um nível relativamente elevado de
incerteza no atendimento da terceira condição.
Neste livro, estudaremos apenas modelos recursivos. Ou seja, a
relação entre variáveis se dará sempre em uma mesma direção. Todavia,
as relações entre três ou mais variáveis poderão ser de três tipos.
Imaginemos que se está estimando um modelo com apenas três variáveis
(X1, X2 e Y), todas observadas. As relações entre elas poderão assumir os
seguintes formatos:
Figura 2.1 – Formato de efeito apenas indireto de X1 sobre Y

Fonte: Elaboração própria.

Figura 2.2 – Formato de relação espúria entre X1 e Y

Fonte: Elaboração própria.

19
Modelo de equações estruturais: uma introdução aplicada

Figura 2.3 – Formato de efeitos direto e indireto de X1 sobre Y

Fonte: Elaboração própria.

Na Figura 2.1, observa-se uma situação na qual a relação entre a


variável X1 e a variável Y é totalmente mediada pela variável X2. Nesse caso,
X1 precede temporalmente X2, que, por sua vez, precede temporalmente
Y. Portanto, todo possível efeito causal de X1 sobre Y se dá através de X2.
Na Figura 2.2, observa-se uma situação na qual a relação entre X1 e
Y é espúria. Ou seja, toda a correlação entre X1 e Y se deve ao fato de que
ambas as variáveis têm X2 como causa.
Na Figura 2.3, observa-se o caso mais interessante e comum
de relação causal complexa entre três ou mais variáveis. Nesse caso,
X1 precede temporalmente X2 que precede temporalmente Y, mas,
diferentemente do que se observa na Figura 2.1, aqui o potencial efeito
causal de X1 sobre Y é decomposto em um efeito direto e um efeito
indireto.
Os MEE recursivos atendem a maior parte dos pressupostos dos
modelos de regressão de mínimos quadrados5, quais sejam:
a) Independência dos erros.
b) Independência das observações.
c) Linearidade.
d) Normalidade dos erros.

5 Sobre os pressupostos da análise de regressão de mínimos quadrados, ver, entre outros,


Gujarati (2006), além da discussão apresentada no capítulo introdutório deste livro.

20
2 Fundamentos estatísticos e substantivos

e) Homoscedasticidade.
f) Aleatoriedade.
Todavia, de modo geral, os MEE permitem a estimação de modelos
com elevados níveis de colinariedade entre variáveis explicativas. No caso
de modelos não recursivos6, o pressuposto da independência dos erros
pode ser relaxado.
Os MEE são uma integração da análise de regressão com a análise
fatorial confirmatória. A análise fatorial usa a matriz de covariância para
estimar o fator estrutural decorrente da análise do fator desenvolvida
inicialmente para explicar a correlação entre as variáveis. O objetivo do
uso da matriz de covariância (ou de correlação, no caso de modelos com
coeficientes padronizados) é reduzir os tipos de variáveis padronizadas
no modelo.
Os modelos de fatores são conhecidos como subidentificados,
identificados ou sobreidentificados. Se o modelo é subidentificado, não
se pode estimar por não ter uma solução única. Quando o modelo for
identificado, existe uma solução exata para a matriz de covariância dos
dados, implicando em um ajuste perfeito. Se o modelo for sobreidentificado,
não ocorre o ajuste perfeito do modelo (Sharma, 1996).
A análise fatorial pressupõe que as covariâncias entre um conjunto
de variáveis observadas podem ser explicadas por um menor número de
fatores latentes subjacentes. No modelo de fator exploratório, procede-
se como se não houvesse hipóteses sobre o número de fatores latentes
e as relações entre os fatores latentes e as variáveis observadas. Os
procedimentos estatísticos são utilizados para estimar o número de
fatores subjacentes e para estimar o fator de carga. Na análise fatorial
exploratória, o modelo é arbitrário: todas as variáveis são carregadas em
todos os fatores. Os MEE, por sua vez, fazem uso de modelos de análise
fatorial confirmatória. Ou seja, na modelagem de equações estruturais,

6 Modelos não recursivos são aqueles nos quais a direção da causalidade não é única. Por
exemplo, neste caso a relação entre duas variáveis pode ser recíproca, como na figura
abaixo:

21
Modelo de equações estruturais: uma introdução aplicada

o modelo de fator confirmatório é imposto aos dados. Nesse caso,


o propósito da modelagem de equação estrutural é duplo. Primeiro,
pretende obter estimativas dos parâmetros do modelo, ou seja, as cargas
fatoriais, as variâncias e covariâncias do fator e as variâncias de erro
residual das variáveis observadas. O segundo objetivo é avaliar o ajuste do
modelo, ou seja, avaliar se o próprio modelo fornece um ajuste adequado
aos dados (Hox; Bechger, 1998).
Os MEE completos, portanto, são compostos da integração de
modelos de regressão com análises fatoriais confirmatórias. Os modelos de
regressão fornecem a parte determinística dos MEE (o modelo causal), ao
passo que as análises fatoriais confirmatórias fornecem a parte referente
às mensurações. No próximo capítulo, será demonstrada e discutida
a estimação de MEE compostos apenas pela parte determinística. No
quarto capítulo, serão demonstrados e discutidos os MEE voltados apenas
à mensuração de variáveis latentes. Finalmente, no quinto capítulo, serão
demonstrados e discutidos MEE completos, ou seja, contendo a parte
determinística e a parte referente às mensurações. Ao final, há uma breve
conclusão do livro.

22
3 Modelos contendo apenas variáveis observadas

3 Modelos contendo apenas


variáveis observadas

Os modelos de equações estruturais que incluem apenas


variáveis observadas são expansões das análises de regressão. Mais
especificamente, eles são um conjunto de equações de regressão, às
vezes chamado de sistema de equações estruturais.

3.1 Primeiro exemplo: o modelo de realização de status


socioeconômico

Vamos, inicialmente, desenvolver um modelo com base na teoria


de estratificação social, conhecido como modelo de realização de status
socioeconômico. Esse modelo se estabeleceu a partir do trabalho seminal
de Blau e Duncan (1967). No presente capítulo, será estimado um modelo
semelhante àquele utilizado por Blau e Duncan (1967), a partir da análise
de uma subamostra de homens de 30 a 50 anos da Pesquisa Nacional
por Amostra de Domicílios de 2014 (PNAD-2014)7. Depois de 18 anos, o
IBGE realizou uma nova PNAD que possibilita a estimação dos modelos de
realização de status socioeconômico e das análises de mobilidade social8.
As variáveis incluídas no modelo foram:
• escmãe: anos de escolaridade completados com sucesso pela
mãe do indivíduo incluído na amostra (escala discreta entre 0
e 16 pontos);
• escpai: anos de escolaridade completados com sucesso pelo
pai do indivíduo incluído na amostra (escala discreta entre 0 e
16 pontos);

Esses dados foram preparados por Neves e Lima (2017).


7

As PNADs de 1973, 1976, 1982, 1988, 1996 e 2014 contêm dados que permitem tais
8

tipos de análise.

23
Modelo de equações estruturais: uma introdução aplicada

• iseopai: índice socioeconômico da ocupação9 do pai do


indivíduo incluído na amostra (escala contínua entre 0 e 100
pontos);
• esco: anos de escolaridade completados com sucesso pelo
próprio indivíduo incluído na amostra (escala discreta entre 0
e 16 pontos);
• iseo: índice socioeconômico da ocupação do próprio indivíduo
incluído na amostra (escala contínua entre 0 e 100 pontos).
O sistema de equações para a realização da análise é:

escoi = b01 + b1(escmãe)i + b2(escpai)i + b3(iseopai)i + Ɛ1i (3.1)


iseoi = b02 + β4(escmãe)i + β5(escpai)i + β6(iseopai)i + β7(iseopai)i Ɛ1i
+
(3.2)

Esse sistema de equações gera o seguinte diagrama de equações


estruturais, exposto na Figura 3.1:
Figura 3.1 – Diagrama de equações estruturais do modelo de realização
de status socioeconômico com dados da PNAD-2014

Fonte: Elaboração própria.

9
O índice socioeconômico da ocupação foi também criado por Blau e Duncan (1967).
Atualmente, há um índice internacional (International Socioeconomic Index of
Occupational Status – ISEI) desenvolvido por Ganzeboom e Treiman (1996), que foi
utilizado nas análises deste livro. Nesse tipo de índice, o status socioeconômico das
ocupações varia numa escala entre 0 e 100 pontos.

24
3 Modelos contendo apenas variáveis observadas

Para desenhar o diagrama, utiliza-se a seguinte sequência de


comandos do STATA: Statistics -> SEM (structural equation modeling) ->
Model building and estimation.

Dentro da janela para desenvolvimento do MEE, desenha-se o diagrama


com o uso dos ícones do lado esquerdo da janela e, depois, parte-se para
a estimação dos coeficientes com o seguinte conjunto de comandos:
Estimation -> Estimate -> Reporting -> Display standardized coefficients
and values -> Ok. A sintaxe gerada pelo STATA é: sem (escmãe -> esco)
(escmãe -> iseo) (escpai -> esco) (escpai -> iseo) (iseopai -> esco) (iseopai ->
iseo) (esco -> iseo), cov( escpai*esc) > mãe iseopai*escmãe iseopai*escpai)
nocapslatent.

25
Modelo de equações estruturais: uma introdução aplicada

26
3 Modelos contendo apenas variáveis observadas

As estimações aparecerão sobre o próprio diagrama, na forma da


Figura 3.2:
Figura 3.2 – Diagrama de equações estruturais do modelo de realização
de status socioeconômico com dados da PNAD-2014, com a estimação
dos coeficientes não padronizados

Fonte: Elaboração própria.

Em geral, é de interesse observar também os coeficientes


padronizados. Para tanto, basta utilizar a seguinte sequência de comandos

27
Modelo de equações estruturais: uma introdução aplicada

na janela de MEE do STATA: View -> Standardized Estimates. O resultado


será este, conforme a Figura 3.3:
Figura 3.3 – Diagrama de equações estruturais do modelo de realização
de status socioeconômico com dados da PNAD-2014, com a estimação
dos coeficientes padronizados

Fonte: Elaboração própria.

O modelo de realização de status levou à consolidação de toda uma


área de pesquisa nas ciências sociais sobre o processo de estratificação
social. Ele permitiu que se pudessem testar empiricamente as hipóteses
que fundaram a análise de estratificação e mobilidade social nos tempos
atuais.
A partir da década de 1930, houve um importante debate teórico
entre dois importantes nomes da sociologia americana da Universidade
Harvard: Talcott Parsons e Pitirim Sorokin. O primeiro, entre outras
importantes contribuições, é um dos pais da chamada Teoria da
Modernização nas Ciências Sociais, ao passo que o segundo é um dos pais
da moderna Teoria da Reprodução Social.
Para Parsons, as sociedades modernas tenderiam a se tornar mais
fluidas com o processo de modernização, indicando que o efeito de
variáveis referentes à origem socioeconômica sobre a alocação ocupacional
dos indivíduos tenderia a diminuir, ao passo que o efeito da educação
tenderia a aumentar. Isso decorreria de uma “revolução educacional”, ou
seja, de um processo de universalização do acesso à educação pública

28
3 Modelos contendo apenas variáveis observadas

que derivaria da modernização das sociedades. O fenômeno descrito


por Parsons transformaria as sociedades no que depois passou a ser
denominado de sistema meritocrático.
Sorokin, por sua vez, argumentou que sociedades tendem a
substituir mecanismos de reprodução social antigos por mecanismos
novos. Assim, para ele, a expansão dos sistemas educacionais públicos
que decorre da modernização não levaria a uma sociedade mais fluida,
mas apenas criaria um mecanismo diferente de reprodução social
intergeracional.
As pesquisas sociológicas desenvolvidas a partir do modelo alocação
de status ocupacional referido acima têm trazido fortes evidências a favor
da hipótese de Sorokin. O Modelo de alocação de status é o mais adequado
para confrontar as hipóteses de Parsons e Sorokin, pois permite observar
os efeitos diretos e indiretos de variáveis de origem socioeconômica
(características socioeconômicas dos pais e das mães dos indivíduos)
sobre o destino socioeconômico medido pelo índice socioeconômico da
ocupação. O que se tem observado em nível mundial é que o processo
de modernização leva a uma transformação do processo de transmissão
intergeracional da desigualdade, fazendo com que o efeito de variáveis de
origem socioeconômica sobre a alocação de status ocupacional se dê cada
vez menos a partir de efeitos diretos e mais a partir de efeitos indiretos.
O modelo estimado acima permite a observação dos efeitos
diretos e indiretos. Os coeficientes expostos no diagrama de trajetórias
representam os efeitos diretos. Para se estimar os efeitos indiretos, é
necessário multiplicar os efeitos diretos. A análise comparativa entre
efeitos diretos e indiretos é muito melhor de ser entendida quando se
estão utilizando coeficientes padronizados. Assim, por exemplo, o efeito
direto padronizado da escolaridade da mãe (escmãe) sobre o índice
socioeconômico da ocupação do entrevistado (iseo) é 0,071 (7,1 * 10-2).
Por sua vez, o efeito direto padronizado da escolaridade da mãe (escmãe)
sobre a escolaridade do entrevistado é 0,24. Finalmente, o efeito
padronizado direto da escolaridade do entrevistado (esco) sobre o índice
socioeconômico da ocupação do entrevistado (iseo) é 0,44. Assim, o efeito

29
Modelo de equações estruturais: uma introdução aplicada

indireto padronizado da mãe (escmãe) sobre o índice socioeconômico


da ocupação do entrevistado (iseo) é o produto dos dois efeitos diretos,
ou seja, 0,24 * 0,44 = 0,106. Por sua vez, o efeito total padronizado é
a soma do efeito direto com o efeito indireto, ou seja, 0,071 + 0,106 =
0,177. Observa-se, assim, que a maior parte do efeito da escolaridade da
mãe sobre o nível socioeconômico da ocupação do entrevistado se dá
de forma indireta (aproximadamente 60% do efeito total padronizado é
indireto, ao passo que 40% é direto). O efeito total pode ser interpretado
da seguinte forma: a elevação de um desvio padrão na escolaridade da
mãe é acompanhada pela elevação de 0,177 desvio padrão no status
socioeconômico da ocupação do entrevistado.
A decomposição em efeitos diretos, indiretos e totais pode ser
obtida a partir da seguinte sequência de comandos: Estimation -> Testing
and CIs -> Direct and indirect effects -> Decomposition of effects into
total, direct, and indirect (teffects) -> Report standardized effects -> Ok.

30
3 Modelos contendo apenas variáveis observadas

Os resultados calculados pelo STATA estão reportados a seguir:

31
Modelo de equações estruturais: uma introdução aplicada

A última coluna à direita apresenta os coeficientes padronizados.


Pode-se observar que os efeitos direto, indireto e total padronizados da
relação entre escmãe e iseo são idênticos aos reportados previamente.

3.1.2 Testes de hipóteses

O modelo proposto gera sete estimadores. Assim, há a necessidade


de realizar o mesmo número de testes de hipóteses, nos quais as hipóteses
nulas serão sempre de que os parâmetros populacionais são iguais a zero
(ᵦ = 0), assumindo-se um teste bilateral. Os resultados (gerados a partir
da sequência de comandos reportada no início deste capítulo) calculados
pelo STATA estão reportados a seguir:

32
3 Modelos contendo apenas variáveis observadas

33
Modelo de equações estruturais: uma introdução aplicada

34
3 Modelos contendo apenas variáveis observadas

Os resultados do STATA reportados mostram que, para todos os


testes de hipóteses, é possível a rejeição da hipótese nula, visto que todos
apresentam p-valores < 0,001. Obviamente, como se está trabalhando
com uma amostra bastante grande (n = 4467), a rejeição da hipótese
nula tende a ser bastante facilitada. Assim, é cada vez mais consensual
que se deve aplicar uma lógica típica da estatística bayesiana e se buscar
analisar se os coeficientes são não apenas significantes, mas também
substantivamente relevantes. Essa análise exige, do pesquisador ou de
qualquer outro profissional que esteja desenvolvendo os procedimentos
analíticos, um conhecimento aprofundado do que está sendo analisado
para poder ter uma boa ideia da relevância dos resultados encontrados.
Para tanto, é recomendável que se observem os resultados com base nos
coeficientes padronizados. Esses resultados indicam que dois trajetos têm
coeficientes padronizados bastante baixos e, talvez, possam ser omitidos
do modelo. Esses trajetos são os efeitos diretos da escolaridade da mãe
e da escolaridade do pai sobre o status socioeconômico da ocupação do
entrevistado. Para se decidir se os referidos trajetos devem ser mantidos
no modelo, faz-se necessária uma análise comparativa da qualidade de
ajuste dos modelos com e sem o referido trajeto.

3.1.3 Análise da qualidade do ajuste

O modelo estimado acima é comumente denominado de modelo


saturado, pois ele tem todos os trajetos possíveis. Para se obter as
principais estatísticas referentes à qualidade de ajuste de um modelo,
utiliza-se a seguinte sequência de comandos do STATA: Estimation ->
Goodness off it -> Overall goodeness off it -> Goodness of fit statistics
(gof) -> All of above.

35
Modelo de equações estruturais: uma introdução aplicada

36
3 Modelos contendo apenas variáveis observadas

Os resultados encontrados estão reportados a seguir:

37
Modelo de equações estruturais: uma introdução aplicada

Agora, deve-se estimar um modelo sem os dois trajetos que têm


coeficientes com valores baixos e que talvez sejam irrelevantes. Esse
modelo tem o seguinte diagrama:
Figura 3.4 – Variação mais parcimoniosa do diagrama de equações
estruturais do modelo de realização de status socioeconômico

Fonte: Elaboração própria.

Os resultados com coeficientes não-padronizados e padronizados


desse modelo mais parcimonioso (ou seja, com um menor número de
parâmetros para ser estimado) encontram-se a seguir:
Figura 3.5 – Resultados da variação mais parcimoniosa do diagrama de
equações estruturais do modelo de realização de status socioeconômico
com dados da PNAD-2014, com a estimação dos coeficientes
padronizados

Fonte: Elaboração própria.

38
3 Modelos contendo apenas variáveis observadas

Para decidir sobre qual modelo devemos utilizar, vamos pedir as


estatísticas de qualidade do ajustamento do segundo modelo. Essas
estatísticas encontram-se a seguir:

Os resultados das estatísticas de ajustamento dos dois modelos


são bastante bons. Todavia, a parcimônia é um princípio importante da
análise estatística. Assim, deve-se buscar identificar se a queda no poder
explicativo ocorrida com o segundo modelo – que é mais parcimonioso
– é pequena o suficiente para que se faça a opção por ele. Os resultados
de ajuste dos dois modelos são bastante bons, indicando que ambos são
adequados, pois têm estatísticas CFI, TLI e CD bastante próximas. Todavia,
um teste mais objetivo (embora afetado pelo tamanho da amostra) pode
ser realizado pela comparação das estatísticas de qui-quadrado das razões
de verossimilhança dos dois modelos. O que se observa é que o segundo
modelo, quando comparado ao modelo saturado, tem uma estatística qui-

39
Modelo de equações estruturais: uma introdução aplicada

quadrado de 58,923, com 2 graus de liberdade. Visto que o valor crítico da


estatística qui-quadrado com 2 graus de liberdade e nível de significância
de 0,01 é 9,21, observa-se, assim, que, quando comparado ao modelo
saturado (ou seja, o primeiro modelo), o segundo modelo não tem uma
boa qualidade de ajuste (o ideal seria um qui-quadrado com um p-valor
> 0,05, quando se tem um p-valor < 0,001). Conclui-se, portanto, que o
modelo saturado (o primeiro modelo) deve ser o escolhido.

3.2 Segundo exemplo: a estimação do IGD-M

Em 2006, o então Ministério do Desenvolvimento Social e Combate


à Fome (MDS) criou o índice de gestão descentralizada (IGD), para medir
e acompanhar a gestão do Programa Bolsa Família e do Cadastro Único
por parte dos entes federados. No caso dos municípios, o índice se chama
IGD-M. Nesta parte do livro, vamos desenvolver um primeiro MEE para
explicar a determinação do referido índice. Para tanto, são utilizados os
dados referentes ao ano de 2014.
O modelo proposto é o seguinte:
Figura 3.6 – Diagrama de equações estruturais do modelo para explicação
do IDH

Fonte: Elaboração própria

Onde:
rdpc: diz respeito à renda per capita do município.
PIBcapi3: diz respeito ao PIB per capita do município.

40
3 Modelos contendo apenas variáveis observadas

pbf_pop7: é a proporção de beneficiários do Programa Bolsa Família


em relação ao tamanho da população.
Igdm_m_3: diz respeito ao índice de gestão descentralizada
municipal.

A estimação do modelo se dá a partir da seguinte sequência de


comandos no STATA:

41
Modelo de equações estruturais: uma introdução aplicada

42
3 Modelos contendo apenas variáveis observadas

Após sua estimação, o modelo apresenta os seguintes resultados


com coeficientes padronizados:
Figura 3.7 – Diagrama de equações estruturais com os resultados do
modelo para explicação do IDH

Fonte: Elaboração própria.

43
Modelo de equações estruturais: uma introdução aplicada

Os resultados reportados para o modelo da Figura 3.7, quando a


variável resposta é a proporção de beneficiários do Programa Bolsa Família
em relação à população total do município, são compatíveis com o que se
poderia esperar. Mais especificamente, se observa que a renda per capita
e o PIB dos municípios têm um efeito negativo sobre a proporção de
beneficiários do Programa Bolsa Família em relação à população total do
município. Obviamente, se espera que, em municípios mais ricos, ou seja,
com maior renda e maior produção, se observe uma menor proporção de
beneficiários do Programa Bolsa Família.
Por outro lado, quando a variável resposta é o IGD-M, os resultados
talvez sejam surpreendentes para alguns. Observa-se que a renda per
capita e o PIB dos municípios têm um efeito negativo sobre IGD-M,
indicando que, em municípios mais ricos, a qualidade da política de
assistência social tende a ser pior. Por sua vez, a variável referente à

44
3 Modelos contendo apenas variáveis observadas

proporção de beneficiários do Programa Bolsa Família em relação à


população total do município apresenta um efeito positivo sobre o
IGD-M. A estimação do modelo indica, portanto, que o IGD-M é bastante
dependente da proporção de beneficiários do Programa Bolsa Família
em relação à população total do município. Ou seja, o que impulsiona a
elevação da qualidade da política de assistência social dos municípios é
sua dependência dos recursos oriundos do Programa Bolsa Família.
Outro ponto que chama atenção nos resultados acima é o efeito
indireto da variável referente à renda per capita sobre o IGD-M. Mais
especificamente, observa-se que a maior parte do efeito da renda per
capita sobre o IGD-M se dá através da proporção de beneficiários do
Programa Bolsa Família em relação à população total do município. Ou
seja, uma maior renda per capita tem um efeito negativo forte sobre o
IGD-M, ao reduzir a dependência do município dos recursos do Programa
Bolsa Família.

3.2.1 Testes de hipóteses

O modelo proposto gera quatro estimadores. Assim, há a necessidade


de realizar o mesmo número de testes de hipóteses, nos quais as hipóteses
nulas serão sempre de que os parâmetros populacionais são iguais a zero
(ᵦ = 0), assumindo-se um teste bilateral. Os resultados (gerados a partir
da sequência de comandos reportada no início deste capítulo) calculados
pelo STATA estão reportados nas tabelas anteriormente apresentadas.
Os resultados do STATA mostram que, para todos os testes
de hipóteses, é possível a rejeição da hipótese nula, visto que todos
apresentam p-valores < 0,001. Obviamente, como se está trabalhando
com uma amostra bastante grande (n = 5565), a rejeição da hipótese
nula tende a ser bastante facilitada. Assim, é cada vez mais consensual
que se deve aplicar uma lógica típica da estatística bayesiana e se buscar
analisar se os coeficientes são não apenas significantes, mas também
substantivamente relevantes. Essa análise exige, do pesquisador ou de
qualquer outro profissional que esteja desenvolvendo os procedimentos

45
Modelo de equações estruturais: uma introdução aplicada

analíticos, um conhecimento aprofundado do que está sendo analisado


para poder ter uma boa ideia da relevância dos resultados encontrados.
Para tanto, é recomendável que se observem os resultados com base
nos coeficientes padronizados. Os resultados parecem indicar que todos
os coeficientes são relevantes. Todavia, para se concluir de forma mais
segura que o modelo proposto é adequado, faz-se necessária a realização
de uma análise sobre a qualidade de ajuste do modelo.

3.2.3 Análise da qualidade do ajuste

Para se realizar a análise da qualidade do ajuste do modelo, deve-se


seguir os mesmos procedimentos desenvolvidos para o exemplo anterior,
quais sejam:

46
3 Modelos contendo apenas variáveis observadas

Os resultados obtidos são os seguintes:

47
Modelo de equações estruturais: uma introdução aplicada

Os resultados de ajuste do modelo são bastante bons, indicando


sua adequabilidade, pois tem estatísticas CFI, TLI e CD com valores
bastante elevados. Todavia, um teste mais objetivo (embora afetado pelo
tamanho da amostra) pode ser dado pela comparação das estatísticas
de qui-quadrado das razões de verossimilhança do modelo. O que se
observa é que o modelo, quando comparado ao modelo saturado, tem
uma estatística qui-quadrado de 0,527, com 1 grau de liberdade. Visto
que o valor crítico da estatística qui-quadrado com 1 grau de liberdade
e nível de significância de 0,05 é 3,85, observa-se, assim, que, quando
comparado ao modelo saturado (ou seja, o primeiro modelo), o segundo
modelo tem uma boa qualidade de ajuste (o ideal é justamente um qui-
quadrado com um p-valor > 0,05). Conclui-se, portanto, que o modelo
estimado tem uma boa qualidade de ajuste.

3.3 Comentários finais do capítulo

Neste capítulo, foram estimados MEE contendo apenas variáveis


observadas. Primeiramente, foi utilizado um modelo clássico da análise
de estratificação social, o chamado modelo de alocação de status
socioeconômico. Os resultados indicaram que o modelo saturado foi o
que apresentou o melhor ajuste e que os efeitos indiretos de duas das
variáveis exógenas foram mais relevantes do que os efeitos diretos, o que
indica a adequabilidade da estimação de um MEE. Posteriormente, foi
estimado um modelo para a explicação do índice de gestão descentralizada
municipal (IGD-M). O modelo proposto apresentou um elevado nível de
qualidade do ajuste e uma estrutura complexa e reveladora de relação
entre as variáveis.
A leitura deste capítulo, portanto, permite que se aprenda:
a) como realizar a estimação de MEE contendo apenas variáveis
observadas (ou seja, apenas o modelo causal);
b) como realizar os testes de hipóteses;
c) como realizar a análise sobre a qualidade de ajuste dos modelos.

48
4 Modelos contendo apenas a análise de mensuração

4 Modelos contendo apenas a


análise de mensuração
Os MEE que incluem apenas análise de mensuração representam
um subtipo dos modelos completos, que serão estudados no próximo
capítulo. No caso das análises de mensuração, o objetivo é apenas o de
mensurar construtos latentes a partir de variáveis observadas. Ou seja,
ao passo que, no capítulo anterior, o objetivo da análise era propor e
testar sistemas complexos de causalidade ou de determinação entre
variáveis observadas, neste capítulo utilizam-se variáveis observadas para
mensurar construtos (ou variáveis) latentes que devem ser fortemente
associadas, mas não contam com relações de determinação entre elas.
As análises de mensuração dos MEE requerem a aplicação de
análises fatoriais confirmatórias. Neste caso, como foi visto anteriormente,
a análise fatorial é utilizada para confirmar uma expectativa de que duas ou
mais variáveis observadas irão convergir para formar um mesmo construto
latente e que tal construto é consistente e confiável. Ao passo que, na
análise fatorial exploratória, os construtos (ou fatores) são formados
a partir apenas de procedimentos estatísticos e suas constituições são
desconhecidas pelo pesquisador ou analista em momentos prévios à
análise, a análise fatorial confirmatória se presta à confirmação ou não de
uma prévia teoria de mensuração. Ou seja, é necessário que o pesquisador
ou analista tenha uma expectativa prévia de quais variáveis devem formar
um construto.
A definição sobre a adequabilidade do modelo de mensuração
proposto é dada por análises de confiabilidade e/ou de ajuste. É comum
o uso do coeficiente Alfa de Cronbach para análises de confiabilidade
de escalas ou construtos latentes. Todavia, esses coeficientes são muito
afetados pelo número de itens (variáveis observadas) da escala (construto).
Mais especificamente, mantido tudo o mais constante, quanto maior o
número de itens da escala mensurada, maior tenderá a ser o valor do
coeficiente Alfa de Cronbach. Quando o modelo de mensuração conta

49
Modelo de equações estruturais: uma introdução aplicada

com um número pequeno de itens, o valor do Alfa de Cronbach tende a


ser muito baixo. No caso das análises que serão utilizadas como exemplo,
neste capítulo, ter-se-á justamente esse tipo de situação, pois todos os
modelos de mensuração contarão com apenas duas ou três variáveis
observadas (itens). Assim, fica ainda mais evidente a utilidade de se
realizar mensurações a partir de MEE, pois é possível obter-se uma análise
de ajuste do modelo mais adequada e ampla do que com o coeficiente
Alfa de Crombach, em particular quando se tem um número pequeno de
variáveis observadas incluídas no modelo.

4.1 Primeiro exemplo: a mensuração da origem


socioeconômica

Para que se possa propor um modelo de mensuração com base


em uma análise fatorial confirmatória, deve-se partir de uma teoria da
mensuração. Como visto no capítulo anterior, a teoria da estratificação
social propõe que variáveis tais como a escolaridade dos pais e das mães e
o status socioeconômico da ocupação dos pais são componentes da origem
socioeconômica dos indivíduos. No capítulo anterior, essas variáveis foram
incluídas de forma independente em um modelo de caminhos. Todavia, é
possível que um analista ou pesquisador queira analisar se essas variáveis
poderiam ser operacionalizadas a partir de um único construto. Assim,
com base na teoria da estratificação social, propõe-se uma teoria da
mensuração na qual se espera que as variáveis referentes à educação
do pai, à educação da mãe e ao status socioeconômico do pai convirjam
para formar um único construto. Para tanto, mais uma vez, será utilizada
a subamostra da PNAD-2014, a mesma usada no capítulo anterior. O
diagrama de equações estruturais proposto é, portanto, o seguinte:

50
4 Modelos contendo apenas a análise de mensuração

Figura 4.1: Diagrama do modelo de equações estruturais para a


mensuração da variável latente referente à origem socioeconômica

Fonte: Elaboração própria

Onde:
ose = variável latente referente à origem socioeconômica dos
indivíduos da subamostra;
iseopai = índice socioeconômico da ocupação do pai do indivíduo
da subamostra;
escpai = anos de escolaridade do pai do indivíduo da subamostra;
escmãe = anos de escolaridade da mãe do indivíduo da subamostra.

Os resultados encontrados (coeficientes padronizados) foram os


seguintes:
Figura 4.2: Diagrama do modelo de equações estruturais para a
mensuração da variável latente referente à origem socioeconômica com
os resultados padronizados a partir dos dados da PNAD-2014

Fonte: Elaboração própria

51
Modelo de equações estruturais: uma introdução aplicada

Os resultados do modelo de mensuração da variável referente


à origem socioeconômica mostram que as cargas fatoriais são todas
bastante elevadas (superiores a 0,70; a menor é igual a 0,73 e a maior é
igual a 0,92) e estatisticamente significantes.
A seguir, têm-se os resultados do ajuste do modelo. Pode-se
observar que o software não gerou um coeficiente de qui-quadrado
referente à comparação com o modelo saturado, pois o modelo analisado
é exatamente igual ao modelo saturado (ou seja, ele contém todas as
relações possíveis dadas as variáveis observadas utilizadas). Portanto, o
coeficiente de qui-quadrado que deve ser observado é aquele referente
à comparação entre o modelo nulo (baseline) e o modelo saturado. Mais
uma vez, um coeficiente que tenha um p-valor < 0,05 indica que o primeiro
modelo da comparação (no caso, o modelo nulo) tem um ajuste inferior
ao segundo modelo (no caso, o modelo saturado). Portanto, visto que o

52
4 Modelos contendo apenas a análise de mensuração

modelo utilizado na análise é equivalente ao modelo saturado, conclui-


se que ele tem um ajuste adequado, quando se toma como referência a
análise do qui-quadrado. Outras medidas de ajuste do modelo utilizadas
com frequência (CFI, TLI e CD) – todas com valor igual ou próximo de 1,00
– também apresentam resultados que corroboram a qualidade de ajuste
do modelo de mensuração proposto.

Assim, com base nos valores elevados das cargas fatoriais, nos
testes de significância dessas cargas e nos indicadores de ajuste, pode-
se concluir que o modelo apresenta um ajuste adequado. Assim, do
ponto de vista substantivo, a conclusão deve ser a de que a teoria de
mensuração proposta está correta, ou seja, as variáveis referentes à origem
socioeconômica dos indivíduos de fato convergem adequadamente para
formar um único construto latente.

53
Modelo de equações estruturais: uma introdução aplicada

4.2 Segundo exemplo: a mensuração do destino


socioeconômico

No capítulo anterior, a variável resposta final do modelo foi o status


socioeconômico da ocupação dos indivíduos da subamostra. Todavia, pode
ser desejável a estimação de um modelo de mensuração no qual a variável
latente é um construto que componha o índice de status socioeconômico
da ocupação e o rendimento do trabalho. A composição dessas duas
variáveis permite a mensuração do destino socioeconômico considerando
tanto o elemento referente ao status ocupacional – que é uma variável
de caráter mais estrutural – como também o rendimento do trabalho,
que tem um caráter mais individual. Utilizando-se a mesma subamostra
do exemplo anterior – e com base na teoria de mensuração de que o
destino socioeconômico pode ser mensurado a partir da composição das
variáveis observadas referentes ao status socioeconômico da ocupação e
ao rendimento do trabalho –, propõe-se um modelo de mensuração com
base no seguinte diagrama:

Figura 4.3: Diagrama do modelo de equações estruturais para a


mensuração da variável latente referente ao destino socioeconômica

Fonte: Elaboração própria

Onde:
dse = construto latente referente ao destino socioeconômico dos
indivíduos da subamostra;
iseo = índice socioeconômico da ocupação dos indivíduos da
subamostra;

54
4 Modelos contendo apenas a análise de mensuração

lnrenda = logaritmo natural (ou neperiano) do rendimento do


trabalho (de todas as ocupações) dos indivíduos da subamostra.
Os resultados encontrados (coeficientes padronizados) foram os
seguintes:

Figura 4.4: Diagrama do modelo de equações estruturais para a


mensuração da variável latente referente ao destino socioeconômico
com resultados padronizados a partir dos dados da PNAD-2014

Fonte: Elaboração própria

55
Modelo de equações estruturais: uma introdução aplicada

Os resultados da mensuração do destino socioeconômico


mostram que as cargas fatoriais são todas adequadas (superiores a 0,40)
e estatisticamente significantes. Abaixo, têm-se os resultados do ajuste
do modelo. Pode-se observar que, mais uma vez, o software não gerou
um coeficiente de qui-quadrado referente à comparação com o modelo
saturado, pois o modelo analisado é exatamente igual ao modelo saturado
(ou seja, ele contém todas as relações possíveis dadas as variáveis
observadas utilizadas). Portanto, o coeficiente de qui-quadrado que deve ser
observado é aquele referente à comparação entre o modelo nulo (baseline)
e o modelo saturado. Mais uma vez, um coeficiente que tenha um p-valor <
0,05 indica que o primeiro modelo da comparação (no caso, o modelo nulo)
tem um ajuste inferior ao segundo modelo (no caso, o modelo saturado).
Portanto, visto que o modelo utilizado na análise é equivalente ao modelo
saturado, conclui-se que ele tem um ajuste adequado, quando se toma
como referência a análise do qui-quadrado. Outras medidas de ajuste do
modelo utilizadas com frequência (CFI, TLI e CD) – todas com valor igual
a 1,00 – também apresentam resultados que corroboram a qualidade de
ajuste do modelo de mensuração proposto.

56
4 Modelos contendo apenas a análise de mensuração

Assim, com base nos valores adequados das cargas fatoriais, nos
testes de significância dessas cargas e nos indicadores de ajuste, pode-se
concluir que o modelo apresenta um ajuste adequado. Assim, do ponto de
vista substantivo, a conclusão deve ser a de que a teoria de mensuração
proposta está correta, ou seja, as variáveis referentes ao destino
socioeconômico dos indivíduos de fato convergem adequadamente para
formar um único construto latente.

4.3 Terceiro exemplo: mensurando a dependência do


município em relação ao Programa Bolsa Família

No capítulo anterior, foi estimado um modelo de determinação


do IGD-M. Observou-se que ele era influenciado pela dependência que
o município tem dos recursos financeiros do Programa Bolsa Família.
Todavia, naquele momento, essa dependência financeira foi mensurada
por apenas uma variável, a saber, a proporção da população beneficiária

57
Modelo de equações estruturais: uma introdução aplicada

em relação à população total do município. Ocorre que, um pesquisador


ou analista pode querer testar um construto para a dependência do
município em relação ao Programa Bolsa Família. Para tanto, propõe-se
uma teoria de mensuração de que a dependência se refere não apenas
à proporção da população beneficiária do programa, mas também à
proporção da soma dos recursos totais repassados pelo Programa Bolsa
Família com relação ao PIB do município.
O modelo de mensuração proposto foi:

Figura 4.5: Diagrama do modelo de equações estruturais para a


mensuração da variável latente referente à dependência do programa
bolsa família

Fonte: Elaboração própria

Onde:
pbf_pib7: é o valor da soma de benefícios do Programa Bolsa Família
recebido pelos moradores do município em relação ao PIB municipal.
pbf_pop7: é a proporção de beneficiários do Programa Bolsa Família
em relação ao tamanho da população.
deppbf: é o construto latente que representa a dependência que o
município tem do Programa Bolsa Família e é derivado das duas variáveis
acima.
Os resultados encontrados (coeficientes padronizados) foram os
seguintes:

58
4 Modelos contendo apenas a análise de mensuração

Figura 4.6: Diagrama do modelo de equações estruturais para a


mensuração da variável latente referente à dependência do programa
bolsa família com resultados padronizados

Fonte: Elaboração própria

Os resultados do modelo de mensuração da dependência do


programa bolsa família mostram que as cargas fatoriais são bastante
elevadas (superiores a 0,80) e estatisticamente significantes. A seguir,
tem-se os resultados do ajuste do modelo. Pode-se observar que, mais
uma vez, o software não gerou um coeficiente de qui-quadrado referente
à comparação com o modelo saturado, pois o modelo analisado é

59
Modelo de equações estruturais: uma introdução aplicada

exatamente igual ao modelo saturado (ou seja, ele contém todas as


relações possíveis dadas as variáveis observadas utilizadas). Portanto, o
coeficiente de qui-quadrado que deve ser observado é aquele referente
à comparação entre o modelo nulo (baseline) e o modelo saturado. Mais
uma vez, um coeficiente que tenha um p-valor < 0,05 indica que o primeiro
modelo da comparação (no caso, o modelo nulo) tem um ajuste inferior
ao segundo modelo (no caso, o modelo saturado). Portanto, visto que o
modelo utilizado na análise é equivalente ao modelo saturado, conclui-
se que ele tem um ajuste adequado, quando se toma como referência a
análise do qui-quadrado. Outras medidas de ajuste do modelo utilizadas
com frequência (CFI, TLI e CD) – todas com valor igual a 1,00 – também
apresentam resultados que corroboram a qualidade de ajuste do modelo
de mensuração proposto.

60
4 Modelos contendo apenas a análise de mensuração

4.4 Comentários finais do capítulo

Neste capítulo, foram testados MEE para mensuração de variáveis


latentes. Primeiramente, foram utilizadas variáveis do modelo clássico da
análise de estratificação social, o chamado modelo de alocação de status
socioeconômico. Os resultados indicaram que os modelos de mensuração
apresentaram bons ajustes. Posteriormente, foi testado um modelo para
a mensuração da dependência dos municípios em relação aos recursos
financeiros do Programa Bolsa Família. O modelo proposto apresentou
um elevado nível de qualidade do ajuste.
A leitura deste capítulo, portanto, permite que se aprenda:
a) como realizar a estimação de MEE para mensuração de variáveis
latentes;
b) como realizar os testes de hipóteses;
c) como realizar a análise sobre a qualidade de ajuste dos modelos.

61
5 Modelos contendo variáveis observadas e construtos latentes

5 Modelos contendo variáveis


observadas e construtos latentes
Neste capítulo, serão estimados MEE com a introdução de variáveis
observadas e de variáveis mensuradas (latentes). Nesses casos, os MEE
são uma composição de análises de regressão e de análises fatoriais
confirmatórias. Serão apresentados dois exemplos diferentes. O primeiro
será uma extensão do exemplo utilizado no capítulo anterior, baseado
no modelo de realização de status socioeconômico. O segundo será uma
aplicação na área de políticas sociais.
Para se estimar modelos completos de equações estruturais, é
necessário que se desenvolva uma teoria estrutural. Uma teoria estrutural
é uma representação conceitual das relações entre variáveis observadas e
construtos. Ela pode ser expressa em termos de um MEE que represente
adequadamente a partir de um sistema de equações estruturais e pode
ser representada por um diagrama gráfico. Modelos estruturais são
conhecidos por diversos nomes, em particular modelo causal. Um modelo
causal infere que as relações atendem às condições necessárias para
causalidade, que foram discutidas anteriormente.

5.1 Primeiro exemplo: o modelo de realização de status


socioeconômico contendo a mensuração de um construto

No terceiro capítulo, vimos a estimação de um modelo clássico de


realização de status socioeconômico no qual todas as variáveis incluídas
eram observadas. A variável resposta final do modelo diz respeito
ao status socioeconômico da ocupação. Todavia, pode ser desejável
a estimação de um modelo no qual a variável resposta final seja um
construto que componha o índice de status socioeconômico da ocupação
e o rendimento do trabalho. A composição dessas duas variáveis
permite a mensuração do destino socioeconômico considerando tanto
o elemento referente ao status ocupacional – que é uma variável de

63
Modelo de equações estruturais: uma introdução aplicada

caráter mais estrutural – como também o rendimento do trabalho, que


tem um caráter mais individual.
O sistema de equações para a realização da análise é:
escoi = b01 + b1(escmãe)i + b2(escpai)i + b3(iseopai)i + Ɛ1i (4.1)
dsei = b02 + β4(escmãe)i + β5(escpai)i + β6(iseopai)i + β7(iseopai)i Ɛ1i
+
(4.2)

Esse sistema de equações gera o seguinte diagrama de equações


estruturais:
Figura 5.1: Diagrama de modelo de equações estruturais completo para
a explicação do destino socioeconômico

Fonte: Elaboração própria

Os resultados da estimação do modelo foram os seguintes:


Figura 5.2: Diagrama de modelo de equações estruturais completo para
a explicação do destino socioeconômico com os resultados padronizados
a partir dos dados da PNAD-2014

Fonte: Elaboração própria

64
5 Modelos contendo variáveis observadas e construtos latentes

O modelo estimado é agora composto por duas partes: um modelo


causal e um modelo de mensuração. Esse último traz uma variável latente
(um construto referente ao destino socioeconômico do entrevistado,
dse) gerada a partir de análise fatorial confirmatória com duas variáveis
observadas: nível socioeconômico (iseo) e o logaritmo natural do
rendimento do trabalho (lnrenda). O modelo padronizado mostra cargas
fatoriais de 0,79 e 0,52, indicando que as variáveis observadas convergem
de forma satisfatória para formar o construto.
Os resultados da estimação do modelo foram os seguintes:

65
Modelo de equações estruturais: uma introdução aplicada

66
5 Modelos contendo variáveis observadas e construtos latentes

67
Modelo de equações estruturais: uma introdução aplicada

68
5 Modelos contendo variáveis observadas e construtos latentes

69
Modelo de equações estruturais: uma introdução aplicada

70
5 Modelos contendo variáveis observadas e construtos latentes

Os resultados acima são semelhantes àqueles do capítulo anterior.


Mais uma vez, se observa a relevância do MEE, ao se perceber que os
efeitos indiretos das variáveis referentes à origem socioeconômica – em
particular da escolaridade do pai e da mãe – sobre o destino socioeconômico
são tão ou mais relevantes do que os efeitos diretos. Observa-se, ainda,
que o ajuste do modelo com a introdução da mensuração do construto
referente ao destino socioeconômico é ainda melhor do que aquele do
modelo estimado no terceiro capítulo. O coeficiente de determinação
(CD) cresceu e agora é 0,445, e o qui-quadrado é 2,515, o que dá um
p-valor de 0,473, bem maior do que um nível de significância de 0,05,
mostrando que não se deve rejeitar a hipótese nula de que o modelo tem
um bom ajustamento.

5.2 Segundo exemplo: modelo de determinação do IGD-M

Em 2006, o então Ministério do Desenvolvimento Social e Combate


à Fome (MDS) criou o índice de gestão descentralizada (IGD) para medir
e acompanhar a gestão do Programa Bolsa Família e do Cadastro Único
por parte dos entes federados. No caso dos municípios, o índice se chama
IGD-M. Nesta parte do livro, vamos desenvolver um MEE para explicar
a determinação do referido índice. Para tanto, são utilizados os dados
referentes ao ano de 2014.
O modelo proposto originalmente é o seguinte:

71
Modelo de equações estruturais: uma introdução aplicada

Figura 5.3: Diagrama do modelo completo para explicação do IDH-M

Fonte: Elaboração própria

Onde:

rdpc: diz respeito à renda per capita do município.


PIBcapi3: diz respeito ao PIB per capita do município.
L1: é um construto derivado das duas variáveis acima e representa
o nível econômico do município.
pbf_pib: é o valor da soma de benefícios do Programa Bolsa Família
recebido pelos moradores do município em relação ao PIB municipal.
pbf_pop7: é a proporção de beneficiários do Programa Bolsa Família
em relação ao tamanho da população.
dep_pbf: é o construto latente que representa a dependência que o
município tem do Programa Bolsa Família e é derivado das duas variáveis
acima.
Igdm_m_3: diz respeito ao índice de gestão descentralizada
municipal.
O modelo acima pressupõe efeitos diretos e indiretos. Todavia, esse
modelo teórico proposto originalmente não pode ser estimado, pois não
foi possível se encontrar uma solução aceitável, mesmo após dezenas

72
5 Modelos contendo variáveis observadas e construtos latentes

de iterações computacionais. Então, foi necessário buscar um modelo


mais parcimonioso. Assim, evoluiu-se para um modelo no qual a variável
exógena só tem efeito indireto sobre a variável resposta final, a saber:

Figura 5.4: Diagrama do modelo mais parcimonioso para explicação do


IDH-M

Fonte: Elaboração própria

Os resultados da estimação do modelo acima foram os seguintes:

Figura 5.5: Diagrama do modelo mais parcimonioso para explicação do


IDH-M com resultados padronizados

Fonte: Elaboração própria

73
Modelo de equações estruturais: uma introdução aplicada

74
5 Modelos contendo variáveis observadas e construtos latentes

75
Modelo de equações estruturais: uma introdução aplicada

76
5 Modelos contendo variáveis observadas e construtos latentes

Os resultados acima mostram a adequabilidade da estimação de


um MEE com a inclusão de análise de determinação e de modelos de
mensuração. A maior parte dos indicadores de ajuste do modelo (CFI, TLI
e CD) obtiveram coeficientes bastante elevados (próximos de 1). O único
indicador de ajuste que não obteve resultado favorável à qualidade do
modelo foi a comparação entre o qui-quadrado do modelo estimado em
relação ao modelo saturado10. Observe-se, porém, que o modelo saturado
não pode ser estimado, como se viu acima. Os coeficientes padronizados
de regressão e as cargas fatoriais apresentaram todos os valores bastante
elevados ou pelo menos satisfatórios (a menor carga fatorial foi maior do
que 0,5). O modelo estimado, portanto, justifica a busca de uma estrutura
complexa de relação entre construtos latentes e variáveis observadas
considerando efeitos indiretos.

Dada a sensibilidade da estatística do qui-quadrado para o tamanho da amostra é


10

que os especialistas propuseram uma variedade de índices de ajuste alternativos para


avaliar o ajuste do modelo. Todas as medidas de bondade são algumas das funções
do qui-quadrado e dos graus de liberdade. A maioria desses índices de ajuste não só
considera o ajuste do modelo, mas também a sua simplicidade. Um modelo saturado, que
especifica todos os caminhos (ou ligações) possíveis entre todas as variáveis, sempre se
adapta perfeitamente aos dados, mas é tão complexo quanto os dados observados. Mas,
se dois modelos tiverem o mesmo grau de ajuste, deve-se preferir o mais simples dos dois
(princípio da parcimônia). Em geral, há uma compensação entre o ajuste de um modelo
e sua simplicidade. Vários índices de qualidade de ajuste foram propostos para avaliar
simultaneamente o ajuste e a simplicidade de um modelo. O objetivo é produzir um índice
de qualidade de ajuste que não dependa do tamanho da amostra ou da distribuição dos
dados. De fato, a maioria dos índices de qualidade de ajuste ainda depende do tamanho
e da distribuição da amostra, mas a dependência é muito menor que a do teste de Qui-
quadrado tradicional.

77
Modelo de equações estruturais: uma introdução aplicada

5.3 Comentários finais do capítulo

Neste capítulo, foram estimados MEE completos, ou seja, que


incluem determinação e mensuração. Primeiramente, foram utilizadas
variáveis do modelo clássico da análise de estratificação social, o chamado
modelo de alocação de status socioeconômico. Os resultados indicaram
que os modelos alcançaram bons ajustes. Posteriormente, foi estimado
um modelo para a explicação do IGD-M. O modelo proposto apresentou
um elevado nível de qualidade do ajuste.
Modelos estruturais completos diferem de modelos de mensuração
no sentido de que a ênfase deixa de ser apenas a relação entre construtos
latentes e variáveis medidas para a natureza e magnitude das relações
entre construtos e variáveis observadas. Modelos de mensuração são
testados usando-se apenas análise fatorial confirmatória. O resultado é a
especificação de um modelo estrutural que é usado para testar o modelo
teórico proposto.
Por outro lado, um MEE completo inclui não apenas a determinação
entre variáveis, mas também a mensuração. Isso permite que se possam
desenvolver modelos complexos de relação causal nos quais são
controlados tanto erros de estimação quanto erros de mensuração.
A leitura deste capítulo, portanto, permite que se aprenda:
a) como realizar a estimação de MEE completo, ou seja, com
mensuração de variáveis latentes e sistemas complexos de
relação entre variáveis;
b) como realizar os testes de hipóteses;
c) como realizar a análise sobre a qualidade de ajuste dos modelos.

78
5 Modelos contendo variáveis observadas e construtos latentes

6 Conclusão

Um MEE completo envolve tanto o teste da teoria de mensuração


quanto da teoria estrutural (ou causal) que conecta construtos entre si de
uma maneira teoricamente fundamentada. A modelagem de equações
estruturais não é apenas mais uma técnica estatística multivariada: é uma
maneira de testar teorias. Modelagens estatísticas muito mais fáceis estão
disponíveis para a exploração de relações. Mas quando um pesquisador
ou analista conhece suficientemente bem a questão que está analisando
e que requer a observação de um conjunto de relações entre variáveis
observadas e construtos latentes, além da maneira como tais construtos
são medidos, o MEE passa a ser a melhor opção.
Neste livro, são apresentadas as principais variações de MEE. A
aplicação dessas variações permite que o pesquisador ou analista consiga
desenvolver análises multivariadas de dados tanto com perspectiva causal
quanto focada na mensuração, ou ainda, o que é o potencial máximo da
MEE, a combinação das duas.
A aplicação das técnicas expostas neste livro permite ao pesquisador
ou ao analista de dados que desenvolva trabalhos que tanto podem
contribuir para o avanço do conhecimento científico em diversas áreas
das Ciências Humanas ou Sociais Aplicada, quanto realizar análises que
podem subsidiar o processo de tomada de decisão de gestores públicos.
As potencialidades das técnicas estudadas aqui são múltiplas e bastante
significativas.

79
Modelo de equações estruturais: uma introdução aplicada

Referências bibliográficas

Blau, Peter; Duncan, Otis. The American Occupational Structure. Nova York: The Free
Press, 1967.
Fernandes, Flávio. Federalismo, políticas sociais e sistemas de incentivo: o caso do
Programa Bolsa Família (2006-2014). Belo Horizonte: PPGCP/FAFICH/UFMG, 2016. Tese
(Doutorado em Ciência Política) – Universidade Federal de Minas Gerais, Belo Horizonte.
Ganzeboom, Harry; Treiman, Donald. Internationally Comparable Measures of
Occupational Status for the 1988 International Standard Classification of Occupations.
Social Science Research, v. 25, p. 201-239, 1996.
Gujarati, Damodar. Econometria Básica. São Paulo: Makron Books, 1995.
Gujarati, Damodar. Econometria Básica. Rio de Janeiro: Elsevier, 2006.
Hox, Joop; Bechger, Timo. An introduction to structural equation modeling. Family Science
Review, v. 11, p. 354-373, 1998.
Neves, Jorge; Lima, Luciana. Industrialização, políticas de bem estar e fluidez social no
Brasil: de 1973 a 2014. In: Congresso Brasileiro de Sociologia, 18., 2017 , Brasília. Anais...
Brasília: Sociedade Brasileira de Sociologia, 2017.
Reis, Elizabeth. Estatística multivariada aplicada. Lisboa: Edições Sílabo, 1997.
Sharma, Subhash. Applied multivariate techniques. Nova York: John Wiley & Sons, 1996.

Esta obra foi impressa pela Imprensa Nacional


SIG, Quadra 6, Lote 800
70610-460 – Brasília-DF

80