Anda di halaman 1dari 3

Roteiro de Análise de Modelos de Regressão

 quanto maior o número de dados, melhor;

 todos os dados que compõem a amostra devem ser vistoriados;

 conferência dos dados após digitação;

 optar pela opção de cálculo geral (p/ computadores com bom hardware);

 análise cuidadosa dos resultados gerais;


 significância dos regressores;
 Outliers;
 F calculado;
 coeficiente de correlação;

 coeficientes de determinação (com coeficientes elevados);


 variação total muito grande;
 altos graus de colinearidade ou multicolinearidade entre os regressores
 outliers como pontos influenciantes

 coeficientes de determinação (coeficientes baixos);


 variáveis não explicam a variação do valor em torno da média;
 variáveis independentes mal definidas e devem ser revistas
 Podem estar faltando variáveis ou a(s) escala(s) está(ão) inadequada(s);
 variação total a ser explicada é pequena (dados homogêneos);
 neste caso devem ser analisados os demais resultados da regressão

 teste da equação
 crescimento da variável para 10% variação em sua amplitude (última coluna do
modo equação);
 variáveis dicotômicas – influência total;
 ordenação da variável dependente para identificar dados discrepantes;
 análise gráfica através da opção exibir variáveis;
 dados inconsistentes (Ex.: unitário elevado em imóvel com área elevada);
 Significâncias
significância dos regressores significância do modelo
 grau III ≤ 10%;  grau III ≤ 1%;
 grau II ≤ 20%;  grau II ≤ 5%;
 grau I ≤ 30% ;  grau I ≤ 10%;

 “t” de Student
 quanto maior o “t” de Student, maior a influência da variável no modelo;
 se uma variável apresenta “t” muito maior do que as demais pode significar que
essa variável explica quase toda a variação e as demais contribuem pouco;
 cuidado na utilização do modelo quando for definir esta variável no imóvel a ser
avaliado, principalmente ser for variável qualitativa;

 resíduos do modelo
 valor coletado para o dado menos o valor calculado na equação;
 nenhum dos valores calculados deve apresentar valor negativo;
 a coluna de desvios relativos (percentual de variação entre o valor coletado e o
valor calculado) não deve apresentar valores excessivos:
 acima de 60% - examinar o dado;
 acima de 80% - preocupar com a aceitação do dado na amostra;
 acima de 100% - verificar o comportamento do modelo sem o dado;
 a coluna R/DP indica a relação entre o Resíduo e o Desvio Padrão do modelo, isto
é, quantos desvios padrões o dado se distancia de sua média estimada;
 valores superiores a +2 ou inferiores a -2 indicam dados excessivamente
dispersos

 Heterocedasticidade (auto-correlação)
 feito a partir do gráfico de resíduos da variável dependente;
 ocorre quando há variação gradativa da dispersão;
 Teste de Durbin-Watson

 multicolinearidade
 dificulta a obtenção de resultados confiáveis;
 quando a multicolinearidade está presente no mercado não há prejuízos (Ex.:
distância ao centro x padrão do imóvel, logo, simulações de padrões altos próximos
do centro e padrões baixo afastados do centro não terão grandes influências, mas o
contrário pode ser perigoso);
 melhor analisar correlações com influência;
 até 40% - fraca
 até 70% - aceitável
 até 85 % - preocupante
 acima de 85% pode ser prejudicial

 intervalo de confiança
 não coincide necessariamente com o campo de arbítrio que é limitado a 15%;
 pode ser utilizado para ajustar o valor final de avaliações quando determinadas
situações identificadas no mercado não puderam ser detectadas na amostra;
 pode indicar a consistência do modelo de regressão;
 intervalos amplos para 80% certeza : pouca consistência
 até 10% para cada lado da média: bom resultado;
 até 15% para cada lado da média: aceitável;
 até 20% para cada lado da média: preocupante
 acima de 20% para cada lado da média: não recomendável
 normalidade dos resíduos
 68% entre -1 e +1 desvios padrão da média;
 90% entre -1,64 e +1,64 desvios padrão da média;
 95% entre -1,96 e +1,96 desvios padrão da média

 auto-regressão;
 deve ser calculada para a variável mais influente no modelo (maior t observado)

 gráficos
 através dos gráficos pode-se observar o comportamento de cada variável
independente com a variável dependente bem como entre as variáveis
independentes, duas a duas;
 pode-se avaliar também o comportamento dos dados em torno da média com a
evolução de cada variável (homocedasticidade).

 Micronumerosidade
 a) para evitar a micronumerosidade, o número mínimo de dados efetivamente
utilizados (n) no modelo deve obedecer aos seguintes critérios, com respeito ao
número de variáveis independentes (k):
n  3 (k+1)

ni  5, até duas variáveis dicotômicas ou três códigos alocados para a mesma


característica;

ni  3, para 3 ou mais variáveis dicotômicas ou quatro ou mais códigos alocados


para a mesma característica onde:
 ni é o número de dados de mesma característica, no caso de utilização de
variáveis dicotômicas ou de códigos alocados, ou número de valores
observados distintos para cada uma das variáveis quantitativas;

 Códigos alocados
 Recomenda-se considerar tantas variáveis dicotômicas quantas forem necessárias
para descrever as diferenças qualitativas, em lugar da utilização de códigos
alocados, especialmente quando a quantidade de dados é abundante e pode-se
preservar os graus de liberdade necessários à modelagem estatística,definidos nesta
Norma.
 A utilização de códigos alocados é tolerada nos seguintes casos, na seguinte ordem
de prioridade:
 a) quando seus valores são extraídos da amostra com a utilização de
variáveis dicotômicas;
 b) quando são utilizados números naturais em ordem crescente das
características possíveis, com valor inicial igual a 1, sem a utilização de
transformações, ou seja, na escala original.