Anda di halaman 1dari 4

A correlação e a regressão são dois aspectos que andam sempre muito ligados, pertencendo à

Estatística Descritiva. Assim, importa fazermos a distinção entre eles:


• A correlação pode ser definida como o grau de semelhança no sentido das variações
entre os valores correspondentes dos dois caracteres, isto é, a correlação preocupa‐se com
a descrição da relação entre variáveis.
• A regressão é usada quando tentamos predizer uma variável quando conhecemos a
outra

Os conceitos de Intervalo de Confiança e Intervalo de Predição, as suas diferenças entre si e as suas aplicações são assuntos que têm
gerado dúvidas e polêmicas entre os engenheiros e arquitetos avaliadores de imóveis, pois a definição de Intervalo de Predição da
norma técnica NBR 14653/ABNT não é clara e alguns softwares de avaliações utilizam nomenclaturas diferentes para estes dois
intervalos. Para complicar mais a questão, a literatura técnica de Estatística normalmente tem outra nomenclatura para o intervalo
que a norma técnica chama de Intervalo de Predição. Até o momento em que publicamos este artigo, não havíamos encontrado na
literatura específica de avaliação imobiliária nem na web algum texto que esclarecesse o assunto. Aqui, compartilha-se uma
contribuição para a compreensão de cada um destes intervalos e para as suas adequadas interpretações e usos na avaliação de
imóveis por inferência estatística. Os alunos do Curso de Avaliações de Imóveis por Inferência Estatística da Qualific Net já
conhecem essas diferenças e conseguem interpretar e aplicar estes intervalos de forma adequada.

Intervalo de Confiança (IC)

A definição de Intervalo de Confiança que a norma técnica NBR 14653-2/ABNT dá é a seguinte:

“Intervalo de valores dentro do qual está contido o parâmetro populacional com determinada confiança” (NBR 14.653-2/2011. Item
3.40).

Esta nos parece ser uma definição muito sucinta, embora seja clara, para quem conhece a teoria da inferência estatística.

Uma característica peculiar do Intervalo de Confiança é que ele é estabelecido com base nos dados da amostra. O IC é o intervalo
onde a média populacional estará, considerada a confiança predeterminada no estudo.

No caso das avaliações imobiliárias, o parâmetro populacional que se deseja estimar é o preço de mercado, o qual é um valor de
tendência central (média), numa população onde o desvio padrão não é conhecido. O Intervalo de Confiança, portanto, define os
limites superior e inferior do intervalo de valores, dentro do qual estará o preço do mercado onde o avaliador pesquisou os dados
amostrais. O nível de confiança determinado pela NBR 14.653-2/2011 para avaliação de imóveis urbanos é de 80%.

A equação para o cálculo dos limites do Intervalo de Confiança, em uma regressão linear múltipla para avaliação de imóveis, é:

Quanto ao uso, o Intervalo de Confiança é importante nas avaliações imobiliárias, uma vez que o grau de precisão do modelo é
classificado em função da amplitude do IC, conforme o item 9.2.3 da NBR 14653-2.
Outro uso importante do IC é o arbitramento do valor pontual da avaliação, quando o modelo não possui a variável “Evento”
(oferta/venda). Às vezes, dependendo do tipo do imóvel avaliando e do momento da pesquisa, o mercado não dispõe de dados
suficientes de imóveis vendidos, para a consideração desta variável explicativa no modelo. Neste caso, é recomendável que o
avaliador, no momento de definir o valor pontual final da avaliação, adote o limite inferior (Li) do IC, pois os preços dos imóveis
pesquisados estão em oferta, e possuem grande probabilidade de sofrer descontos quando de suas efetivas vendas. Para tanto, a
amplitude do IC tem que ser inferior à do Campo de Arbítrio (intervalo de valores cujos limites são mais ou menos 15% em torno da
estimativa de tendência central).

Intervalo de Predição (IP)

A norma técnica NBR 14653-2/ABNT define Intervalo de Predição (IP) assim:

“Estimativa de um intervalo de valores, a partir de dados de mercado observados, dentro do qual novos dados do mesmo contexto
estarão contidos, com determinada probabilidade” (NBR 14.653-2/2011. Item 3.41).

Esta definição da norma técnica é um tanto confusa.

O intervalo que a NBR 14653-2 denomina como Intervalo de Predição (IP) é o intervalo de valores (com confiança determinada)
onde estará a média populacional, quando se infere o preço de mercado a partir de valores não observados – que não pertencem à
amostra pesquisada.

Esta é a principal diferença entre o IP e o IC. Enquanto o IC é determinado apenas com os dados que pertencem à amostra, o IP é
delimitado a partir de dados que não pertencem à ela. Trata-se de uma previsão com o uso do modelo de regressão linear. Por isto
a literatura técnica de Estatística normalmente denomina este intervalo de Intervalo de Previsão. Alguns sistemas informatizados de
Estatística Geral, tais como o R e o Action Stat, também denominam o Intervalo de Predição como Intervalo de Previsão.

A equação para determinação do Intervalo de Predição/Previsão (IP) é semelhante à equação para determinação do Intervalo de
Confiança (IC), no entanto, no cálculo dos limites do IP soma-se a variância do modelo ao S(Yh). Por isto, o IP é mais amplo do que o
IC.

Quanto ao uso nas avaliações, o IP também pode ser usado para arbitramento do valor pontual final da avaliação (no caso de uma
variável independente importante não ter sido considerada no modelo), se o imóvel avaliando possui características diferentes dos
dados da amostra e se o IP tiver amplitude menor que a do Campo de Arbítrio. A norma citada permite isto, em seu Anexo A. O IP,
porém, não pode ser usado para determinar o grau de precisão do modelo, pois, como já foi dito, a norma técnica brasileira
disciplina que somente o IC pode ser usado para este propósito.

Além do conteúdo do presente artigo, no curso são disponibilizados aos alunos exemplos resolvidos e um quadro com as diferenças
de nomenclatura para estes dois intervalos, encontradas nos principais softwares de avaliação disponíveis no mercado brasileiro.

Espera-se ter contribuído para melhor compreensão do tema e agradece-se por comentários e sugestões aqui postados.
O que é o Intervalo de Confiança?

Um intervalo de confiança refere-se a uma gama de valores que provavelmente conterá o valor de um parâmetro de população
desconhecida, como a média, com base nos dados amostrados dessa população.

Recolhido aleatoriamente, é improvável que duas amostras de uma determinada população tenham intervalos de confiança
idênticos. Mas se a população for amostrada uma e outra vez, uma certa porcentagem desses intervalos de confiança conterá o
parâmetro da população desconhecida. A porcentagem desses intervalos de confiança que contém esse parâmetro é o nível de
confiança do intervalo.

Os intervalos de confiança são mais utilizados para expressar a média da população ou desvio padrão, mas também podem ser
calculados para proporções, coeficientes de regressão, taxas de ocorrência (Poisson) e para as diferenças entre as populações em
testes de hipóteses.

Se medimos a vida de lâmpadas de uma amostra aleatória e o Minitab calcula 1230 – 1265 horas com o intervalo de confiança de
95%, isso significa que podemos confiar 95% que a média da duração para a população de bulbos cairá entre 1230 e 1265 horas.

Em relação ao parâmetro de interesse, os intervalos de confiança apenas avaliam o erro de amostragem – o erro inerente na
estimativa de uma característica de população de uma amostra. Os tamanhos de amostra maiores diminuirão o erro de
amostragem e resultarão em intervalos de confiança menores (mais estreitos). Se você pudesse experimentar toda a população, o
intervalo de confiança teria uma largura de 0: não haveria nenhum erro de amostragem, pois obteve o parâmetro real para toda a
população!

Além disso, os intervalos de confiança apenas fornecem informações sobre a média, o desvio padrão ou qualquer que seja o seu
parâmetro de interesse. Não diz nada sobre como os valores individuais estão distribuídos.

O que isso significa em termos práticos?

Isso significa que o intervalo de confiança tem algumas limitações sérias. Neste exemplo, podemos ter 95% de confiança de que a
média da duração em horas das lâmpadas cairá entre 1230 e 1265 horas. Mas esse intervalo de confiança de 95% não indica que
95% das lâmpadas cairão nesse intervalo. Para desenhar uma conclusão como essa, é necessário um intervalo diferente …

O que é o Intervalo de Previsão?

Um intervalo de predição é um intervalo de confiança para previsões derivadas de modelos de regressão linear e não-linear.
Existem dois tipos de intervalos de previsão.

Intervalo de confiança da previsão

Dado configurações específicas dos preditores em um modelo, o intervalo de confiança da predição é um intervalo que
provavelmente contém a resposta média. Como intervalos de confiança regulares, o intervalo de confiança da predição representa
um intervalo para a média, e não para a distribuição dos dados individuais.

Com relação às lâmpadas, poderíamos testar como diferentes técnicas de fabricação (Lentas ou rápidas) e filamentos (A ou B)
afetam a vida da lâmpada. Depois de montar um modelo, podemos usar o software estatístico para prever a vida das lâmpadas
feitas usando o filamento A sob o método Rápido.

Se o intervalo de confiança da previsão for 1400-1450 horas, podemos ter 95% de confiança em que a vida média das lâmpadas
feitas sob essas condições está dentro dessa faixa. No entanto, esse intervalo não nos diz nada sobre como as vidas das lâmpadas
individuais são distribuídas.

Intervalo de previsão

Um intervalo de previsão é um intervalo que provavelmente conterá o valor de resposta de uma nova observação individual em
configurações especificadas de seus preditores.

Se o Minitab calcular um intervalo de previsão de 1350-1500 horas para uma lâmpada produzida nas condições descritas acima,
podemos ter 95% de confiança de que o tempo de vida de uma nova lâmpada produzida com essas configurações estará dentro
desse alcance.

Você notará que o intervalo de previsão é mais amplo do que o intervalo de confiança da predição. Isso sempre será verdade,
porque a incerteza adicional está envolvida quando queremos prever uma resposta única, em vez de uma resposta média.

O que são os Intervalos de Tolerância?

Um intervalo de tolerância é um intervalo que provavelmente contém uma proporção definida de uma população. Para calcular os
intervalos de tolerância, você deve estipular a proporção da população e o nível de confiança desejado – a probabilidade de que a
proporção mencionada esteja realmente inclusa no intervalo. Isso é mais fácil de entender quando você olha um exemplo.
Exemplo de intervalo de tolerância

Para avaliar quanto tempo duraram as lâmpadas, a empresa de lâmpadas amostrou 100 lâmpadas aleatoriamente e registrou
quanto tempo elas duraram.

Para usar esses dados para calcular os intervalos de tolerância, vá para Stat> Ferramentas de qualidade> Intervalos de tolerância no
Minitab. Em Dados, escolha Amostras em colunas. Na caixa de texto, insira Horas. Em seguida, clique em OK.

O teste de normalidade indica que esses dados seguem a distribuição normal, então podemos usar o intervalo Normal (1060 1435).
A empresa pode ter 95% de confiança de que pelo menos 95% de todas as lâmpadas durarão entre 1060 e 1435 horas.

Como os intervalos de tolerância se comparam aos intervalos de confiança?

Como mencionamos anteriormente, a largura de um intervalo de confiança depende inteiramente do erro de amostragem. Quanto
mais perto a amostra chegar de incluir toda a população, menor a largura do intervalo de confiança, até chegar a zero.

Mas a largura de um intervalo de tolerância baseia-se não apenas no erro de amostragem, mas também na variação da população.
À medida que o tamanho da amostra se aproxima de toda a população, o erro de amostragem diminui e os percentis estimados se
aproximam dos percentis da população verdadeira.

O Minitab calcula os valores de dados que correspondem aos percentis 2.5º e 97.5º estimados (97.5 – 2.5 = 95) para determinar o
intervalo em que 95% da população cai.

Porque estamos usando uma amostra, as estimativas percentis terão erro. Uma vez que não podemos dizer que um intervalo de
tolerância realmente contém a proporção especificada com 100% de confiança, os intervalos de tolerância também têm um nível de
confiança.

Como os intervalos de tolerância são usados?

Os intervalos de tolerância são muito úteis quando você deseja prever uma série de resultados prováveis com base em dados
amostrados.

Na melhoria da qualidade, os profissionais geralmente exigem que uma saída do processo (como a vida de uma lâmpada) caia
dentro dos limites da especificação. Ao comparar os requisitos do cliente com os limites de tolerância que cobrem uma proporção
especificada da população, os intervalos de tolerância podem detectar variações excessivas. Um intervalo de tolerância maior do
que os requisitos do cliente pode indicar que a variação do produto é muito alta.

O software estatístico Minitab facilita a obtenção desses intervalos, independentemente daquela que você precisa usar para seus
dados.

Anda mungkin juga menyukai