Avaliação de Imóveis por Inferência Estatística: Pontos Outliers x Pontos Influenciantes
Qual é a diferença entre um ponto outlier e um ponto influenciante? O avaliador deve retirar os pontos outliers da amostra? E os pontos influenciantes?
O conceito de ponto outlier da norma técnica brasileira é o seguinte:
Um ponto (ou dado) outlier é um “Ponto atípico, identificado como estranho à massa de dados” (NBR 14653-2/2011).
Pode-se afirmar que um dado outlier possui uma ou mais características diferenciadas quando se compara com os demais dados amostrais levantados.
Pontos outlier podem ser verificados pelo gráfico “Resíduos Padronizados versus Valores Ajustados”. Pontos fora do intervalo [-2; +2 ] são outlier.
Ponto Outlier Observado no Gráfico
Como os alunos do Curso de Avaliação de Imóveis Urbanos por Inferência Estatística da Qualific Net sabem, a existência de pontos outlier entre os dados amostrais nem sempre prejudica o modelo. O avaliador deve experimentar retirar os pontos outlier (um de cada vez) e observar se o ajuste do modelo melhora ou não com a retirada deles.
Já o ponto influenciante é:
Ponto influenciante: ponto atípico que, quando retirado da amostra, altera significativamente os parâmetros estimados ou a estrutura do modelo” (NBR 14653-2/2011. Item 3.56).
Perceba que a existência de pontos influenciantes na amostra prejudica o modelo de regressão linear, enquanto que a presença de pontos outlier pode não prejudicá-lo.
Como reconhecer um ponto influenciante?
Embora a norma técnica não defina um valor que delimite um ponto como influenciante, os dados que apresentarem resíduo relativo maior do que 40% são pontos influenciantes e o avaliador precisa desconsiderá-los da amostra.
O percentual de resíduo relativo de um dado é calculado com a expressão:
Onde:
Yi = preço observado do dado amostral i
Yi chapéu = preço estimado do dado amostral i com a equação de regressão
Outro critério objetivo para identificação de pontos influenciantes é a Distância de Cook (Dcook). Pontos com Distâncias de Cook maiores do que um (1,00) são pontos influenciantes. O sistema que os alunos do curso recebem calcula a Dcook.
Enfim, o avaliador deve observar e ter cuidado com os pontos outlier, mas não deve necessariamente retirá-los da amostra. No entanto, os pontos influenciantes devem ser retirados da amostra, pois são dados que prejudicam o modelo de regressão desenvolvido pelo avaliador.
————————————-
Este artigo é de autoria do Engenheiro Professor Marcio Soares da Rocha e é parte do curso de Avaliação de Imóveis Urbanos por Inferência Estatística da Qualific Net (acessível aqui).