Avaliação de Imóveis por Inferência Estatística: Pontos Outliers x Pontos Influenciantes
Qual é a diferença entre um ponto outlier e um ponto influenciante? O avaliador deve retirar os pontos outliers da amostra? E os pontos influenciantes?
Ponto Outlier
O conceito de ponto outlier da norma técnica NBR 14654-2 é o seguinte:
“Ponto atípico, identificado como estranho à massa de dados” (NBR 14653-2/2011).
Pode-se afirmar que um dado outlier possui uma ou mais características (quantitativas ou qualitativas) diferenciadas, quando é comparado com os demais dados amostrais levantados/pesquisados.
Os pontos outlier podem identificados por meio do gráfico “Resíduos Padronizados versus Valores Ajustados”. São pontos com resíduos padronizados fora do intervalo [-2; +2 ].
Como os alunos do Curso de Avaliação de Imóveis Urbanos por Inferência Estatística de Acordo com a NBR 14653-2/ABNT, da Qualific Net, já sabem, a existência de pontos outlier entre os dados amostrais nem sempre prejudica o modelo inferencial. O avaliador deve analisar se há informações incorretas sobre os dados outlier e, conforme o caso, julgar qual deve ser a medida a adotar — se retirar/substituir esses dados outlier ou mantê-los na amostra. Ressalta-se que um modelo terá maior precisão se não contiver pontos outlier.
Ponto Influenciante (ou Influente)
A norma técnica conceitua ponto influenciante assim:
Ponto influenciante: ponto atípico que, quando retirado da amostra, altera significativamente os parâmetros estimados ou a estrutura do modelo” (NBR 14653-2/2011. Item 3.56).
Diferentemente dos pontos outlier, a existência de pontos influenciantes na amostra prejudica fortemente o modelo de regressão linear e uma vez identificados, os pontos influentes devem ser retirados da amostra.
Como identificar um ponto influenciante?
Pode-se identificar os pontos influenciantes/influentes por meio do cálculo da Distância de Cook. Alguns sistemas automatizam os cálculos das distâncias de Cook (D-Cook) de cada dado amostral e as apresentam por meios de gráficos ou tabelas. Pontos com distâncias de Cook maiores do que um (1,00) são pontos influenciantes. O sistema que os alunos do curso de Avaliação de Imóveis Urbanos por Inferência Estatística de Acordo com a NBR 14653-2/ABNT, da Qualific Net, recebem gratuitamente, calcula a Dcook.
Um método alternativo (não normativo) para identificar um ponto influenciante é o cálculo dos resíduos relativos. Os dados que possuírem resíduo relativo maior do que 40% são potencialmente pontos influenciantes e o avaliador precisa verificar se a exclusão deles melhora significativamente o modelo inferencial. Se sim, deve desconsidera-los/subtraí-los da sua amostra.
O percentual de resíduo relativo de um dado é calculado com a expressão:
Onde:
Yi = preço observado do dado amostral i
^Yi = preço estimado do dado amostral i com a equação de regressão (também chamado de valor ajustado ou valor previsto)
Enfim, o avaliador deve observar e analisar os pontos outlier, mas não precisa necessariamente retirá-los da amostra, embora saiba-se que um modelo que não contenha pontos outlier será mais preciso. No entanto, os pontos influenciantes devem ser retirados da amostra, pois são dados que prejudicam grandemente o modelo de regressão desenvolvido pelo avaliador.
————————————-
Marcio Soares da Rocha, autor deste artigo, é engenheiro civil, pós graduado (MBA) em Engenharia de Custos e Mestre em Gestão Pública; possui experiência em avaliação de imóveis, em perícias de engenharia, em auditorias de obras e em orçamentos e análise de custos; foi Conselheiro do Crea-CE e é professor do curso online/EAD de Avaliação de Imóveis Urbanos por Inferência Estatística de Acordo com a NBR 14653-2/ABNT da Qualific Net (clique aqui para acessar a página deste curso e se inscrever).