A atividade de avaliação de imóveis tem se tornado cada vez mais importante para lastrear operações financeiras baseadas nos valores desses tipos de bens. Porém, em análises de bases com muitos dados de imóveis, tem-se observado a diminuição da capacidade preditiva quando é utilizado o método tradicional – por Regressão Linear Múltipla. Com o objetivo de verificar se nesses casos a aplicação de algoritmos de mineração de dados pode obter resultados estatísticos superiores, foram coletadas bases de dados de avaliações de imóveis de cinco cidades no Estado do Paraná, fornecidas por unidades da Caixa Econômica Federal. Após validações iniciais, foram geradas bases adicionais com valores originais, transformados e nominais, além de bases brutas. Cada uma foi submetida à aplicação de 17 variações de algoritmos, isolados ou combinados, com uso de 10-fold cross-validation no módulo Experimenter do programa Weka. Em análises de bases de dados de quatro cidades foram observados incrementos variados nos resultados estatísticos com uso de algoritmos em comparação aos obtidos com RLM, em especial quando utilizadas combinações de algoritmos. Os maiores incrementos foram obtidos em bases que possuem maiores quantidades de dados e naquelas onde foram realizadas menores limpezas iniciais. Os algoritmos ainda foram classificados por quantidades de resultados superiores obtidos. Concluiu-se pelo atingimento do objetivo do trabalho e recomendou-se a aplicação de algoritmos em bases de avaliação de imóveis com muitos dados.
The activity of real estate appraisal is becoming increasingly very important to back up financial operations based on the values of these kinds of assets. However, in bases with a lot of data, a decrease of the prediction capacity has been observed when the traditional method is used – by Multiple Linear Regression. With the objective to check if in these cases the application of data mining algorithms can achieve superior statistical results, real estate appraisal databases from five cities in the Estate of Paraná were collected, offered by units from Caixa Econômica Federal. After initial validations, additional bases were generated with original, transformed and nominal values. Each one was submitted to 17 runs of variations of algorithms, isolated or combined, with use of 10-fold cross validation in the Experimenter module on Weka software. Analysis from four city databases showed varied increments in statistical results with use of algorithms in comparison with those obtained by MLR, especially when combined algorithms were used. The largest increments were obtained in bases with a lot of data and in those where minor initial cleanings were performed. The algorithms were still classified by the quantity of superior results obtained. It was concluded by the achievement of the general objective of the work and it was recommended the application of algorithms in real estate bases with a lot of data.
Data da defesa: 18/02/2019
Banca Examinadora
Orientador (a): Lúcio de Medeiros (Lactec)
Membro da Banca: Ana Paula Oening (Lactec)
Membro da Banca: Débora Cíntia Marcílio (Lactec)
Membro da Banca: Milton Pires Ramos (GRAM)
Palavra(s)-Chave: Avaliação de imóveis; Caixa Econômica Federal; Mineração de Dados; Weka.
Keywords: Real Estate Appraisal; Caixa Econômica Federal; Data Mining; Weka.