Um classificador de divisões de interiores de casas para suportar agentes imobiliários

Detalhes bibliográficos
Autor(a) principal: Veiga, Bruno Tiago Silva
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.22/23511
Resumo: Everyday, Real Estate Agents retrieve pictures from houses that are then manually labelled and filtered to pick the best ones to present on their websites and better describe the homes they are selling. This is a time consuming task that delays the whole process of advertising homes and receiving propositions and could be solved with Computer Vision solutions. Machine Learning, more in particular Deep Learning, is a field that has been enjoying much success in the resolution of these types of problems, so it is a very promising solution to be used in this context. For that reason, this work proposes a neural network classifier for indoor images, that will save countless hours spent in these tasks. Moreover, to help achieve better results and provide additional contributions to the field, a study of the main architectures down the years, going from Convolutional Neural Networks to Transformers, and their performance for several datasets retrieved from online sources is also presented, settling all the information in one place and helping future researchers for similar tasks. The selected architectures for the case studies were the most relevant ones according to their popularity and performance, originating from different years, in order to provide an exploratory analysis of the evolution of the architectural aspects and the degree of impact these aspects have on the results obtained. These results confirmed that Transformers are indeed the ideal architecture for image classification tasks, especially in the real estate field, although Convolutional Neural Networks still play an important role, particularly in hybrid networks combining Transformers and Convolutional Neural Networks, where they are capable of achieving similar performance to purely Transformer networks. The best model achieved was able to predict images by training on a research dataset of 79500 images with an accuracy of 90%, which is quite good. This model was adapted and made available through an API. Some promising results were also obtained using a smaller and unbalanced private dataset of 10496 real estate images, where F1-scores of 87% and 86% were achieved for the multi-class and multi-label problems, respectively.
id RCAP_feabc9e4fb7f83e3087871029347733c
oai_identifier_str oai:recipp.ipp.pt:10400.22/23511
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Um classificador de divisões de interiores de casas para suportar agentes imobiliáriosIndoor ClassificationReal EstateDeep LearningComputer VisionConvolutional Neural NetworkVision TransformerClassificação de Divisões de HabitaçãoImobiliáriaAprendizagem ProfundaVisão por ComputadorRede Neuronal ConvolucionalTransformador VisualEveryday, Real Estate Agents retrieve pictures from houses that are then manually labelled and filtered to pick the best ones to present on their websites and better describe the homes they are selling. This is a time consuming task that delays the whole process of advertising homes and receiving propositions and could be solved with Computer Vision solutions. Machine Learning, more in particular Deep Learning, is a field that has been enjoying much success in the resolution of these types of problems, so it is a very promising solution to be used in this context. For that reason, this work proposes a neural network classifier for indoor images, that will save countless hours spent in these tasks. Moreover, to help achieve better results and provide additional contributions to the field, a study of the main architectures down the years, going from Convolutional Neural Networks to Transformers, and their performance for several datasets retrieved from online sources is also presented, settling all the information in one place and helping future researchers for similar tasks. The selected architectures for the case studies were the most relevant ones according to their popularity and performance, originating from different years, in order to provide an exploratory analysis of the evolution of the architectural aspects and the degree of impact these aspects have on the results obtained. These results confirmed that Transformers are indeed the ideal architecture for image classification tasks, especially in the real estate field, although Convolutional Neural Networks still play an important role, particularly in hybrid networks combining Transformers and Convolutional Neural Networks, where they are capable of achieving similar performance to purely Transformer networks. The best model achieved was able to predict images by training on a research dataset of 79500 images with an accuracy of 90%, which is quite good. This model was adapted and made available through an API. Some promising results were also obtained using a smaller and unbalanced private dataset of 10496 real estate images, where F1-scores of 87% and 86% were achieved for the multi-class and multi-label problems, respectively.Todos os dias, agentes Imobiliários recolhem imagens de casas, as quais, posteriormente, têm de filtrar e agrupar por categorias para apresentarem nos seus websites, com o intuito de descrever com mais facilidade e transparência as propriedades que pretendem vender. Esta é uma tarefa que consome muito tempo e que atrasa todo o processo de publicitação, enquanto retém um trabalhador e que pode ser automatizada a partir de soluções de Visão por Computador. Aprendizagem Automática, mais concretamente Aprendizagem Profunda, é uma área que tem vindo a ter muito sucesso na resolução deste tipo de problemas e apresenta-se como uma solução muito promissora para este contexto. Por essa razão, este trabalho propõe um classificador de divisões de casas baseado em redes neuronais, que irá poupar uma elevada quantidade de tempo despendido nestas tarefas. Mais do que isso, para alcançar resultados superiores e fornecer uma contribuição a esta área, um estudo das principais arquiteturas de redes neuronais, aplicadas ao longo dos anos com resultados promissores nesta área, é apresentada, incluindo modelos baseados em Redes Neurais Convolucionais e a sua evolução até aos Transformadores Visuais. Juntamente, o desempenho destas arquiteturas é exposto para vários conjuntos de dados obtidos de fontes online e datasets privados, reunindo todas as informações em um só lugar, com o intuito de ajudar futuros investigadores em tarefas semelhantes. As arquiteturas selecionadas para os casos de estudo foram as mais revelantes de acordo com a sua popularidade e performance e têm a sua origem em diferentes anos, de forma a oferecer uma análise exploratória da evolução dos aspetos arquiteturais e o grau de impacto que esses aspetos têm nos resultados obtidos. Os resultados obtidos comprovaram que, de facto, os Transformadores são agora a arquitetura ideal para tarefas de classificação de imagem, sobretudo na área de imobiliário, ainda que as Redes Neuronais Convolucionais ainda tenham um papel importante, principalmente nas redes mistas de Transformadores e Redes Neuronais Convolulocionais, que são capazes de apresentar performances semelhantes às redes puramente de Transformadores. O melhor modelo obtido foi capaz de prever imagens treinando com um dataset de investigação de 79500 images com acurácia de 90%, um valor bastante bom, tendo sido este modelo adaptado e disponibilizado a partir de uma API. Alguns resultados promissores foram também obtidos com o uso de um dataset privado, não tão grande ou balanceado, com 10496 imagens de imobiliário onde F1-scores de 87% e 86% foram obtidos, tanto para o problema de multi-class como de multi-label, respetivamente.Pinto, Tiago Manuel Campelos FerreiraRepositório Científico do Instituto Politécnico do PortoVeiga, Bruno Tiago Silva20232024-07-25T00:00:00Z2023-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/23511TID:203352599enginfo:eu-repo/semantics/embargoedAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-09-20T01:46:00Zoai:recipp.ipp.pt:10400.22/23511Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:29:05.308609Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Um classificador de divisões de interiores de casas para suportar agentes imobiliários
title Um classificador de divisões de interiores de casas para suportar agentes imobiliários
spellingShingle Um classificador de divisões de interiores de casas para suportar agentes imobiliários
Veiga, Bruno Tiago Silva
Indoor Classification
Real Estate
Deep Learning
Computer Vision
Convolutional Neural Network
Vision Transformer
Classificação de Divisões de Habitação
Imobiliária
Aprendizagem Profunda
Visão por Computador
Rede Neuronal Convolucional
Transformador Visual
title_short Um classificador de divisões de interiores de casas para suportar agentes imobiliários
title_full Um classificador de divisões de interiores de casas para suportar agentes imobiliários
title_fullStr Um classificador de divisões de interiores de casas para suportar agentes imobiliários
title_full_unstemmed Um classificador de divisões de interiores de casas para suportar agentes imobiliários
title_sort Um classificador de divisões de interiores de casas para suportar agentes imobiliários
author Veiga, Bruno Tiago Silva
author_facet Veiga, Bruno Tiago Silva
author_role author
dc.contributor.none.fl_str_mv Pinto, Tiago Manuel Campelos Ferreira
Repositório Científico do Instituto Politécnico do Porto
dc.contributor.author.fl_str_mv Veiga, Bruno Tiago Silva
dc.subject.por.fl_str_mv Indoor Classification
Real Estate
Deep Learning
Computer Vision
Convolutional Neural Network
Vision Transformer
Classificação de Divisões de Habitação
Imobiliária
Aprendizagem Profunda
Visão por Computador
Rede Neuronal Convolucional
Transformador Visual
topic Indoor Classification
Real Estate
Deep Learning
Computer Vision
Convolutional Neural Network
Vision Transformer
Classificação de Divisões de Habitação
Imobiliária
Aprendizagem Profunda
Visão por Computador
Rede Neuronal Convolucional
Transformador Visual
description Everyday, Real Estate Agents retrieve pictures from houses that are then manually labelled and filtered to pick the best ones to present on their websites and better describe the homes they are selling. This is a time consuming task that delays the whole process of advertising homes and receiving propositions and could be solved with Computer Vision solutions. Machine Learning, more in particular Deep Learning, is a field that has been enjoying much success in the resolution of these types of problems, so it is a very promising solution to be used in this context. For that reason, this work proposes a neural network classifier for indoor images, that will save countless hours spent in these tasks. Moreover, to help achieve better results and provide additional contributions to the field, a study of the main architectures down the years, going from Convolutional Neural Networks to Transformers, and their performance for several datasets retrieved from online sources is also presented, settling all the information in one place and helping future researchers for similar tasks. The selected architectures for the case studies were the most relevant ones according to their popularity and performance, originating from different years, in order to provide an exploratory analysis of the evolution of the architectural aspects and the degree of impact these aspects have on the results obtained. These results confirmed that Transformers are indeed the ideal architecture for image classification tasks, especially in the real estate field, although Convolutional Neural Networks still play an important role, particularly in hybrid networks combining Transformers and Convolutional Neural Networks, where they are capable of achieving similar performance to purely Transformer networks. The best model achieved was able to predict images by training on a research dataset of 79500 images with an accuracy of 90%, which is quite good. This model was adapted and made available through an API. Some promising results were also obtained using a smaller and unbalanced private dataset of 10496 real estate images, where F1-scores of 87% and 86% were achieved for the multi-class and multi-label problems, respectively.
publishDate 2023
dc.date.none.fl_str_mv 2023
2023-01-01T00:00:00Z
2024-07-25T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.22/23511
TID:203352599
url http://hdl.handle.net/10400.22/23511
identifier_str_mv TID:203352599
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/embargoedAccess
eu_rights_str_mv embargoedAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133558527229952