Um classificador de divisões de interiores de casas para suportar agentes imobiliários
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.22/23511 |
Resumo: | Everyday, Real Estate Agents retrieve pictures from houses that are then manually labelled and filtered to pick the best ones to present on their websites and better describe the homes they are selling. This is a time consuming task that delays the whole process of advertising homes and receiving propositions and could be solved with Computer Vision solutions. Machine Learning, more in particular Deep Learning, is a field that has been enjoying much success in the resolution of these types of problems, so it is a very promising solution to be used in this context. For that reason, this work proposes a neural network classifier for indoor images, that will save countless hours spent in these tasks. Moreover, to help achieve better results and provide additional contributions to the field, a study of the main architectures down the years, going from Convolutional Neural Networks to Transformers, and their performance for several datasets retrieved from online sources is also presented, settling all the information in one place and helping future researchers for similar tasks. The selected architectures for the case studies were the most relevant ones according to their popularity and performance, originating from different years, in order to provide an exploratory analysis of the evolution of the architectural aspects and the degree of impact these aspects have on the results obtained. These results confirmed that Transformers are indeed the ideal architecture for image classification tasks, especially in the real estate field, although Convolutional Neural Networks still play an important role, particularly in hybrid networks combining Transformers and Convolutional Neural Networks, where they are capable of achieving similar performance to purely Transformer networks. The best model achieved was able to predict images by training on a research dataset of 79500 images with an accuracy of 90%, which is quite good. This model was adapted and made available through an API. Some promising results were also obtained using a smaller and unbalanced private dataset of 10496 real estate images, where F1-scores of 87% and 86% were achieved for the multi-class and multi-label problems, respectively. |
id |
RCAP_feabc9e4fb7f83e3087871029347733c |
---|---|
oai_identifier_str |
oai:recipp.ipp.pt:10400.22/23511 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Um classificador de divisões de interiores de casas para suportar agentes imobiliáriosIndoor ClassificationReal EstateDeep LearningComputer VisionConvolutional Neural NetworkVision TransformerClassificação de Divisões de HabitaçãoImobiliáriaAprendizagem ProfundaVisão por ComputadorRede Neuronal ConvolucionalTransformador VisualEveryday, Real Estate Agents retrieve pictures from houses that are then manually labelled and filtered to pick the best ones to present on their websites and better describe the homes they are selling. This is a time consuming task that delays the whole process of advertising homes and receiving propositions and could be solved with Computer Vision solutions. Machine Learning, more in particular Deep Learning, is a field that has been enjoying much success in the resolution of these types of problems, so it is a very promising solution to be used in this context. For that reason, this work proposes a neural network classifier for indoor images, that will save countless hours spent in these tasks. Moreover, to help achieve better results and provide additional contributions to the field, a study of the main architectures down the years, going from Convolutional Neural Networks to Transformers, and their performance for several datasets retrieved from online sources is also presented, settling all the information in one place and helping future researchers for similar tasks. The selected architectures for the case studies were the most relevant ones according to their popularity and performance, originating from different years, in order to provide an exploratory analysis of the evolution of the architectural aspects and the degree of impact these aspects have on the results obtained. These results confirmed that Transformers are indeed the ideal architecture for image classification tasks, especially in the real estate field, although Convolutional Neural Networks still play an important role, particularly in hybrid networks combining Transformers and Convolutional Neural Networks, where they are capable of achieving similar performance to purely Transformer networks. The best model achieved was able to predict images by training on a research dataset of 79500 images with an accuracy of 90%, which is quite good. This model was adapted and made available through an API. Some promising results were also obtained using a smaller and unbalanced private dataset of 10496 real estate images, where F1-scores of 87% and 86% were achieved for the multi-class and multi-label problems, respectively.Todos os dias, agentes Imobiliários recolhem imagens de casas, as quais, posteriormente, têm de filtrar e agrupar por categorias para apresentarem nos seus websites, com o intuito de descrever com mais facilidade e transparência as propriedades que pretendem vender. Esta é uma tarefa que consome muito tempo e que atrasa todo o processo de publicitação, enquanto retém um trabalhador e que pode ser automatizada a partir de soluções de Visão por Computador. Aprendizagem Automática, mais concretamente Aprendizagem Profunda, é uma área que tem vindo a ter muito sucesso na resolução deste tipo de problemas e apresenta-se como uma solução muito promissora para este contexto. Por essa razão, este trabalho propõe um classificador de divisões de casas baseado em redes neuronais, que irá poupar uma elevada quantidade de tempo despendido nestas tarefas. Mais do que isso, para alcançar resultados superiores e fornecer uma contribuição a esta área, um estudo das principais arquiteturas de redes neuronais, aplicadas ao longo dos anos com resultados promissores nesta área, é apresentada, incluindo modelos baseados em Redes Neurais Convolucionais e a sua evolução até aos Transformadores Visuais. Juntamente, o desempenho destas arquiteturas é exposto para vários conjuntos de dados obtidos de fontes online e datasets privados, reunindo todas as informações em um só lugar, com o intuito de ajudar futuros investigadores em tarefas semelhantes. As arquiteturas selecionadas para os casos de estudo foram as mais revelantes de acordo com a sua popularidade e performance e têm a sua origem em diferentes anos, de forma a oferecer uma análise exploratória da evolução dos aspetos arquiteturais e o grau de impacto que esses aspetos têm nos resultados obtidos. Os resultados obtidos comprovaram que, de facto, os Transformadores são agora a arquitetura ideal para tarefas de classificação de imagem, sobretudo na área de imobiliário, ainda que as Redes Neuronais Convolucionais ainda tenham um papel importante, principalmente nas redes mistas de Transformadores e Redes Neuronais Convolulocionais, que são capazes de apresentar performances semelhantes às redes puramente de Transformadores. O melhor modelo obtido foi capaz de prever imagens treinando com um dataset de investigação de 79500 images com acurácia de 90%, um valor bastante bom, tendo sido este modelo adaptado e disponibilizado a partir de uma API. Alguns resultados promissores foram também obtidos com o uso de um dataset privado, não tão grande ou balanceado, com 10496 imagens de imobiliário onde F1-scores de 87% e 86% foram obtidos, tanto para o problema de multi-class como de multi-label, respetivamente.Pinto, Tiago Manuel Campelos FerreiraRepositório Científico do Instituto Politécnico do PortoVeiga, Bruno Tiago Silva20232024-07-25T00:00:00Z2023-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/23511TID:203352599enginfo:eu-repo/semantics/embargoedAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-09-20T01:46:00Zoai:recipp.ipp.pt:10400.22/23511Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:29:05.308609Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Um classificador de divisões de interiores de casas para suportar agentes imobiliários |
title |
Um classificador de divisões de interiores de casas para suportar agentes imobiliários |
spellingShingle |
Um classificador de divisões de interiores de casas para suportar agentes imobiliários Veiga, Bruno Tiago Silva Indoor Classification Real Estate Deep Learning Computer Vision Convolutional Neural Network Vision Transformer Classificação de Divisões de Habitação Imobiliária Aprendizagem Profunda Visão por Computador Rede Neuronal Convolucional Transformador Visual |
title_short |
Um classificador de divisões de interiores de casas para suportar agentes imobiliários |
title_full |
Um classificador de divisões de interiores de casas para suportar agentes imobiliários |
title_fullStr |
Um classificador de divisões de interiores de casas para suportar agentes imobiliários |
title_full_unstemmed |
Um classificador de divisões de interiores de casas para suportar agentes imobiliários |
title_sort |
Um classificador de divisões de interiores de casas para suportar agentes imobiliários |
author |
Veiga, Bruno Tiago Silva |
author_facet |
Veiga, Bruno Tiago Silva |
author_role |
author |
dc.contributor.none.fl_str_mv |
Pinto, Tiago Manuel Campelos Ferreira Repositório Científico do Instituto Politécnico do Porto |
dc.contributor.author.fl_str_mv |
Veiga, Bruno Tiago Silva |
dc.subject.por.fl_str_mv |
Indoor Classification Real Estate Deep Learning Computer Vision Convolutional Neural Network Vision Transformer Classificação de Divisões de Habitação Imobiliária Aprendizagem Profunda Visão por Computador Rede Neuronal Convolucional Transformador Visual |
topic |
Indoor Classification Real Estate Deep Learning Computer Vision Convolutional Neural Network Vision Transformer Classificação de Divisões de Habitação Imobiliária Aprendizagem Profunda Visão por Computador Rede Neuronal Convolucional Transformador Visual |
description |
Everyday, Real Estate Agents retrieve pictures from houses that are then manually labelled and filtered to pick the best ones to present on their websites and better describe the homes they are selling. This is a time consuming task that delays the whole process of advertising homes and receiving propositions and could be solved with Computer Vision solutions. Machine Learning, more in particular Deep Learning, is a field that has been enjoying much success in the resolution of these types of problems, so it is a very promising solution to be used in this context. For that reason, this work proposes a neural network classifier for indoor images, that will save countless hours spent in these tasks. Moreover, to help achieve better results and provide additional contributions to the field, a study of the main architectures down the years, going from Convolutional Neural Networks to Transformers, and their performance for several datasets retrieved from online sources is also presented, settling all the information in one place and helping future researchers for similar tasks. The selected architectures for the case studies were the most relevant ones according to their popularity and performance, originating from different years, in order to provide an exploratory analysis of the evolution of the architectural aspects and the degree of impact these aspects have on the results obtained. These results confirmed that Transformers are indeed the ideal architecture for image classification tasks, especially in the real estate field, although Convolutional Neural Networks still play an important role, particularly in hybrid networks combining Transformers and Convolutional Neural Networks, where they are capable of achieving similar performance to purely Transformer networks. The best model achieved was able to predict images by training on a research dataset of 79500 images with an accuracy of 90%, which is quite good. This model was adapted and made available through an API. Some promising results were also obtained using a smaller and unbalanced private dataset of 10496 real estate images, where F1-scores of 87% and 86% were achieved for the multi-class and multi-label problems, respectively. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023 2023-01-01T00:00:00Z 2024-07-25T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.22/23511 TID:203352599 |
url |
http://hdl.handle.net/10400.22/23511 |
identifier_str_mv |
TID:203352599 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/embargoedAccess |
eu_rights_str_mv |
embargoedAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133558527229952 |