Utilização de modelos de aprendizagem automática para previsão de preço de Airbnb em Lisboa
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.5/30105 |
Resumo: | Mestrado Bolonha em Métodos Quantitativos para a Decisão Económica e Empresarial |
id |
RCAP_24a1f310deba5cc0ded7d39d56905012 |
---|---|
oai_identifier_str |
oai:www.repository.utl.pt:10400.5/30105 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Utilização de modelos de aprendizagem automática para previsão de preço de Airbnb em LisboaAprendizagem automáticaAirbnbPrevisão de preçosRegressão LinearXGBRegressorMachine LearningPrice PredictionLinear RegressionMestrado Bolonha em Métodos Quantitativos para a Decisão Económica e EmpresarialA economia de partilha surgiu há cerca de vinte anos. Era difícil prever a sua importância para muitos setores, mas, atualmente, está intimamente incorporada no nosso quotidiano. O Airbnb é um excelente exemplo deste fenómeno, uma vez que introduziu um novo modelo de negócio para o sector da hotelaria. Deste modo, prever com precisão uma variável contínua, como o preço, em anúncios do Airbnb tem sido um tema de elevada importância. Este documento analisa uma amostra de 19651 anúncios em Lisboa do InsideAirbnb.com, com o objetivo de criar um modelo de previsão de preços com recurso a técnicas de aprendizagem automática. Inicialmente, é realizada uma limpeza e pré-processamento dos dados, seguida de análises descritivas, prescritivas e exploratórias para compreender a natureza dos dados e identificar atributos importantes para a previsão de preços. Mesmo após a limpeza, valores atípicos são detetados e removidos do conjunto de dados. Por fim, aplicámos modelos que vão desde a regressão linear a modelos de Machine Learning. Desta forma, não só selecionámos o XGBoost como o melhor modelo para a previsão de preços com R2 de 0.6225, mas também identificamos as características que têm significância estatístico para a variável dependente preço.The sharing economy emerged just twenty years ago. It was difficult to foresee its importance for many sectors, but today it is intimately incorporated into our daily lives. Airbnb is an excellent example of this phenomenon, as it has introduced a new business model for the hospitality sector. Therefore, accurately predicting a continuous variable such as price in Airbnb listings has been a topic of significant importance. This paper analyses a sample of 19651 listings in Lisbon from InsideAirbnb.com, with the aim of creating a price prediction model using machine learning techniques. Initially, the data is cleaned and pre-processed, followed by descriptive, prescriptive, and exploratory analysis to understand the nature of the data and identify important attributes for price prediction. Even after cleaning, outliers are detected and removed from the data set. Finally, we applied models ranging from linear regression to machine learning models. In this way, we not only selected XGBoost as the best model for price prediction with an R2 of 0.6225, but also identified the characteristics that have statistical significance for the dependent variable price.Instituto Superior de Economia e GestãoCosta, CarlosRepositório da Universidade de LisboaSalgueirinho, Dinis Duarte2024-02-12T11:36:35Z2023-102023-10-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.5/30105porSalgueirinho, Dinis Duarte (2023). “Utilização de modelos de aprendizagem automática para previsão de preço de Airbnb em Lisboa”. Dissertação de Mestrado. Universidade de Lisboa. Instituto Superior de Economia e Gestãoinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-18T01:31:44Zoai:www.repository.utl.pt:10400.5/30105Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:38:42.303597Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Utilização de modelos de aprendizagem automática para previsão de preço de Airbnb em Lisboa |
title |
Utilização de modelos de aprendizagem automática para previsão de preço de Airbnb em Lisboa |
spellingShingle |
Utilização de modelos de aprendizagem automática para previsão de preço de Airbnb em Lisboa Salgueirinho, Dinis Duarte Aprendizagem automática Airbnb Previsão de preços Regressão Linear XGBRegressor Machine Learning Price Prediction Linear Regression |
title_short |
Utilização de modelos de aprendizagem automática para previsão de preço de Airbnb em Lisboa |
title_full |
Utilização de modelos de aprendizagem automática para previsão de preço de Airbnb em Lisboa |
title_fullStr |
Utilização de modelos de aprendizagem automática para previsão de preço de Airbnb em Lisboa |
title_full_unstemmed |
Utilização de modelos de aprendizagem automática para previsão de preço de Airbnb em Lisboa |
title_sort |
Utilização de modelos de aprendizagem automática para previsão de preço de Airbnb em Lisboa |
author |
Salgueirinho, Dinis Duarte |
author_facet |
Salgueirinho, Dinis Duarte |
author_role |
author |
dc.contributor.none.fl_str_mv |
Costa, Carlos Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Salgueirinho, Dinis Duarte |
dc.subject.por.fl_str_mv |
Aprendizagem automática Airbnb Previsão de preços Regressão Linear XGBRegressor Machine Learning Price Prediction Linear Regression |
topic |
Aprendizagem automática Airbnb Previsão de preços Regressão Linear XGBRegressor Machine Learning Price Prediction Linear Regression |
description |
Mestrado Bolonha em Métodos Quantitativos para a Decisão Económica e Empresarial |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-10 2023-10-01T00:00:00Z 2024-02-12T11:36:35Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.5/30105 |
url |
http://hdl.handle.net/10400.5/30105 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
Salgueirinho, Dinis Duarte (2023). “Utilização de modelos de aprendizagem automática para previsão de preço de Airbnb em Lisboa”. Dissertação de Mestrado. Universidade de Lisboa. Instituto Superior de Economia e Gestão |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Instituto Superior de Economia e Gestão |
publisher.none.fl_str_mv |
Instituto Superior de Economia e Gestão |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799137437646061568 |