Um ensemble baseado em árvores de decisão para predizer a ocorrência de aglomerados de ônibus.

Detalhes bibliográficos
Autor(a) principal: SANTOS , Veruska Borges
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFCG
Texto Completo: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/17873
Resumo: Atrasos nas viagens e superlotação de ônibus são algumas das insatisfações diárias dos usuários de transporte público. Esses problemas podem estar associados aos aglomerados de ônibus, eventos que ocorrem quando dois ou mais ônibus estão executando a mesma rota juntos, ou seja, chegam no mesmo horário nas paradas de ônibus. Devido à natureza estocástica do tráfego, um horário programado estático não é eficaz para evitar a ocorrência desses eventos; assim, são necessárias ações preventivas para melhorar a confiabilidade do sistema de transporte público. Os trabalhos já propostos no contexto preditivo de aglomerados de ônibus apresentam ainda limitações relacionadas à frequência ou privacidade dos dados utilizados, além da eficácia limitada à contextos específicos. Assim, este trabalho propõe um ensemble baseado em modelos de árvores de decisão para prever a formação de aglomerados de ônibus. O ensemble utiliza dados de geolocalização de ônibus, dados programados, dados de clima, da situação de tráfego e é composto pelos modelos Random Forest, XGBoost e CatBoost. Além disso, uma técnica de aprendizagem incremental é incorporada ao modelo proposto para continuamente atualizá-lo de acordo com a chegada de novos dados em tempo real. A eficácia do modelo é demonstrada com o uso de dados reais de duas cidades brasileiras e comparada com quatro modelos competidores: Regressão Linear, Regressão Logística, Support Vector Machine e Relevance Vector Machine. De acordo com os resultados, o modelo proposto é capaz de alcançar uma eficácia entre 73% − 80%, superior aos modelos competidores avaliados, e pode ser usado para prever a formação de aglomerados de ônibus em tempo real até dez paradas antes da ocorrência.
id UFCG_a557b49f47ae17e9ab69fb6ccbaacae4
oai_identifier_str oai:localhost:riufcg/17873
network_acronym_str UFCG
network_name_str Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str 4851
spelling Um ensemble baseado em árvores de decisão para predizer a ocorrência de aglomerados de ônibus.An ensemble based on decision trees to predict the occurrence of bus clusters.Transporte PúblicoAglomerado de ÔnibusAprendizagem de MáquinaHeadwayPublic TransportationBus BunchingMachine LearningCiência da ComputaçãoAtrasos nas viagens e superlotação de ônibus são algumas das insatisfações diárias dos usuários de transporte público. Esses problemas podem estar associados aos aglomerados de ônibus, eventos que ocorrem quando dois ou mais ônibus estão executando a mesma rota juntos, ou seja, chegam no mesmo horário nas paradas de ônibus. Devido à natureza estocástica do tráfego, um horário programado estático não é eficaz para evitar a ocorrência desses eventos; assim, são necessárias ações preventivas para melhorar a confiabilidade do sistema de transporte público. Os trabalhos já propostos no contexto preditivo de aglomerados de ônibus apresentam ainda limitações relacionadas à frequência ou privacidade dos dados utilizados, além da eficácia limitada à contextos específicos. Assim, este trabalho propõe um ensemble baseado em modelos de árvores de decisão para prever a formação de aglomerados de ônibus. O ensemble utiliza dados de geolocalização de ônibus, dados programados, dados de clima, da situação de tráfego e é composto pelos modelos Random Forest, XGBoost e CatBoost. Além disso, uma técnica de aprendizagem incremental é incorporada ao modelo proposto para continuamente atualizá-lo de acordo com a chegada de novos dados em tempo real. A eficácia do modelo é demonstrada com o uso de dados reais de duas cidades brasileiras e comparada com quatro modelos competidores: Regressão Linear, Regressão Logística, Support Vector Machine e Relevance Vector Machine. De acordo com os resultados, o modelo proposto é capaz de alcançar uma eficácia entre 73% − 80%, superior aos modelos competidores avaliados, e pode ser usado para prever a formação de aglomerados de ônibus em tempo real até dez paradas antes da ocorrência.Travel delays and bus overcrowding are some of the daily dissatisfactions of public transportation users. These problems may be caused by bus bunching, an event that occurs when two or more buses are running the same route together, i.e., arriving at the same time at the bus stops. Due to the stochastic nature of the traffic, a static schedule is not effective to avoid the occurrence of these events; thus, preventive actions are necessary to improve the reliabil ity of the public transportation system. The works already proposed in the predictive context of bus bunching still have limitations related to the frequency or privacy of the data used, in addition to the effectiveness limited to specific contexts. Therefore, we propose a decision tree-based ensemble model to predict bus bunching. We use an ensemble of Random Forest, XGBoost and CatBoost models with buses geolocation, scheduled, weather and traffic situation data. In addition, an incremental learning technique was incorporated into the proposed model to continuously update it according new data arrives in real-time. The efficacy of the proposed model has been demonstrated using real data sets of two brazilian cities and has been compared with four competitors: Linear Regression, Logistic Regression, Support Vector Machine and Relevance Vector Machine. According to the results, the proposed model can achieve an efficacy between 73% − 80%, higher than the evaluated competitors models, and can be used to predict bus bunching in real-time up to ten stops before their occurrence.CapesUniversidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIPÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGPIRES , Carlos Eduardo Santos.PIRES, C. E. S.NASCIMENTO FILHO, Dimas Cassimiro do.NASCIMENTO FILHO, D. C.http://lattes.cnpq.br/3151296501932443MARINHO , Leandro Balby.GAMA, Kiev Santos da.http://lattes.cnpq.br/4986021622366786SANTOS , Veruska Borges2020-10-062021-03-29T19:03:39Z2021-03-292021-03-29T19:03:39Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/17873SANTOS, V. B. Um ensemble baseado em árvores de decisão para predizer a ocorrência de aglomerados de ônibus. 2020. 97 f. Dissertação (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2020.porINESinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2021-03-30T10:58:07Zoai:localhost:riufcg/17873Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512021-03-30T10:58:07Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.none.fl_str_mv Um ensemble baseado em árvores de decisão para predizer a ocorrência de aglomerados de ônibus.
An ensemble based on decision trees to predict the occurrence of bus clusters.
title Um ensemble baseado em árvores de decisão para predizer a ocorrência de aglomerados de ônibus.
spellingShingle Um ensemble baseado em árvores de decisão para predizer a ocorrência de aglomerados de ônibus.
SANTOS , Veruska Borges
Transporte Público
Aglomerado de Ônibus
Aprendizagem de Máquina
Headway
Public Transportation
Bus Bunching
Machine Learning
Ciência da Computação
title_short Um ensemble baseado em árvores de decisão para predizer a ocorrência de aglomerados de ônibus.
title_full Um ensemble baseado em árvores de decisão para predizer a ocorrência de aglomerados de ônibus.
title_fullStr Um ensemble baseado em árvores de decisão para predizer a ocorrência de aglomerados de ônibus.
title_full_unstemmed Um ensemble baseado em árvores de decisão para predizer a ocorrência de aglomerados de ônibus.
title_sort Um ensemble baseado em árvores de decisão para predizer a ocorrência de aglomerados de ônibus.
author SANTOS , Veruska Borges
author_facet SANTOS , Veruska Borges
author_role author
dc.contributor.none.fl_str_mv PIRES , Carlos Eduardo Santos.
PIRES, C. E. S.
NASCIMENTO FILHO, Dimas Cassimiro do.
NASCIMENTO FILHO, D. C.
http://lattes.cnpq.br/3151296501932443
MARINHO , Leandro Balby.
GAMA, Kiev Santos da.
http://lattes.cnpq.br/4986021622366786
dc.contributor.author.fl_str_mv SANTOS , Veruska Borges
dc.subject.por.fl_str_mv Transporte Público
Aglomerado de Ônibus
Aprendizagem de Máquina
Headway
Public Transportation
Bus Bunching
Machine Learning
Ciência da Computação
topic Transporte Público
Aglomerado de Ônibus
Aprendizagem de Máquina
Headway
Public Transportation
Bus Bunching
Machine Learning
Ciência da Computação
description Atrasos nas viagens e superlotação de ônibus são algumas das insatisfações diárias dos usuários de transporte público. Esses problemas podem estar associados aos aglomerados de ônibus, eventos que ocorrem quando dois ou mais ônibus estão executando a mesma rota juntos, ou seja, chegam no mesmo horário nas paradas de ônibus. Devido à natureza estocástica do tráfego, um horário programado estático não é eficaz para evitar a ocorrência desses eventos; assim, são necessárias ações preventivas para melhorar a confiabilidade do sistema de transporte público. Os trabalhos já propostos no contexto preditivo de aglomerados de ônibus apresentam ainda limitações relacionadas à frequência ou privacidade dos dados utilizados, além da eficácia limitada à contextos específicos. Assim, este trabalho propõe um ensemble baseado em modelos de árvores de decisão para prever a formação de aglomerados de ônibus. O ensemble utiliza dados de geolocalização de ônibus, dados programados, dados de clima, da situação de tráfego e é composto pelos modelos Random Forest, XGBoost e CatBoost. Além disso, uma técnica de aprendizagem incremental é incorporada ao modelo proposto para continuamente atualizá-lo de acordo com a chegada de novos dados em tempo real. A eficácia do modelo é demonstrada com o uso de dados reais de duas cidades brasileiras e comparada com quatro modelos competidores: Regressão Linear, Regressão Logística, Support Vector Machine e Relevance Vector Machine. De acordo com os resultados, o modelo proposto é capaz de alcançar uma eficácia entre 73% − 80%, superior aos modelos competidores avaliados, e pode ser usado para prever a formação de aglomerados de ônibus em tempo real até dez paradas antes da ocorrência.
publishDate 2020
dc.date.none.fl_str_mv 2020-10-06
2021-03-29T19:03:39Z
2021-03-29
2021-03-29T19:03:39Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/17873
SANTOS, V. B. Um ensemble baseado em árvores de decisão para predizer a ocorrência de aglomerados de ônibus. 2020. 97 f. Dissertação (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2020.
url http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/17873
identifier_str_mv SANTOS, V. B. Um ensemble baseado em árvores de decisão para predizer a ocorrência de aglomerados de ônibus. 2020. 97 f. Dissertação (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2020.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv INES
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFCG
instname:Universidade Federal de Campina Grande (UFCG)
instacron:UFCG
instname_str Universidade Federal de Campina Grande (UFCG)
instacron_str UFCG
institution UFCG
reponame_str Biblioteca Digital de Teses e Dissertações da UFCG
collection Biblioteca Digital de Teses e Dissertações da UFCG
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br
_version_ 1809744483683663872