Route trip building in urban traffic : accelerating learning convergence through information exchange among drivers with similar experiences

Detalhes bibliográficos
Autor(a) principal: Santos, Guilherme Dytz dos
Data de Publicação: 2024
Tipo de documento: Trabalho de conclusão de curso
Idioma: eng
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/273005
Resumo: A dependência crescente de transporte rodoviário privado exige estratégias mais eficientes de gestão de trânsito, especialmente para distribuir rotas em cidades cada vez mais congestionadas. Este estudo propõe uma integração de Aprendizado por Reforço Multiagente (MARL) com a Comunicação Carro-Infraestrutura (C2I), aprimorada pela introdução de um grafo virtual (VG). Este VG estabelece conexões entre pares origem-destino (OD) com atributos similares, permitindo assim a distribuição de informações variadas aos motoristas. Compartilhando dados apenas entre pares OD similares ou adjacentes, o VG acrescenta variabilidade às informações recebidas pelos condutores. O método pro posto, denominado QL-C2I ODVG, foi comparado com outras abordagens: um método centralizado e iterativo de atribuição de rotas, um método tradicional de Q-Learning (QL) para construção de rotas ao longo do trajeto, e um framework QL com C2I sem a inclu são do VG. Os resultados indicam que o QL-C2I ODVG não só acelera o processo de aprendizado rumo ao equilíbrio, mas também supera métodos convencionais na redução dos tempos de viagem. Esses resultados ressaltam o potencial do método proposto para melhorar a distribuição de rotas e o fluxo de trânsito, sugerindo que ele pode ser uma ferramenta valiosa no desenvolvimento de sistemas de tráfego inteligentes. Este estudo também destaca os benefícios de introduzir variabilidade nas informações compartilhadas e sugere futuras direções de pesquisa, como explorar diferentes configurações do VG e seu impacto na dinâmica de aprendizado em cenários de tráfego com múltiplos objetivos.
id UFRGS-2_be75328b71f177dcc6842b4d9978edf5
oai_identifier_str oai:www.lume.ufrgs.br:10183/273005
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Santos, Guilherme Dytz dosBazzan, Ana Lucia Cetertich2024-03-07T05:02:07Z2024http://hdl.handle.net/10183/273005001197705A dependência crescente de transporte rodoviário privado exige estratégias mais eficientes de gestão de trânsito, especialmente para distribuir rotas em cidades cada vez mais congestionadas. Este estudo propõe uma integração de Aprendizado por Reforço Multiagente (MARL) com a Comunicação Carro-Infraestrutura (C2I), aprimorada pela introdução de um grafo virtual (VG). Este VG estabelece conexões entre pares origem-destino (OD) com atributos similares, permitindo assim a distribuição de informações variadas aos motoristas. Compartilhando dados apenas entre pares OD similares ou adjacentes, o VG acrescenta variabilidade às informações recebidas pelos condutores. O método pro posto, denominado QL-C2I ODVG, foi comparado com outras abordagens: um método centralizado e iterativo de atribuição de rotas, um método tradicional de Q-Learning (QL) para construção de rotas ao longo do trajeto, e um framework QL com C2I sem a inclu são do VG. Os resultados indicam que o QL-C2I ODVG não só acelera o processo de aprendizado rumo ao equilíbrio, mas também supera métodos convencionais na redução dos tempos de viagem. Esses resultados ressaltam o potencial do método proposto para melhorar a distribuição de rotas e o fluxo de trânsito, sugerindo que ele pode ser uma ferramenta valiosa no desenvolvimento de sistemas de tráfego inteligentes. Este estudo também destaca os benefícios de introduzir variabilidade nas informações compartilhadas e sugere futuras direções de pesquisa, como explorar diferentes configurações do VG e seu impacto na dinâmica de aprendizado em cenários de tráfego com múltiplos objetivos.The escalating reliance on private transportation calls for better traffic management strate gies to efficiently allocate routes in increasingly congested networks. The present study integrates Multiagent Reinforcement Learning (MARL) with Car-to-Infrastructure (C2I) Communication and further enriches this integration by introducing a virtual graph (VG). This VG connects origin-destination (OD) pairs that exhibit similar attributes, which en ables the provision of variable information to drivers. By sharing information exclusively among similar or adjacent OD pairs, the VG injects a level of variability into the data drivers receive. The proposed method (dubbed QL-C2I ODVG) was assessed against other established approaches: a centralized iterative route assignment approach, a tra ditional en-route trip-building Q-Learning (QL) methodology, and a QL with C2I frame work without the VG integration. Results show that QL-C2I ODVG not only expedites the learning process towards equilibrium but also outperforms traditional methods in achiev ing shorter travel times. These findings underscore the potential of the proposed method at improving route distribution and traffic flow, suggesting that it could be a valuable tool in the development of intelligent traffic systems. It also highlights the benefits of intro ducing variability in shared information and points to future research directions, including exploring different VG configurations and their impact on learning dynamics in multiob jective traffic scenariosapplication/pdfengGrafo virtualAprendizado por reforçoSistemas de transportesQ-LearningCar-to-Infrastructure CommunicationSimilarity GraphRoute trip building in urban traffic : accelerating learning convergence through information exchange among drivers with similar experiencesConstrução de Rotas em Tráfego Urbano: acelerando a convergência do aprendizado através do compartilhamento de informação entre motoristas com experiências similaresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2024Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001197705.pdf.txt001197705.pdf.txtExtracted Texttext/plain55924http://www.lume.ufrgs.br/bitstream/10183/273005/2/001197705.pdf.txt3a2666428f0b3230da380ced63fd5475MD52ORIGINAL001197705.pdfTexto completo (inglês)application/pdf5124911http://www.lume.ufrgs.br/bitstream/10183/273005/1/001197705.pdfccf3b9555dfcbb3fc0edde90d0598e2bMD5110183/2730052024-03-21 05:05:58.59055oai:www.lume.ufrgs.br:10183/273005Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2024-03-21T08:05:58Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Route trip building in urban traffic : accelerating learning convergence through information exchange among drivers with similar experiences
dc.title.alternative.pt.fl_str_mv Construção de Rotas em Tráfego Urbano: acelerando a convergência do aprendizado através do compartilhamento de informação entre motoristas com experiências similares
title Route trip building in urban traffic : accelerating learning convergence through information exchange among drivers with similar experiences
spellingShingle Route trip building in urban traffic : accelerating learning convergence through information exchange among drivers with similar experiences
Santos, Guilherme Dytz dos
Grafo virtual
Aprendizado por reforço
Sistemas de transportes
Q-Learning
Car-to-Infrastructure Communication
Similarity Graph
title_short Route trip building in urban traffic : accelerating learning convergence through information exchange among drivers with similar experiences
title_full Route trip building in urban traffic : accelerating learning convergence through information exchange among drivers with similar experiences
title_fullStr Route trip building in urban traffic : accelerating learning convergence through information exchange among drivers with similar experiences
title_full_unstemmed Route trip building in urban traffic : accelerating learning convergence through information exchange among drivers with similar experiences
title_sort Route trip building in urban traffic : accelerating learning convergence through information exchange among drivers with similar experiences
author Santos, Guilherme Dytz dos
author_facet Santos, Guilherme Dytz dos
author_role author
dc.contributor.author.fl_str_mv Santos, Guilherme Dytz dos
dc.contributor.advisor1.fl_str_mv Bazzan, Ana Lucia Cetertich
contributor_str_mv Bazzan, Ana Lucia Cetertich
dc.subject.por.fl_str_mv Grafo virtual
Aprendizado por reforço
Sistemas de transportes
topic Grafo virtual
Aprendizado por reforço
Sistemas de transportes
Q-Learning
Car-to-Infrastructure Communication
Similarity Graph
dc.subject.eng.fl_str_mv Q-Learning
Car-to-Infrastructure Communication
Similarity Graph
description A dependência crescente de transporte rodoviário privado exige estratégias mais eficientes de gestão de trânsito, especialmente para distribuir rotas em cidades cada vez mais congestionadas. Este estudo propõe uma integração de Aprendizado por Reforço Multiagente (MARL) com a Comunicação Carro-Infraestrutura (C2I), aprimorada pela introdução de um grafo virtual (VG). Este VG estabelece conexões entre pares origem-destino (OD) com atributos similares, permitindo assim a distribuição de informações variadas aos motoristas. Compartilhando dados apenas entre pares OD similares ou adjacentes, o VG acrescenta variabilidade às informações recebidas pelos condutores. O método pro posto, denominado QL-C2I ODVG, foi comparado com outras abordagens: um método centralizado e iterativo de atribuição de rotas, um método tradicional de Q-Learning (QL) para construção de rotas ao longo do trajeto, e um framework QL com C2I sem a inclu são do VG. Os resultados indicam que o QL-C2I ODVG não só acelera o processo de aprendizado rumo ao equilíbrio, mas também supera métodos convencionais na redução dos tempos de viagem. Esses resultados ressaltam o potencial do método proposto para melhorar a distribuição de rotas e o fluxo de trânsito, sugerindo que ele pode ser uma ferramenta valiosa no desenvolvimento de sistemas de tráfego inteligentes. Este estudo também destaca os benefícios de introduzir variabilidade nas informações compartilhadas e sugere futuras direções de pesquisa, como explorar diferentes configurações do VG e seu impacto na dinâmica de aprendizado em cenários de tráfego com múltiplos objetivos.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-03-07T05:02:07Z
dc.date.issued.fl_str_mv 2024
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/273005
dc.identifier.nrb.pt_BR.fl_str_mv 001197705
url http://hdl.handle.net/10183/273005
identifier_str_mv 001197705
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/273005/2/001197705.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/273005/1/001197705.pdf
bitstream.checksum.fl_str_mv 3a2666428f0b3230da380ced63fd5475
ccf3b9555dfcbb3fc0edde90d0598e2b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801224677566185472