Aplicação big data para predição de tempo de viagens de táxi

Detalhes bibliográficos
Autor(a) principal: Polo, Luís Felipe
Data de Publicação: 2017
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/169044
Resumo: Em uma iniciativa para melhorar acessibilidade, transparência e prestação de contas da cidade, os legisladores de Nova York aprovaram em 2012 uma legislação sobre Open Data. O projeto NYC Open Data disponibiliza dados gerados por diversos órgãos públicos da cidade. Qualquer pessoa pode utilizar esses dados para realizar pesquisas e desenvolver aplicações. Como parte desse projeto, a New York City Taxi Limousine Commission disponibiliza dados de mais de um bilhão de viagens de táxi realizadas na cidade de Nova York desde 2009. Este trabalho propõe uma aplicação que cruza dados de corridas de táxi com dados climáticos para identificar a influência de diferentes variáveis climáticas no tempo de viagem. A aplicação faz uma predição da duração de uma corrida de táxi a ser realizada baseada no histórico de corridas similares, as variáveis que definem a similaridade são a data/hora inicial, data/hora de chegada, local de origem, local de destino e informações climáticas (chuva, neve e vento). Para fazer essa predição, foi utilizado um modelo que inicialmente agrupa corridas similares geograficamente e temporalmente, e depois utiliza regressão para definir a influência das variáveis climáticas e estimar o tempo. Devido ao grande volume dos conjuntos de dados utilizados, é necessária uma implementação paralela e execução da aplicação em um ambiente com maior capacidade de processamento para obter um bom desempenho. A implementação é feita utilizando o modelo de programação MapReduce. Os experimentos para avaliação dos resultados e do desempenho são feitos utilizando Hadoop em um cluster na plataforma Microsoft Azure.
id UFRGS-2_1f27b1d82476a304af9d7d0d1f162e40
oai_identifier_str oai:www.lume.ufrgs.br:10183/169044
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Polo, Luís FelipeGeyer, Claudio Fernando ResinGalante, Renata de Matos2017-09-28T02:28:47Z2017http://hdl.handle.net/10183/169044001048259Em uma iniciativa para melhorar acessibilidade, transparência e prestação de contas da cidade, os legisladores de Nova York aprovaram em 2012 uma legislação sobre Open Data. O projeto NYC Open Data disponibiliza dados gerados por diversos órgãos públicos da cidade. Qualquer pessoa pode utilizar esses dados para realizar pesquisas e desenvolver aplicações. Como parte desse projeto, a New York City Taxi Limousine Commission disponibiliza dados de mais de um bilhão de viagens de táxi realizadas na cidade de Nova York desde 2009. Este trabalho propõe uma aplicação que cruza dados de corridas de táxi com dados climáticos para identificar a influência de diferentes variáveis climáticas no tempo de viagem. A aplicação faz uma predição da duração de uma corrida de táxi a ser realizada baseada no histórico de corridas similares, as variáveis que definem a similaridade são a data/hora inicial, data/hora de chegada, local de origem, local de destino e informações climáticas (chuva, neve e vento). Para fazer essa predição, foi utilizado um modelo que inicialmente agrupa corridas similares geograficamente e temporalmente, e depois utiliza regressão para definir a influência das variáveis climáticas e estimar o tempo. Devido ao grande volume dos conjuntos de dados utilizados, é necessária uma implementação paralela e execução da aplicação em um ambiente com maior capacidade de processamento para obter um bom desempenho. A implementação é feita utilizando o modelo de programação MapReduce. Os experimentos para avaliação dos resultados e do desempenho são feitos utilizando Hadoop em um cluster na plataforma Microsoft Azure.As an initiative to improve the accessibility, transparency, and accountability of City government, New York City lawmakers passed an Open Data legislation in 2012. The NYC Open Data project provides data generated by various New York City public agencies. Anyone can use this data to research and develop applications. As part of this project, the New York City Taxi Limousine Commission provides information covering over 1 bilion taxi trips in the city from January 2009 through December 2016. This work proposes an application that uses taxi trip data and weather data to identify the influence of weather variables on travel time. The application predicts the travel time of a future trip based on similar trips, the variables that define similarity are starting time, arrival time, origin, destination, and weather information (rain, snow and wind). First, similar trips are grouped based on geographical and temporal information, and then a regression model is used to define the influence of weather variables and estimate time. The application is implemented based on the MapReduce programming model. Experiments to evaluate results and performance are done using Hadoop in a cluster on the Microsoft Azure platform.application/pdfporSistemas : InformaçãoBig dataBig dataMapReduceOpen dataTrafficTrip time predictionAplicação big data para predição de tempo de viagens de táxiBig data application for taxi trip time predicion info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2017Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL001048259.pdf001048259.pdfTexto completoapplication/pdf511720http://www.lume.ufrgs.br/bitstream/10183/169044/1/001048259.pdffb36660978248457f88ee24e574c440dMD51TEXT001048259.pdf.txt001048259.pdf.txtExtracted Texttext/plain69442http://www.lume.ufrgs.br/bitstream/10183/169044/2/001048259.pdf.txt4b56910a24f68fc26aedb5f51e93d2a7MD52THUMBNAIL001048259.pdf.jpg001048259.pdf.jpgGenerated Thumbnailimage/jpeg1062http://www.lume.ufrgs.br/bitstream/10183/169044/3/001048259.pdf.jpg35a28a775ee9d8d47c69969f4cc4ba2fMD5310183/1690442018-10-29 08:03:48.073oai:www.lume.ufrgs.br:10183/169044Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2018-10-29T11:03:48Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Aplicação big data para predição de tempo de viagens de táxi
dc.title.alternative.en.fl_str_mv Big data application for taxi trip time predicion
title Aplicação big data para predição de tempo de viagens de táxi
spellingShingle Aplicação big data para predição de tempo de viagens de táxi
Polo, Luís Felipe
Sistemas : Informação
Big data
Big data
MapReduce
Open data
Traffic
Trip time prediction
title_short Aplicação big data para predição de tempo de viagens de táxi
title_full Aplicação big data para predição de tempo de viagens de táxi
title_fullStr Aplicação big data para predição de tempo de viagens de táxi
title_full_unstemmed Aplicação big data para predição de tempo de viagens de táxi
title_sort Aplicação big data para predição de tempo de viagens de táxi
author Polo, Luís Felipe
author_facet Polo, Luís Felipe
author_role author
dc.contributor.author.fl_str_mv Polo, Luís Felipe
dc.contributor.advisor1.fl_str_mv Geyer, Claudio Fernando Resin
dc.contributor.advisor-co1.fl_str_mv Galante, Renata de Matos
contributor_str_mv Geyer, Claudio Fernando Resin
Galante, Renata de Matos
dc.subject.por.fl_str_mv Sistemas : Informação
Big data
topic Sistemas : Informação
Big data
Big data
MapReduce
Open data
Traffic
Trip time prediction
dc.subject.eng.fl_str_mv Big data
MapReduce
Open data
Traffic
Trip time prediction
description Em uma iniciativa para melhorar acessibilidade, transparência e prestação de contas da cidade, os legisladores de Nova York aprovaram em 2012 uma legislação sobre Open Data. O projeto NYC Open Data disponibiliza dados gerados por diversos órgãos públicos da cidade. Qualquer pessoa pode utilizar esses dados para realizar pesquisas e desenvolver aplicações. Como parte desse projeto, a New York City Taxi Limousine Commission disponibiliza dados de mais de um bilhão de viagens de táxi realizadas na cidade de Nova York desde 2009. Este trabalho propõe uma aplicação que cruza dados de corridas de táxi com dados climáticos para identificar a influência de diferentes variáveis climáticas no tempo de viagem. A aplicação faz uma predição da duração de uma corrida de táxi a ser realizada baseada no histórico de corridas similares, as variáveis que definem a similaridade são a data/hora inicial, data/hora de chegada, local de origem, local de destino e informações climáticas (chuva, neve e vento). Para fazer essa predição, foi utilizado um modelo que inicialmente agrupa corridas similares geograficamente e temporalmente, e depois utiliza regressão para definir a influência das variáveis climáticas e estimar o tempo. Devido ao grande volume dos conjuntos de dados utilizados, é necessária uma implementação paralela e execução da aplicação em um ambiente com maior capacidade de processamento para obter um bom desempenho. A implementação é feita utilizando o modelo de programação MapReduce. Os experimentos para avaliação dos resultados e do desempenho são feitos utilizando Hadoop em um cluster na plataforma Microsoft Azure.
publishDate 2017
dc.date.accessioned.fl_str_mv 2017-09-28T02:28:47Z
dc.date.issued.fl_str_mv 2017
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/169044
dc.identifier.nrb.pt_BR.fl_str_mv 001048259
url http://hdl.handle.net/10183/169044
identifier_str_mv 001048259
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/169044/1/001048259.pdf
http://www.lume.ufrgs.br/bitstream/10183/169044/2/001048259.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/169044/3/001048259.pdf.jpg
bitstream.checksum.fl_str_mv fb36660978248457f88ee24e574c440d
4b56910a24f68fc26aedb5f51e93d2a7
35a28a775ee9d8d47c69969f4cc4ba2f
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801224538185269248