Uso de aprendizado de máquina para classificação de risco de acidentes em rodovias.

Detalhes bibliográficos
Autor(a) principal: AMORIM, Brunna de Sousa Pereira.
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFCG
Texto Completo: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7340
Resumo: Soluções para identificação dos fatores que influenciam o acontecimento de acidentes em rodovias e a identificação de trechos de risco estão sendo estudados e aplicados por pesquisadores e governos de todo o mundo, a fim de encontrar uma solução que possa diminuir o número de tais acidentes. No entanto, o estudo de acidentes em rodovias depende do local onde o mesmo acontece. Destarte, esta pesquisa faz uso de técnicas de aprendizado de máquina supervisionado e aprendizado de máquina automatizado com o uso de diferentes características para analisar seu impacto na tarefa de predição do risco de acidentes graves ou não-graves em trechos de rodovias brasileiras, a fim de otimizar o desempenho e a performance dos classificadores. Os dados de acidentes foram pré-processados, analisados e técnicas de seleção de atributos foram empregadas, resultando em uma base com informações sobre o dia da semana, o turno do dia em que o acidente aconteceu, o tipo da pista, o traçado da via, o sentido da rodovia, a condição meteorológica no momento do acidente e o tipo do acidente. Diferentes modelos de aprendizado de máquina foram treinados e avaliados em quatro cenários diferentes: o cenário A utiliza uma base de dados desbalanceada com o atributo “Frequência de Acidentes”, enquanto o cenário B consiste na base de dados desbalanceada sem tal atributo; o cenário C faz uso da base de dados balanceada com o atributo “Frequência de Acidentes” e o cenário D utiliza a base de dados balanceada sem este atributo. A avaliação experimental ocorreu com o emprego das métricas acurácia, precisão, revocação e medida F. Os resultados dos cenários A e B não foram relevantes ao estudo, uma vez que os classificadores não convergiram, classificando os dados em apenas uma classe: não-grave. O melhor resultado para o cenário C foi a Rede Neural MLP, que obteve 85% de acurácia, 87% de precisão, 85% de revocação e 84% de medida F. Já para o cenário D, os melhores resultados foram combinações de dois modelos diferentes: Random Forest+BernoulliNB e Logistic Regression+ExtraTreesClassifier, ambos com 84,58% de acurácia, 88,14% de precisão, 84,58% de revocação e 84,06% medida F.
id UFCG_24d21afae1f2f74bd16a9cc7dd8d33ae
oai_identifier_str oai:localhost:riufcg/7340
network_acronym_str UFCG
network_name_str Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str 4851
spelling Uso de aprendizado de máquina para classificação de risco de acidentes em rodovias.Use of machine learning for classification risk of road accidents.Aprendizado de MáquinaAprendizado de Máquina AutomatizadoSeleção de CaracterísticasRedução de DimensionalidadeRisco de Acidente em RodoviasClassificação de RiscoMachine LearningAutomated Machine LearningFeature SelectionDimensionality ReductionRoad Accident RiskRisk RatingCiência da ComputaçãoSoluções para identificação dos fatores que influenciam o acontecimento de acidentes em rodovias e a identificação de trechos de risco estão sendo estudados e aplicados por pesquisadores e governos de todo o mundo, a fim de encontrar uma solução que possa diminuir o número de tais acidentes. No entanto, o estudo de acidentes em rodovias depende do local onde o mesmo acontece. Destarte, esta pesquisa faz uso de técnicas de aprendizado de máquina supervisionado e aprendizado de máquina automatizado com o uso de diferentes características para analisar seu impacto na tarefa de predição do risco de acidentes graves ou não-graves em trechos de rodovias brasileiras, a fim de otimizar o desempenho e a performance dos classificadores. Os dados de acidentes foram pré-processados, analisados e técnicas de seleção de atributos foram empregadas, resultando em uma base com informações sobre o dia da semana, o turno do dia em que o acidente aconteceu, o tipo da pista, o traçado da via, o sentido da rodovia, a condição meteorológica no momento do acidente e o tipo do acidente. Diferentes modelos de aprendizado de máquina foram treinados e avaliados em quatro cenários diferentes: o cenário A utiliza uma base de dados desbalanceada com o atributo “Frequência de Acidentes”, enquanto o cenário B consiste na base de dados desbalanceada sem tal atributo; o cenário C faz uso da base de dados balanceada com o atributo “Frequência de Acidentes” e o cenário D utiliza a base de dados balanceada sem este atributo. A avaliação experimental ocorreu com o emprego das métricas acurácia, precisão, revocação e medida F. Os resultados dos cenários A e B não foram relevantes ao estudo, uma vez que os classificadores não convergiram, classificando os dados em apenas uma classe: não-grave. O melhor resultado para o cenário C foi a Rede Neural MLP, que obteve 85% de acurácia, 87% de precisão, 85% de revocação e 84% de medida F. Já para o cenário D, os melhores resultados foram combinações de dois modelos diferentes: Random Forest+BernoulliNB e Logistic Regression+ExtraTreesClassifier, ambos com 84,58% de acurácia, 88,14% de precisão, 84,58% de revocação e 84,06% medida F.In order to decrease the number of road accidents, solutions to identify influencing factors of road accidents and its risk areas are being researched throughout the world. However, road accident studies depend upon its location, hence this study uses supervised machine learning techniques and automated machine learning to classify accident risk sections of brazilian federal road s in severe or not-severe, using several features. The accident data was analized, pre-processed and its features were selected using different techniques, resulting in a set of information containing the week day and time the accident happened, the road type, the road route, the road orientation, the weather condition when the accident happened and the accident type. Machine learning models were trained and evaluated in four different scenarios: scenario A used a imbalanced database with the "accident frequency" feature, while scenario B used a imbalanced database without the "accident frequency" feature; scenario C used a balanced database with the "accident frequency" feature and scenario D used a balanced database without the "accident frequency" feature. To validate the model, the accuracy, precision, recall and F-measure metrics were used. Scenarios A and B results were disregarded since all models preticted only one class: not-severe. Scenario C best result was a MLP neural network model with 85% of accuracy, 87% of precision, 85% of recall and 84% of F-measure. The best results to scenario D were two combinations of classifiers: first, the combination of Random Forest and BernoulliNB; second, the combination of Logistic Regression and ExtraTreesClassifier, both resulting in 84,58% of accuracy, 88,14% of precision, 84,58% of recall and 84,06% of F-measure.CNPqUniversidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIPÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGBAPTISTA, Cláudio de Souza.BAPTISTA, C. S.http://lattes.cnpq.br/0104124422364023GOMES , Herman Martins.BRAZ JUNIOR, Geraldo.AMORIM, Brunna de Sousa Pereira.2019-08-212019-09-26T11:30:54Z2019-09-262019-09-26T11:30:54Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7340AMORIM, B. de S. P. Uso de aprendizado de máquina para classificação de risco de acidentes em rodovias. 2019. 93 f. Dissertação (Mestrado em Ciência da Computação) – Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2019. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7340porCapesinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2022-03-30T12:11:24Zoai:localhost:riufcg/7340Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512022-03-30T12:11:24Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.none.fl_str_mv Uso de aprendizado de máquina para classificação de risco de acidentes em rodovias.
Use of machine learning for classification risk of road accidents.
title Uso de aprendizado de máquina para classificação de risco de acidentes em rodovias.
spellingShingle Uso de aprendizado de máquina para classificação de risco de acidentes em rodovias.
AMORIM, Brunna de Sousa Pereira.
Aprendizado de Máquina
Aprendizado de Máquina Automatizado
Seleção de Características
Redução de Dimensionalidade
Risco de Acidente em Rodovias
Classificação de Risco
Machine Learning
Automated Machine Learning
Feature Selection
Dimensionality Reduction
Road Accident Risk
Risk Rating
Ciência da Computação
title_short Uso de aprendizado de máquina para classificação de risco de acidentes em rodovias.
title_full Uso de aprendizado de máquina para classificação de risco de acidentes em rodovias.
title_fullStr Uso de aprendizado de máquina para classificação de risco de acidentes em rodovias.
title_full_unstemmed Uso de aprendizado de máquina para classificação de risco de acidentes em rodovias.
title_sort Uso de aprendizado de máquina para classificação de risco de acidentes em rodovias.
author AMORIM, Brunna de Sousa Pereira.
author_facet AMORIM, Brunna de Sousa Pereira.
author_role author
dc.contributor.none.fl_str_mv BAPTISTA, Cláudio de Souza.
BAPTISTA, C. S.
http://lattes.cnpq.br/0104124422364023
GOMES , Herman Martins.
BRAZ JUNIOR, Geraldo.
dc.contributor.author.fl_str_mv AMORIM, Brunna de Sousa Pereira.
dc.subject.por.fl_str_mv Aprendizado de Máquina
Aprendizado de Máquina Automatizado
Seleção de Características
Redução de Dimensionalidade
Risco de Acidente em Rodovias
Classificação de Risco
Machine Learning
Automated Machine Learning
Feature Selection
Dimensionality Reduction
Road Accident Risk
Risk Rating
Ciência da Computação
topic Aprendizado de Máquina
Aprendizado de Máquina Automatizado
Seleção de Características
Redução de Dimensionalidade
Risco de Acidente em Rodovias
Classificação de Risco
Machine Learning
Automated Machine Learning
Feature Selection
Dimensionality Reduction
Road Accident Risk
Risk Rating
Ciência da Computação
description Soluções para identificação dos fatores que influenciam o acontecimento de acidentes em rodovias e a identificação de trechos de risco estão sendo estudados e aplicados por pesquisadores e governos de todo o mundo, a fim de encontrar uma solução que possa diminuir o número de tais acidentes. No entanto, o estudo de acidentes em rodovias depende do local onde o mesmo acontece. Destarte, esta pesquisa faz uso de técnicas de aprendizado de máquina supervisionado e aprendizado de máquina automatizado com o uso de diferentes características para analisar seu impacto na tarefa de predição do risco de acidentes graves ou não-graves em trechos de rodovias brasileiras, a fim de otimizar o desempenho e a performance dos classificadores. Os dados de acidentes foram pré-processados, analisados e técnicas de seleção de atributos foram empregadas, resultando em uma base com informações sobre o dia da semana, o turno do dia em que o acidente aconteceu, o tipo da pista, o traçado da via, o sentido da rodovia, a condição meteorológica no momento do acidente e o tipo do acidente. Diferentes modelos de aprendizado de máquina foram treinados e avaliados em quatro cenários diferentes: o cenário A utiliza uma base de dados desbalanceada com o atributo “Frequência de Acidentes”, enquanto o cenário B consiste na base de dados desbalanceada sem tal atributo; o cenário C faz uso da base de dados balanceada com o atributo “Frequência de Acidentes” e o cenário D utiliza a base de dados balanceada sem este atributo. A avaliação experimental ocorreu com o emprego das métricas acurácia, precisão, revocação e medida F. Os resultados dos cenários A e B não foram relevantes ao estudo, uma vez que os classificadores não convergiram, classificando os dados em apenas uma classe: não-grave. O melhor resultado para o cenário C foi a Rede Neural MLP, que obteve 85% de acurácia, 87% de precisão, 85% de revocação e 84% de medida F. Já para o cenário D, os melhores resultados foram combinações de dois modelos diferentes: Random Forest+BernoulliNB e Logistic Regression+ExtraTreesClassifier, ambos com 84,58% de acurácia, 88,14% de precisão, 84,58% de revocação e 84,06% medida F.
publishDate 2019
dc.date.none.fl_str_mv 2019-08-21
2019-09-26T11:30:54Z
2019-09-26
2019-09-26T11:30:54Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7340
AMORIM, B. de S. P. Uso de aprendizado de máquina para classificação de risco de acidentes em rodovias. 2019. 93 f. Dissertação (Mestrado em Ciência da Computação) – Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2019. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7340
url http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7340
identifier_str_mv AMORIM, B. de S. P. Uso de aprendizado de máquina para classificação de risco de acidentes em rodovias. 2019. 93 f. Dissertação (Mestrado em Ciência da Computação) – Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2019. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7340
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv Capes
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFCG
instname:Universidade Federal de Campina Grande (UFCG)
instacron:UFCG
instname_str Universidade Federal de Campina Grande (UFCG)
instacron_str UFCG
institution UFCG
reponame_str Biblioteca Digital de Teses e Dissertações da UFCG
collection Biblioteca Digital de Teses e Dissertações da UFCG
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br
_version_ 1809744396938117120