Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão

Detalhes bibliográficos
Autor(a) principal: Pereira, João Gabriel do Amaral
Data de Publicação: 2022
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: http://app.uff.br/riuff/handle/1/24710
Resumo: Relatos de acidentes são importante ferramenta para compreensão da causa dos mesmos e como auxílio em sua futura prevenção. A grande quantidade, porém, destes relatos em forma textual e não estruturada impossibilita que de forma simples seja feita uma síntese destes relatos para que os mesmos sejam acompanhados. Utilizando técnicas de processamento de linguagem natural o presente trabalho tem como objetivo construir um framework que possibilite a síntese de dados textuais não estruturados. A metodologia desenvolvida utiliza o algoritmo Word2Vec para capturar as informações presentes no texto de maneira quantitativa na forma de vetores. Aliado a este foi utilizado o algoritmo UMAP que possibilitou a visualização destes vetores em forma de clusteres. A metodologia foi aplicada a base de dados da MSHA (Mine Safety and Health Administration), órgão do Departamento de Trabalho dos Estados Unidos encarregada de armazenar relatos de acidentes em minas de carvão ocorridos no país. Nesta base estão presentes 247.035 relatórios coletados de 1983 à 2019 o que possibilitou observar as diferenças ocorridas ao decorrer das décadas nestes acidentes.
id UFF-2_33764eedf97d06b4f00d91e8b1e9d2c1
oai_identifier_str oai:app.uff.br:1/24710
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvãoProcessamento de Linguagem NaturalRelatos de AcidentesWord2VecUMAPAprendizado de máquinaAcidente de trabalhoProcessamento de linguagem natural (Computação)Natural Language ProcessingFataliy ReportsWord2VecUMAPRelatos de acidentes são importante ferramenta para compreensão da causa dos mesmos e como auxílio em sua futura prevenção. A grande quantidade, porém, destes relatos em forma textual e não estruturada impossibilita que de forma simples seja feita uma síntese destes relatos para que os mesmos sejam acompanhados. Utilizando técnicas de processamento de linguagem natural o presente trabalho tem como objetivo construir um framework que possibilite a síntese de dados textuais não estruturados. A metodologia desenvolvida utiliza o algoritmo Word2Vec para capturar as informações presentes no texto de maneira quantitativa na forma de vetores. Aliado a este foi utilizado o algoritmo UMAP que possibilitou a visualização destes vetores em forma de clusteres. A metodologia foi aplicada a base de dados da MSHA (Mine Safety and Health Administration), órgão do Departamento de Trabalho dos Estados Unidos encarregada de armazenar relatos de acidentes em minas de carvão ocorridos no país. Nesta base estão presentes 247.035 relatórios coletados de 1983 à 2019 o que possibilitou observar as diferenças ocorridas ao decorrer das décadas nestes acidentes.Fatality reports are an important tool for understanding their cause and as an aid in their future prevention. The large number however of these reports in textual and unstructured form makes it impossible to simply summarize these reports so that they can be followed up. Using natural language processing techniques, the present work aims to build a framework that enables the synthesis of unstructured textual data. The methodology developed uses the Word2Vec algorithm to capture the information present in the text quantitatively in the form of vectors. Allied to this, the UMAP algorithm was used, which allowed the visualization of these vectors in the form of clusters. The methodology was applied to the MSHA (Mine Safety and Health Administration) database, an agency of the United States Department of Labor responsible for storing reports of accidents in coal mines that occurred in the country. On this basis, there are 247,035 reports collected from 1983 to 2019, which made it possible to observe the differences that occurred over the decades in these accidents.51 p.NiteróiPereira, ValdecyNeves, Julio César BispoRoboredo, Marcos CostaPereira, ValdecyNeves , Júlio César BispoRoboredo, Marcos CostaPereira, João Gabriel do Amaral2022-03-09T14:49:10Z2022-03-09T14:49:10Z2022-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfPEREIRA, João Gabriel do Amaral. Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão. 2022. 51f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Produção) -Universidade Federal Fluminense, Escola de Engenharia, Niterói, 2022.http://app.uff.br/riuff/handle/1/24710Aluno de GraduaçãoCC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2022-03-09T14:49:14Zoai:app.uff.br:1/24710Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T11:04:42.999508Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão
title Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão
spellingShingle Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão
Pereira, João Gabriel do Amaral
Processamento de Linguagem Natural
Relatos de Acidentes
Word2Vec
UMAP
Aprendizado de máquina
Acidente de trabalho
Processamento de linguagem natural (Computação)
Natural Language Processing
Fataliy Reports
Word2Vec
UMAP
title_short Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão
title_full Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão
title_fullStr Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão
title_full_unstemmed Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão
title_sort Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão
author Pereira, João Gabriel do Amaral
author_facet Pereira, João Gabriel do Amaral
author_role author
dc.contributor.none.fl_str_mv Pereira, Valdecy
Neves, Julio César Bispo
Roboredo, Marcos Costa
Pereira, Valdecy
Neves , Júlio César Bispo
Roboredo, Marcos Costa
dc.contributor.author.fl_str_mv Pereira, João Gabriel do Amaral
dc.subject.por.fl_str_mv Processamento de Linguagem Natural
Relatos de Acidentes
Word2Vec
UMAP
Aprendizado de máquina
Acidente de trabalho
Processamento de linguagem natural (Computação)
Natural Language Processing
Fataliy Reports
Word2Vec
UMAP
topic Processamento de Linguagem Natural
Relatos de Acidentes
Word2Vec
UMAP
Aprendizado de máquina
Acidente de trabalho
Processamento de linguagem natural (Computação)
Natural Language Processing
Fataliy Reports
Word2Vec
UMAP
description Relatos de acidentes são importante ferramenta para compreensão da causa dos mesmos e como auxílio em sua futura prevenção. A grande quantidade, porém, destes relatos em forma textual e não estruturada impossibilita que de forma simples seja feita uma síntese destes relatos para que os mesmos sejam acompanhados. Utilizando técnicas de processamento de linguagem natural o presente trabalho tem como objetivo construir um framework que possibilite a síntese de dados textuais não estruturados. A metodologia desenvolvida utiliza o algoritmo Word2Vec para capturar as informações presentes no texto de maneira quantitativa na forma de vetores. Aliado a este foi utilizado o algoritmo UMAP que possibilitou a visualização destes vetores em forma de clusteres. A metodologia foi aplicada a base de dados da MSHA (Mine Safety and Health Administration), órgão do Departamento de Trabalho dos Estados Unidos encarregada de armazenar relatos de acidentes em minas de carvão ocorridos no país. Nesta base estão presentes 247.035 relatórios coletados de 1983 à 2019 o que possibilitou observar as diferenças ocorridas ao decorrer das décadas nestes acidentes.
publishDate 2022
dc.date.none.fl_str_mv 2022-03-09T14:49:10Z
2022-03-09T14:49:10Z
2022-02
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PEREIRA, João Gabriel do Amaral. Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão. 2022. 51f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Produção) -Universidade Federal Fluminense, Escola de Engenharia, Niterói, 2022.
http://app.uff.br/riuff/handle/1/24710
Aluno de Graduação
identifier_str_mv PEREIRA, João Gabriel do Amaral. Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão. 2022. 51f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Produção) -Universidade Federal Fluminense, Escola de Engenharia, Niterói, 2022.
Aluno de Graduação
url http://app.uff.br/riuff/handle/1/24710
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Niterói
publisher.none.fl_str_mv Niterói
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1811823653730385920