Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
Texto Completo: | http://app.uff.br/riuff/handle/1/24710 |
Resumo: | Relatos de acidentes são importante ferramenta para compreensão da causa dos mesmos e como auxílio em sua futura prevenção. A grande quantidade, porém, destes relatos em forma textual e não estruturada impossibilita que de forma simples seja feita uma síntese destes relatos para que os mesmos sejam acompanhados. Utilizando técnicas de processamento de linguagem natural o presente trabalho tem como objetivo construir um framework que possibilite a síntese de dados textuais não estruturados. A metodologia desenvolvida utiliza o algoritmo Word2Vec para capturar as informações presentes no texto de maneira quantitativa na forma de vetores. Aliado a este foi utilizado o algoritmo UMAP que possibilitou a visualização destes vetores em forma de clusteres. A metodologia foi aplicada a base de dados da MSHA (Mine Safety and Health Administration), órgão do Departamento de Trabalho dos Estados Unidos encarregada de armazenar relatos de acidentes em minas de carvão ocorridos no país. Nesta base estão presentes 247.035 relatórios coletados de 1983 à 2019 o que possibilitou observar as diferenças ocorridas ao decorrer das décadas nestes acidentes. |
id |
UFF-2_33764eedf97d06b4f00d91e8b1e9d2c1 |
---|---|
oai_identifier_str |
oai:app.uff.br:1/24710 |
network_acronym_str |
UFF-2 |
network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository_id_str |
2120 |
spelling |
Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvãoProcessamento de Linguagem NaturalRelatos de AcidentesWord2VecUMAPAprendizado de máquinaAcidente de trabalhoProcessamento de linguagem natural (Computação)Natural Language ProcessingFataliy ReportsWord2VecUMAPRelatos de acidentes são importante ferramenta para compreensão da causa dos mesmos e como auxílio em sua futura prevenção. A grande quantidade, porém, destes relatos em forma textual e não estruturada impossibilita que de forma simples seja feita uma síntese destes relatos para que os mesmos sejam acompanhados. Utilizando técnicas de processamento de linguagem natural o presente trabalho tem como objetivo construir um framework que possibilite a síntese de dados textuais não estruturados. A metodologia desenvolvida utiliza o algoritmo Word2Vec para capturar as informações presentes no texto de maneira quantitativa na forma de vetores. Aliado a este foi utilizado o algoritmo UMAP que possibilitou a visualização destes vetores em forma de clusteres. A metodologia foi aplicada a base de dados da MSHA (Mine Safety and Health Administration), órgão do Departamento de Trabalho dos Estados Unidos encarregada de armazenar relatos de acidentes em minas de carvão ocorridos no país. Nesta base estão presentes 247.035 relatórios coletados de 1983 à 2019 o que possibilitou observar as diferenças ocorridas ao decorrer das décadas nestes acidentes.Fatality reports are an important tool for understanding their cause and as an aid in their future prevention. The large number however of these reports in textual and unstructured form makes it impossible to simply summarize these reports so that they can be followed up. Using natural language processing techniques, the present work aims to build a framework that enables the synthesis of unstructured textual data. The methodology developed uses the Word2Vec algorithm to capture the information present in the text quantitatively in the form of vectors. Allied to this, the UMAP algorithm was used, which allowed the visualization of these vectors in the form of clusters. The methodology was applied to the MSHA (Mine Safety and Health Administration) database, an agency of the United States Department of Labor responsible for storing reports of accidents in coal mines that occurred in the country. On this basis, there are 247,035 reports collected from 1983 to 2019, which made it possible to observe the differences that occurred over the decades in these accidents.51 p.NiteróiPereira, ValdecyNeves, Julio César BispoRoboredo, Marcos CostaPereira, ValdecyNeves , Júlio César BispoRoboredo, Marcos CostaPereira, João Gabriel do Amaral2022-03-09T14:49:10Z2022-03-09T14:49:10Z2022-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfPEREIRA, João Gabriel do Amaral. Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão. 2022. 51f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Produção) -Universidade Federal Fluminense, Escola de Engenharia, Niterói, 2022.http://app.uff.br/riuff/handle/1/24710Aluno de GraduaçãoCC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2022-03-09T14:49:14Zoai:app.uff.br:1/24710Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T11:04:42.999508Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
dc.title.none.fl_str_mv |
Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão |
title |
Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão |
spellingShingle |
Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão Pereira, João Gabriel do Amaral Processamento de Linguagem Natural Relatos de Acidentes Word2Vec UMAP Aprendizado de máquina Acidente de trabalho Processamento de linguagem natural (Computação) Natural Language Processing Fataliy Reports Word2Vec UMAP |
title_short |
Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão |
title_full |
Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão |
title_fullStr |
Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão |
title_full_unstemmed |
Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão |
title_sort |
Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão |
author |
Pereira, João Gabriel do Amaral |
author_facet |
Pereira, João Gabriel do Amaral |
author_role |
author |
dc.contributor.none.fl_str_mv |
Pereira, Valdecy Neves, Julio César Bispo Roboredo, Marcos Costa Pereira, Valdecy Neves , Júlio César Bispo Roboredo, Marcos Costa |
dc.contributor.author.fl_str_mv |
Pereira, João Gabriel do Amaral |
dc.subject.por.fl_str_mv |
Processamento de Linguagem Natural Relatos de Acidentes Word2Vec UMAP Aprendizado de máquina Acidente de trabalho Processamento de linguagem natural (Computação) Natural Language Processing Fataliy Reports Word2Vec UMAP |
topic |
Processamento de Linguagem Natural Relatos de Acidentes Word2Vec UMAP Aprendizado de máquina Acidente de trabalho Processamento de linguagem natural (Computação) Natural Language Processing Fataliy Reports Word2Vec UMAP |
description |
Relatos de acidentes são importante ferramenta para compreensão da causa dos mesmos e como auxílio em sua futura prevenção. A grande quantidade, porém, destes relatos em forma textual e não estruturada impossibilita que de forma simples seja feita uma síntese destes relatos para que os mesmos sejam acompanhados. Utilizando técnicas de processamento de linguagem natural o presente trabalho tem como objetivo construir um framework que possibilite a síntese de dados textuais não estruturados. A metodologia desenvolvida utiliza o algoritmo Word2Vec para capturar as informações presentes no texto de maneira quantitativa na forma de vetores. Aliado a este foi utilizado o algoritmo UMAP que possibilitou a visualização destes vetores em forma de clusteres. A metodologia foi aplicada a base de dados da MSHA (Mine Safety and Health Administration), órgão do Departamento de Trabalho dos Estados Unidos encarregada de armazenar relatos de acidentes em minas de carvão ocorridos no país. Nesta base estão presentes 247.035 relatórios coletados de 1983 à 2019 o que possibilitou observar as diferenças ocorridas ao decorrer das décadas nestes acidentes. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-03-09T14:49:10Z 2022-03-09T14:49:10Z 2022-02 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
PEREIRA, João Gabriel do Amaral. Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão. 2022. 51f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Produção) -Universidade Federal Fluminense, Escola de Engenharia, Niterói, 2022. http://app.uff.br/riuff/handle/1/24710 Aluno de Graduação |
identifier_str_mv |
PEREIRA, João Gabriel do Amaral. Processamento de linguagem natural aplicado a relatos de acidentes em minas de carvão. 2022. 51f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Produção) -Universidade Federal Fluminense, Escola de Engenharia, Niterói, 2022. Aluno de Graduação |
url |
http://app.uff.br/riuff/handle/1/24710 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
CC-BY-SA info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
CC-BY-SA |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Niterói |
publisher.none.fl_str_mv |
Niterói |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
instname_str |
Universidade Federal Fluminense (UFF) |
instacron_str |
UFF |
institution |
UFF |
reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
repository.mail.fl_str_mv |
riuff@id.uff.br |
_version_ |
1811823653730385920 |