Reconhecimento de entidades nomeadas em textos de boletins de ocorrências
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal do Ceará (UFC) |
Texto Completo: | http://www.repositorio.ufc.br/handle/riufc/49711 |
Resumo: | Classifying entities in a given text is a challenging problem in Natural Language Processing (NLP). A common technique that deals with this problem is Named Entity Recognition (NER). Deep Learning techniques have been widely applied to NER tasks because they require little resource engineering and are free of language-specific resources, learning important resources from combinations of words or characters trained in large amounts of data. However, these techniques require a huge amount of data for training. However, these techniques require a huge amount of data for training. This work proposes Human NERD (stands for Human Named Entity Recognition with Deep learning) which addresses this problem by including humans in the loop. Human NERD is an interactive framework to assist the user in NER classification tasks from creating a massive dataset to building/maintaining a deep learning NER model. Human NERD framework allows the rapid verification of automatic named entity recognition and the correction of errors. It takes into account user corrections, and the deep learning model learns and builds upon these actions. The interface allows for rapid correction using drag and drop user actions. The present work also proposes two NER models, one using the Spacy framework and the other the Keras library, both complement each other. |
id |
UFC-7_c17f6c54e7687e4fdf3d0400ff9bc10d |
---|---|
oai_identifier_str |
oai:repositorio.ufc.br:riufc/49711 |
network_acronym_str |
UFC-7 |
network_name_str |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
repository_id_str |
|
spelling |
Reconhecimento de entidades nomeadas em textos de boletins de ocorrênciasProcessamento de linguagem naturalReconhecimento de entidade nomeadaAprendizagem profundaClassifying entities in a given text is a challenging problem in Natural Language Processing (NLP). A common technique that deals with this problem is Named Entity Recognition (NER). Deep Learning techniques have been widely applied to NER tasks because they require little resource engineering and are free of language-specific resources, learning important resources from combinations of words or characters trained in large amounts of data. However, these techniques require a huge amount of data for training. However, these techniques require a huge amount of data for training. This work proposes Human NERD (stands for Human Named Entity Recognition with Deep learning) which addresses this problem by including humans in the loop. Human NERD is an interactive framework to assist the user in NER classification tasks from creating a massive dataset to building/maintaining a deep learning NER model. Human NERD framework allows the rapid verification of automatic named entity recognition and the correction of errors. It takes into account user corrections, and the deep learning model learns and builds upon these actions. The interface allows for rapid correction using drag and drop user actions. The present work also proposes two NER models, one using the Spacy framework and the other the Keras library, both complement each other.Classificar entidades em um determinado texto é um problema desafiador no Processamento de Linguagem Natural. Uma técnica comum que lida com esse problema é o Reconhecimento de Entidades Nomeadas, em inglês é chamado de Named Entity Recognition (NER). As técnicas de Deep Learning são amplamente aplicadas nas tarefas NER, porque requerem pouca engenharia de recursos e estão livres de recursos específicos do idioma, aprendendo recursos importantes a partir de combinações de palavras ou caracteres treinadas em grandes quantidades de dados. No entanto, essas técnicas exigem uma enorme quantidade de dados para treinamento. Este trabalho propõe o Human Named Entity Recognition with Deep learning (Human NERD), que aborda esse problema incluindo o humano no ciclo. O Human NERD é uma ferramenta interativa para ajudar o usuário nas tarefas de classificação NER, desde a criação de um conjunto de dados massivo até a criação / manutenção de um modelo NER de Deep Learning. A estrutura Human NERD permite a verificação rápida do reconhecimento automático de entidades nomeadas e a correção de erros. Ele leva em consideração as correções do usuário, e o modelo de Deep Learning aprende e desenvolve essas ações. Sua interface gráfica (GUI) permite uma correção rápida usando ações de arrastar e soltar do usuário. O presente trabalho também propõe dois modelos NER, um utilizando o framework Spacy e o outro a biblioteca Keras, em que as predições realizadas por ambos se complementam.Silva, Ticiana Linhares Coelho daAraújo, Natanael da Silva2020-01-29T19:15:01Z2020-01-29T19:15:01Z2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfARAÚJO, Natanael da Silva. Reconhecimento de entidades nomeadas em textos de boletins de ocorrências 2019. 41 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)- Universidade Federal do Ceará, Campus de Quixadá, Quixadá, 2019.http://www.repositorio.ufc.br/handle/riufc/49711porreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFCinfo:eu-repo/semantics/openAccess2020-01-29T19:15:01Zoai:repositorio.ufc.br:riufc/49711Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br || repositorio@ufc.bropendoar:2024-09-11T18:20:22.999283Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false |
dc.title.none.fl_str_mv |
Reconhecimento de entidades nomeadas em textos de boletins de ocorrências |
title |
Reconhecimento de entidades nomeadas em textos de boletins de ocorrências |
spellingShingle |
Reconhecimento de entidades nomeadas em textos de boletins de ocorrências Araújo, Natanael da Silva Processamento de linguagem natural Reconhecimento de entidade nomeada Aprendizagem profunda |
title_short |
Reconhecimento de entidades nomeadas em textos de boletins de ocorrências |
title_full |
Reconhecimento de entidades nomeadas em textos de boletins de ocorrências |
title_fullStr |
Reconhecimento de entidades nomeadas em textos de boletins de ocorrências |
title_full_unstemmed |
Reconhecimento de entidades nomeadas em textos de boletins de ocorrências |
title_sort |
Reconhecimento de entidades nomeadas em textos de boletins de ocorrências |
author |
Araújo, Natanael da Silva |
author_facet |
Araújo, Natanael da Silva |
author_role |
author |
dc.contributor.none.fl_str_mv |
Silva, Ticiana Linhares Coelho da |
dc.contributor.author.fl_str_mv |
Araújo, Natanael da Silva |
dc.subject.por.fl_str_mv |
Processamento de linguagem natural Reconhecimento de entidade nomeada Aprendizagem profunda |
topic |
Processamento de linguagem natural Reconhecimento de entidade nomeada Aprendizagem profunda |
description |
Classifying entities in a given text is a challenging problem in Natural Language Processing (NLP). A common technique that deals with this problem is Named Entity Recognition (NER). Deep Learning techniques have been widely applied to NER tasks because they require little resource engineering and are free of language-specific resources, learning important resources from combinations of words or characters trained in large amounts of data. However, these techniques require a huge amount of data for training. However, these techniques require a huge amount of data for training. This work proposes Human NERD (stands for Human Named Entity Recognition with Deep learning) which addresses this problem by including humans in the loop. Human NERD is an interactive framework to assist the user in NER classification tasks from creating a massive dataset to building/maintaining a deep learning NER model. Human NERD framework allows the rapid verification of automatic named entity recognition and the correction of errors. It takes into account user corrections, and the deep learning model learns and builds upon these actions. The interface allows for rapid correction using drag and drop user actions. The present work also proposes two NER models, one using the Spacy framework and the other the Keras library, both complement each other. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019 2020-01-29T19:15:01Z 2020-01-29T19:15:01Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
ARAÚJO, Natanael da Silva. Reconhecimento de entidades nomeadas em textos de boletins de ocorrências 2019. 41 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)- Universidade Federal do Ceará, Campus de Quixadá, Quixadá, 2019. http://www.repositorio.ufc.br/handle/riufc/49711 |
identifier_str_mv |
ARAÚJO, Natanael da Silva. Reconhecimento de entidades nomeadas em textos de boletins de ocorrências 2019. 41 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)- Universidade Federal do Ceará, Campus de Quixadá, Quixadá, 2019. |
url |
http://www.repositorio.ufc.br/handle/riufc/49711 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal do Ceará (UFC) instname:Universidade Federal do Ceará (UFC) instacron:UFC |
instname_str |
Universidade Federal do Ceará (UFC) |
instacron_str |
UFC |
institution |
UFC |
reponame_str |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
collection |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC) |
repository.mail.fl_str_mv |
bu@ufc.br || repositorio@ufc.br |
_version_ |
1813028761899106304 |