Extração de informação em evoluções clínicas e integração com dados farmacogenômicos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da PUC_RS |
Texto Completo: | https://tede2.pucrs.br/tede2/handle/tede/10359 |
Resumo: | Information Extraction (IE) covers a number of Natural Language Processing (NLP) tasks. Named Entity Recognition (NER) is a task that seeks to identify the Named Entities of a text, such as names of people, places, and organizations, classifying them in a predefined set of categories. This dissertation intends to use NLP techniques and tools for the REN task in the Biomedical domain in Portuguese. Thus, we build a specific corpus and propose two models defined in neural networks able to process the text included in clinical evolutions: BERT and a convolutional neural network (CNN). In addition, a new mechanism has been introduced to incorporate pharmacogenomic knowledge that serves as a basis for aiding clinical decisions. The results show an improvement in the measures of the BERT model compared to CNN and demonstrate that Transformers-based models are promising for advancing the performance of information extraction methods for entities in the Pharmacologic domain in Portuguese. Recognition of Named Entities in clinical evolutions is gaining popularity for improving clinical extraction projects. This study allowed the community working with NLP, in the clinical context, to obtain a formal analysis of this task, including the most successful ways of performing it. |
id |
P_RS_9e56227549138bbbb4fc2ca6525558c5 |
---|---|
oai_identifier_str |
oai:tede2.pucrs.br:tede/10359 |
network_acronym_str |
P_RS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
repository_id_str |
|
spelling |
Bordini, Rafael Heitorhttp://lattes.cnpq.br/4589262718627942http://lattes.cnpq.br/6350735101501043Bettoni, Giovani Nícolas2022-08-03T13:46:48Z2022-03-30https://tede2.pucrs.br/tede2/handle/tede/10359Information Extraction (IE) covers a number of Natural Language Processing (NLP) tasks. Named Entity Recognition (NER) is a task that seeks to identify the Named Entities of a text, such as names of people, places, and organizations, classifying them in a predefined set of categories. This dissertation intends to use NLP techniques and tools for the REN task in the Biomedical domain in Portuguese. Thus, we build a specific corpus and propose two models defined in neural networks able to process the text included in clinical evolutions: BERT and a convolutional neural network (CNN). In addition, a new mechanism has been introduced to incorporate pharmacogenomic knowledge that serves as a basis for aiding clinical decisions. The results show an improvement in the measures of the BERT model compared to CNN and demonstrate that Transformers-based models are promising for advancing the performance of information extraction methods for entities in the Pharmacologic domain in Portuguese. Recognition of Named Entities in clinical evolutions is gaining popularity for improving clinical extraction projects. This study allowed the community working with NLP, in the clinical context, to obtain a formal analysis of this task, including the most successful ways of performing it.A Extração de Informação (EI) abrange uma série de tarefas de Processamento de Linguagem Natural (PLN). Entre elas, o Reconhecimento de Entidades Nomeadas (REN) é uma tarefa que busca identificar as Entidades Nomeadas de um texto, tais como nomes de pessoas, locais e organizações, classificado-as em um conjunto pré-definido de categorias. Nesta dissertação pretendemos utilizar técnicas e ferramentas de PLN para a tarefa de REN no domínio Biomédico em Português. Portanto, realizamos a construção de um corpus específico e propomos dois modelos baseados em redes neurais capazes de processar o texto incluído em evoluções clínicas: BERT e uma rede neural convolucional (CNN). Além disso, foi introduzido um novo mecanismo para incorporar conhecimento farmacogenômico que sirva como base para auxiliar na decisão clínica. Os resultados mostram uma melhoria das medidas do modelo BERT em comparação à CNN e demonstram que os modelos baseados em Transformers são promissores para o avanço do desempenho de métodos de extração de informação para entidades no domínio Farmacológico em Português. O Reconhecimento de Entidades Nomeadas em evoluções clínicas está ganhando popularidade por melhorar os projetos de extração clínica. Este estudo permitiu à comunidade que trabalha com PLN, no contexto clínico, obter uma análise formal dessa tarefa, incluindo as formas mais bem-sucedidas de realizá-la.Submitted by PPG Ciência da Computação (ppgcc@pucrs.br) on 2022-07-27T13:28:31Z No. of bitstreams: 1 GIOVANI_NICOLAS_BETTONI_DIS.pdf: 2031039 bytes, checksum: 83c5c8d37c67b7b4125af1e850703781 (MD5)Approved for entry into archive by Sheila Dias (sheila.dias@pucrs.br) on 2022-08-03T13:41:28Z (GMT) No. of bitstreams: 1 GIOVANI_NICOLAS_BETTONI_DIS.pdf: 2031039 bytes, checksum: 83c5c8d37c67b7b4125af1e850703781 (MD5)Made available in DSpace on 2022-08-03T13:46:48Z (GMT). No. of bitstreams: 1 GIOVANI_NICOLAS_BETTONI_DIS.pdf: 2031039 bytes, checksum: 83c5c8d37c67b7b4125af1e850703781 (MD5) Previous issue date: 2022-03-30Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESapplication/pdfhttps://tede2.pucrs.br/tede2/retrieve/184801/GIOVANI_NICOLAS_BETTONI_DIS.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBrasilEscola PolitécnicaReconhecimento de Entidades NomeadasModelos de LinguagemInteroperabilidadeNamed Entity RecognitionLanguage ModelsInteroperabilityCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOExtração de informação em evoluções clínicas e integração com dados farmacogenômicosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisTrabalho não apresenta restrição para publicação-4570527706994352458500500600-8620782570833253013590462550136975366info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAILGIOVANI_NICOLAS_BETTONI_DIS.pdf.jpgGIOVANI_NICOLAS_BETTONI_DIS.pdf.jpgimage/jpeg5582https://tede2.pucrs.br/tede2/bitstream/tede/10359/4/GIOVANI_NICOLAS_BETTONI_DIS.pdf.jpge4c94972d2e13b63d2a66674c67036e0MD54TEXTGIOVANI_NICOLAS_BETTONI_DIS.pdf.txtGIOVANI_NICOLAS_BETTONI_DIS.pdf.txttext/plain185929https://tede2.pucrs.br/tede2/bitstream/tede/10359/3/GIOVANI_NICOLAS_BETTONI_DIS.pdf.txt7663ea2ce39cb4a6eeb9b538a44cf1b2MD53ORIGINALGIOVANI_NICOLAS_BETTONI_DIS.pdfGIOVANI_NICOLAS_BETTONI_DIS.pdfapplication/pdf2031039https://tede2.pucrs.br/tede2/bitstream/tede/10359/2/GIOVANI_NICOLAS_BETTONI_DIS.pdf83c5c8d37c67b7b4125af1e850703781MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8590https://tede2.pucrs.br/tede2/bitstream/tede/10359/1/license.txt220e11f2d3ba5354f917c7035aadef24MD51tede/103592022-08-03 12:00:20.213oai:tede2.pucrs.br:tede/10359QXV0b3JpemE/P28gcGFyYSBQdWJsaWNhPz9vIEVsZXRyP25pY2E6IENvbSBiYXNlIG5vIGRpc3Bvc3RvIG5hIExlaSBGZWRlcmFsIG4/OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYT8/byBlbGV0cj9uaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWY/Y2lhIFVuaXZlcnNpZGFkZSBDYXQ/bGljYSBkbyBSaW8gR3JhbmRlIGRvIFN1bCwgc2VkaWFkYSBhIEF2LiBJcGlyYW5nYSA2NjgxLCBQb3J0byBBbGVncmUsIFJpbyBHcmFuZGUgZG8gU3VsLCBjb20gcmVnaXN0cm8gZGUgQ05QSiA4ODYzMDQxMzAwMDItODEgYmVtIGNvbW8gZW0gb3V0cmFzIGJpYmxpb3RlY2FzIGRpZ2l0YWlzLCBuYWNpb25haXMgZSBpbnRlcm5hY2lvbmFpcywgY29ucz9yY2lvcyBlIHJlZGVzID9zIHF1YWlzIGEgYmlibGlvdGVjYSBkYSBQVUNSUyBwb3NzYSBhIHZpciBwYXJ0aWNpcGFyLCBzZW0gP251cyBhbHVzaXZvIGFvcyBkaXJlaXRvcyBhdXRvcmFpcywgYSB0P3R1bG8gZGUgZGl2dWxnYT8/byBkYSBwcm9kdT8/byBjaWVudD9maWNhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2022-08-03T15:00:20Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
dc.title.por.fl_str_mv |
Extração de informação em evoluções clínicas e integração com dados farmacogenômicos |
title |
Extração de informação em evoluções clínicas e integração com dados farmacogenômicos |
spellingShingle |
Extração de informação em evoluções clínicas e integração com dados farmacogenômicos Bettoni, Giovani Nícolas Reconhecimento de Entidades Nomeadas Modelos de Linguagem Interoperabilidade Named Entity Recognition Language Models Interoperability CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
title_short |
Extração de informação em evoluções clínicas e integração com dados farmacogenômicos |
title_full |
Extração de informação em evoluções clínicas e integração com dados farmacogenômicos |
title_fullStr |
Extração de informação em evoluções clínicas e integração com dados farmacogenômicos |
title_full_unstemmed |
Extração de informação em evoluções clínicas e integração com dados farmacogenômicos |
title_sort |
Extração de informação em evoluções clínicas e integração com dados farmacogenômicos |
author |
Bettoni, Giovani Nícolas |
author_facet |
Bettoni, Giovani Nícolas |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Bordini, Rafael Heitor |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/4589262718627942 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/6350735101501043 |
dc.contributor.author.fl_str_mv |
Bettoni, Giovani Nícolas |
contributor_str_mv |
Bordini, Rafael Heitor |
dc.subject.por.fl_str_mv |
Reconhecimento de Entidades Nomeadas Modelos de Linguagem Interoperabilidade |
topic |
Reconhecimento de Entidades Nomeadas Modelos de Linguagem Interoperabilidade Named Entity Recognition Language Models Interoperability CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Named Entity Recognition Language Models Interoperability |
dc.subject.cnpq.fl_str_mv |
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
description |
Information Extraction (IE) covers a number of Natural Language Processing (NLP) tasks. Named Entity Recognition (NER) is a task that seeks to identify the Named Entities of a text, such as names of people, places, and organizations, classifying them in a predefined set of categories. This dissertation intends to use NLP techniques and tools for the REN task in the Biomedical domain in Portuguese. Thus, we build a specific corpus and propose two models defined in neural networks able to process the text included in clinical evolutions: BERT and a convolutional neural network (CNN). In addition, a new mechanism has been introduced to incorporate pharmacogenomic knowledge that serves as a basis for aiding clinical decisions. The results show an improvement in the measures of the BERT model compared to CNN and demonstrate that Transformers-based models are promising for advancing the performance of information extraction methods for entities in the Pharmacologic domain in Portuguese. Recognition of Named Entities in clinical evolutions is gaining popularity for improving clinical extraction projects. This study allowed the community working with NLP, in the clinical context, to obtain a formal analysis of this task, including the most successful ways of performing it. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-08-03T13:46:48Z |
dc.date.issued.fl_str_mv |
2022-03-30 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://tede2.pucrs.br/tede2/handle/tede/10359 |
url |
https://tede2.pucrs.br/tede2/handle/tede/10359 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.program.fl_str_mv |
-4570527706994352458 |
dc.relation.confidence.fl_str_mv |
500 500 600 |
dc.relation.cnpq.fl_str_mv |
-862078257083325301 |
dc.relation.sponsorship.fl_str_mv |
3590462550136975366 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
PUCRS |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Escola Politécnica |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
instacron_str |
PUC_RS |
institution |
PUC_RS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
collection |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
bitstream.url.fl_str_mv |
https://tede2.pucrs.br/tede2/bitstream/tede/10359/4/GIOVANI_NICOLAS_BETTONI_DIS.pdf.jpg https://tede2.pucrs.br/tede2/bitstream/tede/10359/3/GIOVANI_NICOLAS_BETTONI_DIS.pdf.txt https://tede2.pucrs.br/tede2/bitstream/tede/10359/2/GIOVANI_NICOLAS_BETTONI_DIS.pdf https://tede2.pucrs.br/tede2/bitstream/tede/10359/1/license.txt |
bitstream.checksum.fl_str_mv |
e4c94972d2e13b63d2a66674c67036e0 7663ea2ce39cb4a6eeb9b538a44cf1b2 83c5c8d37c67b7b4125af1e850703781 220e11f2d3ba5354f917c7035aadef24 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
repository.mail.fl_str_mv |
biblioteca.central@pucrs.br|| |
_version_ |
1799765356717277184 |