Extração de informação em evoluções clínicas e integração com dados farmacogenômicos

Detalhes bibliográficos
Autor(a) principal: Bettoni, Giovani Nícolas
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da PUC_RS
Texto Completo: https://tede2.pucrs.br/tede2/handle/tede/10359
Resumo: Information Extraction (IE) covers a number of Natural Language Processing (NLP) tasks. Named Entity Recognition (NER) is a task that seeks to identify the Named Entities of a text, such as names of people, places, and organizations, classifying them in a predefined set of categories. This dissertation intends to use NLP techniques and tools for the REN task in the Biomedical domain in Portuguese. Thus, we build a specific corpus and propose two models defined in neural networks able to process the text included in clinical evolutions: BERT and a convolutional neural network (CNN). In addition, a new mechanism has been introduced to incorporate pharmacogenomic knowledge that serves as a basis for aiding clinical decisions. The results show an improvement in the measures of the BERT model compared to CNN and demonstrate that Transformers-based models are promising for advancing the performance of information extraction methods for entities in the Pharmacologic domain in Portuguese. Recognition of Named Entities in clinical evolutions is gaining popularity for improving clinical extraction projects. This study allowed the community working with NLP, in the clinical context, to obtain a formal analysis of this task, including the most successful ways of performing it.
id P_RS_9e56227549138bbbb4fc2ca6525558c5
oai_identifier_str oai:tede2.pucrs.br:tede/10359
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Bordini, Rafael Heitorhttp://lattes.cnpq.br/4589262718627942http://lattes.cnpq.br/6350735101501043Bettoni, Giovani Nícolas2022-08-03T13:46:48Z2022-03-30https://tede2.pucrs.br/tede2/handle/tede/10359Information Extraction (IE) covers a number of Natural Language Processing (NLP) tasks. Named Entity Recognition (NER) is a task that seeks to identify the Named Entities of a text, such as names of people, places, and organizations, classifying them in a predefined set of categories. This dissertation intends to use NLP techniques and tools for the REN task in the Biomedical domain in Portuguese. Thus, we build a specific corpus and propose two models defined in neural networks able to process the text included in clinical evolutions: BERT and a convolutional neural network (CNN). In addition, a new mechanism has been introduced to incorporate pharmacogenomic knowledge that serves as a basis for aiding clinical decisions. The results show an improvement in the measures of the BERT model compared to CNN and demonstrate that Transformers-based models are promising for advancing the performance of information extraction methods for entities in the Pharmacologic domain in Portuguese. Recognition of Named Entities in clinical evolutions is gaining popularity for improving clinical extraction projects. This study allowed the community working with NLP, in the clinical context, to obtain a formal analysis of this task, including the most successful ways of performing it.A Extração de Informação (EI) abrange uma série de tarefas de Processamento de Linguagem Natural (PLN). Entre elas, o Reconhecimento de Entidades Nomeadas (REN) é uma tarefa que busca identificar as Entidades Nomeadas de um texto, tais como nomes de pessoas, locais e organizações, classificado-as em um conjunto pré-definido de categorias. Nesta dissertação pretendemos utilizar técnicas e ferramentas de PLN para a tarefa de REN no domínio Biomédico em Português. Portanto, realizamos a construção de um corpus específico e propomos dois modelos baseados em redes neurais capazes de processar o texto incluído em evoluções clínicas: BERT e uma rede neural convolucional (CNN). Além disso, foi introduzido um novo mecanismo para incorporar conhecimento farmacogenômico que sirva como base para auxiliar na decisão clínica. Os resultados mostram uma melhoria das medidas do modelo BERT em comparação à CNN e demonstram que os modelos baseados em Transformers são promissores para o avanço do desempenho de métodos de extração de informação para entidades no domínio Farmacológico em Português. O Reconhecimento de Entidades Nomeadas em evoluções clínicas está ganhando popularidade por melhorar os projetos de extração clínica. Este estudo permitiu à comunidade que trabalha com PLN, no contexto clínico, obter uma análise formal dessa tarefa, incluindo as formas mais bem-sucedidas de realizá-la.Submitted by PPG Ciência da Computação (ppgcc@pucrs.br) on 2022-07-27T13:28:31Z No. of bitstreams: 1 GIOVANI_NICOLAS_BETTONI_DIS.pdf: 2031039 bytes, checksum: 83c5c8d37c67b7b4125af1e850703781 (MD5)Approved for entry into archive by Sheila Dias (sheila.dias@pucrs.br) on 2022-08-03T13:41:28Z (GMT) No. of bitstreams: 1 GIOVANI_NICOLAS_BETTONI_DIS.pdf: 2031039 bytes, checksum: 83c5c8d37c67b7b4125af1e850703781 (MD5)Made available in DSpace on 2022-08-03T13:46:48Z (GMT). No. of bitstreams: 1 GIOVANI_NICOLAS_BETTONI_DIS.pdf: 2031039 bytes, checksum: 83c5c8d37c67b7b4125af1e850703781 (MD5) Previous issue date: 2022-03-30Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESapplication/pdfhttps://tede2.pucrs.br/tede2/retrieve/184801/GIOVANI_NICOLAS_BETTONI_DIS.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBrasilEscola PolitécnicaReconhecimento de Entidades NomeadasModelos de LinguagemInteroperabilidadeNamed Entity RecognitionLanguage ModelsInteroperabilityCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOExtração de informação em evoluções clínicas e integração com dados farmacogenômicosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisTrabalho não apresenta restrição para publicação-4570527706994352458500500600-8620782570833253013590462550136975366info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAILGIOVANI_NICOLAS_BETTONI_DIS.pdf.jpgGIOVANI_NICOLAS_BETTONI_DIS.pdf.jpgimage/jpeg5582https://tede2.pucrs.br/tede2/bitstream/tede/10359/4/GIOVANI_NICOLAS_BETTONI_DIS.pdf.jpge4c94972d2e13b63d2a66674c67036e0MD54TEXTGIOVANI_NICOLAS_BETTONI_DIS.pdf.txtGIOVANI_NICOLAS_BETTONI_DIS.pdf.txttext/plain185929https://tede2.pucrs.br/tede2/bitstream/tede/10359/3/GIOVANI_NICOLAS_BETTONI_DIS.pdf.txt7663ea2ce39cb4a6eeb9b538a44cf1b2MD53ORIGINALGIOVANI_NICOLAS_BETTONI_DIS.pdfGIOVANI_NICOLAS_BETTONI_DIS.pdfapplication/pdf2031039https://tede2.pucrs.br/tede2/bitstream/tede/10359/2/GIOVANI_NICOLAS_BETTONI_DIS.pdf83c5c8d37c67b7b4125af1e850703781MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8590https://tede2.pucrs.br/tede2/bitstream/tede/10359/1/license.txt220e11f2d3ba5354f917c7035aadef24MD51tede/103592022-08-03 12:00:20.213oai:tede2.pucrs.br:tede/10359QXV0b3JpemE/P28gcGFyYSBQdWJsaWNhPz9vIEVsZXRyP25pY2E6IENvbSBiYXNlIG5vIGRpc3Bvc3RvIG5hIExlaSBGZWRlcmFsIG4/OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYT8/byBlbGV0cj9uaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWY/Y2lhIFVuaXZlcnNpZGFkZSBDYXQ/bGljYSBkbyBSaW8gR3JhbmRlIGRvIFN1bCwgc2VkaWFkYSBhIEF2LiBJcGlyYW5nYSA2NjgxLCBQb3J0byBBbGVncmUsIFJpbyBHcmFuZGUgZG8gU3VsLCBjb20gcmVnaXN0cm8gZGUgQ05QSiA4ODYzMDQxMzAwMDItODEgYmVtIGNvbW8gZW0gb3V0cmFzIGJpYmxpb3RlY2FzIGRpZ2l0YWlzLCBuYWNpb25haXMgZSBpbnRlcm5hY2lvbmFpcywgY29ucz9yY2lvcyBlIHJlZGVzID9zIHF1YWlzIGEgYmlibGlvdGVjYSBkYSBQVUNSUyBwb3NzYSBhIHZpciBwYXJ0aWNpcGFyLCBzZW0gP251cyBhbHVzaXZvIGFvcyBkaXJlaXRvcyBhdXRvcmFpcywgYSB0P3R1bG8gZGUgZGl2dWxnYT8/byBkYSBwcm9kdT8/byBjaWVudD9maWNhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2022-08-03T15:00:20Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv Extração de informação em evoluções clínicas e integração com dados farmacogenômicos
title Extração de informação em evoluções clínicas e integração com dados farmacogenômicos
spellingShingle Extração de informação em evoluções clínicas e integração com dados farmacogenômicos
Bettoni, Giovani Nícolas
Reconhecimento de Entidades Nomeadas
Modelos de Linguagem
Interoperabilidade
Named Entity Recognition
Language Models
Interoperability
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short Extração de informação em evoluções clínicas e integração com dados farmacogenômicos
title_full Extração de informação em evoluções clínicas e integração com dados farmacogenômicos
title_fullStr Extração de informação em evoluções clínicas e integração com dados farmacogenômicos
title_full_unstemmed Extração de informação em evoluções clínicas e integração com dados farmacogenômicos
title_sort Extração de informação em evoluções clínicas e integração com dados farmacogenômicos
author Bettoni, Giovani Nícolas
author_facet Bettoni, Giovani Nícolas
author_role author
dc.contributor.advisor1.fl_str_mv Bordini, Rafael Heitor
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/4589262718627942
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/6350735101501043
dc.contributor.author.fl_str_mv Bettoni, Giovani Nícolas
contributor_str_mv Bordini, Rafael Heitor
dc.subject.por.fl_str_mv Reconhecimento de Entidades Nomeadas
Modelos de Linguagem
Interoperabilidade
topic Reconhecimento de Entidades Nomeadas
Modelos de Linguagem
Interoperabilidade
Named Entity Recognition
Language Models
Interoperability
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Named Entity Recognition
Language Models
Interoperability
dc.subject.cnpq.fl_str_mv CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description Information Extraction (IE) covers a number of Natural Language Processing (NLP) tasks. Named Entity Recognition (NER) is a task that seeks to identify the Named Entities of a text, such as names of people, places, and organizations, classifying them in a predefined set of categories. This dissertation intends to use NLP techniques and tools for the REN task in the Biomedical domain in Portuguese. Thus, we build a specific corpus and propose two models defined in neural networks able to process the text included in clinical evolutions: BERT and a convolutional neural network (CNN). In addition, a new mechanism has been introduced to incorporate pharmacogenomic knowledge that serves as a basis for aiding clinical decisions. The results show an improvement in the measures of the BERT model compared to CNN and demonstrate that Transformers-based models are promising for advancing the performance of information extraction methods for entities in the Pharmacologic domain in Portuguese. Recognition of Named Entities in clinical evolutions is gaining popularity for improving clinical extraction projects. This study allowed the community working with NLP, in the clinical context, to obtain a formal analysis of this task, including the most successful ways of performing it.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-08-03T13:46:48Z
dc.date.issued.fl_str_mv 2022-03-30
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://tede2.pucrs.br/tede2/handle/tede/10359
url https://tede2.pucrs.br/tede2/handle/tede/10359
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv -4570527706994352458
dc.relation.confidence.fl_str_mv 500
500
600
dc.relation.cnpq.fl_str_mv -862078257083325301
dc.relation.sponsorship.fl_str_mv 3590462550136975366
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Escola Politécnica
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv https://tede2.pucrs.br/tede2/bitstream/tede/10359/4/GIOVANI_NICOLAS_BETTONI_DIS.pdf.jpg
https://tede2.pucrs.br/tede2/bitstream/tede/10359/3/GIOVANI_NICOLAS_BETTONI_DIS.pdf.txt
https://tede2.pucrs.br/tede2/bitstream/tede/10359/2/GIOVANI_NICOLAS_BETTONI_DIS.pdf
https://tede2.pucrs.br/tede2/bitstream/tede/10359/1/license.txt
bitstream.checksum.fl_str_mv e4c94972d2e13b63d2a66674c67036e0
7663ea2ce39cb4a6eeb9b538a44cf1b2
83c5c8d37c67b7b4125af1e850703781
220e11f2d3ba5354f917c7035aadef24
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1799765356717277184