Extracting knowledge from documents related with invasive fungal infections in iron overload context

Detalhes bibliográficos
Autor(a) principal: Rodrigues, Andreia Dóris Pedras
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/79400
Resumo: Dissertação de Mestrado em Bioinformática
id RCAP_858553471a4317dfcdbbc81368e26fdf
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/79400
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Extracting knowledge from documents related with invasive fungal infections in iron overload contextBiomedical text miningInvasive fungal infections;Iron overloadMineração de textos biomédicosInfeções fúngicas invasivasExcesso de ferroEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaDissertação de Mestrado em BioinformáticaInvasive fungal infections caused by Candida are associated with high mortality and morbidity rates in hospitalized patients. Iron plays a major role in these infections, as they are exacerbated under iron overload conditions. In this context, it is important to understand the association between iron levels and invasive fungal infections, as it can serve as an indicator of the severity of the disease, and eventually it can help establish measures to improve treatment efficacy. Nowadays, manually inferring these associations from biomedical documents is a time consuming task, due to the high amount of available scientific text data. As such, these tasks naturally benefit from the Biomedical Text Mining field, which includes a wide variety of methods for automatic extraction of high-quality information from biomedical text documents. In this work, relevant documents related to iron overload and fungal infections were retrieved from PubMed to build a corpus. Then, both Named Entity Recognition and Relation Extraction processes were executed using the @Note text mining tool. Finally, relevant sentences were manually extracted and a curated dataset with documents containing those sentences was created. Since the number of publications obtained about Candida and iron overload was very low, the analysis was made taking into account all fungi. A total of 15 publications were considered relevant and 168 relevant associations were extracted. Although associations of iron levels with both severity of infection and treatment efficacy were not extracted, it was possible to conclude that, in many cases, iron overload is a predictor for fungal infections, and patients’ iron levels highly affect treatment efficacy. The Biomedical Text Mining process described in the present thesis enabled the creation of a dataset of relevant biomedical publications containing interesting associations between fungal infections, drugs and associated diseases in a clinical context of iron overload, although in the future this process could be improved, especially regarding dictionaries, in order to obtain a higher number of relevant publications.As infeções fúngicas invasivas causadas por Candida estão associadas a elevadas taxas de mortalidade e morbilidade em doentes hospitalizados. O ferro tem um papel importante neste tipo de infeções, visto que estas são exacerbadas em condições de excesso de ferro. Neste contexto, é extremamente importante compreender a associação entre os níveis de ferro e infeções fúngicas invasivas, pois pode servir como indicador da severidade da doença e, eventualmente, ajudar a estabelecer medidas para melhorar a eficácia de tratamento. Atualmente, inferir manualmente este tipo de associações de documentos biomédicos revela-se uma tarefa bastante demorada, devido ao elevado volume de dados de texto científico disponíveis. Como tal, estas tarefas beneficiam claramente da área da mineração de textos biomédicos, que inclui uma ampla variedade de métodos para extração de informação de alta qualidade de documentos de texto biomédicos. No presente trabalho, foram identificados, inicialmente, documentos relevantes que associam o ferro com infeções fúngicas invasivas para construir um corpus. De seguida, os processos de Reconhecimento de entidades nomeadas e Extração de relações foram realizados usando a ferramenta de mineração de textos @Note. Finalmente, as frases mais relevantes foram extraídas e foi criado um corpus curado de documentos contendo essas mesmas frases. Visto que o número de publicações obtidas relacionadas com Candida e excesso de ferro foi muito baixo, a análise foi feita tendo em conta todos os fungos. Um total de 15 publicações foram consideradas relevantes e 168 associações foram extraídas. Embora não tivesse sido possível extrair associações entre níveis de ferro e a eficácia do tratamento/severidade da infeção, foi possível concluir que o excesso de ferro prevê o surgimento de infeções fúngicas em muitos casos, e que os níveis de ferro dos pacientes afetam fortemente a eficácia do tratamento. O processo de mineração de textos biomédicos no presente trabalho possibilitou a criação de um corpus de publicações biomédicas relevantes contendo associações interessantes entre infeções fúngicas, fármacos e doenças associadas, no contexto clínico de excesso de ferro, embora este processo pudesse ser melhorado no futuro, especialmente no que diz respeito aos dicionários, para que seja possível a obtenção de um maior número de publicações relevantes.Rocha, MiguelPimentel, CatarinaUniversidade do MinhoRodrigues, Andreia Dóris Pedras20212021-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/79400por203055969info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:52:21Zoai:repositorium.sdum.uminho.pt:1822/79400Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:51:26.065231Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Extracting knowledge from documents related with invasive fungal infections in iron overload context
title Extracting knowledge from documents related with invasive fungal infections in iron overload context
spellingShingle Extracting knowledge from documents related with invasive fungal infections in iron overload context
Rodrigues, Andreia Dóris Pedras
Biomedical text mining
Invasive fungal infections;
Iron overload
Mineração de textos biomédicos
Infeções fúngicas invasivas
Excesso de ferro
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short Extracting knowledge from documents related with invasive fungal infections in iron overload context
title_full Extracting knowledge from documents related with invasive fungal infections in iron overload context
title_fullStr Extracting knowledge from documents related with invasive fungal infections in iron overload context
title_full_unstemmed Extracting knowledge from documents related with invasive fungal infections in iron overload context
title_sort Extracting knowledge from documents related with invasive fungal infections in iron overload context
author Rodrigues, Andreia Dóris Pedras
author_facet Rodrigues, Andreia Dóris Pedras
author_role author
dc.contributor.none.fl_str_mv Rocha, Miguel
Pimentel, Catarina
Universidade do Minho
dc.contributor.author.fl_str_mv Rodrigues, Andreia Dóris Pedras
dc.subject.por.fl_str_mv Biomedical text mining
Invasive fungal infections;
Iron overload
Mineração de textos biomédicos
Infeções fúngicas invasivas
Excesso de ferro
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic Biomedical text mining
Invasive fungal infections;
Iron overload
Mineração de textos biomédicos
Infeções fúngicas invasivas
Excesso de ferro
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description Dissertação de Mestrado em Bioinformática
publishDate 2021
dc.date.none.fl_str_mv 2021
2021-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/79400
url https://hdl.handle.net/1822/79400
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv 203055969
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133103179956224