Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura

Detalhes bibliográficos
Autor(a) principal: Vasques, Dildre Georgiana
Data de Publicação: 2021
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-20042022-141047/
Resumo: A quantidade de conhecimento acumulada em artigos científicos leva os pesquisadores a lidar com um número expressivo de publicações e a sua fragmentação em diferentes campos de especialidades ou disciplinas. No entanto, é possível fazer a conexão entre essas áreas por meio da Descoberta Baseada em Literatura. Essa abordagem tem como objetivo relacionar diferentes especialidades, a fim de encontrar relacionamentos implícitos potencialmente utilizáveis para o levantamento de novas hipóteses científicas. Para viabilizar esse processo e deixá-lo mais rápido e eficaz, a Descoberta Baseada em Literatura conta com o auxílio de técnicas de Mineração de Textos. Apesar de todo o progresso obtido nessas áreas, os pesquisadores ainda precisam lidar com a falta de explicações lógicas sobre as relações encontradas. Pesquisas recentes têm apresentado diversos avanços nesse sentido com o auxílio de técnicas baseadas em análises linguísticas, com foco em abordagens semânticas. Porém, a incorporação de uma abordagem que considere e explique os relacionamentos de causa e efeito entre os conceitos ainda é um desafio a ser superado. Nesse contexto, esta tese de doutorado foi motivada pelo potencial da semântica verbal e da representação do conhecimento em mapas conceituais, a fim de fornecer explicações detalhadas sobre os mecanismos de interação causal existentes entre os conceitos. O desenvolvimento deste trabalho teve o propósito geral de avançar as pesquisas na área da Descoberta Baseada em Literatura com foco da detecção de relacionamentos causais. Para isso, foi desenvolvida uma abordagem híbrida, baseada em análises estatísticas e linguísticas. Experimentos realizados revelaram que as técnicas estatísticas baseadas em regras de associação e métricas de redes complexas possibilitam a seleção dos conceitos mais representativos do corpus, enquanto as técnicas baseadas em análises linguísticas, com foco em semântica verbal, favorecem a extração de relações causais. Essas relações, quando representadas em mapas conceituais, compõem uma cadeia lógica de conexões, fornecendo uma saída facilmente interpretável. Esse modelo de representação auxilia a detecção de links ocultos e a descoberta de conhecimento por parte do usuário. Os resultados relatados nesta tese fornecem evidências de que a abordagem é eficaz para reconstruir e explicar hipóteses de descobertas baseadas na literatura histórica, além de facilitar o teste e a geração de novas hipóteses. Esses resultados mostram os benefícios que uma abordagem híbrida de Mineração de Textos pode proporcionar à Descoberta Baseada em Literatura
id USP_746321d5def22577916279b72a3db65b
oai_identifier_str oai:teses.usp.br:tde-20042022-141047
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literaturaA hybrid approach to the detection of causal relationships applied to literature- based discoveryAssociation rulesComplex networksConceptMapa conceitualMineração de textosRedes complexasRegras de associaçãoSemântica verbalText miningVerbal semanticsA quantidade de conhecimento acumulada em artigos científicos leva os pesquisadores a lidar com um número expressivo de publicações e a sua fragmentação em diferentes campos de especialidades ou disciplinas. No entanto, é possível fazer a conexão entre essas áreas por meio da Descoberta Baseada em Literatura. Essa abordagem tem como objetivo relacionar diferentes especialidades, a fim de encontrar relacionamentos implícitos potencialmente utilizáveis para o levantamento de novas hipóteses científicas. Para viabilizar esse processo e deixá-lo mais rápido e eficaz, a Descoberta Baseada em Literatura conta com o auxílio de técnicas de Mineração de Textos. Apesar de todo o progresso obtido nessas áreas, os pesquisadores ainda precisam lidar com a falta de explicações lógicas sobre as relações encontradas. Pesquisas recentes têm apresentado diversos avanços nesse sentido com o auxílio de técnicas baseadas em análises linguísticas, com foco em abordagens semânticas. Porém, a incorporação de uma abordagem que considere e explique os relacionamentos de causa e efeito entre os conceitos ainda é um desafio a ser superado. Nesse contexto, esta tese de doutorado foi motivada pelo potencial da semântica verbal e da representação do conhecimento em mapas conceituais, a fim de fornecer explicações detalhadas sobre os mecanismos de interação causal existentes entre os conceitos. O desenvolvimento deste trabalho teve o propósito geral de avançar as pesquisas na área da Descoberta Baseada em Literatura com foco da detecção de relacionamentos causais. Para isso, foi desenvolvida uma abordagem híbrida, baseada em análises estatísticas e linguísticas. Experimentos realizados revelaram que as técnicas estatísticas baseadas em regras de associação e métricas de redes complexas possibilitam a seleção dos conceitos mais representativos do corpus, enquanto as técnicas baseadas em análises linguísticas, com foco em semântica verbal, favorecem a extração de relações causais. Essas relações, quando representadas em mapas conceituais, compõem uma cadeia lógica de conexões, fornecendo uma saída facilmente interpretável. Esse modelo de representação auxilia a detecção de links ocultos e a descoberta de conhecimento por parte do usuário. Os resultados relatados nesta tese fornecem evidências de que a abordagem é eficaz para reconstruir e explicar hipóteses de descobertas baseadas na literatura histórica, além de facilitar o teste e a geração de novas hipóteses. Esses resultados mostram os benefícios que uma abordagem híbrida de Mineração de Textos pode proporcionar à Descoberta Baseada em LiteraturaThe amount of knowledge accumulated in scientific articles leads researchers to deal with an expressive number of publications and their fragmentation in different fields of specialties or disciplines. However, it is possible to make the connection between these areas through LiteratureBased Discovery. This approach aims to relate different specialties in order to find implicit relationships potentially usable for raising new scientific hypotheses. To make this process feasible and make it faster and more effective, Literature-Based Discovery relies on the help of Text Mining techniques. Despite all the progress made in these areas, researchers still have to deal with the lack of logical explanations for the relationships found. Recent researches have shown several advances in this direction with the help of techniques based on linguistic analysis, with a focus on semantic approaches. However, incorporating an approach that considers and explains the cause and effect relationships between concepts is still a challenge to be overcome. In this context, this doctoral thesis was motivated by the potential of verbal semantics and knowledge representation in concept maps, in order to provide detailed explanations about the mechanisms of causal interaction between concepts. The development of this work had the general purpose of advancing research in the field of Literature-Based Discovery with a focus on detecting causal relationships. For this, a hybrid approach was developed, based on statistical and linguistic analysis. Experiments carried out revealed that statistical techniques based on association rules and complex network metrics enable the selection of the most representative concepts of the corpus, while techniques based on linguistic analysis, focusing on verbal semantics, favor the extraction of causal relationships. These relationships, when represented in concept maps, compose a logical chain of connections, providing an easily interpretable output. This representation model aids the detection of hidden links and knowledge discovery by the user. The results reported in this thesis provide evidence that the approach is effective in reconstructing and explaining discovery hypotheses based on the historical literature, in addition to facilitating the testing and generation of new hypotheses. These results show the benefits that a hybrid Text Mining approach can provide to Literature-Based DiscoveryBiblioteca Digitais de Teses e Dissertações da USPRezende, Solange OliveiraVasques, Dildre Georgiana2021-12-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-20042022-141047/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-04-20T17:42:57Zoai:teses.usp.br:tde-20042022-141047Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-04-20T17:42:57Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura
A hybrid approach to the detection of causal relationships applied to literature- based discovery
title Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura
spellingShingle Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura
Vasques, Dildre Georgiana
Association rules
Complex networks
Concept
Mapa conceitual
Mineração de textos
Redes complexas
Regras de associação
Semântica verbal
Text mining
Verbal semantics
title_short Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura
title_full Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura
title_fullStr Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura
title_full_unstemmed Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura
title_sort Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura
author Vasques, Dildre Georgiana
author_facet Vasques, Dildre Georgiana
author_role author
dc.contributor.none.fl_str_mv Rezende, Solange Oliveira
dc.contributor.author.fl_str_mv Vasques, Dildre Georgiana
dc.subject.por.fl_str_mv Association rules
Complex networks
Concept
Mapa conceitual
Mineração de textos
Redes complexas
Regras de associação
Semântica verbal
Text mining
Verbal semantics
topic Association rules
Complex networks
Concept
Mapa conceitual
Mineração de textos
Redes complexas
Regras de associação
Semântica verbal
Text mining
Verbal semantics
description A quantidade de conhecimento acumulada em artigos científicos leva os pesquisadores a lidar com um número expressivo de publicações e a sua fragmentação em diferentes campos de especialidades ou disciplinas. No entanto, é possível fazer a conexão entre essas áreas por meio da Descoberta Baseada em Literatura. Essa abordagem tem como objetivo relacionar diferentes especialidades, a fim de encontrar relacionamentos implícitos potencialmente utilizáveis para o levantamento de novas hipóteses científicas. Para viabilizar esse processo e deixá-lo mais rápido e eficaz, a Descoberta Baseada em Literatura conta com o auxílio de técnicas de Mineração de Textos. Apesar de todo o progresso obtido nessas áreas, os pesquisadores ainda precisam lidar com a falta de explicações lógicas sobre as relações encontradas. Pesquisas recentes têm apresentado diversos avanços nesse sentido com o auxílio de técnicas baseadas em análises linguísticas, com foco em abordagens semânticas. Porém, a incorporação de uma abordagem que considere e explique os relacionamentos de causa e efeito entre os conceitos ainda é um desafio a ser superado. Nesse contexto, esta tese de doutorado foi motivada pelo potencial da semântica verbal e da representação do conhecimento em mapas conceituais, a fim de fornecer explicações detalhadas sobre os mecanismos de interação causal existentes entre os conceitos. O desenvolvimento deste trabalho teve o propósito geral de avançar as pesquisas na área da Descoberta Baseada em Literatura com foco da detecção de relacionamentos causais. Para isso, foi desenvolvida uma abordagem híbrida, baseada em análises estatísticas e linguísticas. Experimentos realizados revelaram que as técnicas estatísticas baseadas em regras de associação e métricas de redes complexas possibilitam a seleção dos conceitos mais representativos do corpus, enquanto as técnicas baseadas em análises linguísticas, com foco em semântica verbal, favorecem a extração de relações causais. Essas relações, quando representadas em mapas conceituais, compõem uma cadeia lógica de conexões, fornecendo uma saída facilmente interpretável. Esse modelo de representação auxilia a detecção de links ocultos e a descoberta de conhecimento por parte do usuário. Os resultados relatados nesta tese fornecem evidências de que a abordagem é eficaz para reconstruir e explicar hipóteses de descobertas baseadas na literatura histórica, além de facilitar o teste e a geração de novas hipóteses. Esses resultados mostram os benefícios que uma abordagem híbrida de Mineração de Textos pode proporcionar à Descoberta Baseada em Literatura
publishDate 2021
dc.date.none.fl_str_mv 2021-12-16
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/55/55134/tde-20042022-141047/
url https://www.teses.usp.br/teses/disponiveis/55/55134/tde-20042022-141047/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257153837989888