Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/55/55134/tde-20042022-141047/ |
Resumo: | A quantidade de conhecimento acumulada em artigos científicos leva os pesquisadores a lidar com um número expressivo de publicações e a sua fragmentação em diferentes campos de especialidades ou disciplinas. No entanto, é possível fazer a conexão entre essas áreas por meio da Descoberta Baseada em Literatura. Essa abordagem tem como objetivo relacionar diferentes especialidades, a fim de encontrar relacionamentos implícitos potencialmente utilizáveis para o levantamento de novas hipóteses científicas. Para viabilizar esse processo e deixá-lo mais rápido e eficaz, a Descoberta Baseada em Literatura conta com o auxílio de técnicas de Mineração de Textos. Apesar de todo o progresso obtido nessas áreas, os pesquisadores ainda precisam lidar com a falta de explicações lógicas sobre as relações encontradas. Pesquisas recentes têm apresentado diversos avanços nesse sentido com o auxílio de técnicas baseadas em análises linguísticas, com foco em abordagens semânticas. Porém, a incorporação de uma abordagem que considere e explique os relacionamentos de causa e efeito entre os conceitos ainda é um desafio a ser superado. Nesse contexto, esta tese de doutorado foi motivada pelo potencial da semântica verbal e da representação do conhecimento em mapas conceituais, a fim de fornecer explicações detalhadas sobre os mecanismos de interação causal existentes entre os conceitos. O desenvolvimento deste trabalho teve o propósito geral de avançar as pesquisas na área da Descoberta Baseada em Literatura com foco da detecção de relacionamentos causais. Para isso, foi desenvolvida uma abordagem híbrida, baseada em análises estatísticas e linguísticas. Experimentos realizados revelaram que as técnicas estatísticas baseadas em regras de associação e métricas de redes complexas possibilitam a seleção dos conceitos mais representativos do corpus, enquanto as técnicas baseadas em análises linguísticas, com foco em semântica verbal, favorecem a extração de relações causais. Essas relações, quando representadas em mapas conceituais, compõem uma cadeia lógica de conexões, fornecendo uma saída facilmente interpretável. Esse modelo de representação auxilia a detecção de links ocultos e a descoberta de conhecimento por parte do usuário. Os resultados relatados nesta tese fornecem evidências de que a abordagem é eficaz para reconstruir e explicar hipóteses de descobertas baseadas na literatura histórica, além de facilitar o teste e a geração de novas hipóteses. Esses resultados mostram os benefícios que uma abordagem híbrida de Mineração de Textos pode proporcionar à Descoberta Baseada em Literatura |
id |
USP_746321d5def22577916279b72a3db65b |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-20042022-141047 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literaturaA hybrid approach to the detection of causal relationships applied to literature- based discoveryAssociation rulesComplex networksConceptMapa conceitualMineração de textosRedes complexasRegras de associaçãoSemântica verbalText miningVerbal semanticsA quantidade de conhecimento acumulada em artigos científicos leva os pesquisadores a lidar com um número expressivo de publicações e a sua fragmentação em diferentes campos de especialidades ou disciplinas. No entanto, é possível fazer a conexão entre essas áreas por meio da Descoberta Baseada em Literatura. Essa abordagem tem como objetivo relacionar diferentes especialidades, a fim de encontrar relacionamentos implícitos potencialmente utilizáveis para o levantamento de novas hipóteses científicas. Para viabilizar esse processo e deixá-lo mais rápido e eficaz, a Descoberta Baseada em Literatura conta com o auxílio de técnicas de Mineração de Textos. Apesar de todo o progresso obtido nessas áreas, os pesquisadores ainda precisam lidar com a falta de explicações lógicas sobre as relações encontradas. Pesquisas recentes têm apresentado diversos avanços nesse sentido com o auxílio de técnicas baseadas em análises linguísticas, com foco em abordagens semânticas. Porém, a incorporação de uma abordagem que considere e explique os relacionamentos de causa e efeito entre os conceitos ainda é um desafio a ser superado. Nesse contexto, esta tese de doutorado foi motivada pelo potencial da semântica verbal e da representação do conhecimento em mapas conceituais, a fim de fornecer explicações detalhadas sobre os mecanismos de interação causal existentes entre os conceitos. O desenvolvimento deste trabalho teve o propósito geral de avançar as pesquisas na área da Descoberta Baseada em Literatura com foco da detecção de relacionamentos causais. Para isso, foi desenvolvida uma abordagem híbrida, baseada em análises estatísticas e linguísticas. Experimentos realizados revelaram que as técnicas estatísticas baseadas em regras de associação e métricas de redes complexas possibilitam a seleção dos conceitos mais representativos do corpus, enquanto as técnicas baseadas em análises linguísticas, com foco em semântica verbal, favorecem a extração de relações causais. Essas relações, quando representadas em mapas conceituais, compõem uma cadeia lógica de conexões, fornecendo uma saída facilmente interpretável. Esse modelo de representação auxilia a detecção de links ocultos e a descoberta de conhecimento por parte do usuário. Os resultados relatados nesta tese fornecem evidências de que a abordagem é eficaz para reconstruir e explicar hipóteses de descobertas baseadas na literatura histórica, além de facilitar o teste e a geração de novas hipóteses. Esses resultados mostram os benefícios que uma abordagem híbrida de Mineração de Textos pode proporcionar à Descoberta Baseada em LiteraturaThe amount of knowledge accumulated in scientific articles leads researchers to deal with an expressive number of publications and their fragmentation in different fields of specialties or disciplines. However, it is possible to make the connection between these areas through LiteratureBased Discovery. This approach aims to relate different specialties in order to find implicit relationships potentially usable for raising new scientific hypotheses. To make this process feasible and make it faster and more effective, Literature-Based Discovery relies on the help of Text Mining techniques. Despite all the progress made in these areas, researchers still have to deal with the lack of logical explanations for the relationships found. Recent researches have shown several advances in this direction with the help of techniques based on linguistic analysis, with a focus on semantic approaches. However, incorporating an approach that considers and explains the cause and effect relationships between concepts is still a challenge to be overcome. In this context, this doctoral thesis was motivated by the potential of verbal semantics and knowledge representation in concept maps, in order to provide detailed explanations about the mechanisms of causal interaction between concepts. The development of this work had the general purpose of advancing research in the field of Literature-Based Discovery with a focus on detecting causal relationships. For this, a hybrid approach was developed, based on statistical and linguistic analysis. Experiments carried out revealed that statistical techniques based on association rules and complex network metrics enable the selection of the most representative concepts of the corpus, while techniques based on linguistic analysis, focusing on verbal semantics, favor the extraction of causal relationships. These relationships, when represented in concept maps, compose a logical chain of connections, providing an easily interpretable output. This representation model aids the detection of hidden links and knowledge discovery by the user. The results reported in this thesis provide evidence that the approach is effective in reconstructing and explaining discovery hypotheses based on the historical literature, in addition to facilitating the testing and generation of new hypotheses. These results show the benefits that a hybrid Text Mining approach can provide to Literature-Based DiscoveryBiblioteca Digitais de Teses e Dissertações da USPRezende, Solange OliveiraVasques, Dildre Georgiana2021-12-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-20042022-141047/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-04-20T17:42:57Zoai:teses.usp.br:tde-20042022-141047Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-04-20T17:42:57Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura A hybrid approach to the detection of causal relationships applied to literature- based discovery |
title |
Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura |
spellingShingle |
Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura Vasques, Dildre Georgiana Association rules Complex networks Concept Mapa conceitual Mineração de textos Redes complexas Regras de associação Semântica verbal Text mining Verbal semantics |
title_short |
Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura |
title_full |
Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura |
title_fullStr |
Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura |
title_full_unstemmed |
Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura |
title_sort |
Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura |
author |
Vasques, Dildre Georgiana |
author_facet |
Vasques, Dildre Georgiana |
author_role |
author |
dc.contributor.none.fl_str_mv |
Rezende, Solange Oliveira |
dc.contributor.author.fl_str_mv |
Vasques, Dildre Georgiana |
dc.subject.por.fl_str_mv |
Association rules Complex networks Concept Mapa conceitual Mineração de textos Redes complexas Regras de associação Semântica verbal Text mining Verbal semantics |
topic |
Association rules Complex networks Concept Mapa conceitual Mineração de textos Redes complexas Regras de associação Semântica verbal Text mining Verbal semantics |
description |
A quantidade de conhecimento acumulada em artigos científicos leva os pesquisadores a lidar com um número expressivo de publicações e a sua fragmentação em diferentes campos de especialidades ou disciplinas. No entanto, é possível fazer a conexão entre essas áreas por meio da Descoberta Baseada em Literatura. Essa abordagem tem como objetivo relacionar diferentes especialidades, a fim de encontrar relacionamentos implícitos potencialmente utilizáveis para o levantamento de novas hipóteses científicas. Para viabilizar esse processo e deixá-lo mais rápido e eficaz, a Descoberta Baseada em Literatura conta com o auxílio de técnicas de Mineração de Textos. Apesar de todo o progresso obtido nessas áreas, os pesquisadores ainda precisam lidar com a falta de explicações lógicas sobre as relações encontradas. Pesquisas recentes têm apresentado diversos avanços nesse sentido com o auxílio de técnicas baseadas em análises linguísticas, com foco em abordagens semânticas. Porém, a incorporação de uma abordagem que considere e explique os relacionamentos de causa e efeito entre os conceitos ainda é um desafio a ser superado. Nesse contexto, esta tese de doutorado foi motivada pelo potencial da semântica verbal e da representação do conhecimento em mapas conceituais, a fim de fornecer explicações detalhadas sobre os mecanismos de interação causal existentes entre os conceitos. O desenvolvimento deste trabalho teve o propósito geral de avançar as pesquisas na área da Descoberta Baseada em Literatura com foco da detecção de relacionamentos causais. Para isso, foi desenvolvida uma abordagem híbrida, baseada em análises estatísticas e linguísticas. Experimentos realizados revelaram que as técnicas estatísticas baseadas em regras de associação e métricas de redes complexas possibilitam a seleção dos conceitos mais representativos do corpus, enquanto as técnicas baseadas em análises linguísticas, com foco em semântica verbal, favorecem a extração de relações causais. Essas relações, quando representadas em mapas conceituais, compõem uma cadeia lógica de conexões, fornecendo uma saída facilmente interpretável. Esse modelo de representação auxilia a detecção de links ocultos e a descoberta de conhecimento por parte do usuário. Os resultados relatados nesta tese fornecem evidências de que a abordagem é eficaz para reconstruir e explicar hipóteses de descobertas baseadas na literatura histórica, além de facilitar o teste e a geração de novas hipóteses. Esses resultados mostram os benefícios que uma abordagem híbrida de Mineração de Textos pode proporcionar à Descoberta Baseada em Literatura |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-12-16 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-20042022-141047/ |
url |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-20042022-141047/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815257153837989888 |