Framework para descoberta científica suportada por interação híbrida homem-máquina

Detalhes bibliográficos
Autor(a) principal: Guimarães, Diogo Jorge Pereira Mesquita
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10348/11174
Resumo: Compreender as interações nas comunidades científicas e as suas colaborações, tornou-se indispensável para a investigação propriamente dita. Assim sendo, a medição da similaridade entre documentos científicos poderá auxiliar os investigadores na identificação de grupos com interesses semelhantes, promovendo a colaboração e o reforço das ligações entre a academia e a indústria. Com este propósito, procura-se avaliar o desempenho de abordagens híbridas na medição de similaridade entre pares de documentos, atrav´es da complementaridade de resultados alcançados por crowd participants e algoritmos de inteligência artificial. Esta dissertação apresenta, assim, uma framework que integra dois componentes sequenciais, contendo dois tipos de processos destinados a perceber de que forma os sistemas que envolvem algoritmos computacionais podem colaborar com seres humanos, na medição de similaridade entre documentos científicos. A primeira componente envolve um conjunto de abordagens de Natural Language Processing (Processamento de Linguagem Natural) ou NLP e de Text Mining, na qual ´e utilizada a medida TFIDF e o modelo de representação Bidirectional Encoder Representation from Transformers (BERT). A segunda componente, consiste numa campanha de crowdsourcing, na qual os participantes (crowd participants) terão de indicar se os documentos cient´ıficos em causa são, ou não, da mesma autoria. A utilização de processos de crowdsourcing nas situações em que algoritmos automáticos não fornecem resultados satisfatórios, faculta uma visão preliminar na deteção de contribuições importantes da cooperação Human-AI. Partindo deste pressuposto, preconiza-se a medição de similaridade entre documentos científicos, visando alcançar um melhor suporte à decisão baseado num worflow híbrido. Assim sendo, acredita-se que os investigadores podem ser melhor informados sobre potenciais colaboradores, recorrendo a mecanismos híbridos de Human-AI baseados no conteúdo das suas publicações científicas.
id RCAP_a9ca56866d16351f63a774e3b58d7303
oai_identifier_str oai:repositorio.utad.pt:10348/11174
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Framework para descoberta científica suportada por interação híbrida homem-máquinaAffinityBERT modelCompreender as interações nas comunidades científicas e as suas colaborações, tornou-se indispensável para a investigação propriamente dita. Assim sendo, a medição da similaridade entre documentos científicos poderá auxiliar os investigadores na identificação de grupos com interesses semelhantes, promovendo a colaboração e o reforço das ligações entre a academia e a indústria. Com este propósito, procura-se avaliar o desempenho de abordagens híbridas na medição de similaridade entre pares de documentos, atrav´es da complementaridade de resultados alcançados por crowd participants e algoritmos de inteligência artificial. Esta dissertação apresenta, assim, uma framework que integra dois componentes sequenciais, contendo dois tipos de processos destinados a perceber de que forma os sistemas que envolvem algoritmos computacionais podem colaborar com seres humanos, na medição de similaridade entre documentos científicos. A primeira componente envolve um conjunto de abordagens de Natural Language Processing (Processamento de Linguagem Natural) ou NLP e de Text Mining, na qual ´e utilizada a medida TFIDF e o modelo de representação Bidirectional Encoder Representation from Transformers (BERT). A segunda componente, consiste numa campanha de crowdsourcing, na qual os participantes (crowd participants) terão de indicar se os documentos cient´ıficos em causa são, ou não, da mesma autoria. A utilização de processos de crowdsourcing nas situações em que algoritmos automáticos não fornecem resultados satisfatórios, faculta uma visão preliminar na deteção de contribuições importantes da cooperação Human-AI. Partindo deste pressuposto, preconiza-se a medição de similaridade entre documentos científicos, visando alcançar um melhor suporte à decisão baseado num worflow híbrido. Assim sendo, acredita-se que os investigadores podem ser melhor informados sobre potenciais colaboradores, recorrendo a mecanismos híbridos de Human-AI baseados no conteúdo das suas publicações científicas.Understanding the intellectual landscape of scientific communities and their collaborations has become an indispensable part of research per se. In this regard, measuring similarities among scientific documents can help researchers to identify groups with similar interests as a basis for strengthening collaboration and university-industry linkages. To this end, we intend to evaluate the performance of hybrid crowd-computing methods in measuring the similarity between document pairs by comparing the results achieved by crowds and artificial intelligence (AI) algorithms. That said, this dissertation presents a framework constituted by two sequential components that contain two types of experiments to illustrate some issues in calculating how similar an automatic solution is to a given ground truth. The first component involves a set of natural language processing (NLP) processes in which we used the TF-IDF measure and the Bidirectional Encoder Representation from Transformers (BERT) model. For the next component, we created a crowdsourcing campaign consisting of four human intelligence tasks (HITs) in which the participants had to indicate whether or not a set of papers belonged to the same author. The use of crowdsourcing processes in situations where automatic algorithms do not provide satisfactory results provides preliminary insights into detecting major contributions from human-AI cooperation at similarity calculation in order to achieve better decision support and the advantage of a hybrid workflow system in this matter. We believe that in this case decision makers can be better informed about potential collaborators based on content-based insights enhanced by hybrid humanAI mechanisms.2022-04-28T09:48:15Z2022-01-25T00:00:00Z2022-01-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfapplication/pdfapplication/pdfhttp://hdl.handle.net/10348/11174TID:202980863porGuimarães, Diogo Jorge Pereira Mesquitainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-02T12:41:02Zoai:repositorio.utad.pt:10348/11174Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:02:44.061656Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Framework para descoberta científica suportada por interação híbrida homem-máquina
title Framework para descoberta científica suportada por interação híbrida homem-máquina
spellingShingle Framework para descoberta científica suportada por interação híbrida homem-máquina
Guimarães, Diogo Jorge Pereira Mesquita
Affinity
BERT model
title_short Framework para descoberta científica suportada por interação híbrida homem-máquina
title_full Framework para descoberta científica suportada por interação híbrida homem-máquina
title_fullStr Framework para descoberta científica suportada por interação híbrida homem-máquina
title_full_unstemmed Framework para descoberta científica suportada por interação híbrida homem-máquina
title_sort Framework para descoberta científica suportada por interação híbrida homem-máquina
author Guimarães, Diogo Jorge Pereira Mesquita
author_facet Guimarães, Diogo Jorge Pereira Mesquita
author_role author
dc.contributor.author.fl_str_mv Guimarães, Diogo Jorge Pereira Mesquita
dc.subject.por.fl_str_mv Affinity
BERT model
topic Affinity
BERT model
description Compreender as interações nas comunidades científicas e as suas colaborações, tornou-se indispensável para a investigação propriamente dita. Assim sendo, a medição da similaridade entre documentos científicos poderá auxiliar os investigadores na identificação de grupos com interesses semelhantes, promovendo a colaboração e o reforço das ligações entre a academia e a indústria. Com este propósito, procura-se avaliar o desempenho de abordagens híbridas na medição de similaridade entre pares de documentos, atrav´es da complementaridade de resultados alcançados por crowd participants e algoritmos de inteligência artificial. Esta dissertação apresenta, assim, uma framework que integra dois componentes sequenciais, contendo dois tipos de processos destinados a perceber de que forma os sistemas que envolvem algoritmos computacionais podem colaborar com seres humanos, na medição de similaridade entre documentos científicos. A primeira componente envolve um conjunto de abordagens de Natural Language Processing (Processamento de Linguagem Natural) ou NLP e de Text Mining, na qual ´e utilizada a medida TFIDF e o modelo de representação Bidirectional Encoder Representation from Transformers (BERT). A segunda componente, consiste numa campanha de crowdsourcing, na qual os participantes (crowd participants) terão de indicar se os documentos cient´ıficos em causa são, ou não, da mesma autoria. A utilização de processos de crowdsourcing nas situações em que algoritmos automáticos não fornecem resultados satisfatórios, faculta uma visão preliminar na deteção de contribuições importantes da cooperação Human-AI. Partindo deste pressuposto, preconiza-se a medição de similaridade entre documentos científicos, visando alcançar um melhor suporte à decisão baseado num worflow híbrido. Assim sendo, acredita-se que os investigadores podem ser melhor informados sobre potenciais colaboradores, recorrendo a mecanismos híbridos de Human-AI baseados no conteúdo das suas publicações científicas.
publishDate 2022
dc.date.none.fl_str_mv 2022-04-28T09:48:15Z
2022-01-25T00:00:00Z
2022-01-25
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10348/11174
TID:202980863
url http://hdl.handle.net/10348/11174
identifier_str_mv TID:202980863
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/pdf
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799137112925143040