Framework para descoberta científica suportada por interação híbrida homem-máquina
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10348/11174 |
Resumo: | Compreender as interações nas comunidades científicas e as suas colaborações, tornou-se indispensável para a investigação propriamente dita. Assim sendo, a medição da similaridade entre documentos científicos poderá auxiliar os investigadores na identificação de grupos com interesses semelhantes, promovendo a colaboração e o reforço das ligações entre a academia e a indústria. Com este propósito, procura-se avaliar o desempenho de abordagens híbridas na medição de similaridade entre pares de documentos, atrav´es da complementaridade de resultados alcançados por crowd participants e algoritmos de inteligência artificial. Esta dissertação apresenta, assim, uma framework que integra dois componentes sequenciais, contendo dois tipos de processos destinados a perceber de que forma os sistemas que envolvem algoritmos computacionais podem colaborar com seres humanos, na medição de similaridade entre documentos científicos. A primeira componente envolve um conjunto de abordagens de Natural Language Processing (Processamento de Linguagem Natural) ou NLP e de Text Mining, na qual ´e utilizada a medida TFIDF e o modelo de representação Bidirectional Encoder Representation from Transformers (BERT). A segunda componente, consiste numa campanha de crowdsourcing, na qual os participantes (crowd participants) terão de indicar se os documentos cient´ıficos em causa são, ou não, da mesma autoria. A utilização de processos de crowdsourcing nas situações em que algoritmos automáticos não fornecem resultados satisfatórios, faculta uma visão preliminar na deteção de contribuições importantes da cooperação Human-AI. Partindo deste pressuposto, preconiza-se a medição de similaridade entre documentos científicos, visando alcançar um melhor suporte à decisão baseado num worflow híbrido. Assim sendo, acredita-se que os investigadores podem ser melhor informados sobre potenciais colaboradores, recorrendo a mecanismos híbridos de Human-AI baseados no conteúdo das suas publicações científicas. |
id |
RCAP_a9ca56866d16351f63a774e3b58d7303 |
---|---|
oai_identifier_str |
oai:repositorio.utad.pt:10348/11174 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Framework para descoberta científica suportada por interação híbrida homem-máquinaAffinityBERT modelCompreender as interações nas comunidades científicas e as suas colaborações, tornou-se indispensável para a investigação propriamente dita. Assim sendo, a medição da similaridade entre documentos científicos poderá auxiliar os investigadores na identificação de grupos com interesses semelhantes, promovendo a colaboração e o reforço das ligações entre a academia e a indústria. Com este propósito, procura-se avaliar o desempenho de abordagens híbridas na medição de similaridade entre pares de documentos, atrav´es da complementaridade de resultados alcançados por crowd participants e algoritmos de inteligência artificial. Esta dissertação apresenta, assim, uma framework que integra dois componentes sequenciais, contendo dois tipos de processos destinados a perceber de que forma os sistemas que envolvem algoritmos computacionais podem colaborar com seres humanos, na medição de similaridade entre documentos científicos. A primeira componente envolve um conjunto de abordagens de Natural Language Processing (Processamento de Linguagem Natural) ou NLP e de Text Mining, na qual ´e utilizada a medida TFIDF e o modelo de representação Bidirectional Encoder Representation from Transformers (BERT). A segunda componente, consiste numa campanha de crowdsourcing, na qual os participantes (crowd participants) terão de indicar se os documentos cient´ıficos em causa são, ou não, da mesma autoria. A utilização de processos de crowdsourcing nas situações em que algoritmos automáticos não fornecem resultados satisfatórios, faculta uma visão preliminar na deteção de contribuições importantes da cooperação Human-AI. Partindo deste pressuposto, preconiza-se a medição de similaridade entre documentos científicos, visando alcançar um melhor suporte à decisão baseado num worflow híbrido. Assim sendo, acredita-se que os investigadores podem ser melhor informados sobre potenciais colaboradores, recorrendo a mecanismos híbridos de Human-AI baseados no conteúdo das suas publicações científicas.Understanding the intellectual landscape of scientific communities and their collaborations has become an indispensable part of research per se. In this regard, measuring similarities among scientific documents can help researchers to identify groups with similar interests as a basis for strengthening collaboration and university-industry linkages. To this end, we intend to evaluate the performance of hybrid crowd-computing methods in measuring the similarity between document pairs by comparing the results achieved by crowds and artificial intelligence (AI) algorithms. That said, this dissertation presents a framework constituted by two sequential components that contain two types of experiments to illustrate some issues in calculating how similar an automatic solution is to a given ground truth. The first component involves a set of natural language processing (NLP) processes in which we used the TF-IDF measure and the Bidirectional Encoder Representation from Transformers (BERT) model. For the next component, we created a crowdsourcing campaign consisting of four human intelligence tasks (HITs) in which the participants had to indicate whether or not a set of papers belonged to the same author. The use of crowdsourcing processes in situations where automatic algorithms do not provide satisfactory results provides preliminary insights into detecting major contributions from human-AI cooperation at similarity calculation in order to achieve better decision support and the advantage of a hybrid workflow system in this matter. We believe that in this case decision makers can be better informed about potential collaborators based on content-based insights enhanced by hybrid humanAI mechanisms.2022-04-28T09:48:15Z2022-01-25T00:00:00Z2022-01-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfapplication/pdfapplication/pdfhttp://hdl.handle.net/10348/11174TID:202980863porGuimarães, Diogo Jorge Pereira Mesquitainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-02T12:41:02Zoai:repositorio.utad.pt:10348/11174Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:02:44.061656Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Framework para descoberta científica suportada por interação híbrida homem-máquina |
title |
Framework para descoberta científica suportada por interação híbrida homem-máquina |
spellingShingle |
Framework para descoberta científica suportada por interação híbrida homem-máquina Guimarães, Diogo Jorge Pereira Mesquita Affinity BERT model |
title_short |
Framework para descoberta científica suportada por interação híbrida homem-máquina |
title_full |
Framework para descoberta científica suportada por interação híbrida homem-máquina |
title_fullStr |
Framework para descoberta científica suportada por interação híbrida homem-máquina |
title_full_unstemmed |
Framework para descoberta científica suportada por interação híbrida homem-máquina |
title_sort |
Framework para descoberta científica suportada por interação híbrida homem-máquina |
author |
Guimarães, Diogo Jorge Pereira Mesquita |
author_facet |
Guimarães, Diogo Jorge Pereira Mesquita |
author_role |
author |
dc.contributor.author.fl_str_mv |
Guimarães, Diogo Jorge Pereira Mesquita |
dc.subject.por.fl_str_mv |
Affinity BERT model |
topic |
Affinity BERT model |
description |
Compreender as interações nas comunidades científicas e as suas colaborações, tornou-se indispensável para a investigação propriamente dita. Assim sendo, a medição da similaridade entre documentos científicos poderá auxiliar os investigadores na identificação de grupos com interesses semelhantes, promovendo a colaboração e o reforço das ligações entre a academia e a indústria. Com este propósito, procura-se avaliar o desempenho de abordagens híbridas na medição de similaridade entre pares de documentos, atrav´es da complementaridade de resultados alcançados por crowd participants e algoritmos de inteligência artificial. Esta dissertação apresenta, assim, uma framework que integra dois componentes sequenciais, contendo dois tipos de processos destinados a perceber de que forma os sistemas que envolvem algoritmos computacionais podem colaborar com seres humanos, na medição de similaridade entre documentos científicos. A primeira componente envolve um conjunto de abordagens de Natural Language Processing (Processamento de Linguagem Natural) ou NLP e de Text Mining, na qual ´e utilizada a medida TFIDF e o modelo de representação Bidirectional Encoder Representation from Transformers (BERT). A segunda componente, consiste numa campanha de crowdsourcing, na qual os participantes (crowd participants) terão de indicar se os documentos cient´ıficos em causa são, ou não, da mesma autoria. A utilização de processos de crowdsourcing nas situações em que algoritmos automáticos não fornecem resultados satisfatórios, faculta uma visão preliminar na deteção de contribuições importantes da cooperação Human-AI. Partindo deste pressuposto, preconiza-se a medição de similaridade entre documentos científicos, visando alcançar um melhor suporte à decisão baseado num worflow híbrido. Assim sendo, acredita-se que os investigadores podem ser melhor informados sobre potenciais colaboradores, recorrendo a mecanismos híbridos de Human-AI baseados no conteúdo das suas publicações científicas. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-04-28T09:48:15Z 2022-01-25T00:00:00Z 2022-01-25 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10348/11174 TID:202980863 |
url |
http://hdl.handle.net/10348/11174 |
identifier_str_mv |
TID:202980863 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf application/pdf application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799137112925143040 |