Framework para descoberta científica suportada por interação híbrida homem-máquina

Guimarães, Diogo Jorge Pereira Mesquita

Framework para descoberta científica suportada por interação híbrida homem-máquina

Detalhes bibliográficos
Autor(a) principal:	Guimarães, Diogo Jorge Pereira Mesquita
Data de Publicação:	2022
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo:	http://hdl.handle.net/10348/11174
Resumo:	Compreender as interações nas comunidades científicas e as suas colaborações, tornou-se indispensável para a investigação propriamente dita. Assim sendo, a medição da similaridade entre documentos científicos poderá auxiliar os investigadores na identificação de grupos com interesses semelhantes, promovendo a colaboração e o reforço das ligações entre a academia e a indústria. Com este propósito, procura-se avaliar o desempenho de abordagens híbridas na medição de similaridade entre pares de documentos, atrav´es da complementaridade de resultados alcançados por crowd participants e algoritmos de inteligência artificial. Esta dissertação apresenta, assim, uma framework que integra dois componentes sequenciais, contendo dois tipos de processos destinados a perceber de que forma os sistemas que envolvem algoritmos computacionais podem colaborar com seres humanos, na medição de similaridade entre documentos científicos. A primeira componente envolve um conjunto de abordagens de Natural Language Processing (Processamento de Linguagem Natural) ou NLP e de Text Mining, na qual ´e utilizada a medida TFIDF e o modelo de representação Bidirectional Encoder Representation from Transformers (BERT). A segunda componente, consiste numa campanha de crowdsourcing, na qual os participantes (crowd participants) terão de indicar se os documentos cient´ıficos em causa são, ou não, da mesma autoria. A utilização de processos de crowdsourcing nas situações em que algoritmos automáticos não fornecem resultados satisfatórios, faculta uma visão preliminar na deteção de contribuições importantes da cooperação Human-AI. Partindo deste pressuposto, preconiza-se a medição de similaridade entre documentos científicos, visando alcançar um melhor suporte à decisão baseado num worflow híbrido. Assim sendo, acredita-se que os investigadores podem ser melhor informados sobre potenciais colaboradores, recorrendo a mecanismos híbridos de Human-AI baseados no conteúdo das suas publicações científicas.

Metadados do item

id	RCAP_a9ca56866d16351f63a774e3b58d7303
oai_identifier_str	oai:repositorio.utad.pt:10348/11174
network_acronym_str	RCAP
network_name_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str	7160
spelling	Framework para descoberta científica suportada por interação híbrida homem-máquinaAffinityBERT modelCompreender as interações nas comunidades científicas e as suas colaborações, tornou-se indispensável para a investigação propriamente dita. Assim sendo, a medição da similaridade entre documentos científicos poderá auxiliar os investigadores na identificação de grupos com interesses semelhantes, promovendo a colaboração e o reforço das ligações entre a academia e a indústria. Com este propósito, procura-se avaliar o desempenho de abordagens híbridas na medição de similaridade entre pares de documentos, atrav´es da complementaridade de resultados alcançados por crowd participants e algoritmos de inteligência artificial. Esta dissertação apresenta, assim, uma framework que integra dois componentes sequenciais, contendo dois tipos de processos destinados a perceber de que forma os sistemas que envolvem algoritmos computacionais podem colaborar com seres humanos, na medição de similaridade entre documentos científicos. A primeira componente envolve um conjunto de abordagens de Natural Language Processing (Processamento de Linguagem Natural) ou NLP e de Text Mining, na qual ´e utilizada a medida TFIDF e o modelo de representação Bidirectional Encoder Representation from Transformers (BERT). A segunda componente, consiste numa campanha de crowdsourcing, na qual os participantes (crowd participants) terão de indicar se os documentos cient´ıficos em causa são, ou não, da mesma autoria. A utilização de processos de crowdsourcing nas situações em que algoritmos automáticos não fornecem resultados satisfatórios, faculta uma visão preliminar na deteção de contribuições importantes da cooperação Human-AI. Partindo deste pressuposto, preconiza-se a medição de similaridade entre documentos científicos, visando alcançar um melhor suporte à decisão baseado num worflow híbrido. Assim sendo, acredita-se que os investigadores podem ser melhor informados sobre potenciais colaboradores, recorrendo a mecanismos híbridos de Human-AI baseados no conteúdo das suas publicações científicas.Understanding the intellectual landscape of scientific communities and their collaborations has become an indispensable part of research per se. In this regard, measuring similarities among scientific documents can help researchers to identify groups with similar interests as a basis for strengthening collaboration and university-industry linkages. To this end, we intend to evaluate the performance of hybrid crowd-computing methods in measuring the similarity between document pairs by comparing the results achieved by crowds and artificial intelligence (AI) algorithms. That said, this dissertation presents a framework constituted by two sequential components that contain two types of experiments to illustrate some issues in calculating how similar an automatic solution is to a given ground truth. The first component involves a set of natural language processing (NLP) processes in which we used the TF-IDF measure and the Bidirectional Encoder Representation from Transformers (BERT) model. For the next component, we created a crowdsourcing campaign consisting of four human intelligence tasks (HITs) in which the participants had to indicate whether or not a set of papers belonged to the same author. The use of crowdsourcing processes in situations where automatic algorithms do not provide satisfactory results provides preliminary insights into detecting major contributions from human-AI cooperation at similarity calculation in order to achieve better decision support and the advantage of a hybrid workflow system in this matter. We believe that in this case decision makers can be better informed about potential collaborators based on content-based insights enhanced by hybrid humanAI mechanisms.2022-04-28T09:48:15Z2022-01-25T00:00:00Z2022-01-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfapplication/pdfapplication/pdfhttp://hdl.handle.net/10348/11174TID:202980863porGuimarães, Diogo Jorge Pereira Mesquitainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-02T12:41:02Zoai:repositorio.utad.pt:10348/11174Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:02:44.061656Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv	Framework para descoberta científica suportada por interação híbrida homem-máquina
title	Framework para descoberta científica suportada por interação híbrida homem-máquina
spellingShingle	Framework para descoberta científica suportada por interação híbrida homem-máquina Guimarães, Diogo Jorge Pereira Mesquita Affinity BERT model
title_short	Framework para descoberta científica suportada por interação híbrida homem-máquina
title_full	Framework para descoberta científica suportada por interação híbrida homem-máquina
title_fullStr	Framework para descoberta científica suportada por interação híbrida homem-máquina
title_full_unstemmed	Framework para descoberta científica suportada por interação híbrida homem-máquina
title_sort	Framework para descoberta científica suportada por interação híbrida homem-máquina
author	Guimarães, Diogo Jorge Pereira Mesquita
author_facet	Guimarães, Diogo Jorge Pereira Mesquita
author_role	author
dc.contributor.author.fl_str_mv	Guimarães, Diogo Jorge Pereira Mesquita
dc.subject.por.fl_str_mv	Affinity BERT model
topic	Affinity BERT model
description	Compreender as interações nas comunidades científicas e as suas colaborações, tornou-se indispensável para a investigação propriamente dita. Assim sendo, a medição da similaridade entre documentos científicos poderá auxiliar os investigadores na identificação de grupos com interesses semelhantes, promovendo a colaboração e o reforço das ligações entre a academia e a indústria. Com este propósito, procura-se avaliar o desempenho de abordagens híbridas na medição de similaridade entre pares de documentos, atrav´es da complementaridade de resultados alcançados por crowd participants e algoritmos de inteligência artificial. Esta dissertação apresenta, assim, uma framework que integra dois componentes sequenciais, contendo dois tipos de processos destinados a perceber de que forma os sistemas que envolvem algoritmos computacionais podem colaborar com seres humanos, na medição de similaridade entre documentos científicos. A primeira componente envolve um conjunto de abordagens de Natural Language Processing (Processamento de Linguagem Natural) ou NLP e de Text Mining, na qual ´e utilizada a medida TFIDF e o modelo de representação Bidirectional Encoder Representation from Transformers (BERT). A segunda componente, consiste numa campanha de crowdsourcing, na qual os participantes (crowd participants) terão de indicar se os documentos cient´ıficos em causa são, ou não, da mesma autoria. A utilização de processos de crowdsourcing nas situações em que algoritmos automáticos não fornecem resultados satisfatórios, faculta uma visão preliminar na deteção de contribuições importantes da cooperação Human-AI. Partindo deste pressuposto, preconiza-se a medição de similaridade entre documentos científicos, visando alcançar um melhor suporte à decisão baseado num worflow híbrido. Assim sendo, acredita-se que os investigadores podem ser melhor informados sobre potenciais colaboradores, recorrendo a mecanismos híbridos de Human-AI baseados no conteúdo das suas publicações científicas.
publishDate	2022
dc.date.none.fl_str_mv	2022-04-28T09:48:15Z 2022-01-25T00:00:00Z 2022-01-25
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10348/11174 TID:202980863
url	http://hdl.handle.net/10348/11174
identifier_str_mv	TID:202980863
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf application/pdf application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP
instname_str	Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str	RCAAP
institution	RCAAP
reponame_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_	1799137112925143040

Framework para descoberta científica suportada por interação híbrida homem-máquina

Registros relacionados