Agrupamento de sentenças semanticamente similares aplicado à descoberta de novas intenções para chatbots cognitivos

Detalhes bibliográficos
Autor(a) principal: Grazziotim, Lucas Bortolanza
Data de Publicação: 2022
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/240211
Resumo: O trabalho apresenta uma solução de automação para o processo de descoberta de novas intenções para chatbots cognitivos. Para tanto, representações vetoriais das mensagens enviadas por usuários a um chatbot cognitivo são obtidas por meio de um modelo de linguagem neural para a língua portuguesa brasileira baseado no BERT, o BERTimbau. Na sequência, a fim de identificar os assuntos requisitados pelos usuários e viabilizar a construção de intenções, mensagens semelhantes são agrupadas por meio da execução de um algoritmo não supervisionado de agrupamento hierárquico aglomerativo sobre as suas representações vetoriais. Para que os agrupamentos obtidos possam ser investigados de uma maneira acessível, foi desenvolvida uma ferramenta de visualização na forma de uma aplicação web. Em um estudo de caso, a aplicação da solução proposta foi capaz de agrupar sentenças com sentido semelhante mesmo quando construídas com palavras distintas, possibilitando, com sucesso, a identificação de intenções a serem inseridas ao chatbot cognitivo a partir de mensagens enviadas pelos seus usuários.
id UFRGS-2_828bb1eba68aa5dfac1f9f7226aed917
oai_identifier_str oai:www.lume.ufrgs.br:10183/240211
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Grazziotim, Lucas BortolanzaGotz, Marcelo2022-06-14T04:42:34Z2022http://hdl.handle.net/10183/240211001141875O trabalho apresenta uma solução de automação para o processo de descoberta de novas intenções para chatbots cognitivos. Para tanto, representações vetoriais das mensagens enviadas por usuários a um chatbot cognitivo são obtidas por meio de um modelo de linguagem neural para a língua portuguesa brasileira baseado no BERT, o BERTimbau. Na sequência, a fim de identificar os assuntos requisitados pelos usuários e viabilizar a construção de intenções, mensagens semelhantes são agrupadas por meio da execução de um algoritmo não supervisionado de agrupamento hierárquico aglomerativo sobre as suas representações vetoriais. Para que os agrupamentos obtidos possam ser investigados de uma maneira acessível, foi desenvolvida uma ferramenta de visualização na forma de uma aplicação web. Em um estudo de caso, a aplicação da solução proposta foi capaz de agrupar sentenças com sentido semelhante mesmo quando construídas com palavras distintas, possibilitando, com sucesso, a identificação de intenções a serem inseridas ao chatbot cognitivo a partir de mensagens enviadas pelos seus usuários.The work presents an automation solution for the process of discovering new intents for cognitive chatbots. To do so, sentence embeddings of messages sent by users to a cognitive chatbot are obtained by means of a neural language model for Brazilian Portuguese based on BERT, which is known as BERTimbau. Subsequently, in order to identify the subjects requested by users and enable the creation of intents, similar messages are grouped together by the execution of an unsupervised agglomerative hierarchical clustering algorithm over their vector representations. So that the clusters obtained can be investigated in an accessible way, a visualization tool was developed as a web application. In a case study, the application of the proposed solution was able to group sentences with similar meaning even when made up of different words, successfully enabling the identification of intents to be added to the cognitive chatbot from messages sent by its users.application/pdfporComunicação digitalLinguagem naturalAprendizado de máquinaAutomatização de processosNatural language processingCognitive chatbotIntent mining,BERTSentence embeddingsSemantic textual similaritySentence clusteringAgrupamento de sentenças semanticamente similares aplicado à descoberta de novas intenções para chatbots cognitivosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPorto Alegre, BR-RS2022Engenharia de Controle e Automaçãograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001141875.pdf.txt001141875.pdf.txtExtracted Texttext/plain128564http://www.lume.ufrgs.br/bitstream/10183/240211/2/001141875.pdf.txtb14ea28522005c68e0382a09150fad9fMD52ORIGINAL001141875.pdfTexto completoapplication/pdf2574804http://www.lume.ufrgs.br/bitstream/10183/240211/1/001141875.pdffb5ad62b02c13788a54f7a7dcaa7ed31MD5110183/2402112022-06-15 04:46:43.110932oai:www.lume.ufrgs.br:10183/240211Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2022-06-15T07:46:43Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Agrupamento de sentenças semanticamente similares aplicado à descoberta de novas intenções para chatbots cognitivos
title Agrupamento de sentenças semanticamente similares aplicado à descoberta de novas intenções para chatbots cognitivos
spellingShingle Agrupamento de sentenças semanticamente similares aplicado à descoberta de novas intenções para chatbots cognitivos
Grazziotim, Lucas Bortolanza
Comunicação digital
Linguagem natural
Aprendizado de máquina
Automatização de processos
Natural language processing
Cognitive chatbot
Intent mining,
BERT
Sentence embeddings
Semantic textual similarity
Sentence clustering
title_short Agrupamento de sentenças semanticamente similares aplicado à descoberta de novas intenções para chatbots cognitivos
title_full Agrupamento de sentenças semanticamente similares aplicado à descoberta de novas intenções para chatbots cognitivos
title_fullStr Agrupamento de sentenças semanticamente similares aplicado à descoberta de novas intenções para chatbots cognitivos
title_full_unstemmed Agrupamento de sentenças semanticamente similares aplicado à descoberta de novas intenções para chatbots cognitivos
title_sort Agrupamento de sentenças semanticamente similares aplicado à descoberta de novas intenções para chatbots cognitivos
author Grazziotim, Lucas Bortolanza
author_facet Grazziotim, Lucas Bortolanza
author_role author
dc.contributor.author.fl_str_mv Grazziotim, Lucas Bortolanza
dc.contributor.advisor1.fl_str_mv Gotz, Marcelo
contributor_str_mv Gotz, Marcelo
dc.subject.por.fl_str_mv Comunicação digital
Linguagem natural
Aprendizado de máquina
Automatização de processos
topic Comunicação digital
Linguagem natural
Aprendizado de máquina
Automatização de processos
Natural language processing
Cognitive chatbot
Intent mining,
BERT
Sentence embeddings
Semantic textual similarity
Sentence clustering
dc.subject.eng.fl_str_mv Natural language processing
Cognitive chatbot
Intent mining,
BERT
Sentence embeddings
Semantic textual similarity
Sentence clustering
description O trabalho apresenta uma solução de automação para o processo de descoberta de novas intenções para chatbots cognitivos. Para tanto, representações vetoriais das mensagens enviadas por usuários a um chatbot cognitivo são obtidas por meio de um modelo de linguagem neural para a língua portuguesa brasileira baseado no BERT, o BERTimbau. Na sequência, a fim de identificar os assuntos requisitados pelos usuários e viabilizar a construção de intenções, mensagens semelhantes são agrupadas por meio da execução de um algoritmo não supervisionado de agrupamento hierárquico aglomerativo sobre as suas representações vetoriais. Para que os agrupamentos obtidos possam ser investigados de uma maneira acessível, foi desenvolvida uma ferramenta de visualização na forma de uma aplicação web. Em um estudo de caso, a aplicação da solução proposta foi capaz de agrupar sentenças com sentido semelhante mesmo quando construídas com palavras distintas, possibilitando, com sucesso, a identificação de intenções a serem inseridas ao chatbot cognitivo a partir de mensagens enviadas pelos seus usuários.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-06-14T04:42:34Z
dc.date.issued.fl_str_mv 2022
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/240211
dc.identifier.nrb.pt_BR.fl_str_mv 001141875
url http://hdl.handle.net/10183/240211
identifier_str_mv 001141875
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/240211/2/001141875.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/240211/1/001141875.pdf
bitstream.checksum.fl_str_mv b14ea28522005c68e0382a09150fad9f
fb5ad62b02c13788a54f7a7dcaa7ed31
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801224634825179136