Detecção multimodal de mentiras para a língua portuguesa por meio de modelo de sinceridade

Constâncio, Alex Sebastião

Detecção multimodal de mentiras para a língua portuguesa por meio de modelo de sinceridade

Detalhes bibliográficos
Autor(a) principal:	Constâncio, Alex Sebastião
Data de Publicação:	2024
Tipo de documento:	Tese
Idioma:	por
Título da fonte:	Repositório Institucional da UFPR
Texto Completo:	https://hdl.handle.net/1884/86521
Resumo:	Orientadora: Profª. Drª. Deborah Ribeiro Carvalho

Metadados do item

id	UFPR_c2c937e348b77699a329d7a52ea16224
oai_identifier_str	oai:acervodigital.ufpr.br:1884/86521
network_acronym_str	UFPR
network_name_str	Repositório Institucional da UFPR
repository_id_str	308
spelling	Silva, Helena de Fátima Nunes, 1956-Silveira, Jocelaine Martins da, 1970-Universidade Federal do Paraná. Setor de Ciências Sociais Aplicadas. Programa de Pós-Graduação em Gestão da InformaçãoCarvalho, Deborah RibeiroConstâncio, Alex Sebastião2024-02-20T13:38:28Z2024-02-20T13:38:28Z2024https://hdl.handle.net/1884/86521Orientadora: Profª. Drª. Deborah Ribeiro CarvalhoCoorientadoras: Profª. Drª. Helena de Fátima Nunes Silva e Profª. Drª. Jocelaine Martins da SilveiraTese (doutorado) - Universidade Federal do Paraná, Setor de Ciências Sociais Aplicadas, Programa de Pós-Graduação em Gestão da Informação. Defesa : Curitiba, 06/12/2023Inclui referênciasResumo: A mentira é um fenômeno psíquico-social complexo e pervasivo. É complexo porque pode ter muitas motivações e desencadear múltiplas variações de expressão no emissor. É pervasivo porque pesquisas apontam para uma incidência média de duas mentiras ao dia para cada pessoa. Em alguns casos a comunicação não sincera não oferece risco ao interlocutor ou ao coletivo, mas existem casos em que a descoberta precoce de uma mentira pode representar a diferença entre a vida e a morte. Dados empíricos demonstram que a mentira pode ser, em muitos casos, detectada a partir da observação de pistas involuntariamente expressas pelo emissor. Em resposta aos cenários mais dramáticos que envolvem a mentira, esta pesquisa apresenta um "Modelo de Sinceridade" capaz de identificar padrões de comunicação sincera para então identificar exemplares de narrativas mentirosas. O Modelo de Sinceridade é um modelo de Aprendizado de Máquina, mais especificamente de Aprendizado Profundo, chamado de Autoencoder. Por incorporar caracteres acústicos, verbais e visuais, trata-se de um modelo multimodal. Por ser um modelo treinado com narrativas expressas em português do Brasil, trata-se do primeiro estudo deste tipo dedicado à língua portuguesa. Após 3.290 experimentos com diferentes arquiteturas de Autoencoder, o modelo multimodal final empregando o mecanismo de Atenção multi head atingiu a acurácia balanceada de 0,714 na detecção de mentiras em 49 narrativas de 12 sujeitos, pertencentes a um conjunto de dados denominado "Multimodal Deception Detection Dataset for Brazilian Portuguese" (MMDDD-PtBr), elaborado especialmente para este estudo, também o primeiro no mundo dedicado ao português. O Modelo de Sinceridade inova ao utilizar o aprendizado autossupervisionado para seu treinamento, potencialmente pavimentando o caminho para a construção de um modelo de detecção independente de dados rotulados, que ainda hoje são raros. Inova também por abordar o problema da detecção de mentiras como um problema de descoberta de anomalias, para o qual a pesquisa desenvolveu uma nova métrica para quantificação da confiança de detecção, denominada de "Escore de Sinceridade", que também oportunizou um novo modelo de fusão de modalidades. O resultado alcançado supera por 17 pontos percentuais a linha de base de acurácia de 0,540, frequentemente apontada como a probabilidade de um indivíduo não treinado detectar uma mensagem não sincera. A margem de ganho alcançada aponta para os efeitos positivos da abordagem e das técnicas e métricas empregadas.Abstract: Deception is a complex and pervasive psychosocial phenomenon. It's complex because it may have many motivations and trigger multiple expression shifts at the emitter. It is pervasive because research shows that the average person tells two lies a day. In some cases, insincere communication poses no risk to the interlocutor or to the population, but there are cases in which the early discovery of a lie can mean the difference between life and death. Empirical data shows that lies can often be detected by observing clues involuntarily expressed by the emitter. In response to the most dramatic scenarios involving deceptions, this research presents a "Sincerity Model", capable of identifying patterns of sincere communication and then identifying examples of lying narratives. The Sincerity Model is a Machine Learning model, more specifically Deep Learning, called Autoencoder. Because it includes acoustic, verbal and visual features, it is a multimodal model. Since it is a model trained with narratives expressed in Brazilian Portuguese, it is the first study of its kind dedicated to Portuguese. After 3,290 experiments with different Autoencoder architectures, the final multimodal model that uses the multi-head Attention mechanism achieved a balanced accuracy of 0.714 in deception detection of 49 narratives from 12 subjects, belonging to a dataset called the "Multimodal Deception Detection Dataset for Brazilian Portuguese" (MMDDD PtBr), especially developed for this study, also the first in the world dedicated to Portuguese. The Sincerity Model innovates by using self-supervised learning for its training, potentially paving the way for the construction of a detection model independent of labeled data, which are still rare nowadays. It also breaks new ground by approaching the problem of lie detection as an anomaly detection problem, for which this research has developed a new metric for quantifying the detection confidence, called the "Sincerity Score" that leveraged a novel mechanism for modality fusion. The result achieved exceeds by 17 percentage points the accuracy baseline of 0.540, often referred to as the probability of an untrained individual to detect a deceptive message. The achieved margin of gain points to the positive effects of the approach, as well as the techniques and metrics used.1 recurso online : PDF.application/pdfInteligência artificialSoftware - DesenvolvimentoAprendizado do computadorCiência da InformaçãoDetecção multimodal de mentiras para a língua portuguesa por meio de modelo de sinceridadeinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - T - ALEX SEBASTIAO CONSTANCIO.pdfapplication/pdf6208671https://acervodigital.ufpr.br/bitstream/1884/86521/1/R%20-%20T%20-%20ALEX%20SEBASTIAO%20CONSTANCIO.pdfae780cfbf388d177ccaaa679e8f72a2fMD51open access1884/865212024-02-20 10:38:28.977open accessoai:acervodigital.ufpr.br:1884/86521Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082024-02-20T13:38:28Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv	Detecção multimodal de mentiras para a língua portuguesa por meio de modelo de sinceridade
title	Detecção multimodal de mentiras para a língua portuguesa por meio de modelo de sinceridade
spellingShingle	Detecção multimodal de mentiras para a língua portuguesa por meio de modelo de sinceridade Constâncio, Alex Sebastião Inteligência artificial Software - Desenvolvimento Aprendizado do computador Ciência da Informação
title_short	Detecção multimodal de mentiras para a língua portuguesa por meio de modelo de sinceridade
title_full	Detecção multimodal de mentiras para a língua portuguesa por meio de modelo de sinceridade
title_fullStr	Detecção multimodal de mentiras para a língua portuguesa por meio de modelo de sinceridade
title_full_unstemmed	Detecção multimodal de mentiras para a língua portuguesa por meio de modelo de sinceridade
title_sort	Detecção multimodal de mentiras para a língua portuguesa por meio de modelo de sinceridade
author	Constâncio, Alex Sebastião
author_facet	Constâncio, Alex Sebastião
author_role	author
dc.contributor.other.pt_BR.fl_str_mv	Silva, Helena de Fátima Nunes, 1956- Silveira, Jocelaine Martins da, 1970- Universidade Federal do Paraná. Setor de Ciências Sociais Aplicadas. Programa de Pós-Graduação em Gestão da Informação
dc.contributor.advisor1.fl_str_mv	Carvalho, Deborah Ribeiro
dc.contributor.author.fl_str_mv	Constâncio, Alex Sebastião
contributor_str_mv	Carvalho, Deborah Ribeiro
dc.subject.por.fl_str_mv	Inteligência artificial Software - Desenvolvimento Aprendizado do computador Ciência da Informação
topic	Inteligência artificial Software - Desenvolvimento Aprendizado do computador Ciência da Informação
description	Orientadora: Profª. Drª. Deborah Ribeiro Carvalho
publishDate	2024
dc.date.accessioned.fl_str_mv	2024-02-20T13:38:28Z
dc.date.available.fl_str_mv	2024-02-20T13:38:28Z
dc.date.issued.fl_str_mv	2024
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/doctoralThesis
format	doctoralThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://hdl.handle.net/1884/86521
url	https://hdl.handle.net/1884/86521
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	1 recurso online : PDF. application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná (UFPR) instacron:UFPR
instname_str	Universidade Federal do Paraná (UFPR)
instacron_str	UFPR
institution	UFPR
reponame_str	Repositório Institucional da UFPR
collection	Repositório Institucional da UFPR
bitstream.url.fl_str_mv	https://acervodigital.ufpr.br/bitstream/1884/86521/1/R%20-%20T%20-%20ALEX%20SEBASTIAO%20CONSTANCIO.pdf
bitstream.checksum.fl_str_mv	ae780cfbf388d177ccaaa679e8f72a2f
bitstream.checksumAlgorithm.fl_str_mv	MD5
repository.name.fl_str_mv	Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv
_version_	1813898793701081088

Detecção multimodal de mentiras para a língua portuguesa por meio de modelo de sinceridade

Registros relacionados