Uma ferramenta de interpretabilidade aplicada à classificação de desinformação sobre a COVID-19

Oliveira, Mariana Suarez de

Uma ferramenta de interpretabilidade aplicada à classificação de desinformação sobre a COVID-19

Detalhes bibliográficos
Autor(a) principal:	Oliveira, Mariana Suarez de
Data de Publicação:	2023
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo:	http://app.uff.br/riuff/handle/1/31127
Resumo:	A pandemia do COVID-19, vírus detectado em dezembro de 2019, infectou e matou milhões de pessoas por todo o mundo. A doença, por ser até então desconhecida, foi foco central de estudos em todas as áreas de conhecimento, e novas descobertas aconteciam diariamente. No meio dessas descobertas científicas, iniciou-se também uma disseminação constante de informações falsas, que foi denominada como “infodemia”. Essas notícias falsas, em um contexto de pandemia, podem trazer consequências gravíssimas, principalmente quando falam sobre prevenção e tratamento de maneiras ineficazes. Para auxiliar no combate ao problema da “infodemia”, este trabalho utiliza técnicas de processamento de linguagem natural e inteligência artificial explicável para desenvolver uma ferramenta de interpretabilidade de notícias relacionadas a COVID-19, através do desenvolvimento de um classificador automático de notícias, em múltiplas classes, não limitado apenas a verdadeiro e falso. Para tanto, são utilizadas redes neurais e o modelo de linguagem BERT, com a adição de uma ferramenta de explicabilidade, para indicar os componentes da notícias responsáveis por uma classificação. Este classificador foi treinado utilizando notícias retiradas de agências de checagem de fatos do Brasil e outros países da América Latina, além de Portugal e Espanha, coordenados pela agência Chequeado, da Argentina. Os resultados da classificação, mesmo com limitações por conta de desbalanceamento e predominância de notícias classificadas como falsa, foram satisfatórios, e aplicados às ferramentas de interpretabilidade para o desenvolvimento de uma interface. Com isso, foi possível desenvolver e disponibilizar para o público uma interface que realiza a classificação e traz uma visualização interpretável do que levou a decisão do classificador, que pode servir para auxiliar no combate desta “infodemia”, ainda um problema mesmo depois de mais de dois anos de pandemia

Metadados do item

id	UFF-2_7c11c2cdb49056089d2b88a26ea5678c
oai_identifier_str	oai:app.uff.br:1/31127
network_acronym_str	UFF-2
network_name_str	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str	2120
spelling	Uma ferramenta de interpretabilidade aplicada à classificação de desinformação sobre a COVID-19Processamento de linguagem naturalAprendizado de máquinaClassificaçãoInteligência Artificial ExplicávelCOVID-19DesinformaçãoCOVID-19Inteligência artificialFake newsNatural language processingMachine learningClassificationExplainable artificial intelligenceMisinformationA pandemia do COVID-19, vírus detectado em dezembro de 2019, infectou e matou milhões de pessoas por todo o mundo. A doença, por ser até então desconhecida, foi foco central de estudos em todas as áreas de conhecimento, e novas descobertas aconteciam diariamente. No meio dessas descobertas científicas, iniciou-se também uma disseminação constante de informações falsas, que foi denominada como “infodemia”. Essas notícias falsas, em um contexto de pandemia, podem trazer consequências gravíssimas, principalmente quando falam sobre prevenção e tratamento de maneiras ineficazes. Para auxiliar no combate ao problema da “infodemia”, este trabalho utiliza técnicas de processamento de linguagem natural e inteligência artificial explicável para desenvolver uma ferramenta de interpretabilidade de notícias relacionadas a COVID-19, através do desenvolvimento de um classificador automático de notícias, em múltiplas classes, não limitado apenas a verdadeiro e falso. Para tanto, são utilizadas redes neurais e o modelo de linguagem BERT, com a adição de uma ferramenta de explicabilidade, para indicar os componentes da notícias responsáveis por uma classificação. Este classificador foi treinado utilizando notícias retiradas de agências de checagem de fatos do Brasil e outros países da América Latina, além de Portugal e Espanha, coordenados pela agência Chequeado, da Argentina. Os resultados da classificação, mesmo com limitações por conta de desbalanceamento e predominância de notícias classificadas como falsa, foram satisfatórios, e aplicados às ferramentas de interpretabilidade para o desenvolvimento de uma interface. Com isso, foi possível desenvolver e disponibilizar para o público uma interface que realiza a classificação e traz uma visualização interpretável do que levou a decisão do classificador, que pode servir para auxiliar no combate desta “infodemia”, ainda um problema mesmo depois de mais de dois anos de pandemiaThe COVID-19 pandemic, a virus detected in December 2019, infected and killed millions worldwide. The disease was previously unknown and was the central focus of studies in all areas, with new discoveries made daily. During these scientific discoveries, false information was constantly disseminated, termed “infodemic”. . In a pandemic context, fake news can have severe consequences, especially when they talk about ineffective methods of prevention and treatment. To help stop this “infodemic”, this work relies on natural language processing techniques and explainable artificial intelligence to develop an interpretability tool for news related to COVID-19. Thus, we strive to build an automatic news classifier, using multiple classes, not limited to true and false, using neural networks and the BERT language model, and apply explainability tools to it, looking to bring more confidence to the classification. This classifier was trained using news from fact-checking agencies in Brazil and other Latin American countries, as well as Portugal and Spain, coordinated by the Chequeado agency from Argentina. The classification results, even with limitations due to imbalance and predominance of news classified as false, were satisfactory, and interpretability tools were applied to develop an interface. With this, it was possible to develop and make available to the public an interface that performs the classification and provides an interpretable view of what led to the classifier’s decision, which can serve to help combat this “infodemic” that is still a problem even after more than two years of the pandemic58 p.Carvalho, Aline Marins PaesSalgado, Luciana Cardoso de CastroLourenço, Vítor NascimentoOliveira, Mariana Suarez de2023-11-16T13:21:35Z2023-11-16T13:21:35Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfapplication/pdfOLIVEIRA, Mariana Suarez de. Uma ferramenta de interpretabilidade aplicada à classificação de desinformação sobre a COVID-19. 2023. 58 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Instituto de Computação, Universidade Federal Fluminense, Niterói, 2023.http://app.uff.br/riuff/handle/1/31127CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2023-11-16T13:21:40Zoai:app.uff.br:1/31127Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T11:02:22.355990Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv	Uma ferramenta de interpretabilidade aplicada à classificação de desinformação sobre a COVID-19
title	Uma ferramenta de interpretabilidade aplicada à classificação de desinformação sobre a COVID-19
spellingShingle	Uma ferramenta de interpretabilidade aplicada à classificação de desinformação sobre a COVID-19 Oliveira, Mariana Suarez de Processamento de linguagem natural Aprendizado de máquina Classificação Inteligência Artificial Explicável COVID-19 Desinformação COVID-19 Inteligência artificial Fake news Natural language processing Machine learning Classification Explainable artificial intelligence Misinformation
title_short	Uma ferramenta de interpretabilidade aplicada à classificação de desinformação sobre a COVID-19
title_full	Uma ferramenta de interpretabilidade aplicada à classificação de desinformação sobre a COVID-19
title_fullStr	Uma ferramenta de interpretabilidade aplicada à classificação de desinformação sobre a COVID-19
title_full_unstemmed	Uma ferramenta de interpretabilidade aplicada à classificação de desinformação sobre a COVID-19
title_sort	Uma ferramenta de interpretabilidade aplicada à classificação de desinformação sobre a COVID-19
author	Oliveira, Mariana Suarez de
author_facet	Oliveira, Mariana Suarez de
author_role	author
dc.contributor.none.fl_str_mv	Carvalho, Aline Marins Paes Salgado, Luciana Cardoso de Castro Lourenço, Vítor Nascimento
dc.contributor.author.fl_str_mv	Oliveira, Mariana Suarez de
dc.subject.por.fl_str_mv	Processamento de linguagem natural Aprendizado de máquina Classificação Inteligência Artificial Explicável COVID-19 Desinformação COVID-19 Inteligência artificial Fake news Natural language processing Machine learning Classification Explainable artificial intelligence Misinformation
topic	Processamento de linguagem natural Aprendizado de máquina Classificação Inteligência Artificial Explicável COVID-19 Desinformação COVID-19 Inteligência artificial Fake news Natural language processing Machine learning Classification Explainable artificial intelligence Misinformation
description	A pandemia do COVID-19, vírus detectado em dezembro de 2019, infectou e matou milhões de pessoas por todo o mundo. A doença, por ser até então desconhecida, foi foco central de estudos em todas as áreas de conhecimento, e novas descobertas aconteciam diariamente. No meio dessas descobertas científicas, iniciou-se também uma disseminação constante de informações falsas, que foi denominada como “infodemia”. Essas notícias falsas, em um contexto de pandemia, podem trazer consequências gravíssimas, principalmente quando falam sobre prevenção e tratamento de maneiras ineficazes. Para auxiliar no combate ao problema da “infodemia”, este trabalho utiliza técnicas de processamento de linguagem natural e inteligência artificial explicável para desenvolver uma ferramenta de interpretabilidade de notícias relacionadas a COVID-19, através do desenvolvimento de um classificador automático de notícias, em múltiplas classes, não limitado apenas a verdadeiro e falso. Para tanto, são utilizadas redes neurais e o modelo de linguagem BERT, com a adição de uma ferramenta de explicabilidade, para indicar os componentes da notícias responsáveis por uma classificação. Este classificador foi treinado utilizando notícias retiradas de agências de checagem de fatos do Brasil e outros países da América Latina, além de Portugal e Espanha, coordenados pela agência Chequeado, da Argentina. Os resultados da classificação, mesmo com limitações por conta de desbalanceamento e predominância de notícias classificadas como falsa, foram satisfatórios, e aplicados às ferramentas de interpretabilidade para o desenvolvimento de uma interface. Com isso, foi possível desenvolver e disponibilizar para o público uma interface que realiza a classificação e traz uma visualização interpretável do que levou a decisão do classificador, que pode servir para auxiliar no combate desta “infodemia”, ainda um problema mesmo depois de mais de dois anos de pandemia
publishDate	2023
dc.date.none.fl_str_mv	2023-11-16T13:21:35Z 2023-11-16T13:21:35Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	OLIVEIRA, Mariana Suarez de. Uma ferramenta de interpretabilidade aplicada à classificação de desinformação sobre a COVID-19. 2023. 58 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Instituto de Computação, Universidade Federal Fluminense, Niterói, 2023. http://app.uff.br/riuff/handle/1/31127
identifier_str_mv	OLIVEIRA, Mariana Suarez de. Uma ferramenta de interpretabilidade aplicada à classificação de desinformação sobre a COVID-19. 2023. 58 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Instituto de Computação, Universidade Federal Fluminense, Niterói, 2023.
url	http://app.uff.br/riuff/handle/1/31127
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	CC-BY-SA info:eu-repo/semantics/openAccess
rights_invalid_str_mv	CC-BY-SA
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF
instname_str	Universidade Federal Fluminense (UFF)
instacron_str	UFF
institution	UFF
reponame_str	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv	Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv	riuff@id.uff.br
_version_	1811823642941587456

Uma ferramenta de interpretabilidade aplicada à classificação de desinformação sobre a COVID-19

Registros relacionados