Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação

Detalhes bibliográficos
Autor(a) principal: Guimarães, Lucas Marques Sathler
Data de Publicação: 2019
Outros Autores: Meireles, Magali Rezende Gouvêa, Almeida, Paulo Eduardo Maciel de
Tipo de documento: Artigo
Idioma: por
Título da fonte: Perspectivas em Ciência da Informação (Online)
Texto Completo: https://periodicos.ufmg.br/index.php/pci/article/view/22609
Resumo: A quantidade de dados não estruturados cresce com a popularização da Internet. Textos em linguagem natural representam um conjunto relevante e significativo para análise e produção de conhecimento. Este trabalho propõe uma análise quantitativa das etapas de pré-processamento e de treinamento de um classificador de textos, que utiliza os sentimentos expressos pelos usuários como atributo. Para realização dos experimentos, foram utilizadas Redes Neurais Artificiais, como algoritmo classificador, e textos provenientes dos sites Amazon, IMDB e Yelp. As bases permitem análise da expressão de sentimentos positivos e negativos dos usuários em avaliações de produtos e serviços em textos não estruturados. Foram realizados dois processos distintos de pré-processamento e diferentes treinamentos das Redes Neurais Artificiais para classificação do conjunto textual. Os resultados confirmam, quantitativamente, a importância das etapas de pré-processamento e de treinamento do classificador, evidenciando a importância do vocabulário selecionado para a representação do texto e para a classificação. As técnicas de classificação disponíveis alcançam resultados satisfatórios. No entanto, mesmo utilizando-se dois processos distintos de pré-processamento e identificando-se o melhor processo de treinamento, não foi possível eliminar, totalmente, as dificuldades de aprendizado e compreensão do modelo para as classificações de sentimentos que envolviam características subjetivas da expressão do sentimento humano.
id UFMG-2_e372570c8ba8ece3d0d6f781ecc2f3cc
oai_identifier_str oai:periodicos.ufmg.br:article/22609
network_acronym_str UFMG-2
network_name_str Perspectivas em Ciência da Informação (Online)
repository_id_str
spelling Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informaçãoClassificaçãoProcessamento de Linguagem NaturalRecuperação da InformaçãoRedes Neurais ArtificiaisTreinamentoA quantidade de dados não estruturados cresce com a popularização da Internet. Textos em linguagem natural representam um conjunto relevante e significativo para análise e produção de conhecimento. Este trabalho propõe uma análise quantitativa das etapas de pré-processamento e de treinamento de um classificador de textos, que utiliza os sentimentos expressos pelos usuários como atributo. Para realização dos experimentos, foram utilizadas Redes Neurais Artificiais, como algoritmo classificador, e textos provenientes dos sites Amazon, IMDB e Yelp. As bases permitem análise da expressão de sentimentos positivos e negativos dos usuários em avaliações de produtos e serviços em textos não estruturados. Foram realizados dois processos distintos de pré-processamento e diferentes treinamentos das Redes Neurais Artificiais para classificação do conjunto textual. Os resultados confirmam, quantitativamente, a importância das etapas de pré-processamento e de treinamento do classificador, evidenciando a importância do vocabulário selecionado para a representação do texto e para a classificação. As técnicas de classificação disponíveis alcançam resultados satisfatórios. No entanto, mesmo utilizando-se dois processos distintos de pré-processamento e identificando-se o melhor processo de treinamento, não foi possível eliminar, totalmente, as dificuldades de aprendizado e compreensão do modelo para as classificações de sentimentos que envolviam características subjetivas da expressão do sentimento humano.Perspectivas em Ciência da InformaçãoPerspectivas em Ciência da InformaçãoPerspectivas em Ciência da Informação2019-04-15info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://periodicos.ufmg.br/index.php/pci/article/view/22609Perspectivas em Ciência da Informação; Vol. 24 No. 1 (2019); 169-190Perspectivas em Ciência da Informação; Vol. 24 Núm. 1 (2019); 169-190Perspectivas em Ciência da Informação; v. 24 n. 1 (2019); 169-1901981-53441413-9936reponame:Perspectivas em Ciência da Informação (Online)instname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGporhttps://periodicos.ufmg.br/index.php/pci/article/view/22609/18193Copyright (c) 2019 Perspectivas em Ciência da Informaçãoinfo:eu-repo/semantics/openAccessGuimarães, Lucas Marques SathlerMeireles, Magali Rezende GouvêaAlmeida, Paulo Eduardo Maciel de2020-06-26T12:18:38Zoai:periodicos.ufmg.br:article/22609Revistahttps://periodicos.ufmg.br/index.php/pci/PUBhttps://periodicos.ufmg.br/index.php/pci/oai||pci@eci.ufmg.br1981-53441413-9936opendoar:2020-06-26T12:18:38Perspectivas em Ciência da Informação (Online) - Universidade Federal de Minas Gerais (UFMG)false
dc.title.none.fl_str_mv Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação
title Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação
spellingShingle Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação
Guimarães, Lucas Marques Sathler
Classificação
Processamento de Linguagem Natural
Recuperação da Informação
Redes Neurais Artificiais
Treinamento
title_short Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação
title_full Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação
title_fullStr Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação
title_full_unstemmed Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação
title_sort Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação
author Guimarães, Lucas Marques Sathler
author_facet Guimarães, Lucas Marques Sathler
Meireles, Magali Rezende Gouvêa
Almeida, Paulo Eduardo Maciel de
author_role author
author2 Meireles, Magali Rezende Gouvêa
Almeida, Paulo Eduardo Maciel de
author2_role author
author
dc.contributor.author.fl_str_mv Guimarães, Lucas Marques Sathler
Meireles, Magali Rezende Gouvêa
Almeida, Paulo Eduardo Maciel de
dc.subject.por.fl_str_mv Classificação
Processamento de Linguagem Natural
Recuperação da Informação
Redes Neurais Artificiais
Treinamento
topic Classificação
Processamento de Linguagem Natural
Recuperação da Informação
Redes Neurais Artificiais
Treinamento
description A quantidade de dados não estruturados cresce com a popularização da Internet. Textos em linguagem natural representam um conjunto relevante e significativo para análise e produção de conhecimento. Este trabalho propõe uma análise quantitativa das etapas de pré-processamento e de treinamento de um classificador de textos, que utiliza os sentimentos expressos pelos usuários como atributo. Para realização dos experimentos, foram utilizadas Redes Neurais Artificiais, como algoritmo classificador, e textos provenientes dos sites Amazon, IMDB e Yelp. As bases permitem análise da expressão de sentimentos positivos e negativos dos usuários em avaliações de produtos e serviços em textos não estruturados. Foram realizados dois processos distintos de pré-processamento e diferentes treinamentos das Redes Neurais Artificiais para classificação do conjunto textual. Os resultados confirmam, quantitativamente, a importância das etapas de pré-processamento e de treinamento do classificador, evidenciando a importância do vocabulário selecionado para a representação do texto e para a classificação. As técnicas de classificação disponíveis alcançam resultados satisfatórios. No entanto, mesmo utilizando-se dois processos distintos de pré-processamento e identificando-se o melhor processo de treinamento, não foi possível eliminar, totalmente, as dificuldades de aprendizado e compreensão do modelo para as classificações de sentimentos que envolviam características subjetivas da expressão do sentimento humano.
publishDate 2019
dc.date.none.fl_str_mv 2019-04-15
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://periodicos.ufmg.br/index.php/pci/article/view/22609
url https://periodicos.ufmg.br/index.php/pci/article/view/22609
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://periodicos.ufmg.br/index.php/pci/article/view/22609/18193
dc.rights.driver.fl_str_mv Copyright (c) 2019 Perspectivas em Ciência da Informação
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2019 Perspectivas em Ciência da Informação
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Perspectivas em Ciência da Informação
Perspectivas em Ciência da Informação
Perspectivas em Ciência da Informação
publisher.none.fl_str_mv Perspectivas em Ciência da Informação
Perspectivas em Ciência da Informação
Perspectivas em Ciência da Informação
dc.source.none.fl_str_mv Perspectivas em Ciência da Informação; Vol. 24 No. 1 (2019); 169-190
Perspectivas em Ciência da Informação; Vol. 24 Núm. 1 (2019); 169-190
Perspectivas em Ciência da Informação; v. 24 n. 1 (2019); 169-190
1981-5344
1413-9936
reponame:Perspectivas em Ciência da Informação (Online)
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Perspectivas em Ciência da Informação (Online)
collection Perspectivas em Ciência da Informação (Online)
repository.name.fl_str_mv Perspectivas em Ciência da Informação (Online) - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv ||pci@eci.ufmg.br
_version_ 1799711080302247936