Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Outros Autores: | , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Perspectivas em Ciência da Informação (Online) |
Texto Completo: | https://periodicos.ufmg.br/index.php/pci/article/view/22609 |
Resumo: | A quantidade de dados não estruturados cresce com a popularização da Internet. Textos em linguagem natural representam um conjunto relevante e significativo para análise e produção de conhecimento. Este trabalho propõe uma análise quantitativa das etapas de pré-processamento e de treinamento de um classificador de textos, que utiliza os sentimentos expressos pelos usuários como atributo. Para realização dos experimentos, foram utilizadas Redes Neurais Artificiais, como algoritmo classificador, e textos provenientes dos sites Amazon, IMDB e Yelp. As bases permitem análise da expressão de sentimentos positivos e negativos dos usuários em avaliações de produtos e serviços em textos não estruturados. Foram realizados dois processos distintos de pré-processamento e diferentes treinamentos das Redes Neurais Artificiais para classificação do conjunto textual. Os resultados confirmam, quantitativamente, a importância das etapas de pré-processamento e de treinamento do classificador, evidenciando a importância do vocabulário selecionado para a representação do texto e para a classificação. As técnicas de classificação disponíveis alcançam resultados satisfatórios. No entanto, mesmo utilizando-se dois processos distintos de pré-processamento e identificando-se o melhor processo de treinamento, não foi possível eliminar, totalmente, as dificuldades de aprendizado e compreensão do modelo para as classificações de sentimentos que envolviam características subjetivas da expressão do sentimento humano. |
id |
UFMG-2_e372570c8ba8ece3d0d6f781ecc2f3cc |
---|---|
oai_identifier_str |
oai:periodicos.ufmg.br:article/22609 |
network_acronym_str |
UFMG-2 |
network_name_str |
Perspectivas em Ciência da Informação (Online) |
repository_id_str |
|
spelling |
Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informaçãoClassificaçãoProcessamento de Linguagem NaturalRecuperação da InformaçãoRedes Neurais ArtificiaisTreinamentoA quantidade de dados não estruturados cresce com a popularização da Internet. Textos em linguagem natural representam um conjunto relevante e significativo para análise e produção de conhecimento. Este trabalho propõe uma análise quantitativa das etapas de pré-processamento e de treinamento de um classificador de textos, que utiliza os sentimentos expressos pelos usuários como atributo. Para realização dos experimentos, foram utilizadas Redes Neurais Artificiais, como algoritmo classificador, e textos provenientes dos sites Amazon, IMDB e Yelp. As bases permitem análise da expressão de sentimentos positivos e negativos dos usuários em avaliações de produtos e serviços em textos não estruturados. Foram realizados dois processos distintos de pré-processamento e diferentes treinamentos das Redes Neurais Artificiais para classificação do conjunto textual. Os resultados confirmam, quantitativamente, a importância das etapas de pré-processamento e de treinamento do classificador, evidenciando a importância do vocabulário selecionado para a representação do texto e para a classificação. As técnicas de classificação disponíveis alcançam resultados satisfatórios. No entanto, mesmo utilizando-se dois processos distintos de pré-processamento e identificando-se o melhor processo de treinamento, não foi possível eliminar, totalmente, as dificuldades de aprendizado e compreensão do modelo para as classificações de sentimentos que envolviam características subjetivas da expressão do sentimento humano.Perspectivas em Ciência da InformaçãoPerspectivas em Ciência da InformaçãoPerspectivas em Ciência da Informação2019-04-15info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://periodicos.ufmg.br/index.php/pci/article/view/22609Perspectivas em Ciência da Informação; Vol. 24 No. 1 (2019); 169-190Perspectivas em Ciência da Informação; Vol. 24 Núm. 1 (2019); 169-190Perspectivas em Ciência da Informação; v. 24 n. 1 (2019); 169-1901981-53441413-9936reponame:Perspectivas em Ciência da Informação (Online)instname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGporhttps://periodicos.ufmg.br/index.php/pci/article/view/22609/18193Copyright (c) 2019 Perspectivas em Ciência da Informaçãoinfo:eu-repo/semantics/openAccessGuimarães, Lucas Marques SathlerMeireles, Magali Rezende GouvêaAlmeida, Paulo Eduardo Maciel de2020-06-26T12:18:38Zoai:periodicos.ufmg.br:article/22609Revistahttps://periodicos.ufmg.br/index.php/pci/PUBhttps://periodicos.ufmg.br/index.php/pci/oai||pci@eci.ufmg.br1981-53441413-9936opendoar:2020-06-26T12:18:38Perspectivas em Ciência da Informação (Online) - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.none.fl_str_mv |
Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação |
title |
Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação |
spellingShingle |
Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação Guimarães, Lucas Marques Sathler Classificação Processamento de Linguagem Natural Recuperação da Informação Redes Neurais Artificiais Treinamento |
title_short |
Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação |
title_full |
Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação |
title_fullStr |
Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação |
title_full_unstemmed |
Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação |
title_sort |
Avaliação das etapas de pré-processamento e de treinamento em algoritmos de classificação de textos no contexto da recuperação da informação |
author |
Guimarães, Lucas Marques Sathler |
author_facet |
Guimarães, Lucas Marques Sathler Meireles, Magali Rezende Gouvêa Almeida, Paulo Eduardo Maciel de |
author_role |
author |
author2 |
Meireles, Magali Rezende Gouvêa Almeida, Paulo Eduardo Maciel de |
author2_role |
author author |
dc.contributor.author.fl_str_mv |
Guimarães, Lucas Marques Sathler Meireles, Magali Rezende Gouvêa Almeida, Paulo Eduardo Maciel de |
dc.subject.por.fl_str_mv |
Classificação Processamento de Linguagem Natural Recuperação da Informação Redes Neurais Artificiais Treinamento |
topic |
Classificação Processamento de Linguagem Natural Recuperação da Informação Redes Neurais Artificiais Treinamento |
description |
A quantidade de dados não estruturados cresce com a popularização da Internet. Textos em linguagem natural representam um conjunto relevante e significativo para análise e produção de conhecimento. Este trabalho propõe uma análise quantitativa das etapas de pré-processamento e de treinamento de um classificador de textos, que utiliza os sentimentos expressos pelos usuários como atributo. Para realização dos experimentos, foram utilizadas Redes Neurais Artificiais, como algoritmo classificador, e textos provenientes dos sites Amazon, IMDB e Yelp. As bases permitem análise da expressão de sentimentos positivos e negativos dos usuários em avaliações de produtos e serviços em textos não estruturados. Foram realizados dois processos distintos de pré-processamento e diferentes treinamentos das Redes Neurais Artificiais para classificação do conjunto textual. Os resultados confirmam, quantitativamente, a importância das etapas de pré-processamento e de treinamento do classificador, evidenciando a importância do vocabulário selecionado para a representação do texto e para a classificação. As técnicas de classificação disponíveis alcançam resultados satisfatórios. No entanto, mesmo utilizando-se dois processos distintos de pré-processamento e identificando-se o melhor processo de treinamento, não foi possível eliminar, totalmente, as dificuldades de aprendizado e compreensão do modelo para as classificações de sentimentos que envolviam características subjetivas da expressão do sentimento humano. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-04-15 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://periodicos.ufmg.br/index.php/pci/article/view/22609 |
url |
https://periodicos.ufmg.br/index.php/pci/article/view/22609 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://periodicos.ufmg.br/index.php/pci/article/view/22609/18193 |
dc.rights.driver.fl_str_mv |
Copyright (c) 2019 Perspectivas em Ciência da Informação info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Copyright (c) 2019 Perspectivas em Ciência da Informação |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Perspectivas em Ciência da Informação Perspectivas em Ciência da Informação Perspectivas em Ciência da Informação |
publisher.none.fl_str_mv |
Perspectivas em Ciência da Informação Perspectivas em Ciência da Informação Perspectivas em Ciência da Informação |
dc.source.none.fl_str_mv |
Perspectivas em Ciência da Informação; Vol. 24 No. 1 (2019); 169-190 Perspectivas em Ciência da Informação; Vol. 24 Núm. 1 (2019); 169-190 Perspectivas em Ciência da Informação; v. 24 n. 1 (2019); 169-190 1981-5344 1413-9936 reponame:Perspectivas em Ciência da Informação (Online) instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Perspectivas em Ciência da Informação (Online) |
collection |
Perspectivas em Ciência da Informação (Online) |
repository.name.fl_str_mv |
Perspectivas em Ciência da Informação (Online) - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
||pci@eci.ufmg.br |
_version_ |
1799711080302247936 |