Avaliação do desempenho de um software de sumarização automática de textos

Detalhes bibliográficos
Autor(a) principal: Tabosa, Hamilton Rodrigues
Data de Publicação: 2020
Outros Autores: Souza, Osvaldo de, Cândido, José Carlos dos Santos, Melo, Ana Cristina Azevedo Ursulino, Reis, Keila Giullianna Braga
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal do Ceará (UFC)
dARK ID: ark:/83112/001300000qtkm
Texto Completo: http://www.repositorio.ufc.br/handle/riufc/51441
Resumo: Introdução: Desde 2014 desenvolvemos uma pesquisa com o intuito de produzir um software (protótipo) que seria capaz de elaborar resumos automáticos de textos baseado em técnicas de Processamento de Linguagem Natural e estatísticas de frequência de palavras. Os primeiros testes da ferramenta geraram resultados que indicaram uma significativa redução da dimensionalidade dos textos, com considerável preservação do seu valor semântico. Objetivo: Neste artigo, apresentamos os resultados da continuidade do nosso trabalho investigativo, a partir de uma avaliação humana da qualidade desses resumos baseada na realização de testes cegos. Metodologia: Um grupo de três bibliotecárias recebeu um bloco misto e não identificado de resumos - produzidos por humanos e os resumos automáticos feitos pelo software - e procedeu a uma avaliação, segundo os critérios de corretude gramatical, preservação das ideias centrais, coerência e legibilidade, extensão do resumo, se houve paráfrase ou cópia de fragmentos e, se houve introdução de ideias não contidas no texto original. Resultados: Os resultados mostraram que em quatro, dos cinco critérios de avaliação adotados, houve equivalência qualitativa entre os resumos produzidos por humanos e os produzidos pelo software, o que parece representar um relativo sucesso, uma vez que o protótipo poderia substituir uma pessoa na atividade de resumir textos sem deixar a desejar, a não ser no quinto critério de avaliação, referente à dimensão do resumo, em que o texto produzido pelo software foi apontado como extenso além do necessário. Conclusões: Apesar dos bons resultados do protótipo, percebemos a necessidade de melhorias em seu desempenho, além de avaliá-lo por métodos mais abrangentes, a partir de amostras mais representativas e por um grupo maior de avaliadores.
id UFC-7_dda97a1b4962a1d424e7f51db3f3e39d
oai_identifier_str oai:repositorio.ufc.br:riufc/51441
network_acronym_str UFC-7
network_name_str Repositório Institucional da Universidade Federal do Ceará (UFC)
repository_id_str
spelling Avaliação do desempenho de um software de sumarização automática de textosSumarização automática de textosAcesso à informaçãoLinguagem natural (processamento)Mediação (prática)Introdução: Desde 2014 desenvolvemos uma pesquisa com o intuito de produzir um software (protótipo) que seria capaz de elaborar resumos automáticos de textos baseado em técnicas de Processamento de Linguagem Natural e estatísticas de frequência de palavras. Os primeiros testes da ferramenta geraram resultados que indicaram uma significativa redução da dimensionalidade dos textos, com considerável preservação do seu valor semântico. Objetivo: Neste artigo, apresentamos os resultados da continuidade do nosso trabalho investigativo, a partir de uma avaliação humana da qualidade desses resumos baseada na realização de testes cegos. Metodologia: Um grupo de três bibliotecárias recebeu um bloco misto e não identificado de resumos - produzidos por humanos e os resumos automáticos feitos pelo software - e procedeu a uma avaliação, segundo os critérios de corretude gramatical, preservação das ideias centrais, coerência e legibilidade, extensão do resumo, se houve paráfrase ou cópia de fragmentos e, se houve introdução de ideias não contidas no texto original. Resultados: Os resultados mostraram que em quatro, dos cinco critérios de avaliação adotados, houve equivalência qualitativa entre os resumos produzidos por humanos e os produzidos pelo software, o que parece representar um relativo sucesso, uma vez que o protótipo poderia substituir uma pessoa na atividade de resumir textos sem deixar a desejar, a não ser no quinto critério de avaliação, referente à dimensão do resumo, em que o texto produzido pelo software foi apontado como extenso além do necessário. Conclusões: Apesar dos bons resultados do protótipo, percebemos a necessidade de melhorias em seu desempenho, além de avaliá-lo por métodos mais abrangentes, a partir de amostras mais representativas e por um grupo maior de avaliadores.2020-04-25T16:14:10Z2020-04-25T16:14:10Z2020info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfTABOSA, Hamilton Rodrigues; SOUZA, Osvaldo de; CÂNDIDO, José Carlos dos Santos; MELO, Ana Cristina Azevedo Ursulino; REIS, Keila Giullianna Braga. Avaliação do desempenho de um software de sumarização automática de textos. Informação & Informação, Londrina, v. 25, n. 1, p. 189-210, jan./mar. 2020.http://www.repositorio.ufc.br/handle/riufc/51441ark:/83112/001300000qtkmTabosa, Hamilton RodriguesSouza, Osvaldo deCândido, José Carlos dos SantosMelo, Ana Cristina Azevedo UrsulinoReis, Keila Giullianna Bragainfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFC2023-10-30T18:02:10Zoai:repositorio.ufc.br:riufc/51441Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br || repositorio@ufc.bropendoar:2024-09-11T18:15:53.598423Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false
dc.title.none.fl_str_mv Avaliação do desempenho de um software de sumarização automática de textos
title Avaliação do desempenho de um software de sumarização automática de textos
spellingShingle Avaliação do desempenho de um software de sumarização automática de textos
Tabosa, Hamilton Rodrigues
Sumarização automática de textos
Acesso à informação
Linguagem natural (processamento)
Mediação (prática)
title_short Avaliação do desempenho de um software de sumarização automática de textos
title_full Avaliação do desempenho de um software de sumarização automática de textos
title_fullStr Avaliação do desempenho de um software de sumarização automática de textos
title_full_unstemmed Avaliação do desempenho de um software de sumarização automática de textos
title_sort Avaliação do desempenho de um software de sumarização automática de textos
author Tabosa, Hamilton Rodrigues
author_facet Tabosa, Hamilton Rodrigues
Souza, Osvaldo de
Cândido, José Carlos dos Santos
Melo, Ana Cristina Azevedo Ursulino
Reis, Keila Giullianna Braga
author_role author
author2 Souza, Osvaldo de
Cândido, José Carlos dos Santos
Melo, Ana Cristina Azevedo Ursulino
Reis, Keila Giullianna Braga
author2_role author
author
author
author
dc.contributor.author.fl_str_mv Tabosa, Hamilton Rodrigues
Souza, Osvaldo de
Cândido, José Carlos dos Santos
Melo, Ana Cristina Azevedo Ursulino
Reis, Keila Giullianna Braga
dc.subject.por.fl_str_mv Sumarização automática de textos
Acesso à informação
Linguagem natural (processamento)
Mediação (prática)
topic Sumarização automática de textos
Acesso à informação
Linguagem natural (processamento)
Mediação (prática)
description Introdução: Desde 2014 desenvolvemos uma pesquisa com o intuito de produzir um software (protótipo) que seria capaz de elaborar resumos automáticos de textos baseado em técnicas de Processamento de Linguagem Natural e estatísticas de frequência de palavras. Os primeiros testes da ferramenta geraram resultados que indicaram uma significativa redução da dimensionalidade dos textos, com considerável preservação do seu valor semântico. Objetivo: Neste artigo, apresentamos os resultados da continuidade do nosso trabalho investigativo, a partir de uma avaliação humana da qualidade desses resumos baseada na realização de testes cegos. Metodologia: Um grupo de três bibliotecárias recebeu um bloco misto e não identificado de resumos - produzidos por humanos e os resumos automáticos feitos pelo software - e procedeu a uma avaliação, segundo os critérios de corretude gramatical, preservação das ideias centrais, coerência e legibilidade, extensão do resumo, se houve paráfrase ou cópia de fragmentos e, se houve introdução de ideias não contidas no texto original. Resultados: Os resultados mostraram que em quatro, dos cinco critérios de avaliação adotados, houve equivalência qualitativa entre os resumos produzidos por humanos e os produzidos pelo software, o que parece representar um relativo sucesso, uma vez que o protótipo poderia substituir uma pessoa na atividade de resumir textos sem deixar a desejar, a não ser no quinto critério de avaliação, referente à dimensão do resumo, em que o texto produzido pelo software foi apontado como extenso além do necessário. Conclusões: Apesar dos bons resultados do protótipo, percebemos a necessidade de melhorias em seu desempenho, além de avaliá-lo por métodos mais abrangentes, a partir de amostras mais representativas e por um grupo maior de avaliadores.
publishDate 2020
dc.date.none.fl_str_mv 2020-04-25T16:14:10Z
2020-04-25T16:14:10Z
2020
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv TABOSA, Hamilton Rodrigues; SOUZA, Osvaldo de; CÂNDIDO, José Carlos dos Santos; MELO, Ana Cristina Azevedo Ursulino; REIS, Keila Giullianna Braga. Avaliação do desempenho de um software de sumarização automática de textos. Informação & Informação, Londrina, v. 25, n. 1, p. 189-210, jan./mar. 2020.
http://www.repositorio.ufc.br/handle/riufc/51441
dc.identifier.dark.fl_str_mv ark:/83112/001300000qtkm
identifier_str_mv TABOSA, Hamilton Rodrigues; SOUZA, Osvaldo de; CÂNDIDO, José Carlos dos Santos; MELO, Ana Cristina Azevedo Ursulino; REIS, Keila Giullianna Braga. Avaliação do desempenho de um software de sumarização automática de textos. Informação & Informação, Londrina, v. 25, n. 1, p. 189-210, jan./mar. 2020.
ark:/83112/001300000qtkm
url http://www.repositorio.ufc.br/handle/riufc/51441
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Ceará (UFC)
instname:Universidade Federal do Ceará (UFC)
instacron:UFC
instname_str Universidade Federal do Ceará (UFC)
instacron_str UFC
institution UFC
reponame_str Repositório Institucional da Universidade Federal do Ceará (UFC)
collection Repositório Institucional da Universidade Federal do Ceará (UFC)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)
repository.mail.fl_str_mv bu@ufc.br || repositorio@ufc.br
_version_ 1818373819636645888