Avaliação do desempenho de um software de sumarização automática de textos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Outros Autores: | , , , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal do Ceará (UFC) |
dARK ID: | ark:/83112/001300000qtkm |
Texto Completo: | http://www.repositorio.ufc.br/handle/riufc/51441 |
Resumo: | Introdução: Desde 2014 desenvolvemos uma pesquisa com o intuito de produzir um software (protótipo) que seria capaz de elaborar resumos automáticos de textos baseado em técnicas de Processamento de Linguagem Natural e estatísticas de frequência de palavras. Os primeiros testes da ferramenta geraram resultados que indicaram uma significativa redução da dimensionalidade dos textos, com considerável preservação do seu valor semântico. Objetivo: Neste artigo, apresentamos os resultados da continuidade do nosso trabalho investigativo, a partir de uma avaliação humana da qualidade desses resumos baseada na realização de testes cegos. Metodologia: Um grupo de três bibliotecárias recebeu um bloco misto e não identificado de resumos - produzidos por humanos e os resumos automáticos feitos pelo software - e procedeu a uma avaliação, segundo os critérios de corretude gramatical, preservação das ideias centrais, coerência e legibilidade, extensão do resumo, se houve paráfrase ou cópia de fragmentos e, se houve introdução de ideias não contidas no texto original. Resultados: Os resultados mostraram que em quatro, dos cinco critérios de avaliação adotados, houve equivalência qualitativa entre os resumos produzidos por humanos e os produzidos pelo software, o que parece representar um relativo sucesso, uma vez que o protótipo poderia substituir uma pessoa na atividade de resumir textos sem deixar a desejar, a não ser no quinto critério de avaliação, referente à dimensão do resumo, em que o texto produzido pelo software foi apontado como extenso além do necessário. Conclusões: Apesar dos bons resultados do protótipo, percebemos a necessidade de melhorias em seu desempenho, além de avaliá-lo por métodos mais abrangentes, a partir de amostras mais representativas e por um grupo maior de avaliadores. |
id |
UFC-7_dda97a1b4962a1d424e7f51db3f3e39d |
---|---|
oai_identifier_str |
oai:repositorio.ufc.br:riufc/51441 |
network_acronym_str |
UFC-7 |
network_name_str |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
repository_id_str |
|
spelling |
Avaliação do desempenho de um software de sumarização automática de textosSumarização automática de textosAcesso à informaçãoLinguagem natural (processamento)Mediação (prática)Introdução: Desde 2014 desenvolvemos uma pesquisa com o intuito de produzir um software (protótipo) que seria capaz de elaborar resumos automáticos de textos baseado em técnicas de Processamento de Linguagem Natural e estatísticas de frequência de palavras. Os primeiros testes da ferramenta geraram resultados que indicaram uma significativa redução da dimensionalidade dos textos, com considerável preservação do seu valor semântico. Objetivo: Neste artigo, apresentamos os resultados da continuidade do nosso trabalho investigativo, a partir de uma avaliação humana da qualidade desses resumos baseada na realização de testes cegos. Metodologia: Um grupo de três bibliotecárias recebeu um bloco misto e não identificado de resumos - produzidos por humanos e os resumos automáticos feitos pelo software - e procedeu a uma avaliação, segundo os critérios de corretude gramatical, preservação das ideias centrais, coerência e legibilidade, extensão do resumo, se houve paráfrase ou cópia de fragmentos e, se houve introdução de ideias não contidas no texto original. Resultados: Os resultados mostraram que em quatro, dos cinco critérios de avaliação adotados, houve equivalência qualitativa entre os resumos produzidos por humanos e os produzidos pelo software, o que parece representar um relativo sucesso, uma vez que o protótipo poderia substituir uma pessoa na atividade de resumir textos sem deixar a desejar, a não ser no quinto critério de avaliação, referente à dimensão do resumo, em que o texto produzido pelo software foi apontado como extenso além do necessário. Conclusões: Apesar dos bons resultados do protótipo, percebemos a necessidade de melhorias em seu desempenho, além de avaliá-lo por métodos mais abrangentes, a partir de amostras mais representativas e por um grupo maior de avaliadores.2020-04-25T16:14:10Z2020-04-25T16:14:10Z2020info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfTABOSA, Hamilton Rodrigues; SOUZA, Osvaldo de; CÂNDIDO, José Carlos dos Santos; MELO, Ana Cristina Azevedo Ursulino; REIS, Keila Giullianna Braga. Avaliação do desempenho de um software de sumarização automática de textos. Informação & Informação, Londrina, v. 25, n. 1, p. 189-210, jan./mar. 2020.http://www.repositorio.ufc.br/handle/riufc/51441ark:/83112/001300000qtkmTabosa, Hamilton RodriguesSouza, Osvaldo deCândido, José Carlos dos SantosMelo, Ana Cristina Azevedo UrsulinoReis, Keila Giullianna Bragainfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFC2023-10-30T18:02:10Zoai:repositorio.ufc.br:riufc/51441Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br || repositorio@ufc.bropendoar:2024-09-11T18:15:53.598423Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false |
dc.title.none.fl_str_mv |
Avaliação do desempenho de um software de sumarização automática de textos |
title |
Avaliação do desempenho de um software de sumarização automática de textos |
spellingShingle |
Avaliação do desempenho de um software de sumarização automática de textos Tabosa, Hamilton Rodrigues Sumarização automática de textos Acesso à informação Linguagem natural (processamento) Mediação (prática) |
title_short |
Avaliação do desempenho de um software de sumarização automática de textos |
title_full |
Avaliação do desempenho de um software de sumarização automática de textos |
title_fullStr |
Avaliação do desempenho de um software de sumarização automática de textos |
title_full_unstemmed |
Avaliação do desempenho de um software de sumarização automática de textos |
title_sort |
Avaliação do desempenho de um software de sumarização automática de textos |
author |
Tabosa, Hamilton Rodrigues |
author_facet |
Tabosa, Hamilton Rodrigues Souza, Osvaldo de Cândido, José Carlos dos Santos Melo, Ana Cristina Azevedo Ursulino Reis, Keila Giullianna Braga |
author_role |
author |
author2 |
Souza, Osvaldo de Cândido, José Carlos dos Santos Melo, Ana Cristina Azevedo Ursulino Reis, Keila Giullianna Braga |
author2_role |
author author author author |
dc.contributor.author.fl_str_mv |
Tabosa, Hamilton Rodrigues Souza, Osvaldo de Cândido, José Carlos dos Santos Melo, Ana Cristina Azevedo Ursulino Reis, Keila Giullianna Braga |
dc.subject.por.fl_str_mv |
Sumarização automática de textos Acesso à informação Linguagem natural (processamento) Mediação (prática) |
topic |
Sumarização automática de textos Acesso à informação Linguagem natural (processamento) Mediação (prática) |
description |
Introdução: Desde 2014 desenvolvemos uma pesquisa com o intuito de produzir um software (protótipo) que seria capaz de elaborar resumos automáticos de textos baseado em técnicas de Processamento de Linguagem Natural e estatísticas de frequência de palavras. Os primeiros testes da ferramenta geraram resultados que indicaram uma significativa redução da dimensionalidade dos textos, com considerável preservação do seu valor semântico. Objetivo: Neste artigo, apresentamos os resultados da continuidade do nosso trabalho investigativo, a partir de uma avaliação humana da qualidade desses resumos baseada na realização de testes cegos. Metodologia: Um grupo de três bibliotecárias recebeu um bloco misto e não identificado de resumos - produzidos por humanos e os resumos automáticos feitos pelo software - e procedeu a uma avaliação, segundo os critérios de corretude gramatical, preservação das ideias centrais, coerência e legibilidade, extensão do resumo, se houve paráfrase ou cópia de fragmentos e, se houve introdução de ideias não contidas no texto original. Resultados: Os resultados mostraram que em quatro, dos cinco critérios de avaliação adotados, houve equivalência qualitativa entre os resumos produzidos por humanos e os produzidos pelo software, o que parece representar um relativo sucesso, uma vez que o protótipo poderia substituir uma pessoa na atividade de resumir textos sem deixar a desejar, a não ser no quinto critério de avaliação, referente à dimensão do resumo, em que o texto produzido pelo software foi apontado como extenso além do necessário. Conclusões: Apesar dos bons resultados do protótipo, percebemos a necessidade de melhorias em seu desempenho, além de avaliá-lo por métodos mais abrangentes, a partir de amostras mais representativas e por um grupo maior de avaliadores. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-04-25T16:14:10Z 2020-04-25T16:14:10Z 2020 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
TABOSA, Hamilton Rodrigues; SOUZA, Osvaldo de; CÂNDIDO, José Carlos dos Santos; MELO, Ana Cristina Azevedo Ursulino; REIS, Keila Giullianna Braga. Avaliação do desempenho de um software de sumarização automática de textos. Informação & Informação, Londrina, v. 25, n. 1, p. 189-210, jan./mar. 2020. http://www.repositorio.ufc.br/handle/riufc/51441 |
dc.identifier.dark.fl_str_mv |
ark:/83112/001300000qtkm |
identifier_str_mv |
TABOSA, Hamilton Rodrigues; SOUZA, Osvaldo de; CÂNDIDO, José Carlos dos Santos; MELO, Ana Cristina Azevedo Ursulino; REIS, Keila Giullianna Braga. Avaliação do desempenho de um software de sumarização automática de textos. Informação & Informação, Londrina, v. 25, n. 1, p. 189-210, jan./mar. 2020. ark:/83112/001300000qtkm |
url |
http://www.repositorio.ufc.br/handle/riufc/51441 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal do Ceará (UFC) instname:Universidade Federal do Ceará (UFC) instacron:UFC |
instname_str |
Universidade Federal do Ceará (UFC) |
instacron_str |
UFC |
institution |
UFC |
reponame_str |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
collection |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC) |
repository.mail.fl_str_mv |
bu@ufc.br || repositorio@ufc.br |
_version_ |
1818373819636645888 |