Avaliação do desempenho de um software de sumarização automática de textos

Tabosa, Hamilton Rodrigues; Souza, Osvaldo de; Cândido, José Carlos dos Santos; Melo, Ana Cristina Azevedo Ursulino; Reis, Keila Giullianna Braga

Avaliação do desempenho de um software de sumarização automática de textos

Detalhes bibliográficos
Autor(a) principal:	Tabosa, Hamilton Rodrigues
Data de Publicação:	2020
Outros Autores:	Souza, Osvaldo de, Cândido, José Carlos dos Santos, Melo, Ana Cristina Azevedo Ursulino, Reis, Keila Giullianna Braga
Tipo de documento:	Artigo
Idioma:	por
Título da fonte:	Repositório Institucional da Universidade Federal do Ceará (UFC)
dARK ID:	ark:/83112/001300000qtkm
Texto Completo:	http://www.repositorio.ufc.br/handle/riufc/51441
Resumo:	Introdução: Desde 2014 desenvolvemos uma pesquisa com o intuito de produzir um software (protótipo) que seria capaz de elaborar resumos automáticos de textos baseado em técnicas de Processamento de Linguagem Natural e estatísticas de frequência de palavras. Os primeiros testes da ferramenta geraram resultados que indicaram uma significativa redução da dimensionalidade dos textos, com considerável preservação do seu valor semântico. Objetivo: Neste artigo, apresentamos os resultados da continuidade do nosso trabalho investigativo, a partir de uma avaliação humana da qualidade desses resumos baseada na realização de testes cegos. Metodologia: Um grupo de três bibliotecárias recebeu um bloco misto e não identificado de resumos - produzidos por humanos e os resumos automáticos feitos pelo software - e procedeu a uma avaliação, segundo os critérios de corretude gramatical, preservação das ideias centrais, coerência e legibilidade, extensão do resumo, se houve paráfrase ou cópia de fragmentos e, se houve introdução de ideias não contidas no texto original. Resultados: Os resultados mostraram que em quatro, dos cinco critérios de avaliação adotados, houve equivalência qualitativa entre os resumos produzidos por humanos e os produzidos pelo software, o que parece representar um relativo sucesso, uma vez que o protótipo poderia substituir uma pessoa na atividade de resumir textos sem deixar a desejar, a não ser no quinto critério de avaliação, referente à dimensão do resumo, em que o texto produzido pelo software foi apontado como extenso além do necessário. Conclusões: Apesar dos bons resultados do protótipo, percebemos a necessidade de melhorias em seu desempenho, além de avaliá-lo por métodos mais abrangentes, a partir de amostras mais representativas e por um grupo maior de avaliadores.

Metadados do item

id	UFC-7_dda97a1b4962a1d424e7f51db3f3e39d
oai_identifier_str	oai:repositorio.ufc.br:riufc/51441
network_acronym_str	UFC-7
network_name_str	Repositório Institucional da Universidade Federal do Ceará (UFC)
repository_id_str
spelling	Avaliação do desempenho de um software de sumarização automática de textosSumarização automática de textosAcesso à informaçãoLinguagem natural (processamento)Mediação (prática)Introdução: Desde 2014 desenvolvemos uma pesquisa com o intuito de produzir um software (protótipo) que seria capaz de elaborar resumos automáticos de textos baseado em técnicas de Processamento de Linguagem Natural e estatísticas de frequência de palavras. Os primeiros testes da ferramenta geraram resultados que indicaram uma significativa redução da dimensionalidade dos textos, com considerável preservação do seu valor semântico. Objetivo: Neste artigo, apresentamos os resultados da continuidade do nosso trabalho investigativo, a partir de uma avaliação humana da qualidade desses resumos baseada na realização de testes cegos. Metodologia: Um grupo de três bibliotecárias recebeu um bloco misto e não identificado de resumos - produzidos por humanos e os resumos automáticos feitos pelo software - e procedeu a uma avaliação, segundo os critérios de corretude gramatical, preservação das ideias centrais, coerência e legibilidade, extensão do resumo, se houve paráfrase ou cópia de fragmentos e, se houve introdução de ideias não contidas no texto original. Resultados: Os resultados mostraram que em quatro, dos cinco critérios de avaliação adotados, houve equivalência qualitativa entre os resumos produzidos por humanos e os produzidos pelo software, o que parece representar um relativo sucesso, uma vez que o protótipo poderia substituir uma pessoa na atividade de resumir textos sem deixar a desejar, a não ser no quinto critério de avaliação, referente à dimensão do resumo, em que o texto produzido pelo software foi apontado como extenso além do necessário. Conclusões: Apesar dos bons resultados do protótipo, percebemos a necessidade de melhorias em seu desempenho, além de avaliá-lo por métodos mais abrangentes, a partir de amostras mais representativas e por um grupo maior de avaliadores.2020-04-25T16:14:10Z2020-04-25T16:14:10Z2020info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfTABOSA, Hamilton Rodrigues; SOUZA, Osvaldo de; CÂNDIDO, José Carlos dos Santos; MELO, Ana Cristina Azevedo Ursulino; REIS, Keila Giullianna Braga. Avaliação do desempenho de um software de sumarização automática de textos. Informação & Informação, Londrina, v. 25, n. 1, p. 189-210, jan./mar. 2020.http://www.repositorio.ufc.br/handle/riufc/51441ark:/83112/001300000qtkmTabosa, Hamilton RodriguesSouza, Osvaldo deCândido, José Carlos dos SantosMelo, Ana Cristina Azevedo UrsulinoReis, Keila Giullianna Bragainfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFC2023-10-30T18:02:10Zoai:repositorio.ufc.br:riufc/51441Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br \|\| repositorio@ufc.bropendoar:2024-09-11T18:15:53.598423Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false
dc.title.none.fl_str_mv	Avaliação do desempenho de um software de sumarização automática de textos
title	Avaliação do desempenho de um software de sumarização automática de textos
spellingShingle	Avaliação do desempenho de um software de sumarização automática de textos Tabosa, Hamilton Rodrigues Sumarização automática de textos Acesso à informação Linguagem natural (processamento) Mediação (prática)
title_short	Avaliação do desempenho de um software de sumarização automática de textos
title_full	Avaliação do desempenho de um software de sumarização automática de textos
title_fullStr	Avaliação do desempenho de um software de sumarização automática de textos
title_full_unstemmed	Avaliação do desempenho de um software de sumarização automática de textos
title_sort	Avaliação do desempenho de um software de sumarização automática de textos
author	Tabosa, Hamilton Rodrigues
author_facet	Tabosa, Hamilton Rodrigues Souza, Osvaldo de Cândido, José Carlos dos Santos Melo, Ana Cristina Azevedo Ursulino Reis, Keila Giullianna Braga
author_role	author
author2	Souza, Osvaldo de Cândido, José Carlos dos Santos Melo, Ana Cristina Azevedo Ursulino Reis, Keila Giullianna Braga
author2_role	author author author author
dc.contributor.author.fl_str_mv	Tabosa, Hamilton Rodrigues Souza, Osvaldo de Cândido, José Carlos dos Santos Melo, Ana Cristina Azevedo Ursulino Reis, Keila Giullianna Braga
dc.subject.por.fl_str_mv	Sumarização automática de textos Acesso à informação Linguagem natural (processamento) Mediação (prática)
topic	Sumarização automática de textos Acesso à informação Linguagem natural (processamento) Mediação (prática)
description	Introdução: Desde 2014 desenvolvemos uma pesquisa com o intuito de produzir um software (protótipo) que seria capaz de elaborar resumos automáticos de textos baseado em técnicas de Processamento de Linguagem Natural e estatísticas de frequência de palavras. Os primeiros testes da ferramenta geraram resultados que indicaram uma significativa redução da dimensionalidade dos textos, com considerável preservação do seu valor semântico. Objetivo: Neste artigo, apresentamos os resultados da continuidade do nosso trabalho investigativo, a partir de uma avaliação humana da qualidade desses resumos baseada na realização de testes cegos. Metodologia: Um grupo de três bibliotecárias recebeu um bloco misto e não identificado de resumos - produzidos por humanos e os resumos automáticos feitos pelo software - e procedeu a uma avaliação, segundo os critérios de corretude gramatical, preservação das ideias centrais, coerência e legibilidade, extensão do resumo, se houve paráfrase ou cópia de fragmentos e, se houve introdução de ideias não contidas no texto original. Resultados: Os resultados mostraram que em quatro, dos cinco critérios de avaliação adotados, houve equivalência qualitativa entre os resumos produzidos por humanos e os produzidos pelo software, o que parece representar um relativo sucesso, uma vez que o protótipo poderia substituir uma pessoa na atividade de resumir textos sem deixar a desejar, a não ser no quinto critério de avaliação, referente à dimensão do resumo, em que o texto produzido pelo software foi apontado como extenso além do necessário. Conclusões: Apesar dos bons resultados do protótipo, percebemos a necessidade de melhorias em seu desempenho, além de avaliá-lo por métodos mais abrangentes, a partir de amostras mais representativas e por um grupo maior de avaliadores.
publishDate	2020
dc.date.none.fl_str_mv	2020-04-25T16:14:10Z 2020-04-25T16:14:10Z 2020
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/article
format	article
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	TABOSA, Hamilton Rodrigues; SOUZA, Osvaldo de; CÂNDIDO, José Carlos dos Santos; MELO, Ana Cristina Azevedo Ursulino; REIS, Keila Giullianna Braga. Avaliação do desempenho de um software de sumarização automática de textos. Informação & Informação, Londrina, v. 25, n. 1, p. 189-210, jan./mar. 2020. http://www.repositorio.ufc.br/handle/riufc/51441
dc.identifier.dark.fl_str_mv	ark:/83112/001300000qtkm
identifier_str_mv	TABOSA, Hamilton Rodrigues; SOUZA, Osvaldo de; CÂNDIDO, José Carlos dos Santos; MELO, Ana Cristina Azevedo Ursulino; REIS, Keila Giullianna Braga. Avaliação do desempenho de um software de sumarização automática de textos. Informação & Informação, Londrina, v. 25, n. 1, p. 189-210, jan./mar. 2020. ark:/83112/001300000qtkm
url	http://www.repositorio.ufc.br/handle/riufc/51441
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Institucional da Universidade Federal do Ceará (UFC) instname:Universidade Federal do Ceará (UFC) instacron:UFC
instname_str	Universidade Federal do Ceará (UFC)
instacron_str	UFC
institution	UFC
reponame_str	Repositório Institucional da Universidade Federal do Ceará (UFC)
collection	Repositório Institucional da Universidade Federal do Ceará (UFC)
repository.name.fl_str_mv	Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)
repository.mail.fl_str_mv	bu@ufc.br \|\| repositorio@ufc.br
_version_	1818373819636645888

Avaliação do desempenho de um software de sumarização automática de textos

Registros relacionados