Winograd schemas in portuguese.

Detalhes bibliográficos
Autor(a) principal: Melo, Gabriela Souza de
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-14012021-124730/
Resumo: The Winograd Schema Challenge has become a common benchmark for question answering and natural language processing, having been originally developed in the English language. In order to stimulate the development of Natural Language Processing in Portuguese, we have developed a set of Winograd Schemas in Portuguese. We have also adapted solutions proposed for the English-based version of the challenge so as to have an initial model for usage in its Portuguese-based version. To do so, we created a language model for Portuguese based on a set of Wikipedia documents. In order to evaluate the impact of the increase in the language model capacity in the results for the Portuguese challenge, we tested training of the model with the usage of a myriad of techniques that have previously led to state-of-the-art results for English-based tasks.
id USP_7b97736cce6ef84951af46623d88e0ff
oai_identifier_str oai:teses.usp.br:tde-14012021-124730
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Winograd schemas in portuguese.Esquemas de Wwnograd em português.Análise de textoInteligência artificialLinguagem naturalSintaxe e semântica da linguagem naturalThe Winograd Schema Challenge has become a common benchmark for question answering and natural language processing, having been originally developed in the English language. In order to stimulate the development of Natural Language Processing in Portuguese, we have developed a set of Winograd Schemas in Portuguese. We have also adapted solutions proposed for the English-based version of the challenge so as to have an initial model for usage in its Portuguese-based version. To do so, we created a language model for Portuguese based on a set of Wikipedia documents. In order to evaluate the impact of the increase in the language model capacity in the results for the Portuguese challenge, we tested training of the model with the usage of a myriad of techniques that have previously led to state-of-the-art results for English-based tasks.O Desafio de Winograd se tornou uma referência em tarefas de resposta textual automatizada e processamento de linguagem natural, tendo sido desenvolvido inicialmente na língua inglesa. De forma a estimular o desenvolvimento do campo de Processamento de Linguagem Natural em português, desenvolvemos um conjunto de Esquemas de Winograd em português. Também adaptamos soluções propostas para a versão do desafio baseada em inglês, de forma a disponibilizarmos um modelo inicial para ser utilizado na versão do desafio baseada em português. Para fazê-lo, criamos um modelo de linguagem treinado sobre um conjunto de documentos da Wikipedia. De forma a avaliar o impacto da variação da capacidade do modelo de linguagem nos resultados para o desafio em português, nós testamos o treinamento do modelo utilizando-se de diversas técnicas que anteriormente levaram a resultados estado-da-arte para tarefas na língua inglesa.Biblioteca Digitais de Teses e Dissertações da USPCozman, Fabio GagliardiMelo, Gabriela Souza de2020-08-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-14012021-124730/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2024-10-09T12:45:42Zoai:teses.usp.br:tde-14012021-124730Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-10-09T12:45:42Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Winograd schemas in portuguese.
Esquemas de Wwnograd em português.
title Winograd schemas in portuguese.
spellingShingle Winograd schemas in portuguese.
Melo, Gabriela Souza de
Análise de texto
Inteligência artificial
Linguagem natural
Sintaxe e semântica da linguagem natural
title_short Winograd schemas in portuguese.
title_full Winograd schemas in portuguese.
title_fullStr Winograd schemas in portuguese.
title_full_unstemmed Winograd schemas in portuguese.
title_sort Winograd schemas in portuguese.
author Melo, Gabriela Souza de
author_facet Melo, Gabriela Souza de
author_role author
dc.contributor.none.fl_str_mv Cozman, Fabio Gagliardi
dc.contributor.author.fl_str_mv Melo, Gabriela Souza de
dc.subject.por.fl_str_mv Análise de texto
Inteligência artificial
Linguagem natural
Sintaxe e semântica da linguagem natural
topic Análise de texto
Inteligência artificial
Linguagem natural
Sintaxe e semântica da linguagem natural
description The Winograd Schema Challenge has become a common benchmark for question answering and natural language processing, having been originally developed in the English language. In order to stimulate the development of Natural Language Processing in Portuguese, we have developed a set of Winograd Schemas in Portuguese. We have also adapted solutions proposed for the English-based version of the challenge so as to have an initial model for usage in its Portuguese-based version. To do so, we created a language model for Portuguese based on a set of Wikipedia documents. In order to evaluate the impact of the increase in the language model capacity in the results for the Portuguese challenge, we tested training of the model with the usage of a myriad of techniques that have previously led to state-of-the-art results for English-based tasks.
publishDate 2020
dc.date.none.fl_str_mv 2020-08-03
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/3/3141/tde-14012021-124730/
url https://www.teses.usp.br/teses/disponiveis/3/3141/tde-14012021-124730/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815256508158443520