Winograd schemas in portuguese.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/3/3141/tde-14012021-124730/ |
Resumo: | The Winograd Schema Challenge has become a common benchmark for question answering and natural language processing, having been originally developed in the English language. In order to stimulate the development of Natural Language Processing in Portuguese, we have developed a set of Winograd Schemas in Portuguese. We have also adapted solutions proposed for the English-based version of the challenge so as to have an initial model for usage in its Portuguese-based version. To do so, we created a language model for Portuguese based on a set of Wikipedia documents. In order to evaluate the impact of the increase in the language model capacity in the results for the Portuguese challenge, we tested training of the model with the usage of a myriad of techniques that have previously led to state-of-the-art results for English-based tasks. |
id |
USP_7b97736cce6ef84951af46623d88e0ff |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-14012021-124730 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Winograd schemas in portuguese.Esquemas de Wwnograd em português.Análise de textoInteligência artificialLinguagem naturalSintaxe e semântica da linguagem naturalThe Winograd Schema Challenge has become a common benchmark for question answering and natural language processing, having been originally developed in the English language. In order to stimulate the development of Natural Language Processing in Portuguese, we have developed a set of Winograd Schemas in Portuguese. We have also adapted solutions proposed for the English-based version of the challenge so as to have an initial model for usage in its Portuguese-based version. To do so, we created a language model for Portuguese based on a set of Wikipedia documents. In order to evaluate the impact of the increase in the language model capacity in the results for the Portuguese challenge, we tested training of the model with the usage of a myriad of techniques that have previously led to state-of-the-art results for English-based tasks.O Desafio de Winograd se tornou uma referência em tarefas de resposta textual automatizada e processamento de linguagem natural, tendo sido desenvolvido inicialmente na língua inglesa. De forma a estimular o desenvolvimento do campo de Processamento de Linguagem Natural em português, desenvolvemos um conjunto de Esquemas de Winograd em português. Também adaptamos soluções propostas para a versão do desafio baseada em inglês, de forma a disponibilizarmos um modelo inicial para ser utilizado na versão do desafio baseada em português. Para fazê-lo, criamos um modelo de linguagem treinado sobre um conjunto de documentos da Wikipedia. De forma a avaliar o impacto da variação da capacidade do modelo de linguagem nos resultados para o desafio em português, nós testamos o treinamento do modelo utilizando-se de diversas técnicas que anteriormente levaram a resultados estado-da-arte para tarefas na língua inglesa.Biblioteca Digitais de Teses e Dissertações da USPCozman, Fabio GagliardiMelo, Gabriela Souza de2020-08-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-14012021-124730/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2024-10-09T12:45:42Zoai:teses.usp.br:tde-14012021-124730Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-10-09T12:45:42Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Winograd schemas in portuguese. Esquemas de Wwnograd em português. |
title |
Winograd schemas in portuguese. |
spellingShingle |
Winograd schemas in portuguese. Melo, Gabriela Souza de Análise de texto Inteligência artificial Linguagem natural Sintaxe e semântica da linguagem natural |
title_short |
Winograd schemas in portuguese. |
title_full |
Winograd schemas in portuguese. |
title_fullStr |
Winograd schemas in portuguese. |
title_full_unstemmed |
Winograd schemas in portuguese. |
title_sort |
Winograd schemas in portuguese. |
author |
Melo, Gabriela Souza de |
author_facet |
Melo, Gabriela Souza de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Cozman, Fabio Gagliardi |
dc.contributor.author.fl_str_mv |
Melo, Gabriela Souza de |
dc.subject.por.fl_str_mv |
Análise de texto Inteligência artificial Linguagem natural Sintaxe e semântica da linguagem natural |
topic |
Análise de texto Inteligência artificial Linguagem natural Sintaxe e semântica da linguagem natural |
description |
The Winograd Schema Challenge has become a common benchmark for question answering and natural language processing, having been originally developed in the English language. In order to stimulate the development of Natural Language Processing in Portuguese, we have developed a set of Winograd Schemas in Portuguese. We have also adapted solutions proposed for the English-based version of the challenge so as to have an initial model for usage in its Portuguese-based version. To do so, we created a language model for Portuguese based on a set of Wikipedia documents. In order to evaluate the impact of the increase in the language model capacity in the results for the Portuguese challenge, we tested training of the model with the usage of a myriad of techniques that have previously led to state-of-the-art results for English-based tasks. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-08-03 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-14012021-124730/ |
url |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-14012021-124730/ |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256508158443520 |