O modelo Encoder-Decoder aplicado em irregularidades verbais do Português Brasileiro

Detalhes bibliográficos
Autor(a) principal: Albiero, Beatriz
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/8/8139/tde-20022020-164808/
Resumo: Inspirada na controversa questão da aquisição de verbos irregulares na língua inglesa (Chomsky, N. & Halle (1968/1991), Pinker & Prince (1988), Albright, A. & Hayes (2003), Kirov & Cotterell (2018)), esta pesquisa tem como objetivo estudar a questão da flexão de verbos irregulares do Português Brasileiro sob a ótica do modelo computacional Encoder- Decoder. Para tanto, a tarefa proposta ao modelo era a de predizer uma forma verbal flexionada dada uma forma primária (Radical + Vogal Temática). O escopo da pesquisa restringiu-se ao estudo do paradigma de 1a Pessoa do Singular no Modo Indicativo e Tempo Presente. O modelo utilizado, por sua vez, é um modelo de caráter associativo que pertence ao grupo dos modelos de Redes Neurais Artificiais. Também, fez-se necessária a construção de um corpus linguístico composto pelo paradigma selecionado e em seguida transcrito em notação fonética específica para viabilizar a utilização do modelo escolhido. O corpus produzido é composto por 423 verbos que foram marcados como pertencendo às famílias de verbos regulares (51%) ou irregulares (49%). Ainda, dentro do escopo da família de verbos irregulares, foi possível identificar 15 subgrupos conforme a identificação de diferentes padrões de flexão. A partir da notação fonética utilizada, os verbos puderam ser associados a novas representações que englobavam informações relativas aos traços fonéticos presentes. Assim, o modelo proposto tenta predizer as formas flexionadas a partir da identificação das relações fonéticas envolvidas durante o processo de flexão. O modelo apresentado foi submetido a múltiplos treinamentos e testes e apresentou uma acurácia média de 13.55%, mas chegou a acertar 17% em um dos experimentos. Considerando a segmentação entre verbos regulares e irregulares, o modelo performou melhor na classe dos regulares. Entretanto, considerandose todas as 16 classes individualmente (15 irregulares + 1 regular), pôde-se observar que as duas primeiras classes em que o modelo performou melhor eram classes irregulares, deixando a classe regular como a terceira com os melhores resultados.
id USP_d82b0ae302aaf625dde20b69eedead40
oai_identifier_str oai:teses.usp.br:tde-20022020-164808
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling O modelo Encoder-Decoder aplicado em irregularidades verbais do Português BrasileiroThe Encoder-Decoder Model Applied to Brazilian-Portuguese Verbal IrregularitiesAprendizagem de máquinaConexionismoConnectionismMachine learningMorfologia verbalVerbal morphologyInspirada na controversa questão da aquisição de verbos irregulares na língua inglesa (Chomsky, N. & Halle (1968/1991), Pinker & Prince (1988), Albright, A. & Hayes (2003), Kirov & Cotterell (2018)), esta pesquisa tem como objetivo estudar a questão da flexão de verbos irregulares do Português Brasileiro sob a ótica do modelo computacional Encoder- Decoder. Para tanto, a tarefa proposta ao modelo era a de predizer uma forma verbal flexionada dada uma forma primária (Radical + Vogal Temática). O escopo da pesquisa restringiu-se ao estudo do paradigma de 1a Pessoa do Singular no Modo Indicativo e Tempo Presente. O modelo utilizado, por sua vez, é um modelo de caráter associativo que pertence ao grupo dos modelos de Redes Neurais Artificiais. Também, fez-se necessária a construção de um corpus linguístico composto pelo paradigma selecionado e em seguida transcrito em notação fonética específica para viabilizar a utilização do modelo escolhido. O corpus produzido é composto por 423 verbos que foram marcados como pertencendo às famílias de verbos regulares (51%) ou irregulares (49%). Ainda, dentro do escopo da família de verbos irregulares, foi possível identificar 15 subgrupos conforme a identificação de diferentes padrões de flexão. A partir da notação fonética utilizada, os verbos puderam ser associados a novas representações que englobavam informações relativas aos traços fonéticos presentes. Assim, o modelo proposto tenta predizer as formas flexionadas a partir da identificação das relações fonéticas envolvidas durante o processo de flexão. O modelo apresentado foi submetido a múltiplos treinamentos e testes e apresentou uma acurácia média de 13.55%, mas chegou a acertar 17% em um dos experimentos. Considerando a segmentação entre verbos regulares e irregulares, o modelo performou melhor na classe dos regulares. Entretanto, considerandose todas as 16 classes individualmente (15 irregulares + 1 regular), pôde-se observar que as duas primeiras classes em que o modelo performou melhor eram classes irregulares, deixando a classe regular como a terceira com os melhores resultados.Inspired by the controversial debate about the acquisition of irregular verbs in Englishlanguage (Chomsky, N. & Halle (1968/1991), Pinker & Prince (1988), Albright, A. & Hayes (2003), Kirov & Cotterell (2018)), this research aims to study the inflection process of irregular verbs in Portuguese through the perspective of the computational model Encoder- Decoder. To do this, we proposed the task of predicting an inflected verbal form given a primary form (Stem + Thematic Vowel). The scope of the research was restricted to the study of the singular first-person paradigm in the indicative mood and present tense. The model, in turn, is an associative model that belongs to the group of Artificial Neural Networks models. Also, it was necessary to construct a linguistic corpus composed by the chosen paradigm and then transcribe it into a specific phonetic notation to enable the usage of the chosen model. The resulting corpus consists of 423 verbs that were marked as belonging to either regular (51%) or irregular (49%) verb families. Moreover, within the scope of irregular verbs, it was possible to identify 15 subgroups through the identification of inflection patterns. Through the phonetic notation provided, verbs could be associated with new representations that included information related to the phonetic features. Thus, the proposed model attempts to predict inflected forms by identifying the involved phonetic relationships during the inflection process. The model was submitted to multiple trainings and tests and presented an average accuracy of 13.55%, but it got to 17% in one of the experiments. Considering the segmentation between regular and irregular verbs, the model performed better among the regular class. However, considering all 16 classes individually (15 irregular + 1 regular), it was observed that the first two classes in which the model performed best were irregular classes, leaving the regular class with the third place.Biblioteca Digitais de Teses e Dissertações da USPFerreira, Marcelo BarraAlbiero, Beatriz2019-11-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/8/8139/tde-20022020-164808/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-02-20T22:52:02Zoai:teses.usp.br:tde-20022020-164808Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-02-20T22:52:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv O modelo Encoder-Decoder aplicado em irregularidades verbais do Português Brasileiro
The Encoder-Decoder Model Applied to Brazilian-Portuguese Verbal Irregularities
title O modelo Encoder-Decoder aplicado em irregularidades verbais do Português Brasileiro
spellingShingle O modelo Encoder-Decoder aplicado em irregularidades verbais do Português Brasileiro
Albiero, Beatriz
Aprendizagem de máquina
Conexionismo
Connectionism
Machine learning
Morfologia verbal
Verbal morphology
title_short O modelo Encoder-Decoder aplicado em irregularidades verbais do Português Brasileiro
title_full O modelo Encoder-Decoder aplicado em irregularidades verbais do Português Brasileiro
title_fullStr O modelo Encoder-Decoder aplicado em irregularidades verbais do Português Brasileiro
title_full_unstemmed O modelo Encoder-Decoder aplicado em irregularidades verbais do Português Brasileiro
title_sort O modelo Encoder-Decoder aplicado em irregularidades verbais do Português Brasileiro
author Albiero, Beatriz
author_facet Albiero, Beatriz
author_role author
dc.contributor.none.fl_str_mv Ferreira, Marcelo Barra
dc.contributor.author.fl_str_mv Albiero, Beatriz
dc.subject.por.fl_str_mv Aprendizagem de máquina
Conexionismo
Connectionism
Machine learning
Morfologia verbal
Verbal morphology
topic Aprendizagem de máquina
Conexionismo
Connectionism
Machine learning
Morfologia verbal
Verbal morphology
description Inspirada na controversa questão da aquisição de verbos irregulares na língua inglesa (Chomsky, N. & Halle (1968/1991), Pinker & Prince (1988), Albright, A. & Hayes (2003), Kirov & Cotterell (2018)), esta pesquisa tem como objetivo estudar a questão da flexão de verbos irregulares do Português Brasileiro sob a ótica do modelo computacional Encoder- Decoder. Para tanto, a tarefa proposta ao modelo era a de predizer uma forma verbal flexionada dada uma forma primária (Radical + Vogal Temática). O escopo da pesquisa restringiu-se ao estudo do paradigma de 1a Pessoa do Singular no Modo Indicativo e Tempo Presente. O modelo utilizado, por sua vez, é um modelo de caráter associativo que pertence ao grupo dos modelos de Redes Neurais Artificiais. Também, fez-se necessária a construção de um corpus linguístico composto pelo paradigma selecionado e em seguida transcrito em notação fonética específica para viabilizar a utilização do modelo escolhido. O corpus produzido é composto por 423 verbos que foram marcados como pertencendo às famílias de verbos regulares (51%) ou irregulares (49%). Ainda, dentro do escopo da família de verbos irregulares, foi possível identificar 15 subgrupos conforme a identificação de diferentes padrões de flexão. A partir da notação fonética utilizada, os verbos puderam ser associados a novas representações que englobavam informações relativas aos traços fonéticos presentes. Assim, o modelo proposto tenta predizer as formas flexionadas a partir da identificação das relações fonéticas envolvidas durante o processo de flexão. O modelo apresentado foi submetido a múltiplos treinamentos e testes e apresentou uma acurácia média de 13.55%, mas chegou a acertar 17% em um dos experimentos. Considerando a segmentação entre verbos regulares e irregulares, o modelo performou melhor na classe dos regulares. Entretanto, considerandose todas as 16 classes individualmente (15 irregulares + 1 regular), pôde-se observar que as duas primeiras classes em que o modelo performou melhor eram classes irregulares, deixando a classe regular como a terceira com os melhores resultados.
publishDate 2019
dc.date.none.fl_str_mv 2019-11-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/8/8139/tde-20022020-164808/
url https://www.teses.usp.br/teses/disponiveis/8/8139/tde-20022020-164808/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090882602795008