Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural

Detalhes bibliográficos
Autor(a) principal: Santos, Vangevaldo Cardoso dos
Data de Publicação: 2011
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
Texto Completo: http://repositorio.ufes.br/handle/10/3733
Resumo: This research proposes a study of fixed expressions of Portuguese in Brazil, especially those with names of body parts, identified in newspaper texts and dictionaries. The description and formalization of these fixed expressions are of utmost importance to Automatic Processing of Natural Language. We selected a corpus with 558 fixed expressions, 351 are of verbal argument structures and 207 nouns argument structures. These expressions are analyzed from formal linguistic criteria to identify the morphosyntactic-semantic behavior of each one and, from these structural properties observed in the context of use, we propose an encoding to formalize them, with the aim to be inserted into a computing environment, expanding the descriptive studies on the lexicon of Portuguese and correcting deficiencies that might impair the quality of a text processed automatically. The formal representation of these fixed expressions is essential so that we can include them in an electronic dictionary, and thus use them at Unitex software or any other morphosyntactic analyzer.
id UFES_34b3411d798238d8272306cf81a53799
oai_identifier_str oai:repositorio.ufes.br:10/3733
network_acronym_str UFES
network_name_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
repository_id_str 2108
spelling Smarsaro, Aucione das DoresSantos, Vangevaldo Cardoso dosVale, Oto AraújoMeireles, Alexsandro2016-08-29T15:08:48Z2016-07-112016-08-29T15:08:48Z2011-03-31This research proposes a study of fixed expressions of Portuguese in Brazil, especially those with names of body parts, identified in newspaper texts and dictionaries. The description and formalization of these fixed expressions are of utmost importance to Automatic Processing of Natural Language. We selected a corpus with 558 fixed expressions, 351 are of verbal argument structures and 207 nouns argument structures. These expressions are analyzed from formal linguistic criteria to identify the morphosyntactic-semantic behavior of each one and, from these structural properties observed in the context of use, we propose an encoding to formalize them, with the aim to be inserted into a computing environment, expanding the descriptive studies on the lexicon of Portuguese and correcting deficiencies that might impair the quality of a text processed automatically. The formal representation of these fixed expressions is essential so that we can include them in an electronic dictionary, and thus use them at Unitex software or any other morphosyntactic analyzer.Esta pesquisa propõe um estudo das expressões fixas do português do Brasil, em especial, aquelas com nomes de partes do corpo, identificadas em dicionários e textos jornalísticos. A descrição e a formalização dessas expressões fixas são de suma importância para o Processamento Automático de Linguagem Natural. Seleciou-se um corpus com 558 expressões fixas, 351 são de estruturas argumentais verbais e 207 de estruturas argumentais substantivais. Essas expressões são analisadas a partir de critérios linguísticos formais, para se identificar o comportamento morfossintático-semântico de cada uma delas e, a partir dessas propriedades estruturais, observadas em contexto de uso, propõe-se uma codificação para formalizá-las, com intuito de serem inseridas em um ambiente computacional, ampliando os estudos descritivos sobre o léxico do português e corrigindo falhas que possam prejudicar a qualidade de um texto processado automaticamente. A representação formal dessas expressões fixas é essencial para que se possa incluí-las em um dicionário eletrônico e, assim, utilizá-las pelo software Unitex ou por qualquer outro analisador morfossintático.Texthttp://repositorio.ufes.br/handle/10/3733porUniversidade Federal do Espírito SantoMestrado em Estudos LinguísticosPrograma de Pós-Graduação em LinguísticaUFESBRFixed expressionsComputational linguisticsLexicon-grammarExpressões fixasLinguística computacionalLéxico-gramáticaLinguísticaProcessamento de linguagem natural (Computação)Dicionários eletrônicosLexicologiaLinguística80Descrição de expressões fixas do português brasileiro para processamento automático de linguagem naturalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)instname:Universidade Federal do Espírito Santo (UFES)instacron:UFESORIGINALtese_4945_DISSERTACAO - Vangevaldo Santos.pdfapplication/pdf1442046http://repositorio.ufes.br/bitstreams/992e8211-da1b-4939-8f69-33bd541a2523/download37b860e3d0dd518deaf26cd46e623a3eMD5110/37332024-07-01 20:21:06.269oai:repositorio.ufes.br:10/3733http://repositorio.ufes.brRepositório InstitucionalPUBhttp://repositorio.ufes.br/oai/requestopendoar:21082024-07-11T14:37:46.966354Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)false
dc.title.none.fl_str_mv Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural
title Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural
spellingShingle Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural
Santos, Vangevaldo Cardoso dos
Fixed expressions
Computational linguistics
Lexicon-grammar
Expressões fixas
Linguística computacional
Léxico-gramática
Linguística
Linguística
Processamento de linguagem natural (Computação)
Dicionários eletrônicos
Lexicologia
80
title_short Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural
title_full Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural
title_fullStr Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural
title_full_unstemmed Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural
title_sort Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural
author Santos, Vangevaldo Cardoso dos
author_facet Santos, Vangevaldo Cardoso dos
author_role author
dc.contributor.advisor1.fl_str_mv Smarsaro, Aucione das Dores
dc.contributor.author.fl_str_mv Santos, Vangevaldo Cardoso dos
dc.contributor.referee1.fl_str_mv Vale, Oto Araújo
dc.contributor.referee2.fl_str_mv Meireles, Alexsandro
contributor_str_mv Smarsaro, Aucione das Dores
Vale, Oto Araújo
Meireles, Alexsandro
dc.subject.eng.fl_str_mv Fixed expressions
Computational linguistics
Lexicon-grammar
topic Fixed expressions
Computational linguistics
Lexicon-grammar
Expressões fixas
Linguística computacional
Léxico-gramática
Linguística
Linguística
Processamento de linguagem natural (Computação)
Dicionários eletrônicos
Lexicologia
80
dc.subject.por.fl_str_mv Expressões fixas
Linguística computacional
Léxico-gramática
dc.subject.cnpq.fl_str_mv Linguística
dc.subject.br-rjbn.none.fl_str_mv Linguística
Processamento de linguagem natural (Computação)
Dicionários eletrônicos
Lexicologia
dc.subject.udc.none.fl_str_mv 80
description This research proposes a study of fixed expressions of Portuguese in Brazil, especially those with names of body parts, identified in newspaper texts and dictionaries. The description and formalization of these fixed expressions are of utmost importance to Automatic Processing of Natural Language. We selected a corpus with 558 fixed expressions, 351 are of verbal argument structures and 207 nouns argument structures. These expressions are analyzed from formal linguistic criteria to identify the morphosyntactic-semantic behavior of each one and, from these structural properties observed in the context of use, we propose an encoding to formalize them, with the aim to be inserted into a computing environment, expanding the descriptive studies on the lexicon of Portuguese and correcting deficiencies that might impair the quality of a text processed automatically. The formal representation of these fixed expressions is essential so that we can include them in an electronic dictionary, and thus use them at Unitex software or any other morphosyntactic analyzer.
publishDate 2011
dc.date.issued.fl_str_mv 2011-03-31
dc.date.accessioned.fl_str_mv 2016-08-29T15:08:48Z
dc.date.available.fl_str_mv 2016-07-11
2016-08-29T15:08:48Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.ufes.br/handle/10/3733
url http://repositorio.ufes.br/handle/10/3733
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv Text
dc.publisher.none.fl_str_mv Universidade Federal do Espírito Santo
Mestrado em Estudos Linguísticos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Linguística
dc.publisher.initials.fl_str_mv UFES
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal do Espírito Santo
Mestrado em Estudos Linguísticos
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
instname:Universidade Federal do Espírito Santo (UFES)
instacron:UFES
instname_str Universidade Federal do Espírito Santo (UFES)
instacron_str UFES
institution UFES
reponame_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
collection Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
bitstream.url.fl_str_mv http://repositorio.ufes.br/bitstreams/992e8211-da1b-4939-8f69-33bd541a2523/download
bitstream.checksum.fl_str_mv 37b860e3d0dd518deaf26cd46e623a3e
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)
repository.mail.fl_str_mv
_version_ 1813022623017205760