Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural
Autor(a) principal: | |
---|---|
Data de Publicação: | 2011 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
Texto Completo: | http://repositorio.ufes.br/handle/10/3733 |
Resumo: | This research proposes a study of fixed expressions of Portuguese in Brazil, especially those with names of body parts, identified in newspaper texts and dictionaries. The description and formalization of these fixed expressions are of utmost importance to Automatic Processing of Natural Language. We selected a corpus with 558 fixed expressions, 351 are of verbal argument structures and 207 nouns argument structures. These expressions are analyzed from formal linguistic criteria to identify the morphosyntactic-semantic behavior of each one and, from these structural properties observed in the context of use, we propose an encoding to formalize them, with the aim to be inserted into a computing environment, expanding the descriptive studies on the lexicon of Portuguese and correcting deficiencies that might impair the quality of a text processed automatically. The formal representation of these fixed expressions is essential so that we can include them in an electronic dictionary, and thus use them at Unitex software or any other morphosyntactic analyzer. |
id |
UFES_34b3411d798238d8272306cf81a53799 |
---|---|
oai_identifier_str |
oai:repositorio.ufes.br:10/3733 |
network_acronym_str |
UFES |
network_name_str |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
repository_id_str |
2108 |
spelling |
Smarsaro, Aucione das DoresSantos, Vangevaldo Cardoso dosVale, Oto AraújoMeireles, Alexsandro2016-08-29T15:08:48Z2016-07-112016-08-29T15:08:48Z2011-03-31This research proposes a study of fixed expressions of Portuguese in Brazil, especially those with names of body parts, identified in newspaper texts and dictionaries. The description and formalization of these fixed expressions are of utmost importance to Automatic Processing of Natural Language. We selected a corpus with 558 fixed expressions, 351 are of verbal argument structures and 207 nouns argument structures. These expressions are analyzed from formal linguistic criteria to identify the morphosyntactic-semantic behavior of each one and, from these structural properties observed in the context of use, we propose an encoding to formalize them, with the aim to be inserted into a computing environment, expanding the descriptive studies on the lexicon of Portuguese and correcting deficiencies that might impair the quality of a text processed automatically. The formal representation of these fixed expressions is essential so that we can include them in an electronic dictionary, and thus use them at Unitex software or any other morphosyntactic analyzer.Esta pesquisa propõe um estudo das expressões fixas do português do Brasil, em especial, aquelas com nomes de partes do corpo, identificadas em dicionários e textos jornalísticos. A descrição e a formalização dessas expressões fixas são de suma importância para o Processamento Automático de Linguagem Natural. Seleciou-se um corpus com 558 expressões fixas, 351 são de estruturas argumentais verbais e 207 de estruturas argumentais substantivais. Essas expressões são analisadas a partir de critérios linguísticos formais, para se identificar o comportamento morfossintático-semântico de cada uma delas e, a partir dessas propriedades estruturais, observadas em contexto de uso, propõe-se uma codificação para formalizá-las, com intuito de serem inseridas em um ambiente computacional, ampliando os estudos descritivos sobre o léxico do português e corrigindo falhas que possam prejudicar a qualidade de um texto processado automaticamente. A representação formal dessas expressões fixas é essencial para que se possa incluí-las em um dicionário eletrônico e, assim, utilizá-las pelo software Unitex ou por qualquer outro analisador morfossintático.Texthttp://repositorio.ufes.br/handle/10/3733porUniversidade Federal do Espírito SantoMestrado em Estudos LinguísticosPrograma de Pós-Graduação em LinguísticaUFESBRFixed expressionsComputational linguisticsLexicon-grammarExpressões fixasLinguística computacionalLéxico-gramáticaLinguísticaProcessamento de linguagem natural (Computação)Dicionários eletrônicosLexicologiaLinguística80Descrição de expressões fixas do português brasileiro para processamento automático de linguagem naturalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)instname:Universidade Federal do Espírito Santo (UFES)instacron:UFESORIGINALtese_4945_DISSERTACAO - Vangevaldo Santos.pdfapplication/pdf1442046http://repositorio.ufes.br/bitstreams/992e8211-da1b-4939-8f69-33bd541a2523/download37b860e3d0dd518deaf26cd46e623a3eMD5110/37332024-07-01 20:21:06.269oai:repositorio.ufes.br:10/3733http://repositorio.ufes.brRepositório InstitucionalPUBhttp://repositorio.ufes.br/oai/requestopendoar:21082024-07-11T14:37:46.966354Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)false |
dc.title.none.fl_str_mv |
Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural |
title |
Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural |
spellingShingle |
Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural Santos, Vangevaldo Cardoso dos Fixed expressions Computational linguistics Lexicon-grammar Expressões fixas Linguística computacional Léxico-gramática Linguística Linguística Processamento de linguagem natural (Computação) Dicionários eletrônicos Lexicologia 80 |
title_short |
Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural |
title_full |
Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural |
title_fullStr |
Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural |
title_full_unstemmed |
Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural |
title_sort |
Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural |
author |
Santos, Vangevaldo Cardoso dos |
author_facet |
Santos, Vangevaldo Cardoso dos |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Smarsaro, Aucione das Dores |
dc.contributor.author.fl_str_mv |
Santos, Vangevaldo Cardoso dos |
dc.contributor.referee1.fl_str_mv |
Vale, Oto Araújo |
dc.contributor.referee2.fl_str_mv |
Meireles, Alexsandro |
contributor_str_mv |
Smarsaro, Aucione das Dores Vale, Oto Araújo Meireles, Alexsandro |
dc.subject.eng.fl_str_mv |
Fixed expressions Computational linguistics Lexicon-grammar |
topic |
Fixed expressions Computational linguistics Lexicon-grammar Expressões fixas Linguística computacional Léxico-gramática Linguística Linguística Processamento de linguagem natural (Computação) Dicionários eletrônicos Lexicologia 80 |
dc.subject.por.fl_str_mv |
Expressões fixas Linguística computacional Léxico-gramática |
dc.subject.cnpq.fl_str_mv |
Linguística |
dc.subject.br-rjbn.none.fl_str_mv |
Linguística Processamento de linguagem natural (Computação) Dicionários eletrônicos Lexicologia |
dc.subject.udc.none.fl_str_mv |
80 |
description |
This research proposes a study of fixed expressions of Portuguese in Brazil, especially those with names of body parts, identified in newspaper texts and dictionaries. The description and formalization of these fixed expressions are of utmost importance to Automatic Processing of Natural Language. We selected a corpus with 558 fixed expressions, 351 are of verbal argument structures and 207 nouns argument structures. These expressions are analyzed from formal linguistic criteria to identify the morphosyntactic-semantic behavior of each one and, from these structural properties observed in the context of use, we propose an encoding to formalize them, with the aim to be inserted into a computing environment, expanding the descriptive studies on the lexicon of Portuguese and correcting deficiencies that might impair the quality of a text processed automatically. The formal representation of these fixed expressions is essential so that we can include them in an electronic dictionary, and thus use them at Unitex software or any other morphosyntactic analyzer. |
publishDate |
2011 |
dc.date.issued.fl_str_mv |
2011-03-31 |
dc.date.accessioned.fl_str_mv |
2016-08-29T15:08:48Z |
dc.date.available.fl_str_mv |
2016-07-11 2016-08-29T15:08:48Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://repositorio.ufes.br/handle/10/3733 |
url |
http://repositorio.ufes.br/handle/10/3733 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
Text |
dc.publisher.none.fl_str_mv |
Universidade Federal do Espírito Santo Mestrado em Estudos Linguísticos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Linguística |
dc.publisher.initials.fl_str_mv |
UFES |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
Universidade Federal do Espírito Santo Mestrado em Estudos Linguísticos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) instname:Universidade Federal do Espírito Santo (UFES) instacron:UFES |
instname_str |
Universidade Federal do Espírito Santo (UFES) |
instacron_str |
UFES |
institution |
UFES |
reponame_str |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
collection |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
bitstream.url.fl_str_mv |
http://repositorio.ufes.br/bitstreams/992e8211-da1b-4939-8f69-33bd541a2523/download |
bitstream.checksum.fl_str_mv |
37b860e3d0dd518deaf26cd46e623a3e |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES) |
repository.mail.fl_str_mv |
|
_version_ |
1813022623017205760 |