Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro

Detalhes bibliográficos
Autor(a) principal: Di Felippo, Ariani [UNESP]
Data de Publicação: 2008
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/103583
Resumo: Devido a vários fatores, como saliência perceptual e relevância semiótica, as línguas apresentam repertórios diferentes de conceitos lexicalizados (isto é, conceitos expressos por unidades lexicais). As divergências léxico-conceituais dificultam o tratamento computacional das línguas naturais em tarefas como tradução automática e recuperação de informação multilíngüe. Assim, a construção de base de dados lexicais bilíngües e multilíngües em que as unidades de línguas distintas estão inter-relacionadas por meio do conceito a elas subjacente tem recebido muita atenção no Processamento Automático das Línguas Naturais (PLN). Para o português brasileiro (PB), faz-se urgente a construção desse tipo de recurso. Nesse cenário, esta tese visa a investigar os padrões de lexicalização do PB e a construir um recurso léxicoconceitual, ainda que de extensões reduzidas, que possa auxiliar o processamento automático dessa língua em meio escrito. Assumindo-se a concepção de PLN enquanto “uma engenharia da linguagem humana”, utilizou-se uma metodologia tripartida que divide as atividades nos domínios: lingüístico, lingüístico-computacional e computacional. Este trabalho, em especial, não realizou as atividades previstas no terceiro domínio, pois estas não fazem parte do escopo desta pesquisa. No domínio lingüístico, um conjunto de conceitos lexicalizados no inglês norte-americano (AmE), extraído da WordNet de Princeton (WN.Pr), foi delimitado por meio da análise manual de recursos estruturados (base de dados e dicionários) e não-estruturados (corpora textuais). Na seqüência, as expressões do PB (em especial, as unidades lexicais) que materializam tais conceitos foram manualmente extraídas de dicionários bilíngües (AmE-PB), dicionários monolíngües e thesaurus e de corpora textuais do PB. No domínio lingüístico-computacional...
id UNSP_562abdcbcb0200b774370ca0f1381b28
oai_identifier_str oai:repositorio.unesp.br:11449/103583
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiroLinguísticaSemanticaPortuguês - LexicografiaConceptsLexical unitsSemanticsDevido a vários fatores, como saliência perceptual e relevância semiótica, as línguas apresentam repertórios diferentes de conceitos lexicalizados (isto é, conceitos expressos por unidades lexicais). As divergências léxico-conceituais dificultam o tratamento computacional das línguas naturais em tarefas como tradução automática e recuperação de informação multilíngüe. Assim, a construção de base de dados lexicais bilíngües e multilíngües em que as unidades de línguas distintas estão inter-relacionadas por meio do conceito a elas subjacente tem recebido muita atenção no Processamento Automático das Línguas Naturais (PLN). Para o português brasileiro (PB), faz-se urgente a construção desse tipo de recurso. Nesse cenário, esta tese visa a investigar os padrões de lexicalização do PB e a construir um recurso léxicoconceitual, ainda que de extensões reduzidas, que possa auxiliar o processamento automático dessa língua em meio escrito. Assumindo-se a concepção de PLN enquanto “uma engenharia da linguagem humana”, utilizou-se uma metodologia tripartida que divide as atividades nos domínios: lingüístico, lingüístico-computacional e computacional. Este trabalho, em especial, não realizou as atividades previstas no terceiro domínio, pois estas não fazem parte do escopo desta pesquisa. No domínio lingüístico, um conjunto de conceitos lexicalizados no inglês norte-americano (AmE), extraído da WordNet de Princeton (WN.Pr), foi delimitado por meio da análise manual de recursos estruturados (base de dados e dicionários) e não-estruturados (corpora textuais). Na seqüência, as expressões do PB (em especial, as unidades lexicais) que materializam tais conceitos foram manualmente extraídas de dicionários bilíngües (AmE-PB), dicionários monolíngües e thesaurus e de corpora textuais do PB. No domínio lingüístico-computacional...Because of several factors, including, for instance, perceptual salience and semiotic relevance, languages have different inventories of lexicalized concepts (i.e. concepts expressed by lexical units). The lexical-conceptual divergences are a hindrance to computational treatment of natural languages in tasks such as machine translation and cross-language information retrieval. Therefore, the construction of bilingual and multilingual lexical databases, in which the lexical units of different languages are aligned by their underlying concepts, has become a very important research topic in Natural Language Processing (NLP). For Brazilian Portuguese (BP), in particular, the construction of such resources is urgent. In this scenario, this thesis aims to investigate lexicalization patterns of BP and to develop a lexical-conceptual resource for the automatic processing of written BP language. Assuming a compromise between NLP and Linguistics, this work follows a three-domain approach methodology, which claims that the research activities should be divided into the linguistic, linguisticcomputational, and computational domains. In particular, this research does not perform the last step, since it is not in the scope of this work. Accordingly, in the linguistic domain, a set of lexicalized concepts of North-American English (AmE) extracted from Princeton WordNet (WN.Pr) was selected through manual analysis of the structured (lexical databases and standard dictionaries) and unstructured resources (textual corpora). Given those concepts, their lexical and phrasal expressions in BP were manually compiled from bilingual dictionaries, with the help of standard monolingual dictionaries, thesauri, and textual corpora. In the linguistic-computational domain, the lexicalized concepts of AmE and BP previously identified were aligned by means of a semantic structured interlingua (or ontology)... (Complete abstract click electronic access below)Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Universidade Estadual Paulista (Unesp)Silva, Bento Carlos Dias da [UNESP]Universidade Estadual Paulista (Unesp)Di Felippo, Ariani [UNESP]2014-06-11T19:32:47Z2014-06-11T19:32:47Z2008-08-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis237 f. : il.application/pdfDI FELIPPO, Ariani. Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro. 2008. 237 f. Tese (doutorado) - Universidade Estadual Paulista, Faculdade de Ciências e Letras de Araraquara, 2008.http://hdl.handle.net/11449/103583000563326difelippo_a_dr_arafcl.pdf33004030009P42202787473720818Alephreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESPporinfo:eu-repo/semantics/openAccess2024-06-13T14:21:29Zoai:repositorio.unesp.br:11449/103583Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T16:23:50.329113Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro
title Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro
spellingShingle Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro
Di Felippo, Ariani [UNESP]
Linguística
Semantica
Português - Lexicografia
Concepts
Lexical units
Semantics
title_short Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro
title_full Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro
title_fullStr Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro
title_full_unstemmed Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro
title_sort Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro
author Di Felippo, Ariani [UNESP]
author_facet Di Felippo, Ariani [UNESP]
author_role author
dc.contributor.none.fl_str_mv Silva, Bento Carlos Dias da [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Di Felippo, Ariani [UNESP]
dc.subject.por.fl_str_mv Linguística
Semantica
Português - Lexicografia
Concepts
Lexical units
Semantics
topic Linguística
Semantica
Português - Lexicografia
Concepts
Lexical units
Semantics
description Devido a vários fatores, como saliência perceptual e relevância semiótica, as línguas apresentam repertórios diferentes de conceitos lexicalizados (isto é, conceitos expressos por unidades lexicais). As divergências léxico-conceituais dificultam o tratamento computacional das línguas naturais em tarefas como tradução automática e recuperação de informação multilíngüe. Assim, a construção de base de dados lexicais bilíngües e multilíngües em que as unidades de línguas distintas estão inter-relacionadas por meio do conceito a elas subjacente tem recebido muita atenção no Processamento Automático das Línguas Naturais (PLN). Para o português brasileiro (PB), faz-se urgente a construção desse tipo de recurso. Nesse cenário, esta tese visa a investigar os padrões de lexicalização do PB e a construir um recurso léxicoconceitual, ainda que de extensões reduzidas, que possa auxiliar o processamento automático dessa língua em meio escrito. Assumindo-se a concepção de PLN enquanto “uma engenharia da linguagem humana”, utilizou-se uma metodologia tripartida que divide as atividades nos domínios: lingüístico, lingüístico-computacional e computacional. Este trabalho, em especial, não realizou as atividades previstas no terceiro domínio, pois estas não fazem parte do escopo desta pesquisa. No domínio lingüístico, um conjunto de conceitos lexicalizados no inglês norte-americano (AmE), extraído da WordNet de Princeton (WN.Pr), foi delimitado por meio da análise manual de recursos estruturados (base de dados e dicionários) e não-estruturados (corpora textuais). Na seqüência, as expressões do PB (em especial, as unidades lexicais) que materializam tais conceitos foram manualmente extraídas de dicionários bilíngües (AmE-PB), dicionários monolíngües e thesaurus e de corpora textuais do PB. No domínio lingüístico-computacional...
publishDate 2008
dc.date.none.fl_str_mv 2008-08-01
2014-06-11T19:32:47Z
2014-06-11T19:32:47Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv DI FELIPPO, Ariani. Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro. 2008. 237 f. Tese (doutorado) - Universidade Estadual Paulista, Faculdade de Ciências e Letras de Araraquara, 2008.
http://hdl.handle.net/11449/103583
000563326
difelippo_a_dr_arafcl.pdf
33004030009P4
2202787473720818
identifier_str_mv DI FELIPPO, Ariani. Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro. 2008. 237 f. Tese (doutorado) - Universidade Estadual Paulista, Faculdade de Ciências e Letras de Araraquara, 2008.
000563326
difelippo_a_dr_arafcl.pdf
33004030009P4
2202787473720818
url http://hdl.handle.net/11449/103583
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 237 f. : il.
application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv Aleph
reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808128642843148288