Corpus Linguistics: theory, interfaces and applications

Detalhes bibliográficos
Autor(a) principal: Oliveira, Lúcia Pacheco de
Data de Publicação: 2009
Tipo de documento: Artigo
Idioma: por
Título da fonte: Matraga (Online)
Texto Completo: https://www.e-publicacoes.uerj.br/matraga/article/view/27796
Resumo: O objetivo deste trabalho é apresentar uma visão geral da Linguística de Corpus, caracterizando-a como uma área do conhecimento; levando em consideração sua interface com outras áreas; e ilustrando suas aplicações, com foco mais específico no português do Brasil. Para atingir este objetivo, este artigo discute características da Linguística de Corpus que a distinguem de outras áreas, tais como: (1) a perspectiva de linguagem que adota e a forma de fazer pesquisas empíricas, com auxílio de ferramentas computacionais e com base em evidências linguísticas extraídas de corpora; (2) a possibilidade de trazer contribuições teóricas para os estudos da linguagem, através de novas descrições de diferentes usos da língua; (3) as interfaces de pesquisa com outras áreas, tais como Linguística Sistêmico-Funcional, Linguística Aplicada e Linguística Computacional; (4) o desenvolvimento da área, inclusive no Brasil, devido às novas perspectivas que possibilita em relação à lexicografia, léxico-gramática, estudos da variação linguística em gêneros discursivos e estudos interculturais. Através da discussão dos pontos acima, espera-se indicar que a Linguística de Corpus é uma área que permite o aprofundamento sobre o conhecimento empírico de diferentes línguas estudadas, levando a novas concepções teóricas sobre a linguagem, não podendo ser considerada, portanto, apenas como uma metodologia de análise. No final do trabalho, serão brevemente apresentadas três pesquisas que incluem dados da língua portuguesa, visando exemplificar aplicações da Linguística de Corpus para o estudo do uso do português. Esses trabalhos foram desenvolvidos a partir do CORPOBRAS PUC-Rio, compilado com o objetivo de ser um corpus representativo do português do Brasil1 .
id UERJ-9_9ca8c3c4b9ad2f3d8b04cbb748e4cbae
oai_identifier_str oai:ojs.www.e-publicacoes.uerj.br:article/27796
network_acronym_str UERJ-9
network_name_str Matraga (Online)
repository_id_str
spelling Corpus Linguistics: theory, interfaces and applicationsLinguística de Corpus: teoria, interfaces e aplicaçõescorpus linguisticstheory and corpusempirical researchBrazilian Portuguese corpusCORPOBRAS PUC-Rio.linguística de corpusteoria e corpuspesquisa empíricacorpus do português do BrasilCORPOBRAS PUC-Rio.O objetivo deste trabalho é apresentar uma visão geral da Linguística de Corpus, caracterizando-a como uma área do conhecimento; levando em consideração sua interface com outras áreas; e ilustrando suas aplicações, com foco mais específico no português do Brasil. Para atingir este objetivo, este artigo discute características da Linguística de Corpus que a distinguem de outras áreas, tais como: (1) a perspectiva de linguagem que adota e a forma de fazer pesquisas empíricas, com auxílio de ferramentas computacionais e com base em evidências linguísticas extraídas de corpora; (2) a possibilidade de trazer contribuições teóricas para os estudos da linguagem, através de novas descrições de diferentes usos da língua; (3) as interfaces de pesquisa com outras áreas, tais como Linguística Sistêmico-Funcional, Linguística Aplicada e Linguística Computacional; (4) o desenvolvimento da área, inclusive no Brasil, devido às novas perspectivas que possibilita em relação à lexicografia, léxico-gramática, estudos da variação linguística em gêneros discursivos e estudos interculturais. Através da discussão dos pontos acima, espera-se indicar que a Linguística de Corpus é uma área que permite o aprofundamento sobre o conhecimento empírico de diferentes línguas estudadas, levando a novas concepções teóricas sobre a linguagem, não podendo ser considerada, portanto, apenas como uma metodologia de análise. No final do trabalho, serão brevemente apresentadas três pesquisas que incluem dados da língua portuguesa, visando exemplificar aplicações da Linguística de Corpus para o estudo do uso do português. Esses trabalhos foram desenvolvidos a partir do CORPOBRAS PUC-Rio, compilado com o objetivo de ser um corpus representativo do português do Brasil1 .The purpose of this paper is to present an overview of Corpus Linguistics, characterizing it as an area of research, considering its relations with other areas of study and illustrating its applications with specific focus on Brazilian Portuguese. In order to develop these topics, this research paper discusses Corpus Linguistics characteristics by pointing out some issues that distinguish it from other areas of research, such as: (1) its specific way to define language as well as a particular form to do empirical research on the basis of evidence extracted from linguistic corpora, using computational tools; (2) the possibility to generate theoretical contributions through new descriptions of different language uses; (3) the interfaces it establishes with Systemic- Functional Linguistics, Applied Linguistics and Computational Linguistics; (4) the expansion of the area in many countries, including Brazil, due to new perspectives opened in several fields, such as, lexicography, lexicogrammatical studies, genre and language variation studies as well as cross-cultural studies. The discussion of the topics above should reinforce the argument that Corpus Linguistics cannot be considered only as a methodological approach, but rather as a research area that allows for empirical linguistic knowledge, leading into new theoretical insights about language. In order to illustrate some corpus research done within the scope of Corpus Linguistics using data from the Portuguese language, three empirical studies are briefly described at the end of this paper. These academic works used data from the CORPOBRAS PUC-Rio, a corpus compiled with the purpose of representing Brazilian Portuguese.Universidade do Estado do Rio de Janeiro2009-06-30info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionartigos de linguísticaartigos de linguísticaapplication/pdfhttps://www.e-publicacoes.uerj.br/matraga/article/view/27796Matraga - Revista do Programa de Pós-Graduação em Letras da UERJ; v. 16 n. 24 (2009): Teorias Gramaticais ContemporâneasMATRAGA - Journal published by the Graduate Program in Letters at Rio de Janeiro State University (UERJ); Vol. 16 No. 24 (2009): Contemporary Theories of Grammar2446-69051414-7165reponame:Matraga (Online)instname:Universidade do Estado do Rio de Janeiro (UERJ)instacron:UERJporhttps://www.e-publicacoes.uerj.br/matraga/article/view/27796/19917Oliveira, Lúcia Pacheco deinfo:eu-repo/semantics/openAccess2019-07-09T04:04:44Zoai:ojs.www.e-publicacoes.uerj.br:article/27796Revistahttps://www.e-publicacoes.uerj.br/index.php/matragaPUBhttps://www.e-publicacoes.uerj.br/index.php/matraga/oai||letrasmatraga@uerj.br2446-69051414-7165opendoar:2019-07-09T04:04:44Matraga (Online) - Universidade do Estado do Rio de Janeiro (UERJ)false
dc.title.none.fl_str_mv Corpus Linguistics: theory, interfaces and applications
Linguística de Corpus: teoria, interfaces e aplicações
title Corpus Linguistics: theory, interfaces and applications
spellingShingle Corpus Linguistics: theory, interfaces and applications
Oliveira, Lúcia Pacheco de
corpus linguistics
theory and corpus
empirical research
Brazilian Portuguese corpus
CORPOBRAS PUC-Rio.
linguística de corpus
teoria e corpus
pesquisa empírica
corpus do português do Brasil
CORPOBRAS PUC-Rio.
title_short Corpus Linguistics: theory, interfaces and applications
title_full Corpus Linguistics: theory, interfaces and applications
title_fullStr Corpus Linguistics: theory, interfaces and applications
title_full_unstemmed Corpus Linguistics: theory, interfaces and applications
title_sort Corpus Linguistics: theory, interfaces and applications
author Oliveira, Lúcia Pacheco de
author_facet Oliveira, Lúcia Pacheco de
author_role author
dc.contributor.author.fl_str_mv Oliveira, Lúcia Pacheco de
dc.subject.por.fl_str_mv corpus linguistics
theory and corpus
empirical research
Brazilian Portuguese corpus
CORPOBRAS PUC-Rio.
linguística de corpus
teoria e corpus
pesquisa empírica
corpus do português do Brasil
CORPOBRAS PUC-Rio.
topic corpus linguistics
theory and corpus
empirical research
Brazilian Portuguese corpus
CORPOBRAS PUC-Rio.
linguística de corpus
teoria e corpus
pesquisa empírica
corpus do português do Brasil
CORPOBRAS PUC-Rio.
description O objetivo deste trabalho é apresentar uma visão geral da Linguística de Corpus, caracterizando-a como uma área do conhecimento; levando em consideração sua interface com outras áreas; e ilustrando suas aplicações, com foco mais específico no português do Brasil. Para atingir este objetivo, este artigo discute características da Linguística de Corpus que a distinguem de outras áreas, tais como: (1) a perspectiva de linguagem que adota e a forma de fazer pesquisas empíricas, com auxílio de ferramentas computacionais e com base em evidências linguísticas extraídas de corpora; (2) a possibilidade de trazer contribuições teóricas para os estudos da linguagem, através de novas descrições de diferentes usos da língua; (3) as interfaces de pesquisa com outras áreas, tais como Linguística Sistêmico-Funcional, Linguística Aplicada e Linguística Computacional; (4) o desenvolvimento da área, inclusive no Brasil, devido às novas perspectivas que possibilita em relação à lexicografia, léxico-gramática, estudos da variação linguística em gêneros discursivos e estudos interculturais. Através da discussão dos pontos acima, espera-se indicar que a Linguística de Corpus é uma área que permite o aprofundamento sobre o conhecimento empírico de diferentes línguas estudadas, levando a novas concepções teóricas sobre a linguagem, não podendo ser considerada, portanto, apenas como uma metodologia de análise. No final do trabalho, serão brevemente apresentadas três pesquisas que incluem dados da língua portuguesa, visando exemplificar aplicações da Linguística de Corpus para o estudo do uso do português. Esses trabalhos foram desenvolvidos a partir do CORPOBRAS PUC-Rio, compilado com o objetivo de ser um corpus representativo do português do Brasil1 .
publishDate 2009
dc.date.none.fl_str_mv 2009-06-30
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
artigos de linguística
artigos de linguística
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.e-publicacoes.uerj.br/matraga/article/view/27796
url https://www.e-publicacoes.uerj.br/matraga/article/view/27796
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://www.e-publicacoes.uerj.br/matraga/article/view/27796/19917
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade do Estado do Rio de Janeiro
publisher.none.fl_str_mv Universidade do Estado do Rio de Janeiro
dc.source.none.fl_str_mv Matraga - Revista do Programa de Pós-Graduação em Letras da UERJ; v. 16 n. 24 (2009): Teorias Gramaticais Contemporâneas
MATRAGA - Journal published by the Graduate Program in Letters at Rio de Janeiro State University (UERJ); Vol. 16 No. 24 (2009): Contemporary Theories of Grammar
2446-6905
1414-7165
reponame:Matraga (Online)
instname:Universidade do Estado do Rio de Janeiro (UERJ)
instacron:UERJ
instname_str Universidade do Estado do Rio de Janeiro (UERJ)
instacron_str UERJ
institution UERJ
reponame_str Matraga (Online)
collection Matraga (Online)
repository.name.fl_str_mv Matraga (Online) - Universidade do Estado do Rio de Janeiro (UERJ)
repository.mail.fl_str_mv ||letrasmatraga@uerj.br
_version_ 1799318492871131136