Corpus Linguistics: theory, interfaces and applications
Autor(a) principal: | |
---|---|
Data de Publicação: | 2009 |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Matraga (Online) |
Texto Completo: | https://www.e-publicacoes.uerj.br/matraga/article/view/27796 |
Resumo: | O objetivo deste trabalho é apresentar uma visão geral da Linguística de Corpus, caracterizando-a como uma área do conhecimento; levando em consideração sua interface com outras áreas; e ilustrando suas aplicações, com foco mais específico no português do Brasil. Para atingir este objetivo, este artigo discute características da Linguística de Corpus que a distinguem de outras áreas, tais como: (1) a perspectiva de linguagem que adota e a forma de fazer pesquisas empíricas, com auxílio de ferramentas computacionais e com base em evidências linguísticas extraídas de corpora; (2) a possibilidade de trazer contribuições teóricas para os estudos da linguagem, através de novas descrições de diferentes usos da língua; (3) as interfaces de pesquisa com outras áreas, tais como Linguística Sistêmico-Funcional, Linguística Aplicada e Linguística Computacional; (4) o desenvolvimento da área, inclusive no Brasil, devido às novas perspectivas que possibilita em relação à lexicografia, léxico-gramática, estudos da variação linguística em gêneros discursivos e estudos interculturais. Através da discussão dos pontos acima, espera-se indicar que a Linguística de Corpus é uma área que permite o aprofundamento sobre o conhecimento empírico de diferentes línguas estudadas, levando a novas concepções teóricas sobre a linguagem, não podendo ser considerada, portanto, apenas como uma metodologia de análise. No final do trabalho, serão brevemente apresentadas três pesquisas que incluem dados da língua portuguesa, visando exemplificar aplicações da Linguística de Corpus para o estudo do uso do português. Esses trabalhos foram desenvolvidos a partir do CORPOBRAS PUC-Rio, compilado com o objetivo de ser um corpus representativo do português do Brasil1 . |
id |
UERJ-9_9ca8c3c4b9ad2f3d8b04cbb748e4cbae |
---|---|
oai_identifier_str |
oai:ojs.www.e-publicacoes.uerj.br:article/27796 |
network_acronym_str |
UERJ-9 |
network_name_str |
Matraga (Online) |
repository_id_str |
|
spelling |
Corpus Linguistics: theory, interfaces and applicationsLinguística de Corpus: teoria, interfaces e aplicaçõescorpus linguisticstheory and corpusempirical researchBrazilian Portuguese corpusCORPOBRAS PUC-Rio.linguística de corpusteoria e corpuspesquisa empíricacorpus do português do BrasilCORPOBRAS PUC-Rio.O objetivo deste trabalho é apresentar uma visão geral da Linguística de Corpus, caracterizando-a como uma área do conhecimento; levando em consideração sua interface com outras áreas; e ilustrando suas aplicações, com foco mais específico no português do Brasil. Para atingir este objetivo, este artigo discute características da Linguística de Corpus que a distinguem de outras áreas, tais como: (1) a perspectiva de linguagem que adota e a forma de fazer pesquisas empíricas, com auxílio de ferramentas computacionais e com base em evidências linguísticas extraídas de corpora; (2) a possibilidade de trazer contribuições teóricas para os estudos da linguagem, através de novas descrições de diferentes usos da língua; (3) as interfaces de pesquisa com outras áreas, tais como Linguística Sistêmico-Funcional, Linguística Aplicada e Linguística Computacional; (4) o desenvolvimento da área, inclusive no Brasil, devido às novas perspectivas que possibilita em relação à lexicografia, léxico-gramática, estudos da variação linguística em gêneros discursivos e estudos interculturais. Através da discussão dos pontos acima, espera-se indicar que a Linguística de Corpus é uma área que permite o aprofundamento sobre o conhecimento empírico de diferentes línguas estudadas, levando a novas concepções teóricas sobre a linguagem, não podendo ser considerada, portanto, apenas como uma metodologia de análise. No final do trabalho, serão brevemente apresentadas três pesquisas que incluem dados da língua portuguesa, visando exemplificar aplicações da Linguística de Corpus para o estudo do uso do português. Esses trabalhos foram desenvolvidos a partir do CORPOBRAS PUC-Rio, compilado com o objetivo de ser um corpus representativo do português do Brasil1 .The purpose of this paper is to present an overview of Corpus Linguistics, characterizing it as an area of research, considering its relations with other areas of study and illustrating its applications with specific focus on Brazilian Portuguese. In order to develop these topics, this research paper discusses Corpus Linguistics characteristics by pointing out some issues that distinguish it from other areas of research, such as: (1) its specific way to define language as well as a particular form to do empirical research on the basis of evidence extracted from linguistic corpora, using computational tools; (2) the possibility to generate theoretical contributions through new descriptions of different language uses; (3) the interfaces it establishes with Systemic- Functional Linguistics, Applied Linguistics and Computational Linguistics; (4) the expansion of the area in many countries, including Brazil, due to new perspectives opened in several fields, such as, lexicography, lexicogrammatical studies, genre and language variation studies as well as cross-cultural studies. The discussion of the topics above should reinforce the argument that Corpus Linguistics cannot be considered only as a methodological approach, but rather as a research area that allows for empirical linguistic knowledge, leading into new theoretical insights about language. In order to illustrate some corpus research done within the scope of Corpus Linguistics using data from the Portuguese language, three empirical studies are briefly described at the end of this paper. These academic works used data from the CORPOBRAS PUC-Rio, a corpus compiled with the purpose of representing Brazilian Portuguese.Universidade do Estado do Rio de Janeiro2009-06-30info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionartigos de linguísticaartigos de linguísticaapplication/pdfhttps://www.e-publicacoes.uerj.br/matraga/article/view/27796Matraga - Revista do Programa de Pós-Graduação em Letras da UERJ; v. 16 n. 24 (2009): Teorias Gramaticais ContemporâneasMATRAGA - Journal published by the Graduate Program in Letters at Rio de Janeiro State University (UERJ); Vol. 16 No. 24 (2009): Contemporary Theories of Grammar2446-69051414-7165reponame:Matraga (Online)instname:Universidade do Estado do Rio de Janeiro (UERJ)instacron:UERJporhttps://www.e-publicacoes.uerj.br/matraga/article/view/27796/19917Oliveira, Lúcia Pacheco deinfo:eu-repo/semantics/openAccess2019-07-09T04:04:44Zoai:ojs.www.e-publicacoes.uerj.br:article/27796Revistahttps://www.e-publicacoes.uerj.br/index.php/matragaPUBhttps://www.e-publicacoes.uerj.br/index.php/matraga/oai||letrasmatraga@uerj.br2446-69051414-7165opendoar:2019-07-09T04:04:44Matraga (Online) - Universidade do Estado do Rio de Janeiro (UERJ)false |
dc.title.none.fl_str_mv |
Corpus Linguistics: theory, interfaces and applications Linguística de Corpus: teoria, interfaces e aplicações |
title |
Corpus Linguistics: theory, interfaces and applications |
spellingShingle |
Corpus Linguistics: theory, interfaces and applications Oliveira, Lúcia Pacheco de corpus linguistics theory and corpus empirical research Brazilian Portuguese corpus CORPOBRAS PUC-Rio. linguística de corpus teoria e corpus pesquisa empírica corpus do português do Brasil CORPOBRAS PUC-Rio. |
title_short |
Corpus Linguistics: theory, interfaces and applications |
title_full |
Corpus Linguistics: theory, interfaces and applications |
title_fullStr |
Corpus Linguistics: theory, interfaces and applications |
title_full_unstemmed |
Corpus Linguistics: theory, interfaces and applications |
title_sort |
Corpus Linguistics: theory, interfaces and applications |
author |
Oliveira, Lúcia Pacheco de |
author_facet |
Oliveira, Lúcia Pacheco de |
author_role |
author |
dc.contributor.author.fl_str_mv |
Oliveira, Lúcia Pacheco de |
dc.subject.por.fl_str_mv |
corpus linguistics theory and corpus empirical research Brazilian Portuguese corpus CORPOBRAS PUC-Rio. linguística de corpus teoria e corpus pesquisa empírica corpus do português do Brasil CORPOBRAS PUC-Rio. |
topic |
corpus linguistics theory and corpus empirical research Brazilian Portuguese corpus CORPOBRAS PUC-Rio. linguística de corpus teoria e corpus pesquisa empírica corpus do português do Brasil CORPOBRAS PUC-Rio. |
description |
O objetivo deste trabalho é apresentar uma visão geral da Linguística de Corpus, caracterizando-a como uma área do conhecimento; levando em consideração sua interface com outras áreas; e ilustrando suas aplicações, com foco mais específico no português do Brasil. Para atingir este objetivo, este artigo discute características da Linguística de Corpus que a distinguem de outras áreas, tais como: (1) a perspectiva de linguagem que adota e a forma de fazer pesquisas empíricas, com auxílio de ferramentas computacionais e com base em evidências linguísticas extraídas de corpora; (2) a possibilidade de trazer contribuições teóricas para os estudos da linguagem, através de novas descrições de diferentes usos da língua; (3) as interfaces de pesquisa com outras áreas, tais como Linguística Sistêmico-Funcional, Linguística Aplicada e Linguística Computacional; (4) o desenvolvimento da área, inclusive no Brasil, devido às novas perspectivas que possibilita em relação à lexicografia, léxico-gramática, estudos da variação linguística em gêneros discursivos e estudos interculturais. Através da discussão dos pontos acima, espera-se indicar que a Linguística de Corpus é uma área que permite o aprofundamento sobre o conhecimento empírico de diferentes línguas estudadas, levando a novas concepções teóricas sobre a linguagem, não podendo ser considerada, portanto, apenas como uma metodologia de análise. No final do trabalho, serão brevemente apresentadas três pesquisas que incluem dados da língua portuguesa, visando exemplificar aplicações da Linguística de Corpus para o estudo do uso do português. Esses trabalhos foram desenvolvidos a partir do CORPOBRAS PUC-Rio, compilado com o objetivo de ser um corpus representativo do português do Brasil1 . |
publishDate |
2009 |
dc.date.none.fl_str_mv |
2009-06-30 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion artigos de linguística artigos de linguística |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.e-publicacoes.uerj.br/matraga/article/view/27796 |
url |
https://www.e-publicacoes.uerj.br/matraga/article/view/27796 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://www.e-publicacoes.uerj.br/matraga/article/view/27796/19917 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade do Estado do Rio de Janeiro |
publisher.none.fl_str_mv |
Universidade do Estado do Rio de Janeiro |
dc.source.none.fl_str_mv |
Matraga - Revista do Programa de Pós-Graduação em Letras da UERJ; v. 16 n. 24 (2009): Teorias Gramaticais Contemporâneas MATRAGA - Journal published by the Graduate Program in Letters at Rio de Janeiro State University (UERJ); Vol. 16 No. 24 (2009): Contemporary Theories of Grammar 2446-6905 1414-7165 reponame:Matraga (Online) instname:Universidade do Estado do Rio de Janeiro (UERJ) instacron:UERJ |
instname_str |
Universidade do Estado do Rio de Janeiro (UERJ) |
instacron_str |
UERJ |
institution |
UERJ |
reponame_str |
Matraga (Online) |
collection |
Matraga (Online) |
repository.name.fl_str_mv |
Matraga (Online) - Universidade do Estado do Rio de Janeiro (UERJ) |
repository.mail.fl_str_mv |
||letrasmatraga@uerj.br |
_version_ |
1799318492871131136 |