O Corpus de Português Escrito em Periódicos - CoPEP
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Outros Autores: | |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada |
Texto Completo: | https://revistas.pucsp.br/index.php/delta/article/view/52552 |
Resumo: | O presente estudo tem como objetivo descrever os desafi os e soluções encontrados na compilação do Corpus de Português Escrito em Periódicos - CoPEP, que contém aproximadamente 40 milhões de palavras, é equilibrado entre as variedades português brasileiro e português europeu em número de palavras e cobre seis grandes áreas de conhecimento. Primeiramente, apresentaremos o contexto de criação do CoPEP, qual seja, a elaboração de um dicionário on-line de português para universitários, para o qual serviu como fonte primária de obtenção de evidências linguísticas. Assim, foram as características desse projeto lexicográfi co que informaram os critérios de criação do desenho do CoPEP e as consequentes tomadas de decisão. A seguir, descreveremos a metodologia de aquisição de dados, com foco especial nos desafi os enfrentados e nas soluções encontradas. Terminaremos com a descrição da fase fi nal de compilação, na qual aplicamos uma série de procedimentos para obtenção de equilíbrio. |
id |
PUC_SP-4_ace0adaa757b40bd8f85cf8496c8a5fa |
---|---|
oai_identifier_str |
oai:ojs.pkp.sfu.ca:article/52552 |
network_acronym_str |
PUC_SP-4 |
network_name_str |
DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada |
repository_id_str |
|
spelling |
O Corpus de Português Escrito em Periódicos - CoPEPcorpus multivariedadecompilação de corpusdiscurso acadêmicolíngua portuguesaO presente estudo tem como objetivo descrever os desafi os e soluções encontrados na compilação do Corpus de Português Escrito em Periódicos - CoPEP, que contém aproximadamente 40 milhões de palavras, é equilibrado entre as variedades português brasileiro e português europeu em número de palavras e cobre seis grandes áreas de conhecimento. Primeiramente, apresentaremos o contexto de criação do CoPEP, qual seja, a elaboração de um dicionário on-line de português para universitários, para o qual serviu como fonte primária de obtenção de evidências linguísticas. Assim, foram as características desse projeto lexicográfi co que informaram os critérios de criação do desenho do CoPEP e as consequentes tomadas de decisão. A seguir, descreveremos a metodologia de aquisição de dados, com foco especial nos desafi os enfrentados e nas soluções encontradas. Terminaremos com a descrição da fase fi nal de compilação, na qual aplicamos uma série de procedimentos para obtenção de equilíbrio.Pontifícia Universidade Católica de São paulo2021-02-08info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://revistas.pucsp.br/index.php/delta/article/view/52552DELTA: Documentação e Estudos em Linguística Teórica e Aplicada; v. 36 n. 2 (2020)1678-460X0102-4450reponame:DELTA: Documentação de Estudos em Lingüística Teórica e Aplicadainstname:Pontifícia Universidade Católica de São Paulo (PUC-SP)instacron:PUC_SPporhttps://revistas.pucsp.br/index.php/delta/article/view/52552/34554Copyright (c) 2021 Tanara Zingano Kuhn, José Pedro Ferreirainfo:eu-repo/semantics/openAccessKuhn, Tanara ZinganoFerreira, José Pedro2021-02-08T23:11:03Zoai:ojs.pkp.sfu.ca:article/52552Revistahttps://revistas.pucsp.br/deltaPRIhttps://revistas.pucsp.br/index.php/delta/oai||delta@pucsp.br1678-460X1678-460Xopendoar:2021-02-08T23:11:03DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada - Pontifícia Universidade Católica de São Paulo (PUC-SP)false |
dc.title.none.fl_str_mv |
O Corpus de Português Escrito em Periódicos - CoPEP |
title |
O Corpus de Português Escrito em Periódicos - CoPEP |
spellingShingle |
O Corpus de Português Escrito em Periódicos - CoPEP Kuhn, Tanara Zingano corpus multivariedade compilação de corpus discurso acadêmico língua portuguesa |
title_short |
O Corpus de Português Escrito em Periódicos - CoPEP |
title_full |
O Corpus de Português Escrito em Periódicos - CoPEP |
title_fullStr |
O Corpus de Português Escrito em Periódicos - CoPEP |
title_full_unstemmed |
O Corpus de Português Escrito em Periódicos - CoPEP |
title_sort |
O Corpus de Português Escrito em Periódicos - CoPEP |
author |
Kuhn, Tanara Zingano |
author_facet |
Kuhn, Tanara Zingano Ferreira, José Pedro |
author_role |
author |
author2 |
Ferreira, José Pedro |
author2_role |
author |
dc.contributor.author.fl_str_mv |
Kuhn, Tanara Zingano Ferreira, José Pedro |
dc.subject.por.fl_str_mv |
corpus multivariedade compilação de corpus discurso acadêmico língua portuguesa |
topic |
corpus multivariedade compilação de corpus discurso acadêmico língua portuguesa |
description |
O presente estudo tem como objetivo descrever os desafi os e soluções encontrados na compilação do Corpus de Português Escrito em Periódicos - CoPEP, que contém aproximadamente 40 milhões de palavras, é equilibrado entre as variedades português brasileiro e português europeu em número de palavras e cobre seis grandes áreas de conhecimento. Primeiramente, apresentaremos o contexto de criação do CoPEP, qual seja, a elaboração de um dicionário on-line de português para universitários, para o qual serviu como fonte primária de obtenção de evidências linguísticas. Assim, foram as características desse projeto lexicográfi co que informaram os critérios de criação do desenho do CoPEP e as consequentes tomadas de decisão. A seguir, descreveremos a metodologia de aquisição de dados, com foco especial nos desafi os enfrentados e nas soluções encontradas. Terminaremos com a descrição da fase fi nal de compilação, na qual aplicamos uma série de procedimentos para obtenção de equilíbrio. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-02-08 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://revistas.pucsp.br/index.php/delta/article/view/52552 |
url |
https://revistas.pucsp.br/index.php/delta/article/view/52552 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://revistas.pucsp.br/index.php/delta/article/view/52552/34554 |
dc.rights.driver.fl_str_mv |
Copyright (c) 2021 Tanara Zingano Kuhn, José Pedro Ferreira info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Copyright (c) 2021 Tanara Zingano Kuhn, José Pedro Ferreira |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica de São paulo |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica de São paulo |
dc.source.none.fl_str_mv |
DELTA: Documentação e Estudos em Linguística Teórica e Aplicada; v. 36 n. 2 (2020) 1678-460X 0102-4450 reponame:DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada instname:Pontifícia Universidade Católica de São Paulo (PUC-SP) instacron:PUC_SP |
instname_str |
Pontifícia Universidade Católica de São Paulo (PUC-SP) |
instacron_str |
PUC_SP |
institution |
PUC_SP |
reponame_str |
DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada |
collection |
DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada |
repository.name.fl_str_mv |
DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada - Pontifícia Universidade Católica de São Paulo (PUC-SP) |
repository.mail.fl_str_mv |
||delta@pucsp.br |
_version_ |
1799129304630558720 |