O Corpus de Português Escrito em Periódicos - CoPEP

Detalhes bibliográficos
Autor(a) principal: Kuhn, Tanara Zingano
Data de Publicação: 2021
Outros Autores: Ferreira, José Pedro
Tipo de documento: Artigo
Idioma: por
Título da fonte: DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada
Texto Completo: https://revistas.pucsp.br/index.php/delta/article/view/52552
Resumo: O presente estudo tem como objetivo descrever os desafi os e soluções encontrados na compilação do Corpus de Português Escrito em Periódicos - CoPEP, que contém aproximadamente 40 milhões de palavras, é equilibrado entre as variedades português brasileiro e português europeu em número de palavras e cobre seis grandes áreas de conhecimento. Primeiramente, apresentaremos o contexto de criação do CoPEP, qual seja, a elaboração de um dicionário on-line de português para universitários, para o qual serviu como fonte primária de obtenção de evidências linguísticas. Assim, foram as características desse projeto lexicográfi co que informaram os critérios de criação do desenho do CoPEP e as consequentes tomadas de decisão. A seguir, descreveremos a metodologia de aquisição de dados, com foco especial nos desafi os enfrentados e nas soluções encontradas. Terminaremos com a descrição da fase fi nal de compilação, na qual aplicamos uma série de procedimentos para obtenção de equilíbrio.
id PUC_SP-4_ace0adaa757b40bd8f85cf8496c8a5fa
oai_identifier_str oai:ojs.pkp.sfu.ca:article/52552
network_acronym_str PUC_SP-4
network_name_str DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada
repository_id_str
spelling O Corpus de Português Escrito em Periódicos - CoPEPcorpus multivariedadecompilação de corpusdiscurso acadêmicolíngua portuguesaO presente estudo tem como objetivo descrever os desafi os e soluções encontrados na compilação do Corpus de Português Escrito em Periódicos - CoPEP, que contém aproximadamente 40 milhões de palavras, é equilibrado entre as variedades português brasileiro e português europeu em número de palavras e cobre seis grandes áreas de conhecimento. Primeiramente, apresentaremos o contexto de criação do CoPEP, qual seja, a elaboração de um dicionário on-line de português para universitários, para o qual serviu como fonte primária de obtenção de evidências linguísticas. Assim, foram as características desse projeto lexicográfi co que informaram os critérios de criação do desenho do CoPEP e as consequentes tomadas de decisão. A seguir, descreveremos a metodologia de aquisição de dados, com foco especial nos desafi os enfrentados e nas soluções encontradas. Terminaremos com a descrição da fase fi nal de compilação, na qual aplicamos uma série de procedimentos para obtenção de equilíbrio.Pontifícia Universidade Católica de São paulo2021-02-08info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://revistas.pucsp.br/index.php/delta/article/view/52552DELTA: Documentação e Estudos em Linguística Teórica e Aplicada; v. 36 n. 2 (2020)1678-460X0102-4450reponame:DELTA: Documentação de Estudos em Lingüística Teórica e Aplicadainstname:Pontifícia Universidade Católica de São Paulo (PUC-SP)instacron:PUC_SPporhttps://revistas.pucsp.br/index.php/delta/article/view/52552/34554Copyright (c) 2021 Tanara Zingano Kuhn, José Pedro Ferreirainfo:eu-repo/semantics/openAccessKuhn, Tanara ZinganoFerreira, José Pedro2021-02-08T23:11:03Zoai:ojs.pkp.sfu.ca:article/52552Revistahttps://revistas.pucsp.br/deltaPRIhttps://revistas.pucsp.br/index.php/delta/oai||delta@pucsp.br1678-460X1678-460Xopendoar:2021-02-08T23:11:03DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada - Pontifícia Universidade Católica de São Paulo (PUC-SP)false
dc.title.none.fl_str_mv O Corpus de Português Escrito em Periódicos - CoPEP
title O Corpus de Português Escrito em Periódicos - CoPEP
spellingShingle O Corpus de Português Escrito em Periódicos - CoPEP
Kuhn, Tanara Zingano
corpus multivariedade
compilação de corpus
discurso acadêmico
língua portuguesa
title_short O Corpus de Português Escrito em Periódicos - CoPEP
title_full O Corpus de Português Escrito em Periódicos - CoPEP
title_fullStr O Corpus de Português Escrito em Periódicos - CoPEP
title_full_unstemmed O Corpus de Português Escrito em Periódicos - CoPEP
title_sort O Corpus de Português Escrito em Periódicos - CoPEP
author Kuhn, Tanara Zingano
author_facet Kuhn, Tanara Zingano
Ferreira, José Pedro
author_role author
author2 Ferreira, José Pedro
author2_role author
dc.contributor.author.fl_str_mv Kuhn, Tanara Zingano
Ferreira, José Pedro
dc.subject.por.fl_str_mv corpus multivariedade
compilação de corpus
discurso acadêmico
língua portuguesa
topic corpus multivariedade
compilação de corpus
discurso acadêmico
língua portuguesa
description O presente estudo tem como objetivo descrever os desafi os e soluções encontrados na compilação do Corpus de Português Escrito em Periódicos - CoPEP, que contém aproximadamente 40 milhões de palavras, é equilibrado entre as variedades português brasileiro e português europeu em número de palavras e cobre seis grandes áreas de conhecimento. Primeiramente, apresentaremos o contexto de criação do CoPEP, qual seja, a elaboração de um dicionário on-line de português para universitários, para o qual serviu como fonte primária de obtenção de evidências linguísticas. Assim, foram as características desse projeto lexicográfi co que informaram os critérios de criação do desenho do CoPEP e as consequentes tomadas de decisão. A seguir, descreveremos a metodologia de aquisição de dados, com foco especial nos desafi os enfrentados e nas soluções encontradas. Terminaremos com a descrição da fase fi nal de compilação, na qual aplicamos uma série de procedimentos para obtenção de equilíbrio.
publishDate 2021
dc.date.none.fl_str_mv 2021-02-08
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://revistas.pucsp.br/index.php/delta/article/view/52552
url https://revistas.pucsp.br/index.php/delta/article/view/52552
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://revistas.pucsp.br/index.php/delta/article/view/52552/34554
dc.rights.driver.fl_str_mv Copyright (c) 2021 Tanara Zingano Kuhn, José Pedro Ferreira
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2021 Tanara Zingano Kuhn, José Pedro Ferreira
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica de São paulo
publisher.none.fl_str_mv Pontifícia Universidade Católica de São paulo
dc.source.none.fl_str_mv DELTA: Documentação e Estudos em Linguística Teórica e Aplicada; v. 36 n. 2 (2020)
1678-460X
0102-4450
reponame:DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada
instname:Pontifícia Universidade Católica de São Paulo (PUC-SP)
instacron:PUC_SP
instname_str Pontifícia Universidade Católica de São Paulo (PUC-SP)
instacron_str PUC_SP
institution PUC_SP
reponame_str DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada
collection DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada
repository.name.fl_str_mv DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada - Pontifícia Universidade Católica de São Paulo (PUC-SP)
repository.mail.fl_str_mv ||delta@pucsp.br
_version_ 1799129304630558720