A face quantitativa da linguagem: um dicionário de freqüências do português

Detalhes bibliográficos
Autor(a) principal: Biderman, Maria Tereza Camargo
Data de Publicação: 2001
Tipo de documento: Artigo
Idioma: por
Título da fonte: Alfa (São José do Rio Preto. Online)
Texto Completo: https://periodicos.fclar.unesp.br/alfa/article/view/4049
Resumo: O Dicionário de Freqüências do léxico do português brasileirocontemporâneo baseou-se num corpus de língua escrita, variedade brasileirade 5 milhões de palavras (1950 a 1990). Alguns resultados quantitativos:apenas 42.212 unidades léxicas diferentes totalizaram os 5 milhões de ocorrênciasdo corpus, excluídos topónimos e antropônimos. Os dados estatísticosdo dicionário registram altíssima freqüência das palavras instrumentais(artigos, preposições, pronomes, conjunções etc.) bem como de verbos auxiliarese modalizadores. O mesmo ocorre com palavras de significação muito geral, arquilexemas, altamente polissêmicos. Na vertente oposta estão as palavras de baixa freqüência sobretudo os hapax legomena, que contribuemmaciçamente para o total de 42.212 lexias registradas neste corpus. De fato,as palavras de baixa freqüência totalizam grande parte desse index verborum;caso contrário, o repertório vocabular seria muito menor. A categoria substantivo contribui com a maioria de vocábulos que ocorreram apenas uma vez no corpus, assim como os tecnicismos da linguagem científica. O vocabulário jornalístico é o mais neutro e o menos temático, constituindo uma espéciede média entre os outros gêneros de linguagem.
id UNESP-4_0a35497e9fbfdbe063871bd81a7da00c
oai_identifier_str oai:ojs.pkp.sfu.ca:article/4049
network_acronym_str UNESP-4
network_name_str Alfa (São José do Rio Preto. Online)
repository_id_str
spelling A face quantitativa da linguagem: um dicionário de freqüências do portuguêsLexicoestatísticadicionário de freqüênciashapax legomenaindex verborumvocabulário multiusoO Dicionário de Freqüências do léxico do português brasileirocontemporâneo baseou-se num corpus de língua escrita, variedade brasileirade 5 milhões de palavras (1950 a 1990). Alguns resultados quantitativos:apenas 42.212 unidades léxicas diferentes totalizaram os 5 milhões de ocorrênciasdo corpus, excluídos topónimos e antropônimos. Os dados estatísticosdo dicionário registram altíssima freqüência das palavras instrumentais(artigos, preposições, pronomes, conjunções etc.) bem como de verbos auxiliarese modalizadores. O mesmo ocorre com palavras de significação muito geral, arquilexemas, altamente polissêmicos. Na vertente oposta estão as palavras de baixa freqüência sobretudo os hapax legomena, que contribuemmaciçamente para o total de 42.212 lexias registradas neste corpus. De fato,as palavras de baixa freqüência totalizam grande parte desse index verborum;caso contrário, o repertório vocabular seria muito menor. A categoria substantivo contribui com a maioria de vocábulos que ocorreram apenas uma vez no corpus, assim como os tecnicismos da linguagem científica. O vocabulário jornalístico é o mais neutro e o menos temático, constituindo uma espéciede média entre os outros gêneros de linguagem.UNESP2001-02-12info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://periodicos.fclar.unesp.br/alfa/article/view/4049ALFA: Revista de Linguística; v. 42 - Especial (1998): O estado da arte nas ciências do léxico: lexicologia, lexicografia e terminologia1981-5794reponame:Alfa (São José do Rio Preto. Online)instname:Universidade Estadual Paulista (UNESP)instacron:UNESPporhttps://periodicos.fclar.unesp.br/alfa/article/view/4049/3713Copyright (c) 2001 ALFA: Revista de Linguísticainfo:eu-repo/semantics/openAccessBiderman, Maria Tereza Camargo2013-09-09T19:32:11Zoai:ojs.pkp.sfu.ca:article/4049Revistahttp://www.scielo.br/scielo.php?script=sci_serial&pid=1981-5794&lng=pt&nrm=isoPUBhttps://old.scielo.br/oai/scielo-oai.phpalfa@unesp.br1981-57940002-5216opendoar:2013-09-09T19:32:11Alfa (São José do Rio Preto. Online) - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv A face quantitativa da linguagem: um dicionário de freqüências do português
title A face quantitativa da linguagem: um dicionário de freqüências do português
spellingShingle A face quantitativa da linguagem: um dicionário de freqüências do português
Biderman, Maria Tereza Camargo
Lexicoestatística
dicionário de freqüências
hapax legomena
index verborum
vocabulário multiuso
title_short A face quantitativa da linguagem: um dicionário de freqüências do português
title_full A face quantitativa da linguagem: um dicionário de freqüências do português
title_fullStr A face quantitativa da linguagem: um dicionário de freqüências do português
title_full_unstemmed A face quantitativa da linguagem: um dicionário de freqüências do português
title_sort A face quantitativa da linguagem: um dicionário de freqüências do português
author Biderman, Maria Tereza Camargo
author_facet Biderman, Maria Tereza Camargo
author_role author
dc.contributor.author.fl_str_mv Biderman, Maria Tereza Camargo
dc.subject.por.fl_str_mv Lexicoestatística
dicionário de freqüências
hapax legomena
index verborum
vocabulário multiuso
topic Lexicoestatística
dicionário de freqüências
hapax legomena
index verborum
vocabulário multiuso
description O Dicionário de Freqüências do léxico do português brasileirocontemporâneo baseou-se num corpus de língua escrita, variedade brasileirade 5 milhões de palavras (1950 a 1990). Alguns resultados quantitativos:apenas 42.212 unidades léxicas diferentes totalizaram os 5 milhões de ocorrênciasdo corpus, excluídos topónimos e antropônimos. Os dados estatísticosdo dicionário registram altíssima freqüência das palavras instrumentais(artigos, preposições, pronomes, conjunções etc.) bem como de verbos auxiliarese modalizadores. O mesmo ocorre com palavras de significação muito geral, arquilexemas, altamente polissêmicos. Na vertente oposta estão as palavras de baixa freqüência sobretudo os hapax legomena, que contribuemmaciçamente para o total de 42.212 lexias registradas neste corpus. De fato,as palavras de baixa freqüência totalizam grande parte desse index verborum;caso contrário, o repertório vocabular seria muito menor. A categoria substantivo contribui com a maioria de vocábulos que ocorreram apenas uma vez no corpus, assim como os tecnicismos da linguagem científica. O vocabulário jornalístico é o mais neutro e o menos temático, constituindo uma espéciede média entre os outros gêneros de linguagem.
publishDate 2001
dc.date.none.fl_str_mv 2001-02-12
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://periodicos.fclar.unesp.br/alfa/article/view/4049
url https://periodicos.fclar.unesp.br/alfa/article/view/4049
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://periodicos.fclar.unesp.br/alfa/article/view/4049/3713
dc.rights.driver.fl_str_mv Copyright (c) 2001 ALFA: Revista de Linguística
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2001 ALFA: Revista de Linguística
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv UNESP
publisher.none.fl_str_mv UNESP
dc.source.none.fl_str_mv ALFA: Revista de Linguística; v. 42 - Especial (1998): O estado da arte nas ciências do léxico: lexicologia, lexicografia e terminologia
1981-5794
reponame:Alfa (São José do Rio Preto. Online)
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Alfa (São José do Rio Preto. Online)
collection Alfa (São José do Rio Preto. Online)
repository.name.fl_str_mv Alfa (São José do Rio Preto. Online) - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv alfa@unesp.br
_version_ 1800214376072871936