Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo

Detalhes bibliográficos
Autor(a) principal: Soares, Ana Paula
Data de Publicação: 2014
Outros Autores: Iriarte Sanromán, Álvaro, Almeida, J. J., Simões, Alberto, Costa, Ana, França, Patrícia das Dores Marques da Silva Cunha, Machado, João F., Comesaña, Montserrat
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/1822/30669
Resumo: Neste trabalho apresentamos as estratégias e os procedimentos adoptados na constituição de uma nova medida de frequência lexical do Português Europeu contemporâneo, o Procura-PALavras (P- -PAL). Baseado num corpus de mais de 227 milhões de palavras, o P-PAL é uma aplicação web que oferece, por defeito, valores de frequência lexical para todas as suas entradas lexicais (lemas e formas) e que permite a computação de uma grande diversidade de outras medidas objectivas (lexicais e sublexicais) e subjectivas. Descrevemos ainda o processo de defi nição das suas entradas lexicais e da extracção dos respectivos valores de frequência. O elevado número de índices e de entradas lexicais tornam o P-PAL numa aplicação web avançada e indispensável à promoção e internacionalização da investigação em Portugal. O P-PAL encontra-se disponível em http://p-pal.di.uminho.pt/tools
id RCAP_e1b19ffee7d27a2c627e716b57c72fea
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/30669
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneoProcura-PALavras (P-PAL): a new measure of word frequency for contemporary European PortugueseFrequência lexicalBases lexicaisCorpus/corporaPortuguês europeuWord frequencyLexical databasesEuropean PortugueseSocial SciencesNeste trabalho apresentamos as estratégias e os procedimentos adoptados na constituição de uma nova medida de frequência lexical do Português Europeu contemporâneo, o Procura-PALavras (P- -PAL). Baseado num corpus de mais de 227 milhões de palavras, o P-PAL é uma aplicação web que oferece, por defeito, valores de frequência lexical para todas as suas entradas lexicais (lemas e formas) e que permite a computação de uma grande diversidade de outras medidas objectivas (lexicais e sublexicais) e subjectivas. Descrevemos ainda o processo de defi nição das suas entradas lexicais e da extracção dos respectivos valores de frequência. O elevado número de índices e de entradas lexicais tornam o P-PAL numa aplicação web avançada e indispensável à promoção e internacionalização da investigação em Portugal. O P-PAL encontra-se disponível em http://p-pal.di.uminho.pt/toolsIn this paper we present the strategies and procedures undertaken in the development of a new measure of lexical frequency of the contemporary European Portuguese – Procura-PALavras (P-PAL). Based on a corpus of over 227 million words, P-PAL offers the default frequency per million words (lemmas and wordforms), and the computation of several other objective (lexical and sublexical) and subjective word metrics. We also describe lexical entry integration and word frequency extraction. The high number of indices and lexical entries makes P-PAL an advanced and indispensable web application for the promotion and internationalization of Portuguese research. P-PAL is available at http://p-pal.di.uminho.pt/toolsFundação para a Ciência e a Tecnologia (FCT)Universidade Federal do Rio Grande do Sul (UFRGS)Universidade do MinhoSoares, Ana PaulaIriarte Sanromán, ÁlvaroAlmeida, J. J.Simões, AlbertoCosta, AnaFrança, Patrícia das Dores Marques da Silva CunhaMachado, João F.Comesaña, Montserrat20142014-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttp://hdl.handle.net/1822/30669por0102-797210.1590/S0102-79722014000100013info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:50:21Zoai:repositorium.sdum.uminho.pt:1822/30669Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:49:03.884209Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
Procura-PALavras (P-PAL): a new measure of word frequency for contemporary European Portuguese
title Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
spellingShingle Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
Soares, Ana Paula
Frequência lexical
Bases lexicais
Corpus/corpora
Português europeu
Word frequency
Lexical databases
European Portuguese
Social Sciences
title_short Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
title_full Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
title_fullStr Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
title_full_unstemmed Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
title_sort Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
author Soares, Ana Paula
author_facet Soares, Ana Paula
Iriarte Sanromán, Álvaro
Almeida, J. J.
Simões, Alberto
Costa, Ana
França, Patrícia das Dores Marques da Silva Cunha
Machado, João F.
Comesaña, Montserrat
author_role author
author2 Iriarte Sanromán, Álvaro
Almeida, J. J.
Simões, Alberto
Costa, Ana
França, Patrícia das Dores Marques da Silva Cunha
Machado, João F.
Comesaña, Montserrat
author2_role author
author
author
author
author
author
author
dc.contributor.none.fl_str_mv Universidade do Minho
dc.contributor.author.fl_str_mv Soares, Ana Paula
Iriarte Sanromán, Álvaro
Almeida, J. J.
Simões, Alberto
Costa, Ana
França, Patrícia das Dores Marques da Silva Cunha
Machado, João F.
Comesaña, Montserrat
dc.subject.por.fl_str_mv Frequência lexical
Bases lexicais
Corpus/corpora
Português europeu
Word frequency
Lexical databases
European Portuguese
Social Sciences
topic Frequência lexical
Bases lexicais
Corpus/corpora
Português europeu
Word frequency
Lexical databases
European Portuguese
Social Sciences
description Neste trabalho apresentamos as estratégias e os procedimentos adoptados na constituição de uma nova medida de frequência lexical do Português Europeu contemporâneo, o Procura-PALavras (P- -PAL). Baseado num corpus de mais de 227 milhões de palavras, o P-PAL é uma aplicação web que oferece, por defeito, valores de frequência lexical para todas as suas entradas lexicais (lemas e formas) e que permite a computação de uma grande diversidade de outras medidas objectivas (lexicais e sublexicais) e subjectivas. Descrevemos ainda o processo de defi nição das suas entradas lexicais e da extracção dos respectivos valores de frequência. O elevado número de índices e de entradas lexicais tornam o P-PAL numa aplicação web avançada e indispensável à promoção e internacionalização da investigação em Portugal. O P-PAL encontra-se disponível em http://p-pal.di.uminho.pt/tools
publishDate 2014
dc.date.none.fl_str_mv 2014
2014-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1822/30669
url http://hdl.handle.net/1822/30669
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv 0102-7972
10.1590/S0102-79722014000100013
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Sul (UFRGS)
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Sul (UFRGS)
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133070517862400