Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Outros Autores: | , , , , , , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/1822/30669 |
Resumo: | Neste trabalho apresentamos as estratégias e os procedimentos adoptados na constituição de uma nova medida de frequência lexical do Português Europeu contemporâneo, o Procura-PALavras (P- -PAL). Baseado num corpus de mais de 227 milhões de palavras, o P-PAL é uma aplicação web que oferece, por defeito, valores de frequência lexical para todas as suas entradas lexicais (lemas e formas) e que permite a computação de uma grande diversidade de outras medidas objectivas (lexicais e sublexicais) e subjectivas. Descrevemos ainda o processo de defi nição das suas entradas lexicais e da extracção dos respectivos valores de frequência. O elevado número de índices e de entradas lexicais tornam o P-PAL numa aplicação web avançada e indispensável à promoção e internacionalização da investigação em Portugal. O P-PAL encontra-se disponível em http://p-pal.di.uminho.pt/tools |
id |
RCAP_e1b19ffee7d27a2c627e716b57c72fea |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/30669 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneoProcura-PALavras (P-PAL): a new measure of word frequency for contemporary European PortugueseFrequência lexicalBases lexicaisCorpus/corporaPortuguês europeuWord frequencyLexical databasesEuropean PortugueseSocial SciencesNeste trabalho apresentamos as estratégias e os procedimentos adoptados na constituição de uma nova medida de frequência lexical do Português Europeu contemporâneo, o Procura-PALavras (P- -PAL). Baseado num corpus de mais de 227 milhões de palavras, o P-PAL é uma aplicação web que oferece, por defeito, valores de frequência lexical para todas as suas entradas lexicais (lemas e formas) e que permite a computação de uma grande diversidade de outras medidas objectivas (lexicais e sublexicais) e subjectivas. Descrevemos ainda o processo de defi nição das suas entradas lexicais e da extracção dos respectivos valores de frequência. O elevado número de índices e de entradas lexicais tornam o P-PAL numa aplicação web avançada e indispensável à promoção e internacionalização da investigação em Portugal. O P-PAL encontra-se disponível em http://p-pal.di.uminho.pt/toolsIn this paper we present the strategies and procedures undertaken in the development of a new measure of lexical frequency of the contemporary European Portuguese – Procura-PALavras (P-PAL). Based on a corpus of over 227 million words, P-PAL offers the default frequency per million words (lemmas and wordforms), and the computation of several other objective (lexical and sublexical) and subjective word metrics. We also describe lexical entry integration and word frequency extraction. The high number of indices and lexical entries makes P-PAL an advanced and indispensable web application for the promotion and internationalization of Portuguese research. P-PAL is available at http://p-pal.di.uminho.pt/toolsFundação para a Ciência e a Tecnologia (FCT)Universidade Federal do Rio Grande do Sul (UFRGS)Universidade do MinhoSoares, Ana PaulaIriarte Sanromán, ÁlvaroAlmeida, J. J.Simões, AlbertoCosta, AnaFrança, Patrícia das Dores Marques da Silva CunhaMachado, João F.Comesaña, Montserrat20142014-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttp://hdl.handle.net/1822/30669por0102-797210.1590/S0102-79722014000100013info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:50:21Zoai:repositorium.sdum.uminho.pt:1822/30669Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:49:03.884209Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo Procura-PALavras (P-PAL): a new measure of word frequency for contemporary European Portuguese |
title |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo |
spellingShingle |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo Soares, Ana Paula Frequência lexical Bases lexicais Corpus/corpora Português europeu Word frequency Lexical databases European Portuguese Social Sciences |
title_short |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo |
title_full |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo |
title_fullStr |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo |
title_full_unstemmed |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo |
title_sort |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo |
author |
Soares, Ana Paula |
author_facet |
Soares, Ana Paula Iriarte Sanromán, Álvaro Almeida, J. J. Simões, Alberto Costa, Ana França, Patrícia das Dores Marques da Silva Cunha Machado, João F. Comesaña, Montserrat |
author_role |
author |
author2 |
Iriarte Sanromán, Álvaro Almeida, J. J. Simões, Alberto Costa, Ana França, Patrícia das Dores Marques da Silva Cunha Machado, João F. Comesaña, Montserrat |
author2_role |
author author author author author author author |
dc.contributor.none.fl_str_mv |
Universidade do Minho |
dc.contributor.author.fl_str_mv |
Soares, Ana Paula Iriarte Sanromán, Álvaro Almeida, J. J. Simões, Alberto Costa, Ana França, Patrícia das Dores Marques da Silva Cunha Machado, João F. Comesaña, Montserrat |
dc.subject.por.fl_str_mv |
Frequência lexical Bases lexicais Corpus/corpora Português europeu Word frequency Lexical databases European Portuguese Social Sciences |
topic |
Frequência lexical Bases lexicais Corpus/corpora Português europeu Word frequency Lexical databases European Portuguese Social Sciences |
description |
Neste trabalho apresentamos as estratégias e os procedimentos adoptados na constituição de uma nova medida de frequência lexical do Português Europeu contemporâneo, o Procura-PALavras (P- -PAL). Baseado num corpus de mais de 227 milhões de palavras, o P-PAL é uma aplicação web que oferece, por defeito, valores de frequência lexical para todas as suas entradas lexicais (lemas e formas) e que permite a computação de uma grande diversidade de outras medidas objectivas (lexicais e sublexicais) e subjectivas. Descrevemos ainda o processo de defi nição das suas entradas lexicais e da extracção dos respectivos valores de frequência. O elevado número de índices e de entradas lexicais tornam o P-PAL numa aplicação web avançada e indispensável à promoção e internacionalização da investigação em Portugal. O P-PAL encontra-se disponível em http://p-pal.di.uminho.pt/tools |
publishDate |
2014 |
dc.date.none.fl_str_mv |
2014 2014-01-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1822/30669 |
url |
http://hdl.handle.net/1822/30669 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
0102-7972 10.1590/S0102-79722014000100013 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Sul (UFRGS) |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Sul (UFRGS) |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133070517862400 |