Como encontrar as palavras-chave mais importantes de um corpus com WordSmith tools

Detalhes bibliográficos
Autor(a) principal: Sardinha, Tony Berber
Data de Publicação: 2018
Tipo de documento: Artigo
Idioma: por
Título da fonte: DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada
Texto Completo: https://revistas.pucsp.br/index.php/delta/article/view/37692
Resumo: Um dos procedimentos mais delicados envolvidos numa análise de corpus via palavras-chave com WordSmith Tools KeyWords é a seleção de um sub-conjunto de palavras para serem investigadas em detalhe. A seleção se faz necessária, via de regra, porque o tamanho do léxico chave de um corpus de estudo é em geral muito grande, em geral em torno de 1500 palavras ou até mais. Uma maneira de fazer esse recorte consiste na extração de palavras-chave exclusivas. O léxico chave exclusivo é composto das palavras-chave que ocorrem somente no corpus de estudo em questão em comparação com palavras-chave de outros corpora de estudo. Contudo, comparar a lista de palavras-chave com várias outras é um procedimento custoso e complicado, que não pode ser exigido da maioria dos usuários de WordSmith Tools KeyWords. Uma alternativa para este cenário seria a aplicação de um ponto de corte generalizado baseado em tendências de retorno de palavras-chave observadas através da aplicação do banco de palavras-chave existente. Tal ponto de corte indicaria a região da lista de palavras-chave na qual há maior probabilidade de ocorrência do léxico chave exclusivo. Os resultados obtidos aqui indicam um ponto de corte entre 31% a 53% das palavras da lista, a partir da primeira de uma lista ordenada por chavicidade.
id PUC_SP-4_645738bcecab23cfc871056369e057bc
oai_identifier_str oai:ojs.pkp.sfu.ca:article/37692
network_acronym_str PUC_SP-4
network_name_str DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada
repository_id_str
spelling Como encontrar as palavras-chave mais importantes de um corpus com WordSmith toolsCorporaWordSmith Toolsléxico chaveUm dos procedimentos mais delicados envolvidos numa análise de corpus via palavras-chave com WordSmith Tools KeyWords é a seleção de um sub-conjunto de palavras para serem investigadas em detalhe. A seleção se faz necessária, via de regra, porque o tamanho do léxico chave de um corpus de estudo é em geral muito grande, em geral em torno de 1500 palavras ou até mais. Uma maneira de fazer esse recorte consiste na extração de palavras-chave exclusivas. O léxico chave exclusivo é composto das palavras-chave que ocorrem somente no corpus de estudo em questão em comparação com palavras-chave de outros corpora de estudo. Contudo, comparar a lista de palavras-chave com várias outras é um procedimento custoso e complicado, que não pode ser exigido da maioria dos usuários de WordSmith Tools KeyWords. Uma alternativa para este cenário seria a aplicação de um ponto de corte generalizado baseado em tendências de retorno de palavras-chave observadas através da aplicação do banco de palavras-chave existente. Tal ponto de corte indicaria a região da lista de palavras-chave na qual há maior probabilidade de ocorrência do léxico chave exclusivo. Os resultados obtidos aqui indicam um ponto de corte entre 31% a 53% das palavras da lista, a partir da primeira de uma lista ordenada por chavicidade.Pontifícia Universidade Católica de São paulo2018-06-11info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://revistas.pucsp.br/index.php/delta/article/view/37692DELTA: Documentação e Estudos em Linguística Teórica e Aplicada; v. 21 n. 2 (2005)1678-460X0102-4450reponame:DELTA: Documentação de Estudos em Lingüística Teórica e Aplicadainstname:Pontifícia Universidade Católica de São Paulo (PUC-SP)instacron:PUC_SPporhttps://revistas.pucsp.br/index.php/delta/article/view/37692/26340Copyright (c) 2018 DELTA: Documentação e Estudos em Linguística Teórica e Aplicadainfo:eu-repo/semantics/openAccessSardinha, Tony Berber2018-08-09T12:34:07Zoai:ojs.pkp.sfu.ca:article/37692Revistahttps://revistas.pucsp.br/deltaPRIhttps://revistas.pucsp.br/index.php/delta/oai||delta@pucsp.br1678-460X1678-460Xopendoar:2018-08-09T12:34:07DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada - Pontifícia Universidade Católica de São Paulo (PUC-SP)false
dc.title.none.fl_str_mv Como encontrar as palavras-chave mais importantes de um corpus com WordSmith tools
title Como encontrar as palavras-chave mais importantes de um corpus com WordSmith tools
spellingShingle Como encontrar as palavras-chave mais importantes de um corpus com WordSmith tools
Sardinha, Tony Berber
Corpora
WordSmith Tools
léxico chave
title_short Como encontrar as palavras-chave mais importantes de um corpus com WordSmith tools
title_full Como encontrar as palavras-chave mais importantes de um corpus com WordSmith tools
title_fullStr Como encontrar as palavras-chave mais importantes de um corpus com WordSmith tools
title_full_unstemmed Como encontrar as palavras-chave mais importantes de um corpus com WordSmith tools
title_sort Como encontrar as palavras-chave mais importantes de um corpus com WordSmith tools
author Sardinha, Tony Berber
author_facet Sardinha, Tony Berber
author_role author
dc.contributor.author.fl_str_mv Sardinha, Tony Berber
dc.subject.por.fl_str_mv Corpora
WordSmith Tools
léxico chave
topic Corpora
WordSmith Tools
léxico chave
description Um dos procedimentos mais delicados envolvidos numa análise de corpus via palavras-chave com WordSmith Tools KeyWords é a seleção de um sub-conjunto de palavras para serem investigadas em detalhe. A seleção se faz necessária, via de regra, porque o tamanho do léxico chave de um corpus de estudo é em geral muito grande, em geral em torno de 1500 palavras ou até mais. Uma maneira de fazer esse recorte consiste na extração de palavras-chave exclusivas. O léxico chave exclusivo é composto das palavras-chave que ocorrem somente no corpus de estudo em questão em comparação com palavras-chave de outros corpora de estudo. Contudo, comparar a lista de palavras-chave com várias outras é um procedimento custoso e complicado, que não pode ser exigido da maioria dos usuários de WordSmith Tools KeyWords. Uma alternativa para este cenário seria a aplicação de um ponto de corte generalizado baseado em tendências de retorno de palavras-chave observadas através da aplicação do banco de palavras-chave existente. Tal ponto de corte indicaria a região da lista de palavras-chave na qual há maior probabilidade de ocorrência do léxico chave exclusivo. Os resultados obtidos aqui indicam um ponto de corte entre 31% a 53% das palavras da lista, a partir da primeira de uma lista ordenada por chavicidade.
publishDate 2018
dc.date.none.fl_str_mv 2018-06-11
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://revistas.pucsp.br/index.php/delta/article/view/37692
url https://revistas.pucsp.br/index.php/delta/article/view/37692
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://revistas.pucsp.br/index.php/delta/article/view/37692/26340
dc.rights.driver.fl_str_mv Copyright (c) 2018 DELTA: Documentação e Estudos em Linguística Teórica e Aplicada
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2018 DELTA: Documentação e Estudos em Linguística Teórica e Aplicada
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica de São paulo
publisher.none.fl_str_mv Pontifícia Universidade Católica de São paulo
dc.source.none.fl_str_mv DELTA: Documentação e Estudos em Linguística Teórica e Aplicada; v. 21 n. 2 (2005)
1678-460X
0102-4450
reponame:DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada
instname:Pontifícia Universidade Católica de São Paulo (PUC-SP)
instacron:PUC_SP
instname_str Pontifícia Universidade Católica de São Paulo (PUC-SP)
instacron_str PUC_SP
institution PUC_SP
reponame_str DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada
collection DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada
repository.name.fl_str_mv DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada - Pontifícia Universidade Católica de São Paulo (PUC-SP)
repository.mail.fl_str_mv ||delta@pucsp.br
_version_ 1799129302364585984