Estratégias lexicométricas para detetar especificidades textuais

Detalhes bibliográficos
Autor(a) principal: Iriarte Sanromán, Álvaro
Data de Publicação: 2018
Outros Autores: Gamallo Otero, Pablo, Simões, Alberto
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/1822/61071
Resumo: Neste artigo propomo-nos a definir e desenvolver uma estratégia automática para procurar especificidades lexicais dentro de conjuntos de textos utilizando unidades lexicais simples e expressões com várias palavras, ou termos multipalavra (MWE, a sua sigla em inglês). Propomos uma metodologia para o cálculo da divergência de distribuições de lemas e de MWE que permitirá encontrar, automaticamente, diferenças e semelhanças entre textos não anotados. Esta metodologia poderá ser utilizada para posteriormente identificar grupos de textos sobre os quais se procederá a análises quantitativas e qualitativas semiautomáticas e/ou com intervenção humana. Num primeiro teste, utilizamos dois textos de especialidade (da área da pediatria) e um texto literário, presumindo que os textos de especialidade deveriam apresentar maiores divergências relativamente ao texto literário do que entre eles próprios. Como os testes feitos mostraram a tendência esperada, decidimos aplicar a mesma metodologia a um segundo grupo de textos (três conjuntos de entrevistas a visitantes da cidade de Santiago de Compostela).
id RCAP_4f7d7f405db446a34cc9bc17c9275292
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/61071
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Estratégias lexicométricas para detetar especificidades textuaisLexicometric strategies to detect textual specificitiesDivergência de Kullback-LeiblerDivergência lexicalLexicometriaKullback-Leibler divergencelexical divergencelexicometryHumanidades::Outras HumanidadesSocial SciencesNeste artigo propomo-nos a definir e desenvolver uma estratégia automática para procurar especificidades lexicais dentro de conjuntos de textos utilizando unidades lexicais simples e expressões com várias palavras, ou termos multipalavra (MWE, a sua sigla em inglês). Propomos uma metodologia para o cálculo da divergência de distribuições de lemas e de MWE que permitirá encontrar, automaticamente, diferenças e semelhanças entre textos não anotados. Esta metodologia poderá ser utilizada para posteriormente identificar grupos de textos sobre os quais se procederá a análises quantitativas e qualitativas semiautomáticas e/ou com intervenção humana. Num primeiro teste, utilizamos dois textos de especialidade (da área da pediatria) e um texto literário, presumindo que os textos de especialidade deveriam apresentar maiores divergências relativamente ao texto literário do que entre eles próprios. Como os testes feitos mostraram a tendência esperada, decidimos aplicar a mesma metodologia a um segundo grupo de textos (três conjuntos de entrevistas a visitantes da cidade de Santiago de Compostela).Este trabalho é apoiado pelo projeto Narrativas, usos e consumos de visitantes como aliados ou amena¸cas para o bem-estar da comunidade local: o caso de Santiago de Compostela. Ref: FFI2017-88196-R, parcialmente subsidiado pelo Ministerio de Industria, Econom´ıa y Competitividad espanhol no quadro do Programa Estatal de I+D+i Orientada a los Retos de la Sociedad (2018-2021).Universidade do MinhoUniversidade de VigoUniversidade do MinhoIriarte Sanromán, ÁlvaroGamallo Otero, PabloSimões, Alberto20182018-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttp://hdl.handle.net/1822/61071porIriarte Sanromán, Álvaro, Gamallo Otero, P., & Simões, A. (2018). Estratégias Lexicométricas para Detetar Especificidades Textuais. Linguamática, 10(1), 19-26. https://doi.org/10.21814/lm.10.1.2631647-08181647-081810.21814/lm.10.1.263https://www.linguamatica.com/index.php/linguamatica/article/view/263info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:16:37Zoai:repositorium.sdum.uminho.pt:1822/61071Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:09:10.756262Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Estratégias lexicométricas para detetar especificidades textuais
Lexicometric strategies to detect textual specificities
title Estratégias lexicométricas para detetar especificidades textuais
spellingShingle Estratégias lexicométricas para detetar especificidades textuais
Iriarte Sanromán, Álvaro
Divergência de Kullback-Leibler
Divergência lexical
Lexicometria
Kullback-Leibler divergence
lexical divergence
lexicometry
Humanidades::Outras Humanidades
Social Sciences
title_short Estratégias lexicométricas para detetar especificidades textuais
title_full Estratégias lexicométricas para detetar especificidades textuais
title_fullStr Estratégias lexicométricas para detetar especificidades textuais
title_full_unstemmed Estratégias lexicométricas para detetar especificidades textuais
title_sort Estratégias lexicométricas para detetar especificidades textuais
author Iriarte Sanromán, Álvaro
author_facet Iriarte Sanromán, Álvaro
Gamallo Otero, Pablo
Simões, Alberto
author_role author
author2 Gamallo Otero, Pablo
Simões, Alberto
author2_role author
author
dc.contributor.none.fl_str_mv Universidade do Minho
dc.contributor.author.fl_str_mv Iriarte Sanromán, Álvaro
Gamallo Otero, Pablo
Simões, Alberto
dc.subject.por.fl_str_mv Divergência de Kullback-Leibler
Divergência lexical
Lexicometria
Kullback-Leibler divergence
lexical divergence
lexicometry
Humanidades::Outras Humanidades
Social Sciences
topic Divergência de Kullback-Leibler
Divergência lexical
Lexicometria
Kullback-Leibler divergence
lexical divergence
lexicometry
Humanidades::Outras Humanidades
Social Sciences
description Neste artigo propomo-nos a definir e desenvolver uma estratégia automática para procurar especificidades lexicais dentro de conjuntos de textos utilizando unidades lexicais simples e expressões com várias palavras, ou termos multipalavra (MWE, a sua sigla em inglês). Propomos uma metodologia para o cálculo da divergência de distribuições de lemas e de MWE que permitirá encontrar, automaticamente, diferenças e semelhanças entre textos não anotados. Esta metodologia poderá ser utilizada para posteriormente identificar grupos de textos sobre os quais se procederá a análises quantitativas e qualitativas semiautomáticas e/ou com intervenção humana. Num primeiro teste, utilizamos dois textos de especialidade (da área da pediatria) e um texto literário, presumindo que os textos de especialidade deveriam apresentar maiores divergências relativamente ao texto literário do que entre eles próprios. Como os testes feitos mostraram a tendência esperada, decidimos aplicar a mesma metodologia a um segundo grupo de textos (três conjuntos de entrevistas a visitantes da cidade de Santiago de Compostela).
publishDate 2018
dc.date.none.fl_str_mv 2018
2018-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1822/61071
url http://hdl.handle.net/1822/61071
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv Iriarte Sanromán, Álvaro, Gamallo Otero, P., & Simões, A. (2018). Estratégias Lexicométricas para Detetar Especificidades Textuais. Linguamática, 10(1), 19-26. https://doi.org/10.21814/lm.10.1.263
1647-0818
1647-0818
10.21814/lm.10.1.263
https://www.linguamatica.com/index.php/linguamatica/article/view/263
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade do Minho
Universidade de Vigo
publisher.none.fl_str_mv Universidade do Minho
Universidade de Vigo
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132516411506688