Estratégias Lexicométricas para Detetar Especificidades Textuais

Detalhes bibliográficos
Autor(a) principal: Iriarte Sanroman, Álvaro
Data de Publicação: 2018
Outros Autores: Gamallo Otero, Pablo, Simões, Alberto
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/11110/1421
Resumo: Neste artigo propomo-nos a definir e desenvolver uma estratégia automática para procurar especificidades lexicais dentro de conjuntos de textos utilizando unidades lexicais simples e expressões com várias palavras, ou termos multipalavra (MWE, a sua sigla em inglês). Propomos uma metodologia para o cálculo da divergência de distribuições de lemas e de MWE que permitirá encontrar, automaticamente, diferenças e semelhanças entre textos não anotados. Esta metodologia poderá ser utilizada para posteriormente identificar grupos de textos sobre os quais se procederá a análises quantitativas e qualitativas semiautomáticas e/ou com intervenção humana. Num primeiro teste, utilizamos dois textos de especialidade (da área da pediatria) e um texto literário, presumindo que os textos de especialidade deveriam apresentar maiores divergências relativamente ao texto literário do que entre eles próprios. Como os testes feitos mostraram a tendência esperada, decidimos aplicar a mesma metodologia a um segundo grupo de textos (três conjuntos de entrevistas a visitantes da cidade de Santiago de Compostela).
id RCAP_0658a495f04eb0af2dede4bd34600c78
oai_identifier_str oai:ciencipca.ipca.pt:11110/1421
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Estratégias Lexicométricas para Detetar Especificidades TextuaisLexicometric strategies to detect textual specificitiesNatural Language ProcessingComputational LinguisticsNeste artigo propomo-nos a definir e desenvolver uma estratégia automática para procurar especificidades lexicais dentro de conjuntos de textos utilizando unidades lexicais simples e expressões com várias palavras, ou termos multipalavra (MWE, a sua sigla em inglês). Propomos uma metodologia para o cálculo da divergência de distribuições de lemas e de MWE que permitirá encontrar, automaticamente, diferenças e semelhanças entre textos não anotados. Esta metodologia poderá ser utilizada para posteriormente identificar grupos de textos sobre os quais se procederá a análises quantitativas e qualitativas semiautomáticas e/ou com intervenção humana. Num primeiro teste, utilizamos dois textos de especialidade (da área da pediatria) e um texto literário, presumindo que os textos de especialidade deveriam apresentar maiores divergências relativamente ao texto literário do que entre eles próprios. Como os testes feitos mostraram a tendência esperada, decidimos aplicar a mesma metodologia a um segundo grupo de textos (três conjuntos de entrevistas a visitantes da cidade de Santiago de Compostela).Este trabalho ́e apoiado pelo projeto Narrativas, usos e consumos de visitantes como aliados ou amena ̧cas para o bem-estar da comunidade lo- cal: o caso de Santiago de Compostela. Ref: FFI2017-88196-R, parcialmente subsidiado pelo Ministerio de Industria, Econom ́ıa y Competiti- vidad espanhol no quadro do Programa Estatal de I+D+i Orientada a los Retos de la Sociedad (2018-2021).Linguamática2018-09-28T10:03:02Z2018-09-28T10:03:02Z2018-08-04T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articlehttp://hdl.handle.net/11110/1421oai:ciencipca.ipca.pt:11110/1421porhttps://doi.org/Iriarte Sanromán, Álvaro, Gamallo Otero, P., & Simões, A. (2018). Estratégias Lexicométricas para Detetar Especificidades Textuais. Linguamática, 10(1), 19-26. https://doi.org/10.21814/lm.10.1.2631647-0818http://hdl.handle.net/11110/1421Iriarte Sanroman, ÁlvaroGamallo Otero, PabloSimões, Albertoinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-09-05T12:52:51Zoai:ciencipca.ipca.pt:11110/1421Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T15:01:47.611167Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Estratégias Lexicométricas para Detetar Especificidades Textuais
Lexicometric strategies to detect textual specificities
title Estratégias Lexicométricas para Detetar Especificidades Textuais
spellingShingle Estratégias Lexicométricas para Detetar Especificidades Textuais
Iriarte Sanroman, Álvaro
Natural Language Processing
Computational Linguistics
title_short Estratégias Lexicométricas para Detetar Especificidades Textuais
title_full Estratégias Lexicométricas para Detetar Especificidades Textuais
title_fullStr Estratégias Lexicométricas para Detetar Especificidades Textuais
title_full_unstemmed Estratégias Lexicométricas para Detetar Especificidades Textuais
title_sort Estratégias Lexicométricas para Detetar Especificidades Textuais
author Iriarte Sanroman, Álvaro
author_facet Iriarte Sanroman, Álvaro
Gamallo Otero, Pablo
Simões, Alberto
author_role author
author2 Gamallo Otero, Pablo
Simões, Alberto
author2_role author
author
dc.contributor.author.fl_str_mv Iriarte Sanroman, Álvaro
Gamallo Otero, Pablo
Simões, Alberto
dc.subject.por.fl_str_mv Natural Language Processing
Computational Linguistics
topic Natural Language Processing
Computational Linguistics
description Neste artigo propomo-nos a definir e desenvolver uma estratégia automática para procurar especificidades lexicais dentro de conjuntos de textos utilizando unidades lexicais simples e expressões com várias palavras, ou termos multipalavra (MWE, a sua sigla em inglês). Propomos uma metodologia para o cálculo da divergência de distribuições de lemas e de MWE que permitirá encontrar, automaticamente, diferenças e semelhanças entre textos não anotados. Esta metodologia poderá ser utilizada para posteriormente identificar grupos de textos sobre os quais se procederá a análises quantitativas e qualitativas semiautomáticas e/ou com intervenção humana. Num primeiro teste, utilizamos dois textos de especialidade (da área da pediatria) e um texto literário, presumindo que os textos de especialidade deveriam apresentar maiores divergências relativamente ao texto literário do que entre eles próprios. Como os testes feitos mostraram a tendência esperada, decidimos aplicar a mesma metodologia a um segundo grupo de textos (três conjuntos de entrevistas a visitantes da cidade de Santiago de Compostela).
publishDate 2018
dc.date.none.fl_str_mv 2018-09-28T10:03:02Z
2018-09-28T10:03:02Z
2018-08-04T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11110/1421
oai:ciencipca.ipca.pt:11110/1421
url http://hdl.handle.net/11110/1421
identifier_str_mv oai:ciencipca.ipca.pt:11110/1421
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://doi.org/Iriarte Sanromán, Álvaro, Gamallo Otero, P., & Simões, A. (2018). Estratégias Lexicométricas para Detetar Especificidades Textuais. Linguamática, 10(1), 19-26. https://doi.org/10.21814/lm.10.1.263
1647-0818
http://hdl.handle.net/11110/1421
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Linguamática
publisher.none.fl_str_mv Linguamática
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799129887479431168