Textos de divulgação para leigos sobre o transtorno do estresse pós-traumático em português : alternativas para a acessibilidade textual e terminológica

Detalhes bibliográficos
Autor(a) principal: Silva, Asafe Davi Cortina
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/189547
Resumo: Estudos e pesquisas sobre complexidade e acessibilidade textual, embora extremamente importantes, carecem de referências para a língua portuguesa do Brasil. Dessa forma, esta pesquisa de mestrado se soma aos esforços do projeto de pesquisa “Fundamentos linguísticos para a acessibilidade da informação científica para leitores adultos de escolaridade limitada: simplificação textual, gramatical, lexical e terminológica em Ciências da Saúde”. O principal objetivo deste trabalho é analisar a linguagem utilizada em textos de divulgação científica para leigos sobre o Transtorno do Estresse Pós-Traumático (TEPT) escritos em português brasileiro. Com essa finalidade, estudamos dez textos sobre esse tema por meio de uma análise semiautomática que incorporou conceitos da Terminologia, da Linguística Textual, da Linguística de Corpus, do Processamento da Linguagem Natural (PLN) e da Linguística Sistêmico-Funcional. Coletamos os dez textos mais relevantes e gratuitos encontrados no Google (em indexação desse buscador conforme os parâmetros do algoritmo de buscas vigente em 2017 e 2018), cujos objetivos fossem informar público leigo sobre o TEPT. Submetemos esses textos à ferramenta de PLN denominada Coh-Metrix Dementia para verificar medidas de estimativa de complexidade textual por ela indicadas: índice Flesch, análise semântica latente, relação type-token e densidade semântica. Também foram consideradas cinco medidas de incidência de palavras: de substantivos, de verbos, de adjetivos, de advérbios e de pronomes. Diante da indicação da ferramenta de provável complexidade para público leigo de escolaridade limitada, aplicamos oito estratégias de reescrita diferentes em cada um dos dez textos As estratégias de reescrita aplicadas se originam da bibliografia internacional sobre o tema por nós adaptadas para o português. Após cada reescrita simplificadora, os textos editados foram novamente submetidos ao sistema Coh-Metrix Dementia para que suas medidas pudessem ser comparadas com as dos textos originais e para que pudéssemos verificar a possível eficiência de cada uma das estratégias de acessibilidade adotadas. Ao comparar o desempenho das medidas, observamos a validade das estratégias de reescrita adotadas e concluímos que as três mais relevantes e com melhores resultados foram (em ordem): simplificação lexical, redução de adjetivos e redução de informação. As informações coletadas permitiram concluir que os textos coletados a respeito do TEPT são potencialmente complexos para um público leigo brasileiro de escolaridade limitada e que existem estratégias de reescrita que, aparentemente, conforme valida-nos o sistema Coh-Metrix Dementia, poderiam tornar esses textos mais simples. Diante dessas informações, propusemos instruções para o futuro desenvolvimento de um manual de simplificação de textos desse tipo para a o português brasileiro. Por fim, como um apêndice do trabalho, realizamos um breve ensaio de análise de complexidade com alguns textos de perfil equivalente aos examinados em língua inglesa, sobre o mesmo tema. Esse ensaio poderá servir de base para uma extensão desta pesquisa.
id URGS_5ff58ab71be0c8149a4ae40a0c1ee038
oai_identifier_str oai:www.lume.ufrgs.br:10183/189547
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Silva, Asafe Davi CortinaFinatto, Maria José Bocorny2019-03-23T02:46:33Z2018http://hdl.handle.net/10183/189547001087755Estudos e pesquisas sobre complexidade e acessibilidade textual, embora extremamente importantes, carecem de referências para a língua portuguesa do Brasil. Dessa forma, esta pesquisa de mestrado se soma aos esforços do projeto de pesquisa “Fundamentos linguísticos para a acessibilidade da informação científica para leitores adultos de escolaridade limitada: simplificação textual, gramatical, lexical e terminológica em Ciências da Saúde”. O principal objetivo deste trabalho é analisar a linguagem utilizada em textos de divulgação científica para leigos sobre o Transtorno do Estresse Pós-Traumático (TEPT) escritos em português brasileiro. Com essa finalidade, estudamos dez textos sobre esse tema por meio de uma análise semiautomática que incorporou conceitos da Terminologia, da Linguística Textual, da Linguística de Corpus, do Processamento da Linguagem Natural (PLN) e da Linguística Sistêmico-Funcional. Coletamos os dez textos mais relevantes e gratuitos encontrados no Google (em indexação desse buscador conforme os parâmetros do algoritmo de buscas vigente em 2017 e 2018), cujos objetivos fossem informar público leigo sobre o TEPT. Submetemos esses textos à ferramenta de PLN denominada Coh-Metrix Dementia para verificar medidas de estimativa de complexidade textual por ela indicadas: índice Flesch, análise semântica latente, relação type-token e densidade semântica. Também foram consideradas cinco medidas de incidência de palavras: de substantivos, de verbos, de adjetivos, de advérbios e de pronomes. Diante da indicação da ferramenta de provável complexidade para público leigo de escolaridade limitada, aplicamos oito estratégias de reescrita diferentes em cada um dos dez textos As estratégias de reescrita aplicadas se originam da bibliografia internacional sobre o tema por nós adaptadas para o português. Após cada reescrita simplificadora, os textos editados foram novamente submetidos ao sistema Coh-Metrix Dementia para que suas medidas pudessem ser comparadas com as dos textos originais e para que pudéssemos verificar a possível eficiência de cada uma das estratégias de acessibilidade adotadas. Ao comparar o desempenho das medidas, observamos a validade das estratégias de reescrita adotadas e concluímos que as três mais relevantes e com melhores resultados foram (em ordem): simplificação lexical, redução de adjetivos e redução de informação. As informações coletadas permitiram concluir que os textos coletados a respeito do TEPT são potencialmente complexos para um público leigo brasileiro de escolaridade limitada e que existem estratégias de reescrita que, aparentemente, conforme valida-nos o sistema Coh-Metrix Dementia, poderiam tornar esses textos mais simples. Diante dessas informações, propusemos instruções para o futuro desenvolvimento de um manual de simplificação de textos desse tipo para a o português brasileiro. Por fim, como um apêndice do trabalho, realizamos um breve ensaio de análise de complexidade com alguns textos de perfil equivalente aos examinados em língua inglesa, sobre o mesmo tema. Esse ensaio poderá servir de base para uma extensão desta pesquisa.Even though the studies and researches on textual complexity and accessibility are extremely important, there are not enough references for Brazilian Portuguese. Therefore, this master's research adds to the efforts of the research project named “Fundamentos linguísticos para a acessibilidade da informação científica para leitores adultos de escolaridade limitada: simplificação textual, gramatical, lexical e terminológica em Ciências da Saúde” (Linguistic foundations for the accessibility of scientific information for adult readers of limited schooling: textual, grammatical, lexical, and terminological simplification in Health Sciences). The main goal of this research is to analyze the language used in texts of scientific dissemination for laypeople about the Post Traumatic Stress Disorder (PTSD) written in Brazilian Portuguese. For this purpose, we studied ten texts about this topic through a semiautomatic analysis, incorporating concepts of Terminology, Textual Linguistics, Corpus Linguistics, Natural Language Processing (NLP), and Systemic-Functional Linguistics. We collected the ten most relevant texts, that are available for free, from a Google search (according to the search algorithm parameters in force in 2017 and 2018), whose objectives were to inform a lay public about PTSD. We submitted these texts to the NLP tool called Coh-Metrix Dementia in order to verify measures of textual complexity. These measures are: Flesch index, latent semantic analysis, type-token ration, and semantic density. Moreover, we considered five indexes of incidence of words: nouns, verbs, adjectives, adverbs, and pronouns. Based on the evidences shown by the tool that indicated a probable complexity for a lay public of limited schooling, we applied eight different rewriting strategies in each of the ten texts The rewriting strategies that we applied were chosen based on the international biography translated by us into Portuguese. After each rewriting (which were intended to simplify the texts), the edited texts were submitted to Coh-Metrix Dementia in order to compare their measures to the original ones, so we could verify the possible efficiency of each of the accessibility strategies adopted. After comparing the measures, we observed the validity of the rewriting strategies that were adopted, and we concluded that the three most efficient ones and with the best results are (in order): lexical simplification, reduction of adjectives, and reduction of information. The gathered information allowed us to conclude that the collected texts on PTSD are potentially complex for a lay public of limited schooling. Moreover, we were able to come to the conclusion that there are some rewriting strategies that, apparently, as validated by Coh-Metrix Dementia, could simplify these texts. Based on the facts we found, we proposed instructions for the development of a manual of simplification of texts of this type for Brazilian Portuguese that is going to be designed in the future. Finally, as an appendix of this thesis, we performed a brief essay of complexity analysis with some texts of similar profile and about the same topic, but in English. This essay may serve as the basis for an extension of this research.application/pdfporEstresse pós-traumáticoDivulgação científicaLingüística aplicada (análise de texto)TerminologiaComplexidade textualAcessibilidade comunicacionalLíngua portuguesaLinguagem e línguasBrasilTextual complexityTextual accessibilityTextual simplificationPTSDBrazilian portugueseTextos de divulgação para leigos sobre o transtorno do estresse pós-traumático em português : alternativas para a acessibilidade textual e terminológicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de LetrasPrograma de Pós-Graduação em LetrasPorto Alegre, BR-RS2018mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001087755.pdf.txt001087755.pdf.txtExtracted Texttext/plain1033292http://www.lume.ufrgs.br/bitstream/10183/189547/2/001087755.pdf.txt7685c7cba994df8dfc5eb2b51e5dfa92MD52ORIGINAL001087755.pdfTexto completoapplication/pdf8057927http://www.lume.ufrgs.br/bitstream/10183/189547/1/001087755.pdfe0df069259ae0eb16a66f612bbddf956MD5110183/1895472021-08-18 04:30:48.555229oai:www.lume.ufrgs.br:10183/189547Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532021-08-18T07:30:48Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Textos de divulgação para leigos sobre o transtorno do estresse pós-traumático em português : alternativas para a acessibilidade textual e terminológica
title Textos de divulgação para leigos sobre o transtorno do estresse pós-traumático em português : alternativas para a acessibilidade textual e terminológica
spellingShingle Textos de divulgação para leigos sobre o transtorno do estresse pós-traumático em português : alternativas para a acessibilidade textual e terminológica
Silva, Asafe Davi Cortina
Estresse pós-traumático
Divulgação científica
Lingüística aplicada (análise de texto)
Terminologia
Complexidade textual
Acessibilidade comunicacional
Língua portuguesa
Linguagem e línguas
Brasil
Textual complexity
Textual accessibility
Textual simplification
PTSD
Brazilian portuguese
title_short Textos de divulgação para leigos sobre o transtorno do estresse pós-traumático em português : alternativas para a acessibilidade textual e terminológica
title_full Textos de divulgação para leigos sobre o transtorno do estresse pós-traumático em português : alternativas para a acessibilidade textual e terminológica
title_fullStr Textos de divulgação para leigos sobre o transtorno do estresse pós-traumático em português : alternativas para a acessibilidade textual e terminológica
title_full_unstemmed Textos de divulgação para leigos sobre o transtorno do estresse pós-traumático em português : alternativas para a acessibilidade textual e terminológica
title_sort Textos de divulgação para leigos sobre o transtorno do estresse pós-traumático em português : alternativas para a acessibilidade textual e terminológica
author Silva, Asafe Davi Cortina
author_facet Silva, Asafe Davi Cortina
author_role author
dc.contributor.author.fl_str_mv Silva, Asafe Davi Cortina
dc.contributor.advisor1.fl_str_mv Finatto, Maria José Bocorny
contributor_str_mv Finatto, Maria José Bocorny
dc.subject.por.fl_str_mv Estresse pós-traumático
Divulgação científica
Lingüística aplicada (análise de texto)
Terminologia
Complexidade textual
Acessibilidade comunicacional
Língua portuguesa
Linguagem e línguas
Brasil
topic Estresse pós-traumático
Divulgação científica
Lingüística aplicada (análise de texto)
Terminologia
Complexidade textual
Acessibilidade comunicacional
Língua portuguesa
Linguagem e línguas
Brasil
Textual complexity
Textual accessibility
Textual simplification
PTSD
Brazilian portuguese
dc.subject.eng.fl_str_mv Textual complexity
Textual accessibility
Textual simplification
PTSD
Brazilian portuguese
description Estudos e pesquisas sobre complexidade e acessibilidade textual, embora extremamente importantes, carecem de referências para a língua portuguesa do Brasil. Dessa forma, esta pesquisa de mestrado se soma aos esforços do projeto de pesquisa “Fundamentos linguísticos para a acessibilidade da informação científica para leitores adultos de escolaridade limitada: simplificação textual, gramatical, lexical e terminológica em Ciências da Saúde”. O principal objetivo deste trabalho é analisar a linguagem utilizada em textos de divulgação científica para leigos sobre o Transtorno do Estresse Pós-Traumático (TEPT) escritos em português brasileiro. Com essa finalidade, estudamos dez textos sobre esse tema por meio de uma análise semiautomática que incorporou conceitos da Terminologia, da Linguística Textual, da Linguística de Corpus, do Processamento da Linguagem Natural (PLN) e da Linguística Sistêmico-Funcional. Coletamos os dez textos mais relevantes e gratuitos encontrados no Google (em indexação desse buscador conforme os parâmetros do algoritmo de buscas vigente em 2017 e 2018), cujos objetivos fossem informar público leigo sobre o TEPT. Submetemos esses textos à ferramenta de PLN denominada Coh-Metrix Dementia para verificar medidas de estimativa de complexidade textual por ela indicadas: índice Flesch, análise semântica latente, relação type-token e densidade semântica. Também foram consideradas cinco medidas de incidência de palavras: de substantivos, de verbos, de adjetivos, de advérbios e de pronomes. Diante da indicação da ferramenta de provável complexidade para público leigo de escolaridade limitada, aplicamos oito estratégias de reescrita diferentes em cada um dos dez textos As estratégias de reescrita aplicadas se originam da bibliografia internacional sobre o tema por nós adaptadas para o português. Após cada reescrita simplificadora, os textos editados foram novamente submetidos ao sistema Coh-Metrix Dementia para que suas medidas pudessem ser comparadas com as dos textos originais e para que pudéssemos verificar a possível eficiência de cada uma das estratégias de acessibilidade adotadas. Ao comparar o desempenho das medidas, observamos a validade das estratégias de reescrita adotadas e concluímos que as três mais relevantes e com melhores resultados foram (em ordem): simplificação lexical, redução de adjetivos e redução de informação. As informações coletadas permitiram concluir que os textos coletados a respeito do TEPT são potencialmente complexos para um público leigo brasileiro de escolaridade limitada e que existem estratégias de reescrita que, aparentemente, conforme valida-nos o sistema Coh-Metrix Dementia, poderiam tornar esses textos mais simples. Diante dessas informações, propusemos instruções para o futuro desenvolvimento de um manual de simplificação de textos desse tipo para a o português brasileiro. Por fim, como um apêndice do trabalho, realizamos um breve ensaio de análise de complexidade com alguns textos de perfil equivalente aos examinados em língua inglesa, sobre o mesmo tema. Esse ensaio poderá servir de base para uma extensão desta pesquisa.
publishDate 2018
dc.date.issued.fl_str_mv 2018
dc.date.accessioned.fl_str_mv 2019-03-23T02:46:33Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/189547
dc.identifier.nrb.pt_BR.fl_str_mv 001087755
url http://hdl.handle.net/10183/189547
identifier_str_mv 001087755
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/189547/2/001087755.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/189547/1/001087755.pdf
bitstream.checksum.fl_str_mv 7685c7cba994df8dfc5eb2b51e5dfa92
e0df069259ae0eb16a66f612bbddf956
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085471197331456