Descrição etimológica do léxico indianista em José de Alencar: uma análise lexicográfica direcionada por corpus

Detalhes bibliográficos
Autor(a) principal: Ávila, Maria Virgínia Dias de
Data de Publicação: 2018
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFU
Texto Completo: https://repositorio.ufu.br/handle/123456789/22389
Resumo: This thesis aims at developing a study based on specific lexicon features used by José de Alencar, that is, indigenous lexicon, in his considered indianist works, such as: Iracema, O Guarani and Ubirajara. This study is comprised of two general topics: verifying if the author uses a specific lexicon in his indianist works, and analyzing such lexicon from the perspective of Contextual Fiction Etymology. In addition, as a third objective, we propose the creation of an electronic vocabulary of such indianist terms making them available online. Due to the diversity, in our proposal, we articulated knowledge related to lexicon, concerning Lexicology and Lexicography and we approached issues relating to the characterization and constitution of lexicography words, specifically, electronic dictionaries. Considering lexicon organization procedures, we also discussed semantic fields. In order to carry out our analysis through the Etymology scope, we expanded the concept of Contextual Fiction Etymology and, lastly, our approach on the theoretical and methodology support was centered on a Corpus Linguistics basis approach, mainly in a corpus-guided research scope. We compiled our studied corpus with Alencar’s indianist works, and, to contrast and verify if the author uses a specific lexicon in such works, we compiled a reference corpus with other works of the same author. Corpora processing was done in WordSmith Tools 6.0 and its three main tools: WordList, KeyWords and Concord, which enabled us identify indianist terms, access abonatory contents occurrences, as well as the contrast between the studied and reference corpus. For the etymology analysis, we used a corpus of the Portuguese language (DAVIES, 2016), and also regular and exclusion dictionaries. From the data, we elaborated 17 lexicography forms that served as a sample for the organization of Alencar’s indianist vocabulary. It is our conclusion that Alencar uses a specific lexicon in his indianist works, considering the keywords in the studied corpus in relation to the reference corpora, also due to the fact that approximately 41% of the noun and adjectives used in his works are indigenous. In addition, we also verified that the author creates etymons in his novels to nominate, according to his literary and linguistics wishes. The author uses the segmentation criterion of a term based on indigenous language knowledge to, from the fragments, create new terms according to the fiction context of his novels. Lastly, we consider of great importance that the Indigenous Vocabulary proposal is available online, not only for Alencar’s readers, but also for those that wish to undertake studies on indigenous vocabulary, which contributes for Brazilian Portuguese formation.
id UFU_060cfef9893b9c1e4c22d935b2802d74
oai_identifier_str oai:repositorio.ufu.br:123456789/22389
network_acronym_str UFU
network_name_str Repositório Institucional da UFU
repository_id_str
spelling Descrição etimológica do léxico indianista em José de Alencar: uma análise lexicográfica direcionada por corpusAn etymological description of indianist lexis in José de Alencar: a lexicographic analysis directed by corpusLinguísticaLíngua portuguesa - etimologiaLinguística de corpusAlencar, José de, 1829-1877 - crítica e interpretaçãoEtimologia ficcional contextualIndianismo em AlencarVocabulário indianistaLéxico indianistaContextual fiction etymologyIndianist lexiconIndianismo in AlencarCorpus linguisticsIndianist vocabularyEtimología ficcional contextualIndianismo en AlencarLingüística de corpusVocabulario indianistaCNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::TEORIA E ANALISE LINGUISTICAThis thesis aims at developing a study based on specific lexicon features used by José de Alencar, that is, indigenous lexicon, in his considered indianist works, such as: Iracema, O Guarani and Ubirajara. This study is comprised of two general topics: verifying if the author uses a specific lexicon in his indianist works, and analyzing such lexicon from the perspective of Contextual Fiction Etymology. In addition, as a third objective, we propose the creation of an electronic vocabulary of such indianist terms making them available online. Due to the diversity, in our proposal, we articulated knowledge related to lexicon, concerning Lexicology and Lexicography and we approached issues relating to the characterization and constitution of lexicography words, specifically, electronic dictionaries. Considering lexicon organization procedures, we also discussed semantic fields. In order to carry out our analysis through the Etymology scope, we expanded the concept of Contextual Fiction Etymology and, lastly, our approach on the theoretical and methodology support was centered on a Corpus Linguistics basis approach, mainly in a corpus-guided research scope. We compiled our studied corpus with Alencar’s indianist works, and, to contrast and verify if the author uses a specific lexicon in such works, we compiled a reference corpus with other works of the same author. Corpora processing was done in WordSmith Tools 6.0 and its three main tools: WordList, KeyWords and Concord, which enabled us identify indianist terms, access abonatory contents occurrences, as well as the contrast between the studied and reference corpus. For the etymology analysis, we used a corpus of the Portuguese language (DAVIES, 2016), and also regular and exclusion dictionaries. From the data, we elaborated 17 lexicography forms that served as a sample for the organization of Alencar’s indianist vocabulary. It is our conclusion that Alencar uses a specific lexicon in his indianist works, considering the keywords in the studied corpus in relation to the reference corpora, also due to the fact that approximately 41% of the noun and adjectives used in his works are indigenous. In addition, we also verified that the author creates etymons in his novels to nominate, according to his literary and linguistics wishes. The author uses the segmentation criterion of a term based on indigenous language knowledge to, from the fragments, create new terms according to the fiction context of his novels. Lastly, we consider of great importance that the Indigenous Vocabulary proposal is available online, not only for Alencar’s readers, but also for those that wish to undertake studies on indigenous vocabulary, which contributes for Brazilian Portuguese formation.RESUMEN: Esta tesis tiene como objetivo desarrollar un estudio con base en el léxico indianista de José de Alencar en sus obras consideradas indianistas: Iracema, O Guarani y Ubirajara. Nuestro estudio abarcó dos temas generales: por un lado, verificar si Alencar utiliza un léxico específico en sus obras indianistas; por otro, analizar el léxico indianista basándonos en la perspectiva de la Etimología Ficcional Contextual. Y, como tercer objetivo, proponer la elaboración de un Vocabulario electrónico de los vocablos indianistas, que se harán disponibles online. En nuestra propuesta, dada la diversidad, articulamos saberes relacionados al Léxico, en lo que se refiere a la Lexicología y a la Lexicografía; abordamos cuestiones sobre la caracterización y constitución de obras lexicográficas y sobre los diccionarios electrónicos, en específico. Teniendo en cuentra los procedimientos de organización del léxico, también discurrimos sobre campos semánticos. Para abarcar nuestra propuesta de análisis por la línea de la Etimología, expandimos el concepto para Etimología Ficcional Contextual y, por fin, nuestra mirada para hacia el eje teórico-metodológico se centró en los presupuestos de la Lingüística de Corpus, concibiéndola como abordaje, principalmente, por la línea de las investigaciones guiadas por corpus. Para esta pesquisa, compilamos nuestro corpus de estudios con las obras indianistas de Alencar y, para contrastar y verificar si el autor utiliza un léxico específico en las obras indianistas, compilamos un corpus de referencia con las demás obras del mismo autor. Para procesamiento de los corpus, recurrimos al programa WordSmith Tools 6.0 y sus tres herramientas: WordList, KeyWords y Concord, que nos permitieron la identificación de los vocablos indianistas, acceso a los contextos de cita de las ocurrencias, además del contraste entre el corpus de estudio y los corpus de referencia. Para el análisis etimológico, recurrimos también al Corpus do Portugués (DAVIES, 2016), como corpus de consulta, y a los diccionarios de consulta y exclusión. A partir de los datos, elaboramos 17 fichas lexicográficas que sirvieron de muestra para el trabajo de organización del Vocabulario indianista de Alencar. Concluimos que Alencar utiliza un léxico específico en sus obras indianistas, considerando las palabras que son clave en el corpus de estudio, en relación con los corpus de referencia, y también por el hecho de que, aproximadamente, un 41% de vocablos sustantivos y adjetivos indígenas utilizados por el autor en sus obras son indianistas. Más allá de todo eso, verificamos también que el autor crea étimos en sus novelas con el objetivo de nombrar personajes y cosas, según sus deseos literarios y lingüísticos. Alencar utiliza el criterio de segmentación de un vocablo con base en conocimientos de lengua indígena; posteriormente, con los fragmentos ya segmentados, crea nuevos vocablos de acuerdo con el contexto ficcional en el interior de las novelas. Por fin, consideramos la propuesta del Vocabulario con los vocablos indígenas, que se harán disponibles online, de gran importancia no sólo para los consultores y/o lectores de Alencar, sino también para aquellos que deseen emprender estudios sobre el vocabulario indígena, que contribuyó sobremanera para la formación de la lengua portuguesa brasileña.CBP&D/Café - Consórcio Brasileiro de Pesquisa e Desenvolvimento do CaféTese (Doutorado)A presente tese tem como objetivo desenvolver um estudo com base no léxico indianista de José de Alencar em suas obras consideradas indianistas: Iracema, O Guarani e Ubirajara. Nosso estudo abrangeu dois temas gerais: por um lado, verificar se Alencar utiliza um léxico específico em suas obras indianistas; por outro, analisar o léxico indianista baseando-nos na perspectiva da Etimologia Ficcional Contextual. E, como terceiro objetivo, propor a elaboração de um Vocabulário eletrônico dos vocábulos indianistas, a ser disponibilizado online. Em nossa proposta, dada a diversidade, articulamos saberes relacionados ao Léxico, naquilo que se refere à Lexicologia e à Lexicografia; abordamos questões sobre a caracterização e constituição de obras lexicográficas e sobre os dicionários eletrônicos, em específico. Tendo em vista os procedimentos de organização do léxico, também discorremos sobre campos semânticos. Para dar conta da nossa proposta de análise pelo viés da Etimologia, expandimos o conceito para Etimologia Ficcional Contextual e, por fim, nosso olhar para o arcabouço teórico-metodológico centrou-se nos pressupostos da Linguística de Corpus, concebendo-a como abordagem, principalmente, pelo viés das pesquisas guiadas por corpus. Para esta pesquisa, compilamos nosso corpus de estudos com as obras indianistas de Alencar e, para contrastar e verificar se o autor utiliza um léxico específico nas obras indianistas, compilamos o corpus de referência com as demais obras do mesmo autor. Para processamento dos corpora, recorremos ao programa WordSmith Tools 6.0 e suas três ferramentas: WordList, KeyWords e Concord, que nos permitiram a identificação dos vocábulos indianistas, acesso aos contextos abonatórios das ocorrências, além do contraste entre o corpus de estudo e os corpora de referência. Para a análise etimológica, recorremos também ao Corpus do Português (DAVIES, 2016) e aos dicionários de consulta e exclusão. A partir dos dados, elaboramos 17 fichas lexicográficas que serviram de amostra para o trabalho de organização do Vocabulário indianista de Alencar. Concluímos que Alencar utiliza um léxico específico em suas obras indianistas, considerando as palavras que são chave no corpus de estudo em relação aos corpora de referência, como também pelo fato de, aproximadamente, 41% de vocábulos substantivos e adjetivos indígenas utilizados pelo autor em suas obras, serem indianistas. Além disso, verificamos também que o autor cria étimos em seus romances para nomear, conforme seus desejos literários e linguísticos. Alencar utiliza o critério de segmentação de um vocábulo com base em conhecimentos de língua indígena, para, com os fragmentos, criar novos vocábulos de acordo com o contexto ficcional no interior dos romances. Por fim, consideramos a proposta do Vocabulário com os vocábulos indígenas, a ser disponibilizado online, de grande importância não apenas para os consulentes leitores de Alencar, como também para aqueles que desejarem empreender estudos sobre o vocabulário indígena, que contribuiu para a formação da língua portuguesa brasileira.Universidade Federal de UberlândiaBrasilPrograma de Pós-graduação em Estudos LinguísticosNovodvorski, Arielhttp://lattes.cnpq.br/2882362453894798Pereira, Kênia Maria de Almeidahttp://lattes.cnpq.br/6565924641557935Dias, Elianahttp://lattes.cnpq.br/4639293230175288Martins, Evandro Silvahttp://lattes.cnpq.br/1015298826629744Fromm, Guilhermehttp://lattes.cnpq.br/6627254642763875Ávila, Maria Virgínia Dias de2018-08-28T14:12:04Z2018-08-28T14:12:04Z2018-07-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfÁVILA, Maria Virgínia Dias de. Descrição etimológica do léxico indianista em José de Alencar: uma análise lexicográfica direcionada por corpus. 2018. 254 f. Tese (Doutorado em Estudos Linguísticos) - Universidade Federal de Uberlândia, Uberlândia, 2018. DOI http://dx.doi.org/10.14393/ufu.te.2018.625.https://repositorio.ufu.br/handle/123456789/22389Http://dx.doi.org/10.14393/ufu.te.2018.625porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFU2018-08-28T14:12:04Zoai:repositorio.ufu.br:123456789/22389Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2018-08-28T14:12:04Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false
dc.title.none.fl_str_mv Descrição etimológica do léxico indianista em José de Alencar: uma análise lexicográfica direcionada por corpus
An etymological description of indianist lexis in José de Alencar: a lexicographic analysis directed by corpus
title Descrição etimológica do léxico indianista em José de Alencar: uma análise lexicográfica direcionada por corpus
spellingShingle Descrição etimológica do léxico indianista em José de Alencar: uma análise lexicográfica direcionada por corpus
Ávila, Maria Virgínia Dias de
Linguística
Língua portuguesa - etimologia
Linguística de corpus
Alencar, José de, 1829-1877 - crítica e interpretação
Etimologia ficcional contextual
Indianismo em Alencar
Vocabulário indianista
Léxico indianista
Contextual fiction etymology
Indianist lexicon
Indianismo in Alencar
Corpus linguistics
Indianist vocabulary
Etimología ficcional contextual
Indianismo en Alencar
Lingüística de corpus
Vocabulario indianista
CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::TEORIA E ANALISE LINGUISTICA
title_short Descrição etimológica do léxico indianista em José de Alencar: uma análise lexicográfica direcionada por corpus
title_full Descrição etimológica do léxico indianista em José de Alencar: uma análise lexicográfica direcionada por corpus
title_fullStr Descrição etimológica do léxico indianista em José de Alencar: uma análise lexicográfica direcionada por corpus
title_full_unstemmed Descrição etimológica do léxico indianista em José de Alencar: uma análise lexicográfica direcionada por corpus
title_sort Descrição etimológica do léxico indianista em José de Alencar: uma análise lexicográfica direcionada por corpus
author Ávila, Maria Virgínia Dias de
author_facet Ávila, Maria Virgínia Dias de
author_role author
dc.contributor.none.fl_str_mv Novodvorski, Ariel
http://lattes.cnpq.br/2882362453894798
Pereira, Kênia Maria de Almeida
http://lattes.cnpq.br/6565924641557935
Dias, Eliana
http://lattes.cnpq.br/4639293230175288
Martins, Evandro Silva
http://lattes.cnpq.br/1015298826629744
Fromm, Guilherme
http://lattes.cnpq.br/6627254642763875
dc.contributor.author.fl_str_mv Ávila, Maria Virgínia Dias de
dc.subject.por.fl_str_mv Linguística
Língua portuguesa - etimologia
Linguística de corpus
Alencar, José de, 1829-1877 - crítica e interpretação
Etimologia ficcional contextual
Indianismo em Alencar
Vocabulário indianista
Léxico indianista
Contextual fiction etymology
Indianist lexicon
Indianismo in Alencar
Corpus linguistics
Indianist vocabulary
Etimología ficcional contextual
Indianismo en Alencar
Lingüística de corpus
Vocabulario indianista
CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::TEORIA E ANALISE LINGUISTICA
topic Linguística
Língua portuguesa - etimologia
Linguística de corpus
Alencar, José de, 1829-1877 - crítica e interpretação
Etimologia ficcional contextual
Indianismo em Alencar
Vocabulário indianista
Léxico indianista
Contextual fiction etymology
Indianist lexicon
Indianismo in Alencar
Corpus linguistics
Indianist vocabulary
Etimología ficcional contextual
Indianismo en Alencar
Lingüística de corpus
Vocabulario indianista
CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::TEORIA E ANALISE LINGUISTICA
description This thesis aims at developing a study based on specific lexicon features used by José de Alencar, that is, indigenous lexicon, in his considered indianist works, such as: Iracema, O Guarani and Ubirajara. This study is comprised of two general topics: verifying if the author uses a specific lexicon in his indianist works, and analyzing such lexicon from the perspective of Contextual Fiction Etymology. In addition, as a third objective, we propose the creation of an electronic vocabulary of such indianist terms making them available online. Due to the diversity, in our proposal, we articulated knowledge related to lexicon, concerning Lexicology and Lexicography and we approached issues relating to the characterization and constitution of lexicography words, specifically, electronic dictionaries. Considering lexicon organization procedures, we also discussed semantic fields. In order to carry out our analysis through the Etymology scope, we expanded the concept of Contextual Fiction Etymology and, lastly, our approach on the theoretical and methodology support was centered on a Corpus Linguistics basis approach, mainly in a corpus-guided research scope. We compiled our studied corpus with Alencar’s indianist works, and, to contrast and verify if the author uses a specific lexicon in such works, we compiled a reference corpus with other works of the same author. Corpora processing was done in WordSmith Tools 6.0 and its three main tools: WordList, KeyWords and Concord, which enabled us identify indianist terms, access abonatory contents occurrences, as well as the contrast between the studied and reference corpus. For the etymology analysis, we used a corpus of the Portuguese language (DAVIES, 2016), and also regular and exclusion dictionaries. From the data, we elaborated 17 lexicography forms that served as a sample for the organization of Alencar’s indianist vocabulary. It is our conclusion that Alencar uses a specific lexicon in his indianist works, considering the keywords in the studied corpus in relation to the reference corpora, also due to the fact that approximately 41% of the noun and adjectives used in his works are indigenous. In addition, we also verified that the author creates etymons in his novels to nominate, according to his literary and linguistics wishes. The author uses the segmentation criterion of a term based on indigenous language knowledge to, from the fragments, create new terms according to the fiction context of his novels. Lastly, we consider of great importance that the Indigenous Vocabulary proposal is available online, not only for Alencar’s readers, but also for those that wish to undertake studies on indigenous vocabulary, which contributes for Brazilian Portuguese formation.
publishDate 2018
dc.date.none.fl_str_mv 2018-08-28T14:12:04Z
2018-08-28T14:12:04Z
2018-07-09
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv ÁVILA, Maria Virgínia Dias de. Descrição etimológica do léxico indianista em José de Alencar: uma análise lexicográfica direcionada por corpus. 2018. 254 f. Tese (Doutorado em Estudos Linguísticos) - Universidade Federal de Uberlândia, Uberlândia, 2018. DOI http://dx.doi.org/10.14393/ufu.te.2018.625.
https://repositorio.ufu.br/handle/123456789/22389
Http://dx.doi.org/10.14393/ufu.te.2018.625
identifier_str_mv ÁVILA, Maria Virgínia Dias de. Descrição etimológica do léxico indianista em José de Alencar: uma análise lexicográfica direcionada por corpus. 2018. 254 f. Tese (Doutorado em Estudos Linguísticos) - Universidade Federal de Uberlândia, Uberlândia, 2018. DOI http://dx.doi.org/10.14393/ufu.te.2018.625.
Http://dx.doi.org/10.14393/ufu.te.2018.625
url https://repositorio.ufu.br/handle/123456789/22389
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Uberlândia
Brasil
Programa de Pós-graduação em Estudos Linguísticos
publisher.none.fl_str_mv Universidade Federal de Uberlândia
Brasil
Programa de Pós-graduação em Estudos Linguísticos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFU
instname:Universidade Federal de Uberlândia (UFU)
instacron:UFU
instname_str Universidade Federal de Uberlândia (UFU)
instacron_str UFU
institution UFU
reponame_str Repositório Institucional da UFU
collection Repositório Institucional da UFU
repository.name.fl_str_mv Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)
repository.mail.fl_str_mv diinf@dirbi.ufu.br
_version_ 1805569726949097472