A linguagem formulaica nas TED Talks: uma investigação sobre a variação disciplinar de pacotes lexicais

Detalhes bibliográficos
Autor(a) principal: Silva, Luciano Franco
Data de Publicação: 2023
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: https://hdl.handle.net/11449/251018
Resumo: A tese ora apresentada delineia uma investigação acerca da linguagem formulaica em TED Talks, um gênero discursivo híbrido de palestras voltadas a popularização do conhecimento. A pesquisa centra-se na identificação e análise de marcadores de variação disciplinar presentes nos padrões linguísticos mais recorrentes em um conjunto de 1.519 transcrições de TED Talks. Estas foram associadas a 34 disciplinas acadêmicas e organizadas em dois corpora de estudo de áreas disciplinares distintas: TED-STEM [Ciências, Tecnologia, Engenharia e Matemática] e TED-SHAPE [Ciências Sociais, Humanidades e Artes para o Povo e para Economia]. A base teórica deste trabalho está ancorada em três vertentes: variação disciplinar, linguagem formulaica e linguística de corpus. A perspectiva de registro embasou a compreensão de como características linguísticas recorrentes se relacionam ao contexto situacional e ao propósito comunicativo subjacentes às TED Talks. A concepção da natureza formulaica da língua e as implicações envolvendo sua investigação por meio de corpora viabilizaram um estudo com foco nos pacotes lexicais – sequências fixas de três ou mais palavras, altamente frequentes e distribuídas em um registro. Utilizando parâmetros distribucionais (frequência relativa e dispersão), este estudo abordou pacotes lexicais formados por quatro palavras, com frequência relativa mínima de 20 ocorrências por milhão de palavras e presentes em, pelo menos, 4% dos textos de cada corpora. Foram identificados 138 pacotes lexicais distintos no corpus TED-STEM e 114 no corpus TED-SHAPE. Os resultados sugerem que palestrantes vinculados ao domínio STEM tendem a mobilizar um conjunto maior de expressões padronizadas para expressar posicionamento, aludir a referências e organizar e reformular o discurso quando comparados aos palestrantes que trabalham no domínio SHAPE. Mais especificamente, as funções discursivas de direcionamentos, habilidades e elaboração/clarificação de tópicos revelaram-se como altamente padronizadas no corpus TED-STEM. Variações estruturais também foram evidenciadas, com pacotes lexicais que incorporam orações subordinadas (e.g. what we do is) apresentando uma proporção ligeiramente maior no corpus TED-STEM, ao passo que pacotes lexicais compostos por fragmentos de sintagmas nominais e preposicionais (e.g. at the end of) ocorreram em maior proporção no corpus TED-SHAPE. Os achados evidenciam diferenças no modo como palestrantes de ambos os domínios disciplinares interagem com o público-alvo, expressam opiniões e desejos e organizam seus discursos. Na conclusão desta tese, são apresentadas as principais características do discurso disciplinar das TED Talks, e esboçadas sugestões para o aproveitamento dos dados em futuras investigações sobre a linguagem formulaica em discursos de popularização do conhecimento.
id UNSP_53884f56a5f0d3df3bd4d4d6a49994fc
oai_identifier_str oai:repositorio.unesp.br:11449/251018
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling A linguagem formulaica nas TED Talks: uma investigação sobre a variação disciplinar de pacotes lexicaisFormulaic language in TED Talks: an investigation into the disciplinary variation of lexical bundlesPacotes lexicaisLinguística de corpusLinguagem formulaicaTED TalksLexical bundlesCorpus linguisticsFormulaic languageA tese ora apresentada delineia uma investigação acerca da linguagem formulaica em TED Talks, um gênero discursivo híbrido de palestras voltadas a popularização do conhecimento. A pesquisa centra-se na identificação e análise de marcadores de variação disciplinar presentes nos padrões linguísticos mais recorrentes em um conjunto de 1.519 transcrições de TED Talks. Estas foram associadas a 34 disciplinas acadêmicas e organizadas em dois corpora de estudo de áreas disciplinares distintas: TED-STEM [Ciências, Tecnologia, Engenharia e Matemática] e TED-SHAPE [Ciências Sociais, Humanidades e Artes para o Povo e para Economia]. A base teórica deste trabalho está ancorada em três vertentes: variação disciplinar, linguagem formulaica e linguística de corpus. A perspectiva de registro embasou a compreensão de como características linguísticas recorrentes se relacionam ao contexto situacional e ao propósito comunicativo subjacentes às TED Talks. A concepção da natureza formulaica da língua e as implicações envolvendo sua investigação por meio de corpora viabilizaram um estudo com foco nos pacotes lexicais – sequências fixas de três ou mais palavras, altamente frequentes e distribuídas em um registro. Utilizando parâmetros distribucionais (frequência relativa e dispersão), este estudo abordou pacotes lexicais formados por quatro palavras, com frequência relativa mínima de 20 ocorrências por milhão de palavras e presentes em, pelo menos, 4% dos textos de cada corpora. Foram identificados 138 pacotes lexicais distintos no corpus TED-STEM e 114 no corpus TED-SHAPE. Os resultados sugerem que palestrantes vinculados ao domínio STEM tendem a mobilizar um conjunto maior de expressões padronizadas para expressar posicionamento, aludir a referências e organizar e reformular o discurso quando comparados aos palestrantes que trabalham no domínio SHAPE. Mais especificamente, as funções discursivas de direcionamentos, habilidades e elaboração/clarificação de tópicos revelaram-se como altamente padronizadas no corpus TED-STEM. Variações estruturais também foram evidenciadas, com pacotes lexicais que incorporam orações subordinadas (e.g. what we do is) apresentando uma proporção ligeiramente maior no corpus TED-STEM, ao passo que pacotes lexicais compostos por fragmentos de sintagmas nominais e preposicionais (e.g. at the end of) ocorreram em maior proporção no corpus TED-SHAPE. Os achados evidenciam diferenças no modo como palestrantes de ambos os domínios disciplinares interagem com o público-alvo, expressam opiniões e desejos e organizam seus discursos. Na conclusão desta tese, são apresentadas as principais características do discurso disciplinar das TED Talks, e esboçadas sugestões para o aproveitamento dos dados em futuras investigações sobre a linguagem formulaica em discursos de popularização do conhecimento.The thesis presented herein outlines an investigation into formulaic language in TED Talks, a hybrid genre of lectures aimed at popularizing knowledge. The research focuses on identifying and analyzing markers of disciplinary variation present in recurrent linguistic patterns in a collection of 1,519 transcripts of TED Talks. These were associated with 34 academic disciplines and organized into two study corpora of distinct disciplinary areas: TED-STEM [Science, Technology, Engineering, and Mathematics] and TED-SHAPE [Social Sciences, Humanities, and Arts for People and the Economy]. The theoretical framework is based on three key aspects: register variation, formulaic language, and corpus linguistics. The perspective of disciplinary variation underpinned the understanding of how recurrent linguistic features relate to the situational context and the underlying communicative purpose of TED Talks. The notion of formulaic language and the implications surrounding its investigation through corpora enabled a study focused on lexical bundles – fixed sequences of three or more words, highly frequent and distributed across a register. Employing distributional parameters (relative frequency and dispersion), this study focused on four-word lexical bundles, occurring at least 20 times per million words, across 4% of the texts in each corpus. A total of 138 distinct lexical bundles were identified in the TED-STEM corpus and 114 in the TED-SHAPE corpus. The findings suggest that speakers affiliated with the STEM domain tend to deploy a broader set of standardized expressions to signal stance, time/place references, and organize and reformulate their discourse compared to their SHAPE counterparts. More specifically, discursive functions of directives, abilities, and topic elaboration/clarification emerged as highly standardized in the TED-STEM corpus. Structural variations were also highlighted: lexical bundles incorporating dependent clauses fragments (e.g. what we do is) were more frequent in the TED-STEM corpus, while lexical bundles consisting of noun and prepositional phrase fragments (e.g. at the end of) occurred more frequently in the TED-SHAPE corpus. The findings highlight differences in how speakers from both disciplinary domains engage with their target audience, express opinions, and desires, and organize their discourse. In the concluding remarks, the primary features regarding the disciplinary discourse of TED Talks are presented, and suggestions are outlined for leveraging the data in future investigations on formulaic language in science popularization discourses.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)CAPES: 001Universidade Estadual Paulista (Unesp)Pinto, Paula Tavares [UNESP]Silva, Luciano Franco2023-10-19T14:16:08Z2023-10-19T14:16:08Z2023-09-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfSilva, Luciano Franco. A linguagem formulaica nas TED Talks: uma investigação sobre a variação disciplinar de pacotes lexicais, 2023. Tese (Doutorado) - Universidade Estadual Paulista (Unesp), Instituto de Biociências Letras e Ciências Exatas (Ibilce), São José do Rio Preto, 2023.https://hdl.handle.net/11449/251018porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-12-06T06:19:53Zoai:repositorio.unesp.br:11449/251018Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T19:38:41.897169Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv A linguagem formulaica nas TED Talks: uma investigação sobre a variação disciplinar de pacotes lexicais
Formulaic language in TED Talks: an investigation into the disciplinary variation of lexical bundles
title A linguagem formulaica nas TED Talks: uma investigação sobre a variação disciplinar de pacotes lexicais
spellingShingle A linguagem formulaica nas TED Talks: uma investigação sobre a variação disciplinar de pacotes lexicais
Silva, Luciano Franco
Pacotes lexicais
Linguística de corpus
Linguagem formulaica
TED Talks
Lexical bundles
Corpus linguistics
Formulaic language
title_short A linguagem formulaica nas TED Talks: uma investigação sobre a variação disciplinar de pacotes lexicais
title_full A linguagem formulaica nas TED Talks: uma investigação sobre a variação disciplinar de pacotes lexicais
title_fullStr A linguagem formulaica nas TED Talks: uma investigação sobre a variação disciplinar de pacotes lexicais
title_full_unstemmed A linguagem formulaica nas TED Talks: uma investigação sobre a variação disciplinar de pacotes lexicais
title_sort A linguagem formulaica nas TED Talks: uma investigação sobre a variação disciplinar de pacotes lexicais
author Silva, Luciano Franco
author_facet Silva, Luciano Franco
author_role author
dc.contributor.none.fl_str_mv Pinto, Paula Tavares [UNESP]
dc.contributor.author.fl_str_mv Silva, Luciano Franco
dc.subject.por.fl_str_mv Pacotes lexicais
Linguística de corpus
Linguagem formulaica
TED Talks
Lexical bundles
Corpus linguistics
Formulaic language
topic Pacotes lexicais
Linguística de corpus
Linguagem formulaica
TED Talks
Lexical bundles
Corpus linguistics
Formulaic language
description A tese ora apresentada delineia uma investigação acerca da linguagem formulaica em TED Talks, um gênero discursivo híbrido de palestras voltadas a popularização do conhecimento. A pesquisa centra-se na identificação e análise de marcadores de variação disciplinar presentes nos padrões linguísticos mais recorrentes em um conjunto de 1.519 transcrições de TED Talks. Estas foram associadas a 34 disciplinas acadêmicas e organizadas em dois corpora de estudo de áreas disciplinares distintas: TED-STEM [Ciências, Tecnologia, Engenharia e Matemática] e TED-SHAPE [Ciências Sociais, Humanidades e Artes para o Povo e para Economia]. A base teórica deste trabalho está ancorada em três vertentes: variação disciplinar, linguagem formulaica e linguística de corpus. A perspectiva de registro embasou a compreensão de como características linguísticas recorrentes se relacionam ao contexto situacional e ao propósito comunicativo subjacentes às TED Talks. A concepção da natureza formulaica da língua e as implicações envolvendo sua investigação por meio de corpora viabilizaram um estudo com foco nos pacotes lexicais – sequências fixas de três ou mais palavras, altamente frequentes e distribuídas em um registro. Utilizando parâmetros distribucionais (frequência relativa e dispersão), este estudo abordou pacotes lexicais formados por quatro palavras, com frequência relativa mínima de 20 ocorrências por milhão de palavras e presentes em, pelo menos, 4% dos textos de cada corpora. Foram identificados 138 pacotes lexicais distintos no corpus TED-STEM e 114 no corpus TED-SHAPE. Os resultados sugerem que palestrantes vinculados ao domínio STEM tendem a mobilizar um conjunto maior de expressões padronizadas para expressar posicionamento, aludir a referências e organizar e reformular o discurso quando comparados aos palestrantes que trabalham no domínio SHAPE. Mais especificamente, as funções discursivas de direcionamentos, habilidades e elaboração/clarificação de tópicos revelaram-se como altamente padronizadas no corpus TED-STEM. Variações estruturais também foram evidenciadas, com pacotes lexicais que incorporam orações subordinadas (e.g. what we do is) apresentando uma proporção ligeiramente maior no corpus TED-STEM, ao passo que pacotes lexicais compostos por fragmentos de sintagmas nominais e preposicionais (e.g. at the end of) ocorreram em maior proporção no corpus TED-SHAPE. Os achados evidenciam diferenças no modo como palestrantes de ambos os domínios disciplinares interagem com o público-alvo, expressam opiniões e desejos e organizam seus discursos. Na conclusão desta tese, são apresentadas as principais características do discurso disciplinar das TED Talks, e esboçadas sugestões para o aproveitamento dos dados em futuras investigações sobre a linguagem formulaica em discursos de popularização do conhecimento.
publishDate 2023
dc.date.none.fl_str_mv 2023-10-19T14:16:08Z
2023-10-19T14:16:08Z
2023-09-22
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv Silva, Luciano Franco. A linguagem formulaica nas TED Talks: uma investigação sobre a variação disciplinar de pacotes lexicais, 2023. Tese (Doutorado) - Universidade Estadual Paulista (Unesp), Instituto de Biociências Letras e Ciências Exatas (Ibilce), São José do Rio Preto, 2023.
https://hdl.handle.net/11449/251018
identifier_str_mv Silva, Luciano Franco. A linguagem formulaica nas TED Talks: uma investigação sobre a variação disciplinar de pacotes lexicais, 2023. Tese (Doutorado) - Universidade Estadual Paulista (Unesp), Instituto de Biociências Letras e Ciências Exatas (Ibilce), São José do Rio Preto, 2023.
url https://hdl.handle.net/11449/251018
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808129100194250752