Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa

Detalhes bibliográficos
Autor(a) principal: Silva, Cícero Soares da
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da PUC_SP
Texto Completo: https://repositorio.pucsp.br/jspui/handle/handle/26500
Resumo: The goal of the present research was to identify the dimensions of variation from patterns of co-occurence of lexicogrammatical elements of the langauage used by English learners. The Multilevel Corpus of Brazilian Learners of English as a Foreign Language - COBRA-7 was used. Compiled by W.M. Dantas in 2012 (DANTAS, 2012), the COBRA-7 corpus comprises 2516 school essays of different topics, totalling 571,564 words (tokens) and 19,800 types, distributed in six proficiency levels: basic I, basic II, pre-intermediate, intermediate, high-intermediate and advanced based on the Common European Framework of Reference for Languages (CEFR). Learner Corpus Research (LCR) is aimed at investigating electronic collections of authentic textual data produced by Foreign Language or Second Language learners. Data are gathered according to explicit design criteria for a particular purpose for Foreign Language Acquisition/Foreign Language Teaching. The data are coded using objective criteria such as text source, learnel level, L1 background, among others (GRANGER, 2004, p.4). The methodology used in this research was Functional Multidimensional Analysis (MDA) (BIBER, 1988; 2009; BERBER SARDINHA, VEIRANO PINTO, 2014, 2019), a corpus-based method. MDA can reveal the underlying parameters of variation in a corpus, that is, the grammatical features co-occurring in the texts. The analysis carried out sought to reveal the functional dimensions of variation present in the COBRA corpus. Through a series of ANOVAs, it was possible to determine to what extent the dimensions are good predictors of the variation across independent variables such as “school”, “level” and “gender”. The results showed significant statistical variation exists between learning levels with respect to the dimensions. It is hoped that this study will stimulate the development of other studies using Multidimensional Analysis (MDA), mainly in the field of Learner Corpus Research (LCR) especially from na MDA perspective
id PUC_SP-1_21e5e5129e42755d53307ca611bf4c73
oai_identifier_str oai:repositorio.pucsp.br:handle/26500
network_acronym_str PUC_SP-1
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_SP
repository_id_str
spelling Sardinha, Tony Berberhttp://lattes.cnpq.br/6940454346543706http://lattes.cnpq.br/6907060424053378Silva, Cícero Soares da2022-07-04T15:50:13Z2022-07-04T15:50:13Z2022-04-20Silva, Cícero Soares da. Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa. 2022. Dissertação (Mestrado em Linguística Aplicada e Estudos da Linguagem) - Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem da Pontifícia Universidade Católica de São Paulo, São Paulo, 2022.https://repositorio.pucsp.br/jspui/handle/handle/26500The goal of the present research was to identify the dimensions of variation from patterns of co-occurence of lexicogrammatical elements of the langauage used by English learners. The Multilevel Corpus of Brazilian Learners of English as a Foreign Language - COBRA-7 was used. Compiled by W.M. Dantas in 2012 (DANTAS, 2012), the COBRA-7 corpus comprises 2516 school essays of different topics, totalling 571,564 words (tokens) and 19,800 types, distributed in six proficiency levels: basic I, basic II, pre-intermediate, intermediate, high-intermediate and advanced based on the Common European Framework of Reference for Languages (CEFR). Learner Corpus Research (LCR) is aimed at investigating electronic collections of authentic textual data produced by Foreign Language or Second Language learners. Data are gathered according to explicit design criteria for a particular purpose for Foreign Language Acquisition/Foreign Language Teaching. The data are coded using objective criteria such as text source, learnel level, L1 background, among others (GRANGER, 2004, p.4). The methodology used in this research was Functional Multidimensional Analysis (MDA) (BIBER, 1988; 2009; BERBER SARDINHA, VEIRANO PINTO, 2014, 2019), a corpus-based method. MDA can reveal the underlying parameters of variation in a corpus, that is, the grammatical features co-occurring in the texts. The analysis carried out sought to reveal the functional dimensions of variation present in the COBRA corpus. Through a series of ANOVAs, it was possible to determine to what extent the dimensions are good predictors of the variation across independent variables such as “school”, “level” and “gender”. The results showed significant statistical variation exists between learning levels with respect to the dimensions. It is hoped that this study will stimulate the development of other studies using Multidimensional Analysis (MDA), mainly in the field of Learner Corpus Research (LCR) especially from na MDA perspectiveO objetivo da presente pesquisa foi identificar as dimensões de variação a partir de padrões de coocorrência de elementos lexicogramaticais da linguagem por aprendizes de inglês. Foi empregado o Corpus Multinível de Aprendizes Brasileiros de Inglês como Língua Estrangeira- COBRA-7. Compilado por W. M. Dantas em 2012 (DANTAS, 2012), o corpus COBRA-7 é composto de 2516 redações escolares de diferentes tópicos, totalizando 571.564 palavras (tokens) e 19.800 types, distribuídas em seis níveis de proficiência: básico I (Bs1), básico II (Bs2), pré-intermediário (Pre), intermediário (Int), pós-intermediário (Hig) e avançado (Adv) com base no Quadro Europeu Comum de Referência para Línguas – (CEFR). A Linguística de Corpus de Aprendiz (LCA) é´ voltada à investigação de coleções eletrônicas de dados textuais autênticos produzidos por aprendizes de Língua Estrangeira ou Segunda Língua. Os dados são reunidos de acordo com critérios de desenho explícitos para um determinado propósito para Aquisição de Língua Estrangeira/Ensino de Língua Estrangeira. São codificados de forma padrão e homogênea assim como são documentados suas origens e procedência (GRANGER, 2004, p.4). A metodologia utilizada nesta pesquisa foi a Análise Multidimensional Funcional (AMD) (BIBER,1988; 2009; BERBER SARDINHA, VEIRANO PINTO, 2014, 2019), no âmbito da Linguística de Corpus (LC), que se baseia na pesquisa de corpora utilizando ferramenta computacionais especializados. A AMD pode nos fornecer os parâmetros subjacentes das características linguísticas presentes em um corpus ou corpora, isto é, identifica quais características gramático-funcionais estão coocorrendo nos textos de um corpus ou corpora. A análise buscou revelar quais são as dimensões de variação gramaticofuncionais presentes no corpus. Por meio do procedimento estatístico ANOVA foi possível verificar se/e como ocorre a variação multidimensional funcional em termos de variáveis independentes como “escola”, “nível” e “gênero”. Os resultados mostraram que existe uma variação estatística entre os níveis de ensino. Espera-se que esta pesquisa estimule o desenvolvimento de outros estudos de Análise Multidimensional (AMD), principalmente na Lingúística de Corpus de Aprendiz no que se refere à variação linguística e aos diferentes registros da linguagem em usoCoordenação de Aperfeiçoamento de Pessoal de Nível Superior – CAPESporPontifícia Universidade Católica de São PauloPrograma de Estudos Pós-Graduados em Linguística Aplicada e Estudos da LinguagemPUC-SPBrasilFaculdade de Filosofia, Comunicação, Letras e ArtesCNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADALinguística de corpusNíveis de proficiênciaAnálise multidimensionalCorpus linguisticsLearner corpus researchProfiency levelsMultidimensional analysisAnálise multidimensional de um corpus multinível de aprendizes de Língua Inglesainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_SPinstname:Pontifícia Universidade Católica de São Paulo (PUC-SP)instacron:PUC_SPORIGINALCicero Soares da Silva.pdfapplication/pdf1061788https://repositorio.pucsp.br/xmlui/bitstream/handle/26500/1/Cicero%20Soares%20da%20Silva.pdf22512b567e240a621312210405617090MD51TEXTCicero Soares da Silva.pdf.txtCicero Soares da Silva.pdf.txtExtracted texttext/plain120503https://repositorio.pucsp.br/xmlui/bitstream/handle/26500/2/Cicero%20Soares%20da%20Silva.pdf.txt1aa89a725da963470453e25027cc26bcMD52THUMBNAILCicero Soares da Silva.pdf.jpgCicero Soares da Silva.pdf.jpgGenerated Thumbnailimage/jpeg1286https://repositorio.pucsp.br/xmlui/bitstream/handle/26500/3/Cicero%20Soares%20da%20Silva.pdf.jpgdf2d6dd2d96f13cbbf1e3f8c2cc40cbeMD53handle/265002022-07-05 09:45:00.354oai:repositorio.pucsp.br:handle/26500Biblioteca Digital de Teses e Dissertaçõeshttps://sapientia.pucsp.br/https://sapientia.pucsp.br/oai/requestbngkatende@pucsp.br||rapassi@pucsp.bropendoar:2022-07-05T12:45Biblioteca Digital de Teses e Dissertações da PUC_SP - Pontifícia Universidade Católica de São Paulo (PUC-SP)false
dc.title.pt_BR.fl_str_mv Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa
title Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa
spellingShingle Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa
Silva, Cícero Soares da
CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADA
Linguística de corpus
Níveis de proficiência
Análise multidimensional
Corpus linguistics
Learner corpus research
Profiency levels
Multidimensional analysis
title_short Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa
title_full Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa
title_fullStr Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa
title_full_unstemmed Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa
title_sort Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa
author Silva, Cícero Soares da
author_facet Silva, Cícero Soares da
author_role author
dc.contributor.advisor1.fl_str_mv Sardinha, Tony Berber
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6940454346543706
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/6907060424053378
dc.contributor.author.fl_str_mv Silva, Cícero Soares da
contributor_str_mv Sardinha, Tony Berber
dc.subject.cnpq.fl_str_mv CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADA
topic CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADA
Linguística de corpus
Níveis de proficiência
Análise multidimensional
Corpus linguistics
Learner corpus research
Profiency levels
Multidimensional analysis
dc.subject.por.fl_str_mv Linguística de corpus
Níveis de proficiência
Análise multidimensional
dc.subject.eng.fl_str_mv Corpus linguistics
Learner corpus research
Profiency levels
Multidimensional analysis
description The goal of the present research was to identify the dimensions of variation from patterns of co-occurence of lexicogrammatical elements of the langauage used by English learners. The Multilevel Corpus of Brazilian Learners of English as a Foreign Language - COBRA-7 was used. Compiled by W.M. Dantas in 2012 (DANTAS, 2012), the COBRA-7 corpus comprises 2516 school essays of different topics, totalling 571,564 words (tokens) and 19,800 types, distributed in six proficiency levels: basic I, basic II, pre-intermediate, intermediate, high-intermediate and advanced based on the Common European Framework of Reference for Languages (CEFR). Learner Corpus Research (LCR) is aimed at investigating electronic collections of authentic textual data produced by Foreign Language or Second Language learners. Data are gathered according to explicit design criteria for a particular purpose for Foreign Language Acquisition/Foreign Language Teaching. The data are coded using objective criteria such as text source, learnel level, L1 background, among others (GRANGER, 2004, p.4). The methodology used in this research was Functional Multidimensional Analysis (MDA) (BIBER, 1988; 2009; BERBER SARDINHA, VEIRANO PINTO, 2014, 2019), a corpus-based method. MDA can reveal the underlying parameters of variation in a corpus, that is, the grammatical features co-occurring in the texts. The analysis carried out sought to reveal the functional dimensions of variation present in the COBRA corpus. Through a series of ANOVAs, it was possible to determine to what extent the dimensions are good predictors of the variation across independent variables such as “school”, “level” and “gender”. The results showed significant statistical variation exists between learning levels with respect to the dimensions. It is hoped that this study will stimulate the development of other studies using Multidimensional Analysis (MDA), mainly in the field of Learner Corpus Research (LCR) especially from na MDA perspective
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-07-04T15:50:13Z
dc.date.available.fl_str_mv 2022-07-04T15:50:13Z
dc.date.issued.fl_str_mv 2022-04-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv Silva, Cícero Soares da. Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa. 2022. Dissertação (Mestrado em Linguística Aplicada e Estudos da Linguagem) - Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem da Pontifícia Universidade Católica de São Paulo, São Paulo, 2022.
dc.identifier.uri.fl_str_mv https://repositorio.pucsp.br/jspui/handle/handle/26500
identifier_str_mv Silva, Cícero Soares da. Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa. 2022. Dissertação (Mestrado em Linguística Aplicada e Estudos da Linguagem) - Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem da Pontifícia Universidade Católica de São Paulo, São Paulo, 2022.
url https://repositorio.pucsp.br/jspui/handle/handle/26500
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica de São Paulo
dc.publisher.program.fl_str_mv Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem
dc.publisher.initials.fl_str_mv PUC-SP
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Faculdade de Filosofia, Comunicação, Letras e Artes
publisher.none.fl_str_mv Pontifícia Universidade Católica de São Paulo
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_SP
instname:Pontifícia Universidade Católica de São Paulo (PUC-SP)
instacron:PUC_SP
instname_str Pontifícia Universidade Católica de São Paulo (PUC-SP)
instacron_str PUC_SP
institution PUC_SP
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_SP
collection Biblioteca Digital de Teses e Dissertações da PUC_SP
bitstream.url.fl_str_mv https://repositorio.pucsp.br/xmlui/bitstream/handle/26500/1/Cicero%20Soares%20da%20Silva.pdf
https://repositorio.pucsp.br/xmlui/bitstream/handle/26500/2/Cicero%20Soares%20da%20Silva.pdf.txt
https://repositorio.pucsp.br/xmlui/bitstream/handle/26500/3/Cicero%20Soares%20da%20Silva.pdf.jpg
bitstream.checksum.fl_str_mv 22512b567e240a621312210405617090
1aa89a725da963470453e25027cc26bc
df2d6dd2d96f13cbbf1e3f8c2cc40cbe
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_SP - Pontifícia Universidade Católica de São Paulo (PUC-SP)
repository.mail.fl_str_mv bngkatende@pucsp.br||rapassi@pucsp.br
_version_ 1809277840066084864