Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da PUC_SP |
Texto Completo: | https://repositorio.pucsp.br/jspui/handle/handle/26500 |
Resumo: | The goal of the present research was to identify the dimensions of variation from patterns of co-occurence of lexicogrammatical elements of the langauage used by English learners. The Multilevel Corpus of Brazilian Learners of English as a Foreign Language - COBRA-7 was used. Compiled by W.M. Dantas in 2012 (DANTAS, 2012), the COBRA-7 corpus comprises 2516 school essays of different topics, totalling 571,564 words (tokens) and 19,800 types, distributed in six proficiency levels: basic I, basic II, pre-intermediate, intermediate, high-intermediate and advanced based on the Common European Framework of Reference for Languages (CEFR). Learner Corpus Research (LCR) is aimed at investigating electronic collections of authentic textual data produced by Foreign Language or Second Language learners. Data are gathered according to explicit design criteria for a particular purpose for Foreign Language Acquisition/Foreign Language Teaching. The data are coded using objective criteria such as text source, learnel level, L1 background, among others (GRANGER, 2004, p.4). The methodology used in this research was Functional Multidimensional Analysis (MDA) (BIBER, 1988; 2009; BERBER SARDINHA, VEIRANO PINTO, 2014, 2019), a corpus-based method. MDA can reveal the underlying parameters of variation in a corpus, that is, the grammatical features co-occurring in the texts. The analysis carried out sought to reveal the functional dimensions of variation present in the COBRA corpus. Through a series of ANOVAs, it was possible to determine to what extent the dimensions are good predictors of the variation across independent variables such as “school”, “level” and “gender”. The results showed significant statistical variation exists between learning levels with respect to the dimensions. It is hoped that this study will stimulate the development of other studies using Multidimensional Analysis (MDA), mainly in the field of Learner Corpus Research (LCR) especially from na MDA perspective |
id |
PUC_SP-1_21e5e5129e42755d53307ca611bf4c73 |
---|---|
oai_identifier_str |
oai:repositorio.pucsp.br:handle/26500 |
network_acronym_str |
PUC_SP-1 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_SP |
repository_id_str |
|
spelling |
Sardinha, Tony Berberhttp://lattes.cnpq.br/6940454346543706http://lattes.cnpq.br/6907060424053378Silva, Cícero Soares da2022-07-04T15:50:13Z2022-07-04T15:50:13Z2022-04-20Silva, Cícero Soares da. Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa. 2022. Dissertação (Mestrado em Linguística Aplicada e Estudos da Linguagem) - Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem da Pontifícia Universidade Católica de São Paulo, São Paulo, 2022.https://repositorio.pucsp.br/jspui/handle/handle/26500The goal of the present research was to identify the dimensions of variation from patterns of co-occurence of lexicogrammatical elements of the langauage used by English learners. The Multilevel Corpus of Brazilian Learners of English as a Foreign Language - COBRA-7 was used. Compiled by W.M. Dantas in 2012 (DANTAS, 2012), the COBRA-7 corpus comprises 2516 school essays of different topics, totalling 571,564 words (tokens) and 19,800 types, distributed in six proficiency levels: basic I, basic II, pre-intermediate, intermediate, high-intermediate and advanced based on the Common European Framework of Reference for Languages (CEFR). Learner Corpus Research (LCR) is aimed at investigating electronic collections of authentic textual data produced by Foreign Language or Second Language learners. Data are gathered according to explicit design criteria for a particular purpose for Foreign Language Acquisition/Foreign Language Teaching. The data are coded using objective criteria such as text source, learnel level, L1 background, among others (GRANGER, 2004, p.4). The methodology used in this research was Functional Multidimensional Analysis (MDA) (BIBER, 1988; 2009; BERBER SARDINHA, VEIRANO PINTO, 2014, 2019), a corpus-based method. MDA can reveal the underlying parameters of variation in a corpus, that is, the grammatical features co-occurring in the texts. The analysis carried out sought to reveal the functional dimensions of variation present in the COBRA corpus. Through a series of ANOVAs, it was possible to determine to what extent the dimensions are good predictors of the variation across independent variables such as “school”, “level” and “gender”. The results showed significant statistical variation exists between learning levels with respect to the dimensions. It is hoped that this study will stimulate the development of other studies using Multidimensional Analysis (MDA), mainly in the field of Learner Corpus Research (LCR) especially from na MDA perspectiveO objetivo da presente pesquisa foi identificar as dimensões de variação a partir de padrões de coocorrência de elementos lexicogramaticais da linguagem por aprendizes de inglês. Foi empregado o Corpus Multinível de Aprendizes Brasileiros de Inglês como Língua Estrangeira- COBRA-7. Compilado por W. M. Dantas em 2012 (DANTAS, 2012), o corpus COBRA-7 é composto de 2516 redações escolares de diferentes tópicos, totalizando 571.564 palavras (tokens) e 19.800 types, distribuídas em seis níveis de proficiência: básico I (Bs1), básico II (Bs2), pré-intermediário (Pre), intermediário (Int), pós-intermediário (Hig) e avançado (Adv) com base no Quadro Europeu Comum de Referência para Línguas – (CEFR). A Linguística de Corpus de Aprendiz (LCA) é´ voltada à investigação de coleções eletrônicas de dados textuais autênticos produzidos por aprendizes de Língua Estrangeira ou Segunda Língua. Os dados são reunidos de acordo com critérios de desenho explícitos para um determinado propósito para Aquisição de Língua Estrangeira/Ensino de Língua Estrangeira. São codificados de forma padrão e homogênea assim como são documentados suas origens e procedência (GRANGER, 2004, p.4). A metodologia utilizada nesta pesquisa foi a Análise Multidimensional Funcional (AMD) (BIBER,1988; 2009; BERBER SARDINHA, VEIRANO PINTO, 2014, 2019), no âmbito da Linguística de Corpus (LC), que se baseia na pesquisa de corpora utilizando ferramenta computacionais especializados. A AMD pode nos fornecer os parâmetros subjacentes das características linguísticas presentes em um corpus ou corpora, isto é, identifica quais características gramático-funcionais estão coocorrendo nos textos de um corpus ou corpora. A análise buscou revelar quais são as dimensões de variação gramaticofuncionais presentes no corpus. Por meio do procedimento estatístico ANOVA foi possível verificar se/e como ocorre a variação multidimensional funcional em termos de variáveis independentes como “escola”, “nível” e “gênero”. Os resultados mostraram que existe uma variação estatística entre os níveis de ensino. Espera-se que esta pesquisa estimule o desenvolvimento de outros estudos de Análise Multidimensional (AMD), principalmente na Lingúística de Corpus de Aprendiz no que se refere à variação linguística e aos diferentes registros da linguagem em usoCoordenação de Aperfeiçoamento de Pessoal de Nível Superior – CAPESporPontifícia Universidade Católica de São PauloPrograma de Estudos Pós-Graduados em Linguística Aplicada e Estudos da LinguagemPUC-SPBrasilFaculdade de Filosofia, Comunicação, Letras e ArtesCNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADALinguística de corpusNíveis de proficiênciaAnálise multidimensionalCorpus linguisticsLearner corpus researchProfiency levelsMultidimensional analysisAnálise multidimensional de um corpus multinível de aprendizes de Língua Inglesainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_SPinstname:Pontifícia Universidade Católica de São Paulo (PUC-SP)instacron:PUC_SPORIGINALCicero Soares da Silva.pdfapplication/pdf1061788https://repositorio.pucsp.br/xmlui/bitstream/handle/26500/1/Cicero%20Soares%20da%20Silva.pdf22512b567e240a621312210405617090MD51TEXTCicero Soares da Silva.pdf.txtCicero Soares da Silva.pdf.txtExtracted texttext/plain120503https://repositorio.pucsp.br/xmlui/bitstream/handle/26500/2/Cicero%20Soares%20da%20Silva.pdf.txt1aa89a725da963470453e25027cc26bcMD52THUMBNAILCicero Soares da Silva.pdf.jpgCicero Soares da Silva.pdf.jpgGenerated Thumbnailimage/jpeg1286https://repositorio.pucsp.br/xmlui/bitstream/handle/26500/3/Cicero%20Soares%20da%20Silva.pdf.jpgdf2d6dd2d96f13cbbf1e3f8c2cc40cbeMD53handle/265002022-07-05 09:45:00.354oai:repositorio.pucsp.br:handle/26500Biblioteca Digital de Teses e Dissertaçõeshttps://sapientia.pucsp.br/https://sapientia.pucsp.br/oai/requestbngkatende@pucsp.br||rapassi@pucsp.bropendoar:2022-07-05T12:45Biblioteca Digital de Teses e Dissertações da PUC_SP - Pontifícia Universidade Católica de São Paulo (PUC-SP)false |
dc.title.pt_BR.fl_str_mv |
Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa |
title |
Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa |
spellingShingle |
Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa Silva, Cícero Soares da CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADA Linguística de corpus Níveis de proficiência Análise multidimensional Corpus linguistics Learner corpus research Profiency levels Multidimensional analysis |
title_short |
Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa |
title_full |
Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa |
title_fullStr |
Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa |
title_full_unstemmed |
Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa |
title_sort |
Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa |
author |
Silva, Cícero Soares da |
author_facet |
Silva, Cícero Soares da |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Sardinha, Tony Berber |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/6940454346543706 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/6907060424053378 |
dc.contributor.author.fl_str_mv |
Silva, Cícero Soares da |
contributor_str_mv |
Sardinha, Tony Berber |
dc.subject.cnpq.fl_str_mv |
CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADA |
topic |
CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADA Linguística de corpus Níveis de proficiência Análise multidimensional Corpus linguistics Learner corpus research Profiency levels Multidimensional analysis |
dc.subject.por.fl_str_mv |
Linguística de corpus Níveis de proficiência Análise multidimensional |
dc.subject.eng.fl_str_mv |
Corpus linguistics Learner corpus research Profiency levels Multidimensional analysis |
description |
The goal of the present research was to identify the dimensions of variation from patterns of co-occurence of lexicogrammatical elements of the langauage used by English learners. The Multilevel Corpus of Brazilian Learners of English as a Foreign Language - COBRA-7 was used. Compiled by W.M. Dantas in 2012 (DANTAS, 2012), the COBRA-7 corpus comprises 2516 school essays of different topics, totalling 571,564 words (tokens) and 19,800 types, distributed in six proficiency levels: basic I, basic II, pre-intermediate, intermediate, high-intermediate and advanced based on the Common European Framework of Reference for Languages (CEFR). Learner Corpus Research (LCR) is aimed at investigating electronic collections of authentic textual data produced by Foreign Language or Second Language learners. Data are gathered according to explicit design criteria for a particular purpose for Foreign Language Acquisition/Foreign Language Teaching. The data are coded using objective criteria such as text source, learnel level, L1 background, among others (GRANGER, 2004, p.4). The methodology used in this research was Functional Multidimensional Analysis (MDA) (BIBER, 1988; 2009; BERBER SARDINHA, VEIRANO PINTO, 2014, 2019), a corpus-based method. MDA can reveal the underlying parameters of variation in a corpus, that is, the grammatical features co-occurring in the texts. The analysis carried out sought to reveal the functional dimensions of variation present in the COBRA corpus. Through a series of ANOVAs, it was possible to determine to what extent the dimensions are good predictors of the variation across independent variables such as “school”, “level” and “gender”. The results showed significant statistical variation exists between learning levels with respect to the dimensions. It is hoped that this study will stimulate the development of other studies using Multidimensional Analysis (MDA), mainly in the field of Learner Corpus Research (LCR) especially from na MDA perspective |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-07-04T15:50:13Z |
dc.date.available.fl_str_mv |
2022-07-04T15:50:13Z |
dc.date.issued.fl_str_mv |
2022-04-20 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
Silva, Cícero Soares da. Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa. 2022. Dissertação (Mestrado em Linguística Aplicada e Estudos da Linguagem) - Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem da Pontifícia Universidade Católica de São Paulo, São Paulo, 2022. |
dc.identifier.uri.fl_str_mv |
https://repositorio.pucsp.br/jspui/handle/handle/26500 |
identifier_str_mv |
Silva, Cícero Soares da. Análise multidimensional de um corpus multinível de aprendizes de Língua Inglesa. 2022. Dissertação (Mestrado em Linguística Aplicada e Estudos da Linguagem) - Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem da Pontifícia Universidade Católica de São Paulo, São Paulo, 2022. |
url |
https://repositorio.pucsp.br/jspui/handle/handle/26500 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica de São Paulo |
dc.publisher.program.fl_str_mv |
Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem |
dc.publisher.initials.fl_str_mv |
PUC-SP |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Faculdade de Filosofia, Comunicação, Letras e Artes |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica de São Paulo |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_SP instname:Pontifícia Universidade Católica de São Paulo (PUC-SP) instacron:PUC_SP |
instname_str |
Pontifícia Universidade Católica de São Paulo (PUC-SP) |
instacron_str |
PUC_SP |
institution |
PUC_SP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_SP |
collection |
Biblioteca Digital de Teses e Dissertações da PUC_SP |
bitstream.url.fl_str_mv |
https://repositorio.pucsp.br/xmlui/bitstream/handle/26500/1/Cicero%20Soares%20da%20Silva.pdf https://repositorio.pucsp.br/xmlui/bitstream/handle/26500/2/Cicero%20Soares%20da%20Silva.pdf.txt https://repositorio.pucsp.br/xmlui/bitstream/handle/26500/3/Cicero%20Soares%20da%20Silva.pdf.jpg |
bitstream.checksum.fl_str_mv |
22512b567e240a621312210405617090 1aa89a725da963470453e25027cc26bc df2d6dd2d96f13cbbf1e3f8c2cc40cbe |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_SP - Pontifícia Universidade Católica de São Paulo (PUC-SP) |
repository.mail.fl_str_mv |
bngkatende@pucsp.br||rapassi@pucsp.br |
_version_ |
1809277840066084864 |