O uso de n-gramas de classe semântica em um corpus de aprendiz

Detalhes bibliográficos
Autor(a) principal: Gil, Cristina Borges
Data de Publicação: 2024
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da PUC_SP
Texto Completo: https://repositorio.pucsp.br/jspui/handle/handle/42166
Resumo: The aim of this paper is to analyze the use of semantic class n-grams (BERBER SARDINHA, 2023) in the written and oral production of learners of English as a foreign language. With this research, we evaluated whether variation in the use of semantic class n-grams can be explained by the fact that the text is written or spoken, by the task assigned to the learner, by their level of proficiency, by their mother tongue, by their age or by the years studying the English language. The corpus used in this study was COREFL, whose acronym stands for Corpus of English as a Foreign Language. First, the corpus was tagged with USAS, a semantic tagger. Next, the semantic class n-grams were extracted and selected and their keyness calculated. A Factor Analysis was carried out on these variables, a standard procedure for Multidimensional Analysis, and the factors were interpreted. We observed that the task and the mode play an important role in the variation of the semantic class n-grams used by the learners
id PUC_SP-1_eb862cf64d75c493825f638b9a0e2609
oai_identifier_str oai:repositorio.pucsp.br:handle/42166
network_acronym_str PUC_SP-1
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_SP
repository_id_str
spelling Sardinha, Antonio Paulo Berberhttp://lattes.cnpq.br/6940454346543706http://lattes.cnpq.br/3761009465841468Gil, Cristina Borges2024-07-12T14:01:42Z2024-07-12T14:01:42Z2024-06-07Gil, Cristina Borges. O uso de n-gramas de classe semântica em um corpus de aprendiz. 2024. Tese (Doutorado em Linguística Aplicada e Estudos da Linguagem) - Programa de Pós-Graduação em Linguística Aplicada e Estudos da Linguagem da Pontifícia Universidade Católica de São Paulo, São Paulo, 2024.https://repositorio.pucsp.br/jspui/handle/handle/42166The aim of this paper is to analyze the use of semantic class n-grams (BERBER SARDINHA, 2023) in the written and oral production of learners of English as a foreign language. With this research, we evaluated whether variation in the use of semantic class n-grams can be explained by the fact that the text is written or spoken, by the task assigned to the learner, by their level of proficiency, by their mother tongue, by their age or by the years studying the English language. The corpus used in this study was COREFL, whose acronym stands for Corpus of English as a Foreign Language. First, the corpus was tagged with USAS, a semantic tagger. Next, the semantic class n-grams were extracted and selected and their keyness calculated. A Factor Analysis was carried out on these variables, a standard procedure for Multidimensional Analysis, and the factors were interpreted. We observed that the task and the mode play an important role in the variation of the semantic class n-grams used by the learnersO objetivo deste trabalho é analisar o uso de n-gramas de classe semântica (BERBER SARDINHA, 2023) na produção escrita e oral de aprendizes de inglês como língua estrangeira. Com esta pesquisa, avaliamos se variação no uso dos n gramas de classe semântica pode ser explicada pelo fato de o texto ser escrito ou falado, pela tarefa atribuída ao aprendiz, pelo seu nível de proficiência, pela sua língua materna, pela sua idade ou pelos anos de estudo do idioma inglês. O corpus empregado neste estudo foi o COREFL, cujo acrônimo significa Corpus de Inglês como Língua Estrangeira (Corpus of English as a Foreign Language). Primeiramente, o corpus foi etiquetado com o USAS, um etiquetador semântico. Em seguida, foram extraídos e selecionados os n-gramas de classe semântica e calculada a sua chavicidade. Com essas variáveis foi feita uma análise fatorial, procedimento padrão da Análise Multidimensional, e os fatores interpretados. Observamos que a tarefa e o modo desempenham um papel importante na variação dos n-gramas de classe semântica utilizados pelos aprendizesCoordenação de Aperfeiçoamento de Pessoal de Nível Superior – CAPESporPontifícia Universidade Católica de São PauloPrograma de Pós-Graduação em Linguística Aplicada e Estudos da LinguagemPUC-SPBrasilFaculdade de Filosofia, Comunicação, Letras e ArtesCNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADALinguística de corpusLinguística de corpus de aprendizChavicidadeAnálise multidimensionalN-gramas de classe semânticaCorpus linguisticsLearner corpus researchKeynessMultidimensional analysisSemantic class n-gramsO uso de n-gramas de classe semântica em um corpus de aprendizinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_SPinstname:Pontifícia Universidade Católica de São Paulo (PUC-SP)instacron:PUC_SPORIGINALCristina Borges Gil.pdfCristina Borges Gil.pdfapplication/pdf3024866https://repositorio.pucsp.br/xmlui/bitstream/handle/42166/1/Cristina%20Borges%20Gil.pdf55a6e1ab49be351bc6019478d5e9420cMD51TEXTCristina Borges Gil.pdf.txtCristina Borges Gil.pdf.txtExtracted texttext/plain238077https://repositorio.pucsp.br/xmlui/bitstream/handle/42166/2/Cristina%20Borges%20Gil.pdf.txt4fe2327a9168c38d0048c9cf72f5ff1dMD52THUMBNAILCristina Borges Gil.pdf.jpgCristina Borges Gil.pdf.jpgGenerated Thumbnailimage/jpeg1210https://repositorio.pucsp.br/xmlui/bitstream/handle/42166/3/Cristina%20Borges%20Gil.pdf.jpg53f59d0f7024e98c940313b2c0191625MD53handle/421662024-08-03 01:02:11.549oai:repositorio.pucsp.br:handle/42166Biblioteca Digital de Teses e Dissertaçõeshttps://sapientia.pucsp.br/https://sapientia.pucsp.br/oai/requestbngkatende@pucsp.br||rapassi@pucsp.bropendoar:2024-08-03T04:02:11Biblioteca Digital de Teses e Dissertações da PUC_SP - Pontifícia Universidade Católica de São Paulo (PUC-SP)false
dc.title.pt_BR.fl_str_mv O uso de n-gramas de classe semântica em um corpus de aprendiz
title O uso de n-gramas de classe semântica em um corpus de aprendiz
spellingShingle O uso de n-gramas de classe semântica em um corpus de aprendiz
Gil, Cristina Borges
CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADA
Linguística de corpus
Linguística de corpus de aprendiz
Chavicidade
Análise multidimensional
N-gramas de classe semântica
Corpus linguistics
Learner corpus research
Keyness
Multidimensional analysis
Semantic class n-grams
title_short O uso de n-gramas de classe semântica em um corpus de aprendiz
title_full O uso de n-gramas de classe semântica em um corpus de aprendiz
title_fullStr O uso de n-gramas de classe semântica em um corpus de aprendiz
title_full_unstemmed O uso de n-gramas de classe semântica em um corpus de aprendiz
title_sort O uso de n-gramas de classe semântica em um corpus de aprendiz
author Gil, Cristina Borges
author_facet Gil, Cristina Borges
author_role author
dc.contributor.advisor1.fl_str_mv Sardinha, Antonio Paulo Berber
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6940454346543706
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/3761009465841468
dc.contributor.author.fl_str_mv Gil, Cristina Borges
contributor_str_mv Sardinha, Antonio Paulo Berber
dc.subject.cnpq.fl_str_mv CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADA
topic CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADA
Linguística de corpus
Linguística de corpus de aprendiz
Chavicidade
Análise multidimensional
N-gramas de classe semântica
Corpus linguistics
Learner corpus research
Keyness
Multidimensional analysis
Semantic class n-grams
dc.subject.por.fl_str_mv Linguística de corpus
Linguística de corpus de aprendiz
Chavicidade
Análise multidimensional
N-gramas de classe semântica
dc.subject.eng.fl_str_mv Corpus linguistics
Learner corpus research
Keyness
Multidimensional analysis
Semantic class n-grams
description The aim of this paper is to analyze the use of semantic class n-grams (BERBER SARDINHA, 2023) in the written and oral production of learners of English as a foreign language. With this research, we evaluated whether variation in the use of semantic class n-grams can be explained by the fact that the text is written or spoken, by the task assigned to the learner, by their level of proficiency, by their mother tongue, by their age or by the years studying the English language. The corpus used in this study was COREFL, whose acronym stands for Corpus of English as a Foreign Language. First, the corpus was tagged with USAS, a semantic tagger. Next, the semantic class n-grams were extracted and selected and their keyness calculated. A Factor Analysis was carried out on these variables, a standard procedure for Multidimensional Analysis, and the factors were interpreted. We observed that the task and the mode play an important role in the variation of the semantic class n-grams used by the learners
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-07-12T14:01:42Z
dc.date.available.fl_str_mv 2024-07-12T14:01:42Z
dc.date.issued.fl_str_mv 2024-06-07
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv Gil, Cristina Borges. O uso de n-gramas de classe semântica em um corpus de aprendiz. 2024. Tese (Doutorado em Linguística Aplicada e Estudos da Linguagem) - Programa de Pós-Graduação em Linguística Aplicada e Estudos da Linguagem da Pontifícia Universidade Católica de São Paulo, São Paulo, 2024.
dc.identifier.uri.fl_str_mv https://repositorio.pucsp.br/jspui/handle/handle/42166
identifier_str_mv Gil, Cristina Borges. O uso de n-gramas de classe semântica em um corpus de aprendiz. 2024. Tese (Doutorado em Linguística Aplicada e Estudos da Linguagem) - Programa de Pós-Graduação em Linguística Aplicada e Estudos da Linguagem da Pontifícia Universidade Católica de São Paulo, São Paulo, 2024.
url https://repositorio.pucsp.br/jspui/handle/handle/42166
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica de São Paulo
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Linguística Aplicada e Estudos da Linguagem
dc.publisher.initials.fl_str_mv PUC-SP
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Faculdade de Filosofia, Comunicação, Letras e Artes
publisher.none.fl_str_mv Pontifícia Universidade Católica de São Paulo
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_SP
instname:Pontifícia Universidade Católica de São Paulo (PUC-SP)
instacron:PUC_SP
instname_str Pontifícia Universidade Católica de São Paulo (PUC-SP)
instacron_str PUC_SP
institution PUC_SP
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_SP
collection Biblioteca Digital de Teses e Dissertações da PUC_SP
bitstream.url.fl_str_mv https://repositorio.pucsp.br/xmlui/bitstream/handle/42166/1/Cristina%20Borges%20Gil.pdf
https://repositorio.pucsp.br/xmlui/bitstream/handle/42166/2/Cristina%20Borges%20Gil.pdf.txt
https://repositorio.pucsp.br/xmlui/bitstream/handle/42166/3/Cristina%20Borges%20Gil.pdf.jpg
bitstream.checksum.fl_str_mv 55a6e1ab49be351bc6019478d5e9420c
4fe2327a9168c38d0048c9cf72f5ff1d
53f59d0f7024e98c940313b2c0191625
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_SP - Pontifícia Universidade Católica de São Paulo (PUC-SP)
repository.mail.fl_str_mv bngkatende@pucsp.br||rapassi@pucsp.br
_version_ 1809277886214963200