O uso de n-gramas de classe semântica em um corpus de aprendiz
Autor(a) principal: | |
---|---|
Data de Publicação: | 2024 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da PUC_SP |
Texto Completo: | https://repositorio.pucsp.br/jspui/handle/handle/42166 |
Resumo: | The aim of this paper is to analyze the use of semantic class n-grams (BERBER SARDINHA, 2023) in the written and oral production of learners of English as a foreign language. With this research, we evaluated whether variation in the use of semantic class n-grams can be explained by the fact that the text is written or spoken, by the task assigned to the learner, by their level of proficiency, by their mother tongue, by their age or by the years studying the English language. The corpus used in this study was COREFL, whose acronym stands for Corpus of English as a Foreign Language. First, the corpus was tagged with USAS, a semantic tagger. Next, the semantic class n-grams were extracted and selected and their keyness calculated. A Factor Analysis was carried out on these variables, a standard procedure for Multidimensional Analysis, and the factors were interpreted. We observed that the task and the mode play an important role in the variation of the semantic class n-grams used by the learners |
id |
PUC_SP-1_eb862cf64d75c493825f638b9a0e2609 |
---|---|
oai_identifier_str |
oai:repositorio.pucsp.br:handle/42166 |
network_acronym_str |
PUC_SP-1 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_SP |
repository_id_str |
|
spelling |
Sardinha, Antonio Paulo Berberhttp://lattes.cnpq.br/6940454346543706http://lattes.cnpq.br/3761009465841468Gil, Cristina Borges2024-07-12T14:01:42Z2024-07-12T14:01:42Z2024-06-07Gil, Cristina Borges. O uso de n-gramas de classe semântica em um corpus de aprendiz. 2024. Tese (Doutorado em Linguística Aplicada e Estudos da Linguagem) - Programa de Pós-Graduação em Linguística Aplicada e Estudos da Linguagem da Pontifícia Universidade Católica de São Paulo, São Paulo, 2024.https://repositorio.pucsp.br/jspui/handle/handle/42166The aim of this paper is to analyze the use of semantic class n-grams (BERBER SARDINHA, 2023) in the written and oral production of learners of English as a foreign language. With this research, we evaluated whether variation in the use of semantic class n-grams can be explained by the fact that the text is written or spoken, by the task assigned to the learner, by their level of proficiency, by their mother tongue, by their age or by the years studying the English language. The corpus used in this study was COREFL, whose acronym stands for Corpus of English as a Foreign Language. First, the corpus was tagged with USAS, a semantic tagger. Next, the semantic class n-grams were extracted and selected and their keyness calculated. A Factor Analysis was carried out on these variables, a standard procedure for Multidimensional Analysis, and the factors were interpreted. We observed that the task and the mode play an important role in the variation of the semantic class n-grams used by the learnersO objetivo deste trabalho é analisar o uso de n-gramas de classe semântica (BERBER SARDINHA, 2023) na produção escrita e oral de aprendizes de inglês como língua estrangeira. Com esta pesquisa, avaliamos se variação no uso dos n gramas de classe semântica pode ser explicada pelo fato de o texto ser escrito ou falado, pela tarefa atribuída ao aprendiz, pelo seu nível de proficiência, pela sua língua materna, pela sua idade ou pelos anos de estudo do idioma inglês. O corpus empregado neste estudo foi o COREFL, cujo acrônimo significa Corpus de Inglês como Língua Estrangeira (Corpus of English as a Foreign Language). Primeiramente, o corpus foi etiquetado com o USAS, um etiquetador semântico. Em seguida, foram extraídos e selecionados os n-gramas de classe semântica e calculada a sua chavicidade. Com essas variáveis foi feita uma análise fatorial, procedimento padrão da Análise Multidimensional, e os fatores interpretados. Observamos que a tarefa e o modo desempenham um papel importante na variação dos n-gramas de classe semântica utilizados pelos aprendizesCoordenação de Aperfeiçoamento de Pessoal de Nível Superior – CAPESporPontifícia Universidade Católica de São PauloPrograma de Pós-Graduação em Linguística Aplicada e Estudos da LinguagemPUC-SPBrasilFaculdade de Filosofia, Comunicação, Letras e ArtesCNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADALinguística de corpusLinguística de corpus de aprendizChavicidadeAnálise multidimensionalN-gramas de classe semânticaCorpus linguisticsLearner corpus researchKeynessMultidimensional analysisSemantic class n-gramsO uso de n-gramas de classe semântica em um corpus de aprendizinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_SPinstname:Pontifícia Universidade Católica de São Paulo (PUC-SP)instacron:PUC_SPORIGINALCristina Borges Gil.pdfCristina Borges Gil.pdfapplication/pdf3024866https://repositorio.pucsp.br/xmlui/bitstream/handle/42166/1/Cristina%20Borges%20Gil.pdf55a6e1ab49be351bc6019478d5e9420cMD51TEXTCristina Borges Gil.pdf.txtCristina Borges Gil.pdf.txtExtracted texttext/plain238077https://repositorio.pucsp.br/xmlui/bitstream/handle/42166/2/Cristina%20Borges%20Gil.pdf.txt4fe2327a9168c38d0048c9cf72f5ff1dMD52THUMBNAILCristina Borges Gil.pdf.jpgCristina Borges Gil.pdf.jpgGenerated Thumbnailimage/jpeg1210https://repositorio.pucsp.br/xmlui/bitstream/handle/42166/3/Cristina%20Borges%20Gil.pdf.jpg53f59d0f7024e98c940313b2c0191625MD53handle/421662024-08-03 01:02:11.549oai:repositorio.pucsp.br:handle/42166Biblioteca Digital de Teses e Dissertaçõeshttps://sapientia.pucsp.br/https://sapientia.pucsp.br/oai/requestbngkatende@pucsp.br||rapassi@pucsp.bropendoar:2024-08-03T04:02:11Biblioteca Digital de Teses e Dissertações da PUC_SP - Pontifícia Universidade Católica de São Paulo (PUC-SP)false |
dc.title.pt_BR.fl_str_mv |
O uso de n-gramas de classe semântica em um corpus de aprendiz |
title |
O uso de n-gramas de classe semântica em um corpus de aprendiz |
spellingShingle |
O uso de n-gramas de classe semântica em um corpus de aprendiz Gil, Cristina Borges CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADA Linguística de corpus Linguística de corpus de aprendiz Chavicidade Análise multidimensional N-gramas de classe semântica Corpus linguistics Learner corpus research Keyness Multidimensional analysis Semantic class n-grams |
title_short |
O uso de n-gramas de classe semântica em um corpus de aprendiz |
title_full |
O uso de n-gramas de classe semântica em um corpus de aprendiz |
title_fullStr |
O uso de n-gramas de classe semântica em um corpus de aprendiz |
title_full_unstemmed |
O uso de n-gramas de classe semântica em um corpus de aprendiz |
title_sort |
O uso de n-gramas de classe semântica em um corpus de aprendiz |
author |
Gil, Cristina Borges |
author_facet |
Gil, Cristina Borges |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Sardinha, Antonio Paulo Berber |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/6940454346543706 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/3761009465841468 |
dc.contributor.author.fl_str_mv |
Gil, Cristina Borges |
contributor_str_mv |
Sardinha, Antonio Paulo Berber |
dc.subject.cnpq.fl_str_mv |
CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADA |
topic |
CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADA Linguística de corpus Linguística de corpus de aprendiz Chavicidade Análise multidimensional N-gramas de classe semântica Corpus linguistics Learner corpus research Keyness Multidimensional analysis Semantic class n-grams |
dc.subject.por.fl_str_mv |
Linguística de corpus Linguística de corpus de aprendiz Chavicidade Análise multidimensional N-gramas de classe semântica |
dc.subject.eng.fl_str_mv |
Corpus linguistics Learner corpus research Keyness Multidimensional analysis Semantic class n-grams |
description |
The aim of this paper is to analyze the use of semantic class n-grams (BERBER SARDINHA, 2023) in the written and oral production of learners of English as a foreign language. With this research, we evaluated whether variation in the use of semantic class n-grams can be explained by the fact that the text is written or spoken, by the task assigned to the learner, by their level of proficiency, by their mother tongue, by their age or by the years studying the English language. The corpus used in this study was COREFL, whose acronym stands for Corpus of English as a Foreign Language. First, the corpus was tagged with USAS, a semantic tagger. Next, the semantic class n-grams were extracted and selected and their keyness calculated. A Factor Analysis was carried out on these variables, a standard procedure for Multidimensional Analysis, and the factors were interpreted. We observed that the task and the mode play an important role in the variation of the semantic class n-grams used by the learners |
publishDate |
2024 |
dc.date.accessioned.fl_str_mv |
2024-07-12T14:01:42Z |
dc.date.available.fl_str_mv |
2024-07-12T14:01:42Z |
dc.date.issued.fl_str_mv |
2024-06-07 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
Gil, Cristina Borges. O uso de n-gramas de classe semântica em um corpus de aprendiz. 2024. Tese (Doutorado em Linguística Aplicada e Estudos da Linguagem) - Programa de Pós-Graduação em Linguística Aplicada e Estudos da Linguagem da Pontifícia Universidade Católica de São Paulo, São Paulo, 2024. |
dc.identifier.uri.fl_str_mv |
https://repositorio.pucsp.br/jspui/handle/handle/42166 |
identifier_str_mv |
Gil, Cristina Borges. O uso de n-gramas de classe semântica em um corpus de aprendiz. 2024. Tese (Doutorado em Linguística Aplicada e Estudos da Linguagem) - Programa de Pós-Graduação em Linguística Aplicada e Estudos da Linguagem da Pontifícia Universidade Católica de São Paulo, São Paulo, 2024. |
url |
https://repositorio.pucsp.br/jspui/handle/handle/42166 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica de São Paulo |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Linguística Aplicada e Estudos da Linguagem |
dc.publisher.initials.fl_str_mv |
PUC-SP |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Faculdade de Filosofia, Comunicação, Letras e Artes |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica de São Paulo |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_SP instname:Pontifícia Universidade Católica de São Paulo (PUC-SP) instacron:PUC_SP |
instname_str |
Pontifícia Universidade Católica de São Paulo (PUC-SP) |
instacron_str |
PUC_SP |
institution |
PUC_SP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_SP |
collection |
Biblioteca Digital de Teses e Dissertações da PUC_SP |
bitstream.url.fl_str_mv |
https://repositorio.pucsp.br/xmlui/bitstream/handle/42166/1/Cristina%20Borges%20Gil.pdf https://repositorio.pucsp.br/xmlui/bitstream/handle/42166/2/Cristina%20Borges%20Gil.pdf.txt https://repositorio.pucsp.br/xmlui/bitstream/handle/42166/3/Cristina%20Borges%20Gil.pdf.jpg |
bitstream.checksum.fl_str_mv |
55a6e1ab49be351bc6019478d5e9420c 4fe2327a9168c38d0048c9cf72f5ff1d 53f59d0f7024e98c940313b2c0191625 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_SP - Pontifícia Universidade Católica de São Paulo (PUC-SP) |
repository.mail.fl_str_mv |
bngkatende@pucsp.br||rapassi@pucsp.br |
_version_ |
1809277886214963200 |