Elaboração de lista de palavras de acordo com regras de codificação e frequência do português brasileiro

Detalhes bibliográficos
Autor(a) principal: Rombola, Isabela Tiezi
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/214083
Resumo: A produção da escrita ocorre a partir da interação entre os processos centrais (processos cognitivo-linguísticos) e os processos periféricos (ato motor da escrita), os quais podem ser afetados pelas regras de codificação e frequência das palavras. O objetivo deste estudo foi elaborar uma lista de palavras de acordo com os critérios de codificação de frequência da Língua Portuguesa a fim de auxiliar futuras medidas de interação entre processos centrais e periféricos durante a produção da escrita. Como método, foram utilizadas palavras retiradas de um banco de dados e submetidas aos critérios: a) inclusão e exclusão de palavras do português; b) critérios relacionados às regras de codificação do Português Brasileiro; c) submissão a Juízes; d) critérios de frequência de ocorrência de palavras; e) critério do bigrama. Nos resultados, foram selecionadas 102 palavras de um total de 3.400 palavras. Em relação ao critério de codificação, 414 palavras foram classificadas, sendo 41 como natural (N), 104 dependentes de regras (A1) e 269 independentes de regras (A2). Em relação à frequência, foram selecionadas 12 palavras de alta frequência, 30 palavras de média frequência e 60 palavras de baixa frequência. Quanto à análise dos juízes, verificou-se concordância de 0,952 (Índice Kappa) entre os pares de juízes para as regras de codificação por sílabas e para a classificação das palavras. Para o estabelecimento dos pares de comparação de palavras para o Bigrama, foi necessário inserir também as palavras de média frequência, totalizando 74 pares de palavras, sendo na comparação Natural (N) – 10 pares; Codificação arbitrária (A1) – 9 pares; Codificação arbitrária (A2) – 55 pares. Após análise dos resultados, registraram-se poucas palavras de alta frequência e mais palavras de média e baixa frequência, e constatou-se a possibilidade de criação de uma lista que poderá auxiliar, posteriormente, em análises que verifiquem a interação entre o processo central e periférico. Conclui-se que foi possível elaborar uma lista, sendo de alta, média e baixa frequência e de acordo com os critérios linguísticos de codificação e frequência da Língua Portuguesa.
id UNSP_ddedb4343b8abaee693081cb535b00dc
oai_identifier_str oai:repositorio.unesp.br:11449/214083
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Elaboração de lista de palavras de acordo com regras de codificação e frequência do português brasileiroElaboration of word list according to coding rules and complete brazilian portugueseLista de palavrasPalavrasOrtografiaAprendizagemList of wordsWordsOrthographyLearningA produção da escrita ocorre a partir da interação entre os processos centrais (processos cognitivo-linguísticos) e os processos periféricos (ato motor da escrita), os quais podem ser afetados pelas regras de codificação e frequência das palavras. O objetivo deste estudo foi elaborar uma lista de palavras de acordo com os critérios de codificação de frequência da Língua Portuguesa a fim de auxiliar futuras medidas de interação entre processos centrais e periféricos durante a produção da escrita. Como método, foram utilizadas palavras retiradas de um banco de dados e submetidas aos critérios: a) inclusão e exclusão de palavras do português; b) critérios relacionados às regras de codificação do Português Brasileiro; c) submissão a Juízes; d) critérios de frequência de ocorrência de palavras; e) critério do bigrama. Nos resultados, foram selecionadas 102 palavras de um total de 3.400 palavras. Em relação ao critério de codificação, 414 palavras foram classificadas, sendo 41 como natural (N), 104 dependentes de regras (A1) e 269 independentes de regras (A2). Em relação à frequência, foram selecionadas 12 palavras de alta frequência, 30 palavras de média frequência e 60 palavras de baixa frequência. Quanto à análise dos juízes, verificou-se concordância de 0,952 (Índice Kappa) entre os pares de juízes para as regras de codificação por sílabas e para a classificação das palavras. Para o estabelecimento dos pares de comparação de palavras para o Bigrama, foi necessário inserir também as palavras de média frequência, totalizando 74 pares de palavras, sendo na comparação Natural (N) – 10 pares; Codificação arbitrária (A1) – 9 pares; Codificação arbitrária (A2) – 55 pares. Após análise dos resultados, registraram-se poucas palavras de alta frequência e mais palavras de média e baixa frequência, e constatou-se a possibilidade de criação de uma lista que poderá auxiliar, posteriormente, em análises que verifiquem a interação entre o processo central e periférico. Conclui-se que foi possível elaborar uma lista, sendo de alta, média e baixa frequência e de acordo com os critérios linguísticos de codificação e frequência da Língua Portuguesa.The production of writing occurs from the interaction between central processes (cognitive-linguistic processes) and peripheral processes (motor act of writing), which can be affected by the coding rules and frequency of words. The objective of this study was to prepare a list of words according to the frequency coding criteria of the Portuguese language in order to assist future measures of interaction between central and peripheral processes during the production of writing. As a method, words were taken from a database and subjected to the criteria were used: a) inclusion and exclusion of Portuguese words; b) Criteria related to Brazilian Portuguese coding rules; c) Submission to Judges; d) Criteria for the frequency of occurrence of words; e) Bigram criteria. As results, 102 words were selected from a total of 3,400 words. Regarding the coding criterion, 414 words were classified, 41 as natural (N), 104 dependents on context (A1), 269 competitive alternatives (A2). Regarding frequency, 12 high frequency words, 30 medium frequency words and 60 low frequency words were selected. Regarding frequency, 12 high frequency words, 30 medium frequency words and 60 low frequency words were selected. As for the analysis of the judges, there was an agreement of 0.952 (Kappa index) between the pairs of judges for the rules of trail by syllables and for the classification of words. For the establishment of the word comparison pairs for Bigram, it was also necessary to insert as medium frequency words, totalling 74 words pairs, being in the Natural comparison (N) - 10 pairs Arbitrary coding (A1) - 9 pairs; Arbitrary coding (A2) - 55 pairs. After analysing the results, it was found that there were few words of high frequency and more words of medium and low frequency, and that it was possible to create a list that could later assist in analyses that verify the interaction between the central and peripheral process. It was concluded that it was possible to draw up a list, being of high, medium and low frequency and according to the linguistic criteria of preference and frequency of the Portuguese language.Não recebi financiamentoUniversidade Estadual Paulista (Unesp)Germano, Giseli Donadon [UNESP]Universidade Estadual Paulista (Unesp)Rombola, Isabela Tiezi2021-08-19T13:38:45Z2021-08-19T13:38:45Z2021-05-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/11449/21408333004110045P7porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2024-08-13T18:08:14Zoai:repositorio.unesp.br:11449/214083Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-13T18:08:14Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Elaboração de lista de palavras de acordo com regras de codificação e frequência do português brasileiro
Elaboration of word list according to coding rules and complete brazilian portuguese
title Elaboração de lista de palavras de acordo com regras de codificação e frequência do português brasileiro
spellingShingle Elaboração de lista de palavras de acordo com regras de codificação e frequência do português brasileiro
Rombola, Isabela Tiezi
Lista de palavras
Palavras
Ortografia
Aprendizagem
List of words
Words
Orthography
Learning
title_short Elaboração de lista de palavras de acordo com regras de codificação e frequência do português brasileiro
title_full Elaboração de lista de palavras de acordo com regras de codificação e frequência do português brasileiro
title_fullStr Elaboração de lista de palavras de acordo com regras de codificação e frequência do português brasileiro
title_full_unstemmed Elaboração de lista de palavras de acordo com regras de codificação e frequência do português brasileiro
title_sort Elaboração de lista de palavras de acordo com regras de codificação e frequência do português brasileiro
author Rombola, Isabela Tiezi
author_facet Rombola, Isabela Tiezi
author_role author
dc.contributor.none.fl_str_mv Germano, Giseli Donadon [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Rombola, Isabela Tiezi
dc.subject.por.fl_str_mv Lista de palavras
Palavras
Ortografia
Aprendizagem
List of words
Words
Orthography
Learning
topic Lista de palavras
Palavras
Ortografia
Aprendizagem
List of words
Words
Orthography
Learning
description A produção da escrita ocorre a partir da interação entre os processos centrais (processos cognitivo-linguísticos) e os processos periféricos (ato motor da escrita), os quais podem ser afetados pelas regras de codificação e frequência das palavras. O objetivo deste estudo foi elaborar uma lista de palavras de acordo com os critérios de codificação de frequência da Língua Portuguesa a fim de auxiliar futuras medidas de interação entre processos centrais e periféricos durante a produção da escrita. Como método, foram utilizadas palavras retiradas de um banco de dados e submetidas aos critérios: a) inclusão e exclusão de palavras do português; b) critérios relacionados às regras de codificação do Português Brasileiro; c) submissão a Juízes; d) critérios de frequência de ocorrência de palavras; e) critério do bigrama. Nos resultados, foram selecionadas 102 palavras de um total de 3.400 palavras. Em relação ao critério de codificação, 414 palavras foram classificadas, sendo 41 como natural (N), 104 dependentes de regras (A1) e 269 independentes de regras (A2). Em relação à frequência, foram selecionadas 12 palavras de alta frequência, 30 palavras de média frequência e 60 palavras de baixa frequência. Quanto à análise dos juízes, verificou-se concordância de 0,952 (Índice Kappa) entre os pares de juízes para as regras de codificação por sílabas e para a classificação das palavras. Para o estabelecimento dos pares de comparação de palavras para o Bigrama, foi necessário inserir também as palavras de média frequência, totalizando 74 pares de palavras, sendo na comparação Natural (N) – 10 pares; Codificação arbitrária (A1) – 9 pares; Codificação arbitrária (A2) – 55 pares. Após análise dos resultados, registraram-se poucas palavras de alta frequência e mais palavras de média e baixa frequência, e constatou-se a possibilidade de criação de uma lista que poderá auxiliar, posteriormente, em análises que verifiquem a interação entre o processo central e periférico. Conclui-se que foi possível elaborar uma lista, sendo de alta, média e baixa frequência e de acordo com os critérios linguísticos de codificação e frequência da Língua Portuguesa.
publishDate 2021
dc.date.none.fl_str_mv 2021-08-19T13:38:45Z
2021-08-19T13:38:45Z
2021-05-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/214083
33004110045P7
url http://hdl.handle.net/11449/214083
identifier_str_mv 33004110045P7
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808128190503190528