Geração de Pseudopalavras para Avaliação Linguística
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10316/86630 |
Resumo: | Dissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia |
id |
RCAP_95e9a10eaac303c63db7317d9f3abd7e |
---|---|
oai_identifier_str |
oai:estudogeral.uc.pt:10316/86630 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Geração de Pseudopalavras para Avaliação LinguísticaPseudo-word Generator for Linguistic EvaluationPseudopalavrasBase de dadosGerador de pseudopalavrasSílabasPortuguês EuropeuPseudowordsDatabasePseudowords generatorSyllablesEuropean PortugueseDissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e TecnologiaA capacidade de leitura é um aspeto importante durante a aprendizagem da língua e é adquirida, geralmente, em crianças com idade escolar. A avaliação do desempenho da leitura pode ser aferida através de diferentes formas, tanto na leitura de palavras como na leitura de pseudopalavras. Pseudopalavras são palavras que não existem no léxico, mas que são pronunciáveis, uma vez que seguem as regras fonotáticas de uma determinada língua. A leitura de pseudopalavras permite avaliar se as regras de conversão de texto para fala (consciência fonológica) estão bem assimiladas, já que o leitor não tem familiaridade com as pseudopalavras que está a ler. Assim é possível avaliar o desempenho na leitura, de modo a, por exemplo, prevenir futuros défices fonológicos. Assim, é importante a criação de um sistema que seja capaz de gerar pseudopalavras, segundo determinados critérios e especificações da língua, porque até ao momento não existe nenhum gerador de pseudopalavras, em Portuguêss Europeu. Este trabalho aborda o problema da geração de pseudopalavras, propondo algoritmos para a sua concretização. Os algoritmos são baseados em concatenação de sílabas, com a garantia de que todos os pares de sílabas, que formarão as pseudopalavras, são encontros silábicos encontrados no léxico. A frequência de ocorrência desses pares de sílabas, como ínicio, meio e fim de palavra, será crucial para a formação de pseudopalavras, pois os pares de sílabas tenderão a aparecer com mais frequência, consoante o seu número de ocorrência nas diferentes posições das pseudopalavras. Este projeto também pressupõe a criação de um corpus lexical e um software fácil de utilizar e capaz de mostrar as pseudopalavras geradas e medidas adicionais, relacionadas com proximidade lexical. Os algoritmos e o consequente interface com o utilizador foram desenvolvidos em MATLAB.Reading ability plays an important role during the process of learning any language and is acquired in children, generally, in elementary school. The evaluation of reading performance can be done by reading words or pseudowords.Pseudowords are words that respect the phonotactic restrictions of a language and can be read, but don’t exist in lexicon.When reading pseudowords it’s possible to evaluate if the rules of conversion from text to speech (phonological awareness) are well assimilated, since the reader doesn’t have any kind of familiarity with it. Thus it is possible to evaluate the reading performance in order to, for example, prevent future phonological deficits. So it is important to have a system that can be able to generate pseudowords, according to certain criteria and specifications, because there is none generator, in European Portuguese, at the moment.This thesis describes the process of generating pseudowords and proposes algorithms for this task. The algorithms are based on concatenation of syllables, with the condition that all pairs of syllables, that will form the pseudowords, were found in the lexicon. The frequency of occurrence of the pairs of syllables, in the beginning, middle and end of words from lexicon, will have an important role in the formation of pseudowords. It means that more frequent pairs of syllables will tend to appear, more frequently, in the different positions of the pseudowords. This project also presupposes the creation of a lexical corpora and an easy-to-use software capable of showing in a table the generated pseudowords and other metrics related to lexical proximity. The algorithms and the user interface were developed in MATLAB.2018-02-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/86630http://hdl.handle.net/10316/86630TID:202220583porVenâncio, Rui Pedro de Azevedoinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2020-02-06T10:56:34Zoai:estudogeral.uc.pt:10316/86630Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:07:44.343907Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Geração de Pseudopalavras para Avaliação Linguística Pseudo-word Generator for Linguistic Evaluation |
title |
Geração de Pseudopalavras para Avaliação Linguística |
spellingShingle |
Geração de Pseudopalavras para Avaliação Linguística Venâncio, Rui Pedro de Azevedo Pseudopalavras Base de dados Gerador de pseudopalavras Sílabas Português Europeu Pseudowords Database Pseudowords generator Syllables European Portuguese |
title_short |
Geração de Pseudopalavras para Avaliação Linguística |
title_full |
Geração de Pseudopalavras para Avaliação Linguística |
title_fullStr |
Geração de Pseudopalavras para Avaliação Linguística |
title_full_unstemmed |
Geração de Pseudopalavras para Avaliação Linguística |
title_sort |
Geração de Pseudopalavras para Avaliação Linguística |
author |
Venâncio, Rui Pedro de Azevedo |
author_facet |
Venâncio, Rui Pedro de Azevedo |
author_role |
author |
dc.contributor.author.fl_str_mv |
Venâncio, Rui Pedro de Azevedo |
dc.subject.por.fl_str_mv |
Pseudopalavras Base de dados Gerador de pseudopalavras Sílabas Português Europeu Pseudowords Database Pseudowords generator Syllables European Portuguese |
topic |
Pseudopalavras Base de dados Gerador de pseudopalavras Sílabas Português Europeu Pseudowords Database Pseudowords generator Syllables European Portuguese |
description |
Dissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-02-28 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10316/86630 http://hdl.handle.net/10316/86630 TID:202220583 |
url |
http://hdl.handle.net/10316/86630 |
identifier_str_mv |
TID:202220583 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133968448094208 |