Compansion system for a pictogram-based AAC application in Catalan
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.1/4528 |
Resumo: | Dissertação de mest., Processamento da Linguagem Natural e Tecnologia da Linguagem Humana, Faculdade de Ciências Humanas e Sociais, Univ. do Algarve, 2012 |
id |
RCAP_2d5c01eca04d9880f364f5e03e40ea0b |
---|---|
oai_identifier_str |
oai:sapientia.ualg.pt:10400.1/4528 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Compansion system for a pictogram-based AAC application in CatalanComunicaçãoLinguagem computacionalProcessamento da linguagemLinguagem naturalLíngua catalãDissertação de mest., Processamento da Linguagem Natural e Tecnologia da Linguagem Humana, Faculdade de Ciências Humanas e Sociais, Univ. do Algarve, 2012In this project we have built a compansion (compression-expansion) system that expands telegraphic language (utterances with only uninflected content words) into natural language sentences in Catalan, in the context of an Augmentative and Alternative Communication (AAC) software. The system has been designed to improve the communication of AAC users, who usually have severe speech or motor impairments and use pictogram-based communication methods in their daily life. However, it can also be seen as a potential tool to support Catalan literacy for these users and to help in the field of language rehabilitation. The compansion system has two main components: a syntactic-semantic dependency parser and a generator that constructs the final sentence. A simile of an input system has been built to allow the use of an existing AAC vocabulary (CACE). This vocabulary has been enriched by syntactic and semantic information in view of the parser and the generator. From the user’s input, the parser extracts sentence patterns, based on a constraint grammar and a controlled vocabulary, taking into account input words and their modifiers. It then assigns the remaining words to the structural slots of those patterns, which correspond to the semantic roles of the predicative elements and of other words’ complements. Then, the generator builds the natural language sentence, from the resulting parse tree, reordering and inflecting words and adding articles, prepositions and other necessary particles. The system has been evaluated and results are most promising: 98,7% of the sentences generated by the compansion system were considered correct by three independent annotators.Este projecto consiste na construção de um sistema de compressão-expansão (em inglês: compansion) que expande frases em linguagem telegráfica, isto é, frases formadas apenas por palavras plenamente significativas e sem informação de flexão, em frases em língua natural (Catalão), no contexto de uma aplicação em Comunicação Suplementar e Alternativa (CSA). O sistema foi projectado para melhorar a comunicação dos utilizadores de CSA, que normalmente apresentam graves perturbações motoras ou de fala e que usam métodos comunicativos baseados em pictogramas para as suas actividades quotidianas. Contudo, o sistema pode igualmente ser considerado como uma potencial ferramenta para apoiar a literacia em Catalão destes utilizadores e para ajudar na reabilitação da linguagem. O sistema de compansion tem duas componentes principais: um analisador sintáctico-semântico (parser) e um gerador, que constrói a frase de saída. Um simile de sistema de input foi construído de forma a permitir a utilização de um vocabulário de CSA já existente (o CACE). Este vocabulário foi enriquecido com informação sintáctica e semântica para poder servir tanto ao módulo de análise como de geração. A partir do input, o parser extrai os padrões frásicos, baseados numa gramática e vocabulários controlados, e com base na informação associada às palavras e seus modificadores. Em seguida, atribui as palavras remanescentes às diversas posições estruturais desses padrões frásicos, que correspondem aos papeis semânticos associados aos diversos elementos predicativos e aos complementos de outras palavras. Em seguida, o sistema gera a frase de saída a partir da árvore de análise resultante, reordenando e flexionando as diversas palavras, acrescentando artigos, preposições e outros elementos necessários a uma expressão adequada em língua natural. O sistema foi avaliado e os resultados são muito promissores: 98,7% das frases geradas pelo sistema foram consideradas correctas por três anotadores independentesBaptista, JorgeBlanco, XavierSapientiaPahisa-Solé, Joan2014-06-26T17:08:39Z20122012-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.1/4528enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-24T10:15:51Zoai:sapientia.ualg.pt:10400.1/4528Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:57:54.848478Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Compansion system for a pictogram-based AAC application in Catalan |
title |
Compansion system for a pictogram-based AAC application in Catalan |
spellingShingle |
Compansion system for a pictogram-based AAC application in Catalan Pahisa-Solé, Joan Comunicação Linguagem computacional Processamento da linguagem Linguagem natural Língua catalã |
title_short |
Compansion system for a pictogram-based AAC application in Catalan |
title_full |
Compansion system for a pictogram-based AAC application in Catalan |
title_fullStr |
Compansion system for a pictogram-based AAC application in Catalan |
title_full_unstemmed |
Compansion system for a pictogram-based AAC application in Catalan |
title_sort |
Compansion system for a pictogram-based AAC application in Catalan |
author |
Pahisa-Solé, Joan |
author_facet |
Pahisa-Solé, Joan |
author_role |
author |
dc.contributor.none.fl_str_mv |
Baptista, Jorge Blanco, Xavier Sapientia |
dc.contributor.author.fl_str_mv |
Pahisa-Solé, Joan |
dc.subject.por.fl_str_mv |
Comunicação Linguagem computacional Processamento da linguagem Linguagem natural Língua catalã |
topic |
Comunicação Linguagem computacional Processamento da linguagem Linguagem natural Língua catalã |
description |
Dissertação de mest., Processamento da Linguagem Natural e Tecnologia da Linguagem Humana, Faculdade de Ciências Humanas e Sociais, Univ. do Algarve, 2012 |
publishDate |
2012 |
dc.date.none.fl_str_mv |
2012 2012-01-01T00:00:00Z 2014-06-26T17:08:39Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.1/4528 |
url |
http://hdl.handle.net/10400.1/4528 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133193530507264 |