Mapas auto-organizáveis para reconhecimento de plavaras e descoberta de padrões em séries temporais

Detalhes bibliográficos
Autor(a) principal: BRITO, Raphael Cândido
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPE
dARK ID: ark:/64986/001300000zz5v
Texto Completo: https://repositorio.ufpe.br/handle/123456789/32694
Resumo: Segmentar palavras - identificar palavras em fala contínua - é um passo fundamental na aquisição de linguagem e, especialmente, no desenvolvimento léxico. No entanto, a ausência de silêncios sistemáticos (pausas) entre as palavras em fala contínua torna esta tarefa mais difícil, especialmente no início do desenvolvimento humano, em que outros componentes-chave da linguagem (fonologia, morfologia, sintaxe, etc.) ainda não são totalmente conhecidos pelos bebês. Este processo de aquisição de linguagem em bebês com poucos meses de vida também pode ser descrito como um processo de descoberta de padrões recorrentes (Motif ). Três características principais na tarefa de aquisição de linguagem realizada pelas crianças são observadas e trazidas para o contexto computacional neste trabalho. Os Mapas Auto-Organizáveis (SOM), são muito relevantes para o contexto desta Dissertação, por serem modelos neurais biologicamente inspirados, utilizando aprendizagem não-supervisionada e incremental, que são capazes de produzir como resultado protótipos que podem ser considerados como padrões frequentes em uma série temporal. Todavia, o SOM possui algumas limitações que inviabilizam a realização da tarefa de reconhecer entradas com tamanhos variáveis, como por exemplo, o SOM não implementa dimensões que possuem diferentes relevâncias e a não está apto a ajustar a quantidade de protótipos no mapa ao longo do tempo. Alguns modelos baseados em SOM, apresentam características relevantes para o desenvolvimento desta Dissertação, sendo portanto apresentados no decorrer deste trabalho. Assim, esta Dissertação possui como objetivo criar um modelo, que seja capaz de aprender padrões de tamanhos variáveis e desconhecidos. Partindo de modelos inspirados em SOM, este trabalho propõe uma série de modificações para permitir que o modelo consiga se adaptar a padrões de entrada de tamanhos desconhecidos e variados, assim como os bebês aprendem. No decorrer deste trabalho, estão apresentados experimentos utilizando-se de dados reais e de dados simulados. Ao fim desta Dissertação, os resultados estão apresentados e assim, é possível mostrar que o modelo proposto apresenta a maioria das características desejadas.
id UFPE_56eefbeeba556f62026890f7967b21d2
oai_identifier_str oai:repositorio.ufpe.br:123456789/32694
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling BRITO, Raphael Cândidohttp://lattes.cnpq.br/3452426422772279http://lattes.cnpq.br/1931667959910637BASSANI, Hansenclever de França2019-09-12T18:43:48Z2019-09-12T18:43:48Z2018-07-23https://repositorio.ufpe.br/handle/123456789/32694ark:/64986/001300000zz5vSegmentar palavras - identificar palavras em fala contínua - é um passo fundamental na aquisição de linguagem e, especialmente, no desenvolvimento léxico. No entanto, a ausência de silêncios sistemáticos (pausas) entre as palavras em fala contínua torna esta tarefa mais difícil, especialmente no início do desenvolvimento humano, em que outros componentes-chave da linguagem (fonologia, morfologia, sintaxe, etc.) ainda não são totalmente conhecidos pelos bebês. Este processo de aquisição de linguagem em bebês com poucos meses de vida também pode ser descrito como um processo de descoberta de padrões recorrentes (Motif ). Três características principais na tarefa de aquisição de linguagem realizada pelas crianças são observadas e trazidas para o contexto computacional neste trabalho. Os Mapas Auto-Organizáveis (SOM), são muito relevantes para o contexto desta Dissertação, por serem modelos neurais biologicamente inspirados, utilizando aprendizagem não-supervisionada e incremental, que são capazes de produzir como resultado protótipos que podem ser considerados como padrões frequentes em uma série temporal. Todavia, o SOM possui algumas limitações que inviabilizam a realização da tarefa de reconhecer entradas com tamanhos variáveis, como por exemplo, o SOM não implementa dimensões que possuem diferentes relevâncias e a não está apto a ajustar a quantidade de protótipos no mapa ao longo do tempo. Alguns modelos baseados em SOM, apresentam características relevantes para o desenvolvimento desta Dissertação, sendo portanto apresentados no decorrer deste trabalho. Assim, esta Dissertação possui como objetivo criar um modelo, que seja capaz de aprender padrões de tamanhos variáveis e desconhecidos. Partindo de modelos inspirados em SOM, este trabalho propõe uma série de modificações para permitir que o modelo consiga se adaptar a padrões de entrada de tamanhos desconhecidos e variados, assim como os bebês aprendem. No decorrer deste trabalho, estão apresentados experimentos utilizando-se de dados reais e de dados simulados. Ao fim desta Dissertação, os resultados estão apresentados e assim, é possível mostrar que o modelo proposto apresenta a maioria das características desejadas.CAPESWord Segmentation - identify words in continuous speech - is a fundamental step in the acquisition of language and especially in lexical development. However, the deficiency of systematic silences (pauses) between words in continuous speech makes this task more difficult, especially at the beginning of human development, in which other key components of language (phonology, morphology, syntax, etc.) are not fully known to babies. This process of language acquisition in infants with a few months of life can also be described as a process of discovering recurrent patterns (Motif). The Self-Organizing Maps (SOM), are very relevant to the context of this Dissertation because they are neural models biologically inspired using non-supervised and incremental learning, that are able of producing prototypes that can be considered as frequent patterns in a time series. However, the SOM has some limitations that make it impossible to perform the task of recognizing inputs with variable sizes, for example, SOM does not implement dimensions that have different relevancies and is not able to adjust the number of prototypes on the map over time. Some models based on SOM, present characteristics relevant to the development of this Dissertation, and are therefore presented in the course of this work. Thus, this Dissertation aims to create a model that is capable of learning patterns of variable and unknown sizes. Based on SOM-inspired models, this work proposes a series of modifications to allow the model to adapt to input patterns of unknown and variable sizes. In the course of this work, experiments will be presented using real data and simulated data. At the end of this Dissertation, the results will be presented and then the final considerations. Thus, it will be possible to show that the proposed model has the desired characteristics.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessInteligência computacionalSéries temporaisMapas auto-organizáveis para reconhecimento de plavaras e descoberta de padrões em séries temporaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILDISSERTAÇÃO Raphael Cândido Brito.pdf.jpgDISSERTAÇÃO Raphael Cândido Brito.pdf.jpgGenerated Thumbnailimage/jpeg1255https://repositorio.ufpe.br/bitstream/123456789/32694/5/DISSERTA%c3%87%c3%83O%20Raphael%20C%c3%a2ndido%20Brito.pdf.jpga309366671e607aeaed9dffe93127691MD55ORIGINALDISSERTAÇÃO Raphael Cândido Brito.pdfDISSERTAÇÃO Raphael Cândido Brito.pdfapplication/pdf4553566https://repositorio.ufpe.br/bitstream/123456789/32694/1/DISSERTA%c3%87%c3%83O%20Raphael%20C%c3%a2ndido%20Brito.pdff24526a7b5bf59ace3c847bf8adff234MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/32694/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82310https://repositorio.ufpe.br/bitstream/123456789/32694/3/license.txtbd573a5ca8288eb7272482765f819534MD53TEXTDISSERTAÇÃO Raphael Cândido Brito.pdf.txtDISSERTAÇÃO Raphael Cândido Brito.pdf.txtExtracted texttext/plain110062https://repositorio.ufpe.br/bitstream/123456789/32694/4/DISSERTA%c3%87%c3%83O%20Raphael%20C%c3%a2ndido%20Brito.pdf.txtab5632fe97d01e542e05ad1135425679MD54123456789/326942019-10-25 23:23:08.073oai:repositorio.ufpe.br:123456789/32694TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLCBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWlzcXVlciBvYnJpZ2HDp8O1ZXMgZXhpZ2lkYXMgcGVsbyByZXNwZWN0aXZvIGNvbnRyYXRvIG91IGFjb3Jkby4KCkEgVUZQRSBpZGVudGlmaWNhcsOhIGNsYXJhbWVudGUgbyhzKSBub21lKHMpIGRvKHMpIGF1dG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50byBlbnRyZWd1ZSBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZG8gcHJldmlzdG8gbmEgYWzDrW5lYSBjKS4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-26T02:23:08Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Mapas auto-organizáveis para reconhecimento de plavaras e descoberta de padrões em séries temporais
title Mapas auto-organizáveis para reconhecimento de plavaras e descoberta de padrões em séries temporais
spellingShingle Mapas auto-organizáveis para reconhecimento de plavaras e descoberta de padrões em séries temporais
BRITO, Raphael Cândido
Inteligência computacional
Séries temporais
title_short Mapas auto-organizáveis para reconhecimento de plavaras e descoberta de padrões em séries temporais
title_full Mapas auto-organizáveis para reconhecimento de plavaras e descoberta de padrões em séries temporais
title_fullStr Mapas auto-organizáveis para reconhecimento de plavaras e descoberta de padrões em séries temporais
title_full_unstemmed Mapas auto-organizáveis para reconhecimento de plavaras e descoberta de padrões em séries temporais
title_sort Mapas auto-organizáveis para reconhecimento de plavaras e descoberta de padrões em séries temporais
author BRITO, Raphael Cândido
author_facet BRITO, Raphael Cândido
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3452426422772279
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/1931667959910637
dc.contributor.author.fl_str_mv BRITO, Raphael Cândido
dc.contributor.advisor1.fl_str_mv BASSANI, Hansenclever de França
contributor_str_mv BASSANI, Hansenclever de França
dc.subject.por.fl_str_mv Inteligência computacional
Séries temporais
topic Inteligência computacional
Séries temporais
description Segmentar palavras - identificar palavras em fala contínua - é um passo fundamental na aquisição de linguagem e, especialmente, no desenvolvimento léxico. No entanto, a ausência de silêncios sistemáticos (pausas) entre as palavras em fala contínua torna esta tarefa mais difícil, especialmente no início do desenvolvimento humano, em que outros componentes-chave da linguagem (fonologia, morfologia, sintaxe, etc.) ainda não são totalmente conhecidos pelos bebês. Este processo de aquisição de linguagem em bebês com poucos meses de vida também pode ser descrito como um processo de descoberta de padrões recorrentes (Motif ). Três características principais na tarefa de aquisição de linguagem realizada pelas crianças são observadas e trazidas para o contexto computacional neste trabalho. Os Mapas Auto-Organizáveis (SOM), são muito relevantes para o contexto desta Dissertação, por serem modelos neurais biologicamente inspirados, utilizando aprendizagem não-supervisionada e incremental, que são capazes de produzir como resultado protótipos que podem ser considerados como padrões frequentes em uma série temporal. Todavia, o SOM possui algumas limitações que inviabilizam a realização da tarefa de reconhecer entradas com tamanhos variáveis, como por exemplo, o SOM não implementa dimensões que possuem diferentes relevâncias e a não está apto a ajustar a quantidade de protótipos no mapa ao longo do tempo. Alguns modelos baseados em SOM, apresentam características relevantes para o desenvolvimento desta Dissertação, sendo portanto apresentados no decorrer deste trabalho. Assim, esta Dissertação possui como objetivo criar um modelo, que seja capaz de aprender padrões de tamanhos variáveis e desconhecidos. Partindo de modelos inspirados em SOM, este trabalho propõe uma série de modificações para permitir que o modelo consiga se adaptar a padrões de entrada de tamanhos desconhecidos e variados, assim como os bebês aprendem. No decorrer deste trabalho, estão apresentados experimentos utilizando-se de dados reais e de dados simulados. Ao fim desta Dissertação, os resultados estão apresentados e assim, é possível mostrar que o modelo proposto apresenta a maioria das características desejadas.
publishDate 2018
dc.date.issued.fl_str_mv 2018-07-23
dc.date.accessioned.fl_str_mv 2019-09-12T18:43:48Z
dc.date.available.fl_str_mv 2019-09-12T18:43:48Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/32694
dc.identifier.dark.fl_str_mv ark:/64986/001300000zz5v
url https://repositorio.ufpe.br/handle/123456789/32694
identifier_str_mv ark:/64986/001300000zz5v
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Computacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/32694/5/DISSERTA%c3%87%c3%83O%20Raphael%20C%c3%a2ndido%20Brito.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/32694/1/DISSERTA%c3%87%c3%83O%20Raphael%20C%c3%a2ndido%20Brito.pdf
https://repositorio.ufpe.br/bitstream/123456789/32694/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/32694/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/32694/4/DISSERTA%c3%87%c3%83O%20Raphael%20C%c3%a2ndido%20Brito.pdf.txt
bitstream.checksum.fl_str_mv a309366671e607aeaed9dffe93127691
f24526a7b5bf59ace3c847bf8adff234
e39d27027a6cc9cb039ad269a5db8e34
bd573a5ca8288eb7272482765f819534
ab5632fe97d01e542e05ad1135425679
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1815172958000250880