Aprendizado de máquina multivisão aplicado à análise de correferência em um sistema de aprendizado sem fim

Detalhes bibliográficos
Autor(a) principal: Mansano, Alex Fernandes
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/10227
Resumo: NELL (Never-Ending Language Learning) is the first never-ending learning system presented in the litera ture. It has been modeled to create a knowledge base in an autonomous way, reading the web 24 hours per day, seven days per week. In this paradigm, all knowledge acquired is used to improve the learning performance. In this paradigm we face cases where the same object can be named in several ways. These cases as called as correferents, and has great importance for the never-ending learning process, as long as the knowledge about certain entity in a textual base may be distributed among its denominations.As such, the co-reference analysis has a crucial role in NELL’s learning paradigm. In this paper, we approach the combination of different feature vectors as an optimization task performed by meta-heuristic techniques and artificial neural networks, in order to maximize the separability of samples in the feature space, being the optimization process guided by the accuracy of Optimum Path Forest and variations of Siamese Networks in a validation set. The experiments showed the proposed methodology can obtain much better results when compared to the performance of individual feature extraction algorithms.
id SCAR_3fd4e66756928ebcd132b8c318767eab
oai_identifier_str oai:repositorio.ufscar.br:ufscar/10227
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Mansano, Alex FernandesHruschka Júnior, Estevam Rafaelhttp://lattes.cnpq.br/2097340857065853http://lattes.cnpq.br/32150126064840312018-06-28T19:49:09Z2018-06-28T19:49:09Z2018-03-01MANSANO, Alex Fernandes. Aprendizado de máquina multivisão aplicado à análise de correferência em um sistema de aprendizado sem fim. 2018. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2018. Disponível em: https://repositorio.ufscar.br/handle/ufscar/10227.https://repositorio.ufscar.br/handle/ufscar/10227NELL (Never-Ending Language Learning) is the first never-ending learning system presented in the litera ture. It has been modeled to create a knowledge base in an autonomous way, reading the web 24 hours per day, seven days per week. In this paradigm, all knowledge acquired is used to improve the learning performance. In this paradigm we face cases where the same object can be named in several ways. These cases as called as correferents, and has great importance for the never-ending learning process, as long as the knowledge about certain entity in a textual base may be distributed among its denominations.As such, the co-reference analysis has a crucial role in NELL’s learning paradigm. In this paper, we approach the combination of different feature vectors as an optimization task performed by meta-heuristic techniques and artificial neural networks, in order to maximize the separability of samples in the feature space, being the optimization process guided by the accuracy of Optimum Path Forest and variations of Siamese Networks in a validation set. The experiments showed the proposed methodology can obtain much better results when compared to the performance of individual feature extraction algorithms.A NELL (Nerver-Ending Language Learning) é o primeiro sistema de aprendizado sem fim presente na literatura. Este sistema foi modelado para criar uma base de conhecimento autônoma, lendo a Web 24 horas por dia, sete dias por semana. Neste paradigma, todo conhecimento adquirido é utilizado para melhorar sua performance. Diante deste paradigma nos deparamos em casos onde um mesmo objeto pode ser nomeado de diversas maneiras. Estes casos são denominados como correferentes e têm grande importância para o aprendizado sem fim, pois o conhecimento sobre certa entidade em uma base textual pode estar distribuído entre suas diversas denominações. Desta forma, a análise de correferência tem um papel crucial no paradigma de aprendizado da NELL. Neste projeto, nós abordamos técnicas de aprendizado multivisão, combinando diferentes vetores de características como uma tarefa de otimização, executado por técnicas meta-heurísticas e redes neurais artificiais, a fim de maximizar a separabilidade das amostras no espaço amostral, sendo que o processo de otimização é guiado pela acurácia dos classificadores Floresta de Caminhos Ótimos e variantes de Redes Neurais Siamesas em um conjunto de validação. Os experimentos mostraram que a metodologia proposta pode obter resultados melhores quando comparado à performance de extração de características individuais.Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)porUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarMeta-heurísticaCombinação de descritoresRedes neuraisNever-ending language learningMeta-heuristicsDescriptor combinationNeural networksCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAOCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOAprendizado de máquina multivisão aplicado à análise de correferência em um sistema de aprendizado sem fimMultivision machine learning applied to correference analysis in a never ending learning systeminfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisOnlineinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARLICENSElicense.txtlicense.txttext/plain; charset=utf-81957https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/10227/3/license.txtae0398b6f8b235e40ad82cba6c50031dMD53ORIGINALMANSANO_Alex_2018.pdfMANSANO_Alex_2018.pdfapplication/pdf1558847https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/10227/4/MANSANO_Alex_2018.pdf186842d66d21321a39ef6cd118ed99b3MD54TEXTMANSANO_Alex_2018.pdf.txtMANSANO_Alex_2018.pdf.txtExtracted texttext/plain127087https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/10227/5/MANSANO_Alex_2018.pdf.txt6722c91ec06cd643974055d8b9eb51bdMD55THUMBNAILMANSANO_Alex_2018.pdf.jpgMANSANO_Alex_2018.pdf.jpgIM Thumbnailimage/jpeg8456https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/10227/6/MANSANO_Alex_2018.pdf.jpg5f862739bfa2b220c12961cc4f05a7f2MD56ufscar/102272019-09-11 03:17:21.471oai:repositorio.ufscar.br:ufscar/10227TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlCkZlZGVyYWwgZGUgU8OjbyBDYXJsb3MgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdQpkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlCmVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcyBmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZTQ2FyIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28KcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGU0NhciBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgYSBzdWEgdGVzZSBvdQpkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcwpuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldQpjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6oKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFVGU0NhcgpvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUKaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRlNDYXIsClZPQ8OKIERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJU8ODTyBDT01PClRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVRlNDYXIgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSAocykgb3UgbyhzKSBub21lKHMpIGRvKHMpCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzCmNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222019-09-11T03:17:21Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Aprendizado de máquina multivisão aplicado à análise de correferência em um sistema de aprendizado sem fim
dc.title.alternative.eng.fl_str_mv Multivision machine learning applied to correference analysis in a never ending learning system
title Aprendizado de máquina multivisão aplicado à análise de correferência em um sistema de aprendizado sem fim
spellingShingle Aprendizado de máquina multivisão aplicado à análise de correferência em um sistema de aprendizado sem fim
Mansano, Alex Fernandes
Meta-heurística
Combinação de descritores
Redes neurais
Never-ending language learning
Meta-heuristics
Descriptor combination
Neural networks
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short Aprendizado de máquina multivisão aplicado à análise de correferência em um sistema de aprendizado sem fim
title_full Aprendizado de máquina multivisão aplicado à análise de correferência em um sistema de aprendizado sem fim
title_fullStr Aprendizado de máquina multivisão aplicado à análise de correferência em um sistema de aprendizado sem fim
title_full_unstemmed Aprendizado de máquina multivisão aplicado à análise de correferência em um sistema de aprendizado sem fim
title_sort Aprendizado de máquina multivisão aplicado à análise de correferência em um sistema de aprendizado sem fim
author Mansano, Alex Fernandes
author_facet Mansano, Alex Fernandes
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/3215012606484031
dc.contributor.author.fl_str_mv Mansano, Alex Fernandes
dc.contributor.advisor1.fl_str_mv Hruschka Júnior, Estevam Rafael
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/2097340857065853
contributor_str_mv Hruschka Júnior, Estevam Rafael
dc.subject.por.fl_str_mv Meta-heurística
Combinação de descritores
Redes neurais
topic Meta-heurística
Combinação de descritores
Redes neurais
Never-ending language learning
Meta-heuristics
Descriptor combination
Neural networks
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Never-ending language learning
Meta-heuristics
Descriptor combination
Neural networks
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description NELL (Never-Ending Language Learning) is the first never-ending learning system presented in the litera ture. It has been modeled to create a knowledge base in an autonomous way, reading the web 24 hours per day, seven days per week. In this paradigm, all knowledge acquired is used to improve the learning performance. In this paradigm we face cases where the same object can be named in several ways. These cases as called as correferents, and has great importance for the never-ending learning process, as long as the knowledge about certain entity in a textual base may be distributed among its denominations.As such, the co-reference analysis has a crucial role in NELL’s learning paradigm. In this paper, we approach the combination of different feature vectors as an optimization task performed by meta-heuristic techniques and artificial neural networks, in order to maximize the separability of samples in the feature space, being the optimization process guided by the accuracy of Optimum Path Forest and variations of Siamese Networks in a validation set. The experiments showed the proposed methodology can obtain much better results when compared to the performance of individual feature extraction algorithms.
publishDate 2018
dc.date.accessioned.fl_str_mv 2018-06-28T19:49:09Z
dc.date.available.fl_str_mv 2018-06-28T19:49:09Z
dc.date.issued.fl_str_mv 2018-03-01
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv MANSANO, Alex Fernandes. Aprendizado de máquina multivisão aplicado à análise de correferência em um sistema de aprendizado sem fim. 2018. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2018. Disponível em: https://repositorio.ufscar.br/handle/ufscar/10227.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/10227
identifier_str_mv MANSANO, Alex Fernandes. Aprendizado de máquina multivisão aplicado à análise de correferência em um sistema de aprendizado sem fim. 2018. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2018. Disponível em: https://repositorio.ufscar.br/handle/ufscar/10227.
url https://repositorio.ufscar.br/handle/ufscar/10227
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/10227/3/license.txt
https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/10227/4/MANSANO_Alex_2018.pdf
https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/10227/5/MANSANO_Alex_2018.pdf.txt
https://{{ getenv "DSPACE_HOST" "repositorio.ufscar.br" }}/bitstream/ufscar/10227/6/MANSANO_Alex_2018.pdf.jpg
bitstream.checksum.fl_str_mv ae0398b6f8b235e40ad82cba6c50031d
186842d66d21321a39ef6cd118ed99b3
6722c91ec06cd643974055d8b9eb51bd
5f862739bfa2b220c12961cc4f05a7f2
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1777472100429201408