Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim

Detalhes bibliográficos
Autor(a) principal: Marino, Silvio Carlos
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/11661
Resumo: Artificial Intelligence (AI) refers to a machine capable of systematizing and automating tasks that require intelligence when performed by humans. With AI it may be possible to create a decision-making process with an ever-smaller margin of error. In this sense, the project Read the Web and an endless learning computing system called NELL (Never- Ending Language Learning) were created. NELL performs an endless learning process to learn how to read the web better and better. With the success of obtaining knowledge in English, the system was modeled to learn how to extract facts from web pages in other languages, such as Portuguese, French and Spanish. However, the knowledge learned in the different languages is not directly related. Therefore, the main motivation of the research is to develop a mechanism capable of transferring knowledge from one base to another, using machine learning to automatically tell if concepts learned in different languages are the same. The results of the experiments, with the use of neural networks, C4.5 and XGBoost as a model of machine learning, show a significant gain in comparison with the simple use of dictionaries.
id SCAR_14d006a0506e6817179842aecbc9930e
oai_identifier_str oai:repositorio.ufscar.br:ufscar/11661
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Marino, Silvio CarlosHruschka Júnior, Estevam Rafaelhttp://lattes.cnpq.br/2097340857065853http://lattes.cnpq.br/5788922136217687564cd4c7-e13d-4930-a16e-d8d4aadfe5f42019-08-08T19:47:42Z2019-08-08T19:47:42Z2019-06-24MARINO, Silvio Carlos. Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/ufscar/11661.https://repositorio.ufscar.br/handle/ufscar/11661Artificial Intelligence (AI) refers to a machine capable of systematizing and automating tasks that require intelligence when performed by humans. With AI it may be possible to create a decision-making process with an ever-smaller margin of error. In this sense, the project Read the Web and an endless learning computing system called NELL (Never- Ending Language Learning) were created. NELL performs an endless learning process to learn how to read the web better and better. With the success of obtaining knowledge in English, the system was modeled to learn how to extract facts from web pages in other languages, such as Portuguese, French and Spanish. However, the knowledge learned in the different languages is not directly related. Therefore, the main motivation of the research is to develop a mechanism capable of transferring knowledge from one base to another, using machine learning to automatically tell if concepts learned in different languages are the same. The results of the experiments, with the use of neural networks, C4.5 and XGBoost as a model of machine learning, show a significant gain in comparison with the simple use of dictionaries.A Inteligência Artificial (IA) refere-se a uma máquina capaz de sistematizar e automatizar tarefas que requerem inteligência quando realizadas por humanos. Com IA pode ser possível criar um processo capaz de tomar decisões com uma margem de erro cada vez menor. Neste sentido, foram criados o projeto Read The Web e um sistema de computação de aprendizado sem fim chamado NELL: Never-Ending Language Learning. NELL realiza um processo de aprendizado sem fim para aprender a ler a web cada vez melhor. Com o sucesso de obtenção do conhecimento na língua inglesa, o sistema foi modelado para aprender a extrair fatos de páginas web em outras línguas, tais como: português, francês e espanhol. No entanto, o conhecimento aprendido nos diferentes idiomas não está diretamente relacionado. Sendo assim, a principal motivação da pesquisa é desenvolver um mecanismo capaz de transferir o conhecimento de uma base para outra, utilizando aprendizado de máquina para automaticamente dizer se os conceitos aprendidos em idiomas diferentes são os mesmos. Os resultados dos experimentos, com a utilização de redes neurais, C4.5 e XGBoost como modelo de aprendizado de máquina, mostram um ganho significativo em comparação com o simples uso de dicionários.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarInteligência ArtificialAprendizado de máquinaRedes neuraisC4.5XGBoostEquivalência de conceitosArtificial IntelligenceMachine learningNeural networksEquivalence of conceptsCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOIdentificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fiminfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisOnline6006c142165-1935-4e21-8c88-f27f8c42b0c1info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissertação Mestrado - Silvio Carlos Marino-versao-final_com_pdf_aprovacao.pdfDissertação Mestrado - Silvio Carlos Marino-versao-final_com_pdf_aprovacao.pdfapplication/pdf976598https://repositorio.ufscar.br/bitstream/ufscar/11661/1/Dissertac%cc%a7a%cc%83o%20Mestrado%20-%20Silvio%20Carlos%20Marino-versao-final_com_pdf_aprovacao.pdf182a93208d17e9eb6ec57a2b94fb7f52MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81957https://repositorio.ufscar.br/bitstream/ufscar/11661/3/license.txtae0398b6f8b235e40ad82cba6c50031dMD53TEXTDissertação Mestrado - Silvio Carlos Marino-versao-final_com_pdf_aprovacao.pdf.txtDissertação Mestrado - Silvio Carlos Marino-versao-final_com_pdf_aprovacao.pdf.txtExtracted texttext/plain114198https://repositorio.ufscar.br/bitstream/ufscar/11661/4/Dissertac%cc%a7a%cc%83o%20Mestrado%20-%20Silvio%20Carlos%20Marino-versao-final_com_pdf_aprovacao.pdf.txte213ea2a5a01299bc7ed42f0f49526c0MD54THUMBNAILDissertação Mestrado - Silvio Carlos Marino-versao-final_com_pdf_aprovacao.pdf.jpgDissertação Mestrado - Silvio Carlos Marino-versao-final_com_pdf_aprovacao.pdf.jpgIM Thumbnailimage/jpeg8337https://repositorio.ufscar.br/bitstream/ufscar/11661/5/Dissertac%cc%a7a%cc%83o%20Mestrado%20-%20Silvio%20Carlos%20Marino-versao-final_com_pdf_aprovacao.pdf.jpge6fcd25622a7a1e66d9b08f7c75fb13dMD55ufscar/116612023-09-18 18:31:53.1oai:repositorio.ufscar.br:ufscar/11661TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlCkZlZGVyYWwgZGUgU8OjbyBDYXJsb3MgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdQpkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlCmVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcyBmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZTQ2FyIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28KcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGU0NhciBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgYSBzdWEgdGVzZSBvdQpkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcwpuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldQpjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6oKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFVGU0NhcgpvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUKaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRlNDYXIsClZPQ8OKIERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJU8ODTyBDT01PClRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVRlNDYXIgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSAocykgb3UgbyhzKSBub21lKHMpIGRvKHMpCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzCmNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:53Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim
title Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim
spellingShingle Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim
Marino, Silvio Carlos
Inteligência Artificial
Aprendizado de máquina
Redes neurais
C4.5
XGBoost
Equivalência de conceitos
Artificial Intelligence
Machine learning
Neural networks
Equivalence of concepts
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
title_short Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim
title_full Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim
title_fullStr Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim
title_full_unstemmed Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim
title_sort Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim
author Marino, Silvio Carlos
author_facet Marino, Silvio Carlos
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/5788922136217687
dc.contributor.author.fl_str_mv Marino, Silvio Carlos
dc.contributor.advisor1.fl_str_mv Hruschka Júnior, Estevam Rafael
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/2097340857065853
dc.contributor.authorID.fl_str_mv 564cd4c7-e13d-4930-a16e-d8d4aadfe5f4
contributor_str_mv Hruschka Júnior, Estevam Rafael
dc.subject.por.fl_str_mv Inteligência Artificial
Aprendizado de máquina
Redes neurais
C4.5
XGBoost
Equivalência de conceitos
topic Inteligência Artificial
Aprendizado de máquina
Redes neurais
C4.5
XGBoost
Equivalência de conceitos
Artificial Intelligence
Machine learning
Neural networks
Equivalence of concepts
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
dc.subject.eng.fl_str_mv Artificial Intelligence
Machine learning
Neural networks
Equivalence of concepts
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
description Artificial Intelligence (AI) refers to a machine capable of systematizing and automating tasks that require intelligence when performed by humans. With AI it may be possible to create a decision-making process with an ever-smaller margin of error. In this sense, the project Read the Web and an endless learning computing system called NELL (Never- Ending Language Learning) were created. NELL performs an endless learning process to learn how to read the web better and better. With the success of obtaining knowledge in English, the system was modeled to learn how to extract facts from web pages in other languages, such as Portuguese, French and Spanish. However, the knowledge learned in the different languages is not directly related. Therefore, the main motivation of the research is to develop a mechanism capable of transferring knowledge from one base to another, using machine learning to automatically tell if concepts learned in different languages are the same. The results of the experiments, with the use of neural networks, C4.5 and XGBoost as a model of machine learning, show a significant gain in comparison with the simple use of dictionaries.
publishDate 2019
dc.date.accessioned.fl_str_mv 2019-08-08T19:47:42Z
dc.date.available.fl_str_mv 2019-08-08T19:47:42Z
dc.date.issued.fl_str_mv 2019-06-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv MARINO, Silvio Carlos. Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/ufscar/11661.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/11661
identifier_str_mv MARINO, Silvio Carlos. Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/ufscar/11661.
url https://repositorio.ufscar.br/handle/ufscar/11661
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv 600
dc.relation.authority.fl_str_mv 6c142165-1935-4e21-8c88-f27f8c42b0c1
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/11661/1/Dissertac%cc%a7a%cc%83o%20Mestrado%20-%20Silvio%20Carlos%20Marino-versao-final_com_pdf_aprovacao.pdf
https://repositorio.ufscar.br/bitstream/ufscar/11661/3/license.txt
https://repositorio.ufscar.br/bitstream/ufscar/11661/4/Dissertac%cc%a7a%cc%83o%20Mestrado%20-%20Silvio%20Carlos%20Marino-versao-final_com_pdf_aprovacao.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/11661/5/Dissertac%cc%a7a%cc%83o%20Mestrado%20-%20Silvio%20Carlos%20Marino-versao-final_com_pdf_aprovacao.pdf.jpg
bitstream.checksum.fl_str_mv 182a93208d17e9eb6ec57a2b94fb7f52
ae0398b6f8b235e40ad82cba6c50031d
e213ea2a5a01299bc7ed42f0f49526c0
e6fcd25622a7a1e66d9b08f7c75fb13d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1813715607136239616