Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/11661 |
Resumo: | Artificial Intelligence (AI) refers to a machine capable of systematizing and automating tasks that require intelligence when performed by humans. With AI it may be possible to create a decision-making process with an ever-smaller margin of error. In this sense, the project Read the Web and an endless learning computing system called NELL (Never- Ending Language Learning) were created. NELL performs an endless learning process to learn how to read the web better and better. With the success of obtaining knowledge in English, the system was modeled to learn how to extract facts from web pages in other languages, such as Portuguese, French and Spanish. However, the knowledge learned in the different languages is not directly related. Therefore, the main motivation of the research is to develop a mechanism capable of transferring knowledge from one base to another, using machine learning to automatically tell if concepts learned in different languages are the same. The results of the experiments, with the use of neural networks, C4.5 and XGBoost as a model of machine learning, show a significant gain in comparison with the simple use of dictionaries. |
id |
SCAR_14d006a0506e6817179842aecbc9930e |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/11661 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Marino, Silvio CarlosHruschka Júnior, Estevam Rafaelhttp://lattes.cnpq.br/2097340857065853http://lattes.cnpq.br/5788922136217687564cd4c7-e13d-4930-a16e-d8d4aadfe5f42019-08-08T19:47:42Z2019-08-08T19:47:42Z2019-06-24MARINO, Silvio Carlos. Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/ufscar/11661.https://repositorio.ufscar.br/handle/ufscar/11661Artificial Intelligence (AI) refers to a machine capable of systematizing and automating tasks that require intelligence when performed by humans. With AI it may be possible to create a decision-making process with an ever-smaller margin of error. In this sense, the project Read the Web and an endless learning computing system called NELL (Never- Ending Language Learning) were created. NELL performs an endless learning process to learn how to read the web better and better. With the success of obtaining knowledge in English, the system was modeled to learn how to extract facts from web pages in other languages, such as Portuguese, French and Spanish. However, the knowledge learned in the different languages is not directly related. Therefore, the main motivation of the research is to develop a mechanism capable of transferring knowledge from one base to another, using machine learning to automatically tell if concepts learned in different languages are the same. The results of the experiments, with the use of neural networks, C4.5 and XGBoost as a model of machine learning, show a significant gain in comparison with the simple use of dictionaries.A Inteligência Artificial (IA) refere-se a uma máquina capaz de sistematizar e automatizar tarefas que requerem inteligência quando realizadas por humanos. Com IA pode ser possível criar um processo capaz de tomar decisões com uma margem de erro cada vez menor. Neste sentido, foram criados o projeto Read The Web e um sistema de computação de aprendizado sem fim chamado NELL: Never-Ending Language Learning. NELL realiza um processo de aprendizado sem fim para aprender a ler a web cada vez melhor. Com o sucesso de obtenção do conhecimento na língua inglesa, o sistema foi modelado para aprender a extrair fatos de páginas web em outras línguas, tais como: português, francês e espanhol. No entanto, o conhecimento aprendido nos diferentes idiomas não está diretamente relacionado. Sendo assim, a principal motivação da pesquisa é desenvolver um mecanismo capaz de transferir o conhecimento de uma base para outra, utilizando aprendizado de máquina para automaticamente dizer se os conceitos aprendidos em idiomas diferentes são os mesmos. Os resultados dos experimentos, com a utilização de redes neurais, C4.5 e XGBoost como modelo de aprendizado de máquina, mostram um ganho significativo em comparação com o simples uso de dicionários.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarInteligência ArtificialAprendizado de máquinaRedes neuraisC4.5XGBoostEquivalência de conceitosArtificial IntelligenceMachine learningNeural networksEquivalence of conceptsCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOIdentificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fiminfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisOnline6006c142165-1935-4e21-8c88-f27f8c42b0c1info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissertação Mestrado - Silvio Carlos Marino-versao-final_com_pdf_aprovacao.pdfDissertação Mestrado - Silvio Carlos Marino-versao-final_com_pdf_aprovacao.pdfapplication/pdf976598https://repositorio.ufscar.br/bitstream/ufscar/11661/1/Dissertac%cc%a7a%cc%83o%20Mestrado%20-%20Silvio%20Carlos%20Marino-versao-final_com_pdf_aprovacao.pdf182a93208d17e9eb6ec57a2b94fb7f52MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81957https://repositorio.ufscar.br/bitstream/ufscar/11661/3/license.txtae0398b6f8b235e40ad82cba6c50031dMD53TEXTDissertação Mestrado - Silvio Carlos Marino-versao-final_com_pdf_aprovacao.pdf.txtDissertação Mestrado - Silvio Carlos Marino-versao-final_com_pdf_aprovacao.pdf.txtExtracted texttext/plain114198https://repositorio.ufscar.br/bitstream/ufscar/11661/4/Dissertac%cc%a7a%cc%83o%20Mestrado%20-%20Silvio%20Carlos%20Marino-versao-final_com_pdf_aprovacao.pdf.txte213ea2a5a01299bc7ed42f0f49526c0MD54THUMBNAILDissertação Mestrado - Silvio Carlos Marino-versao-final_com_pdf_aprovacao.pdf.jpgDissertação Mestrado - Silvio Carlos Marino-versao-final_com_pdf_aprovacao.pdf.jpgIM Thumbnailimage/jpeg8337https://repositorio.ufscar.br/bitstream/ufscar/11661/5/Dissertac%cc%a7a%cc%83o%20Mestrado%20-%20Silvio%20Carlos%20Marino-versao-final_com_pdf_aprovacao.pdf.jpge6fcd25622a7a1e66d9b08f7c75fb13dMD55ufscar/116612023-09-18 18:31:53.1oai:repositorio.ufscar.br:ufscar/11661TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlCkZlZGVyYWwgZGUgU8OjbyBDYXJsb3MgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdQpkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlCmVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcyBmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZTQ2FyIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28KcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGU0NhciBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgYSBzdWEgdGVzZSBvdQpkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcwpuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldQpjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6oKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFVGU0NhcgpvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUKaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRlNDYXIsClZPQ8OKIERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJU8ODTyBDT01PClRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVRlNDYXIgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSAocykgb3UgbyhzKSBub21lKHMpIGRvKHMpCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzCmNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:53Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim |
title |
Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim |
spellingShingle |
Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim Marino, Silvio Carlos Inteligência Artificial Aprendizado de máquina Redes neurais C4.5 XGBoost Equivalência de conceitos Artificial Intelligence Machine learning Neural networks Equivalence of concepts CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
title_short |
Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim |
title_full |
Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim |
title_fullStr |
Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim |
title_full_unstemmed |
Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim |
title_sort |
Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim |
author |
Marino, Silvio Carlos |
author_facet |
Marino, Silvio Carlos |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/5788922136217687 |
dc.contributor.author.fl_str_mv |
Marino, Silvio Carlos |
dc.contributor.advisor1.fl_str_mv |
Hruschka Júnior, Estevam Rafael |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/2097340857065853 |
dc.contributor.authorID.fl_str_mv |
564cd4c7-e13d-4930-a16e-d8d4aadfe5f4 |
contributor_str_mv |
Hruschka Júnior, Estevam Rafael |
dc.subject.por.fl_str_mv |
Inteligência Artificial Aprendizado de máquina Redes neurais C4.5 XGBoost Equivalência de conceitos |
topic |
Inteligência Artificial Aprendizado de máquina Redes neurais C4.5 XGBoost Equivalência de conceitos Artificial Intelligence Machine learning Neural networks Equivalence of concepts CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Artificial Intelligence Machine learning Neural networks Equivalence of concepts |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
description |
Artificial Intelligence (AI) refers to a machine capable of systematizing and automating tasks that require intelligence when performed by humans. With AI it may be possible to create a decision-making process with an ever-smaller margin of error. In this sense, the project Read the Web and an endless learning computing system called NELL (Never- Ending Language Learning) were created. NELL performs an endless learning process to learn how to read the web better and better. With the success of obtaining knowledge in English, the system was modeled to learn how to extract facts from web pages in other languages, such as Portuguese, French and Spanish. However, the knowledge learned in the different languages is not directly related. Therefore, the main motivation of the research is to develop a mechanism capable of transferring knowledge from one base to another, using machine learning to automatically tell if concepts learned in different languages are the same. The results of the experiments, with the use of neural networks, C4.5 and XGBoost as a model of machine learning, show a significant gain in comparison with the simple use of dictionaries. |
publishDate |
2019 |
dc.date.accessioned.fl_str_mv |
2019-08-08T19:47:42Z |
dc.date.available.fl_str_mv |
2019-08-08T19:47:42Z |
dc.date.issued.fl_str_mv |
2019-06-24 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
MARINO, Silvio Carlos. Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/ufscar/11661. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/11661 |
identifier_str_mv |
MARINO, Silvio Carlos. Identificação automática de equivalência de conceitos em diferentes idiomas para aprendizado sem fim. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/ufscar/11661. |
url |
https://repositorio.ufscar.br/handle/ufscar/11661 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
600 |
dc.relation.authority.fl_str_mv |
6c142165-1935-4e21-8c88-f27f8c42b0c1 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC |
dc.publisher.initials.fl_str_mv |
UFSCar |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/11661/1/Dissertac%cc%a7a%cc%83o%20Mestrado%20-%20Silvio%20Carlos%20Marino-versao-final_com_pdf_aprovacao.pdf https://repositorio.ufscar.br/bitstream/ufscar/11661/3/license.txt https://repositorio.ufscar.br/bitstream/ufscar/11661/4/Dissertac%cc%a7a%cc%83o%20Mestrado%20-%20Silvio%20Carlos%20Marino-versao-final_com_pdf_aprovacao.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/11661/5/Dissertac%cc%a7a%cc%83o%20Mestrado%20-%20Silvio%20Carlos%20Marino-versao-final_com_pdf_aprovacao.pdf.jpg |
bitstream.checksum.fl_str_mv |
182a93208d17e9eb6ec57a2b94fb7f52 ae0398b6f8b235e40ad82cba6c50031d e213ea2a5a01299bc7ed42f0f49526c0 e6fcd25622a7a1e66d9b08f7c75fb13d |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1813715607136239616 |