Assessing irace for automated machine learning

Detalhes bibliográficos
Autor(a) principal: Vieira, Carlos Eduardo Morais
Data de Publicação: 2019
Tipo de documento: Trabalho de conclusão de curso
Idioma: eng
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/34163
Resumo: Ferramentas automáticas de engenharia de algoritmos têm se tornado um recurso importante tanto para a academia quanto para a indústria. Em geral, essas ferramentas funcionam com o uso de certos configuradores de algoritmos demonstravelmente eficientes, dentre estes, o irace. Nessa prova de conceito, avaliamos a aplicação do irace ao campo de aprendizado de máquina (AM). Para isso, propomos um template composto de componentes do framework algorítmico sklearn, que nomeamos isklearn. Além disso, definimos formalmente um espaço de configuração e um setup experimental que permitem que o irace trate conjuntos de dados de AM como instâncias de um problema de otimização, fazendo do isklearn um sistema funcional de aprendizado de máquina automatizado. Resultados preliminares demonstram que irace é capaz de produzir modelos efetivos para três dos maiores domínios de aplicação de AM: visão computacional, processamento de linguagens naturais, e análise de séries temporais.
id UFRN_fc5dd1ad5e5c6bcf5fe218958af0ba3b
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/34163
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Vieira, Carlos Eduardo MoraisLópez-Ibáñez, ManuelAbreu, Márjory da CostaGoldbarg, Elizabeth Ferreira GouveaBezerra, Leonardo César Teonácio2019-12-02T15:52:35Z2021-09-20T11:46:05Z2019-12-02T15:52:35Z2021-09-20T11:46:05Z2019-11-1920180153371VIEIRA, Carlos Eduardo Morais. Assessing irace for automated machine learning. 2019. 54 f. TCC (Graduação) - Curso de Ciência da Computação, Departamento de Informática e Matemática Aplicada, Universiade Federal do Rio Grande do Norte, Natal, 2019.https://repositorio.ufrn.br/handle/123456789/34163Ferramentas automáticas de engenharia de algoritmos têm se tornado um recurso importante tanto para a academia quanto para a indústria. Em geral, essas ferramentas funcionam com o uso de certos configuradores de algoritmos demonstravelmente eficientes, dentre estes, o irace. Nessa prova de conceito, avaliamos a aplicação do irace ao campo de aprendizado de máquina (AM). Para isso, propomos um template composto de componentes do framework algorítmico sklearn, que nomeamos isklearn. Além disso, definimos formalmente um espaço de configuração e um setup experimental que permitem que o irace trate conjuntos de dados de AM como instâncias de um problema de otimização, fazendo do isklearn um sistema funcional de aprendizado de máquina automatizado. Resultados preliminares demonstram que irace é capaz de produzir modelos efetivos para três dos maiores domínios de aplicação de AM: visão computacional, processamento de linguagens naturais, e análise de séries temporais.Automated algorithm engineering tools have become an important asset for both academia and industry. In general, these tools are powered by a few, provenly effective algorithm configurators, among which is irace. In this proof-of-concept investigation, we assess the application of irace to the field of machine learning (ML). To do so, we propose a template built on top of the scikit-learn algorithmic framework, dubbed isklearn, comprising many preprocessing, feature engineering, and prediction algorithms. Furthermore, we formally define a configuration space and an experimental setup that allow irace to treat machine learning datasets as instances of an optimization problem, making isklearn a fully functional automated machine learning (AutoML) system. Preliminary results demonstrate that irace is able to engineer effective algorithms for three of the major ML application domains, namely computer vision, natural language processing, and time series analysis.Universidade Federal do Rio Grande do NorteUFRNBrasilBacharelado em Ciência da Computaçãomachine learningalgorithm configurationcomputer visionnatural language processingtime series analysisAssessing irace for automated machine learninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisengreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNinfo:eu-repo/semantics/openAccessTEXTthesis-final.pdf.txtExtracted texttext/plain71440https://repositorio.ufrn.br/bitstream/123456789/34163/1/thesis-final.pdf.txt1951f422f4ff952dd7f0b9c4ae5a1e41MD51ORIGINALAssessingIraceAutomated_Vieira_2019.pdfapplication/pdf3390595https://repositorio.ufrn.br/bitstream/123456789/34163/2/AssessingIraceAutomated_Vieira_2019.pdfa75e706791ce6d3dc9399a08d8d098eaMD52LICENSElicense.txttext/plain762https://repositorio.ufrn.br/bitstream/123456789/34163/3/license.txte428689918449bd69f843393981e4109MD53123456789/341632023-01-09 14:53:28.64oai:https://repositorio.ufrn.br:123456789/34163PGNlbnRlcj48c3Ryb25nPlVOSVZFUlNJREFERSBGRURFUkFMIERPIFJJTyBHUkFOREUgRE8gTk9SVEU8L3N0cm9uZz48L2NlbnRlcj4NCjxjZW50ZXI+PHN0cm9uZz5CSUJMSU9URUNBIERJR0lUQUwgREUgTU9OT0dSQUZJQVM8L3N0cm9uZz48L2NlbnRlcj4NCg0KPGNlbnRlcj5UZXJtbyBkZSBBdXRvcml6YcOnw6NvIHBhcmEgZGlzcG9uaWJpbGl6YcOnw6NvIGRlIE1vbm9ncmFmaWFzIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbyBuYSBCaWJsaW90ZWNhIERpZ2l0YWwgZGUgTW9ub2dyYWZpYXMgKEJETSk8L2NlbnRlcj4NCg0KTmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIG1vbm9ncmFmaWEsIGF1dG9yaXpvIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZG8gUmlvIEdyYW5kZSBkbyBOb3J0ZSAoVUZSTikgYSBkaXNwb25pYmlsaXphciBhdHJhdsOpcyBkYSBCaWJsaW90ZWNhIERpZ2l0YWwgZGUgTW9ub2dyYWZpYXMgZGEgVUZSTiwgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG7CsCA5NjEwLzk4LCBvIHRleHRvIGludGVncmFsIGRhIG9icmEgc3VibWV0aWRhIHBhcmEgZmlucyBkZSBsZWl0dXJhLCBpbXByZXNzw6NvIGUvb3UgZG93bmxvYWQsIGEgdMOtdHVsbyBkZSBkaXZ1bGdhw6fDo28gZGEgcHJvZHXDp8OjbyBjaWVudMOtZmljYSBicmFzaWxlaXJhLCBhIHBhcnRpciBkYSBkYXRhIGRlc3RhIHN1Ym1pc3PDo28uIA0KRepositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2023-01-09T17:53:28Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Assessing irace for automated machine learning
title Assessing irace for automated machine learning
spellingShingle Assessing irace for automated machine learning
Vieira, Carlos Eduardo Morais
machine learning
algorithm configuration
computer vision
natural language processing
time series analysis
title_short Assessing irace for automated machine learning
title_full Assessing irace for automated machine learning
title_fullStr Assessing irace for automated machine learning
title_full_unstemmed Assessing irace for automated machine learning
title_sort Assessing irace for automated machine learning
author Vieira, Carlos Eduardo Morais
author_facet Vieira, Carlos Eduardo Morais
author_role author
dc.contributor.referees1.none.fl_str_mv López-Ibáñez, Manuel
dc.contributor.referees2.none.fl_str_mv Abreu, Márjory da Costa
dc.contributor.referees3.none.fl_str_mv Goldbarg, Elizabeth Ferreira Gouvea
dc.contributor.author.fl_str_mv Vieira, Carlos Eduardo Morais
dc.contributor.advisor1.fl_str_mv Bezerra, Leonardo César Teonácio
contributor_str_mv Bezerra, Leonardo César Teonácio
dc.subject.por.fl_str_mv machine learning
algorithm configuration
computer vision
natural language processing
time series analysis
topic machine learning
algorithm configuration
computer vision
natural language processing
time series analysis
description Ferramentas automáticas de engenharia de algoritmos têm se tornado um recurso importante tanto para a academia quanto para a indústria. Em geral, essas ferramentas funcionam com o uso de certos configuradores de algoritmos demonstravelmente eficientes, dentre estes, o irace. Nessa prova de conceito, avaliamos a aplicação do irace ao campo de aprendizado de máquina (AM). Para isso, propomos um template composto de componentes do framework algorítmico sklearn, que nomeamos isklearn. Além disso, definimos formalmente um espaço de configuração e um setup experimental que permitem que o irace trate conjuntos de dados de AM como instâncias de um problema de otimização, fazendo do isklearn um sistema funcional de aprendizado de máquina automatizado. Resultados preliminares demonstram que irace é capaz de produzir modelos efetivos para três dos maiores domínios de aplicação de AM: visão computacional, processamento de linguagens naturais, e análise de séries temporais.
publishDate 2019
dc.date.accessioned.fl_str_mv 2019-12-02T15:52:35Z
2021-09-20T11:46:05Z
dc.date.available.fl_str_mv 2019-12-02T15:52:35Z
2021-09-20T11:46:05Z
dc.date.issued.fl_str_mv 2019-11-19
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.pt_BR.fl_str_mv 20180153371
dc.identifier.citation.fl_str_mv VIEIRA, Carlos Eduardo Morais. Assessing irace for automated machine learning. 2019. 54 f. TCC (Graduação) - Curso de Ciência da Computação, Departamento de Informática e Matemática Aplicada, Universiade Federal do Rio Grande do Norte, Natal, 2019.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/34163
identifier_str_mv 20180153371
VIEIRA, Carlos Eduardo Morais. Assessing irace for automated machine learning. 2019. 54 f. TCC (Graduação) - Curso de Ciência da Computação, Departamento de Informática e Matemática Aplicada, Universiade Federal do Rio Grande do Norte, Natal, 2019.
url https://repositorio.ufrn.br/handle/123456789/34163
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Bacharelado em Ciência da Computação
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/34163/1/thesis-final.pdf.txt
https://repositorio.ufrn.br/bitstream/123456789/34163/2/AssessingIraceAutomated_Vieira_2019.pdf
https://repositorio.ufrn.br/bitstream/123456789/34163/3/license.txt
bitstream.checksum.fl_str_mv 1951f422f4ff952dd7f0b9c4ae5a1e41
a75e706791ce6d3dc9399a08d8d098ea
e428689918449bd69f843393981e4109
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1814832773481889792