Metodologia de aprendizado AutoML baseado em informações de complexidade de instâncias

Detalhes bibliográficos
Autor(a) principal: Habib Asseiss Neto
Data de Publicação: 2020
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/35575
Resumo: A análise de dados biológicos é uma tarefa importante, pois permite a obtenção de informações úteis e da expansão do conhecimento sobre determinado domínio biológico. Materiais biológicos podem ser analisados por diversas técnicas e um método amplamente utilizado para analisar a composição estrutural desses materiais é denominada análise de espectroscopia por infravermelho, que permite extrair informações através da emissão da luz infravermelha nas amostras. As técnicas de espectroscopia produzem um grande volume de dados, o que tornam complexas análises manuais por especialistas. A Ciência da Computação, através do Aprendizado de Máquina, pode ajudar nessa tarefa, oferecendo maneiras de compreender e produzir conhecimentos importantes a partir de amostras espectrais. As Redes Neurais Convolucionais, geralmente aplicadas com sucesso no reconhecimento de imagens, são especificamente adequadas para os dados espectrais das amostras, uma vez que as estruturas dos espectros podem ser vistas como uma imagem. Este trabalho conduz experimentos nos quais se procura detectar a ocorrência de adulteração no leite bovino através de análises de espectroscopia por infravermelho, utilizando, para isso, uma arquitetura proposta de rede neural convolucional e modelos ensemble de árvores de decisão. Nos experimentos realizados, dados espectrais de milhares de amostras, puras e adulteradas, do leite bovino foram submetidas à rede neural convolucional proposta, aos modelos ensemble e a outros métodos comumente utilizados para este fim, permitindo uma comparação de diferentes abordagens. A abordagem proposta foi capaz de detectar adulterantes com acurácia de até 98,76% para os métodos de rede neural convolucional e ensemble de árvores, enquanto os métodos de baseline comumente utilizados produziram acurácias médias de 65,88%. Apesar do bom desempenho da rede neural convolucional para o problema abordado, elaborar arquiteturas de redes neurais que ofereçam bom desempenho para problemas genéricos é uma tarefa desafiadora. Geralmente, a busca por uma arquitetura adequada é um processo específico para o problema abordado e é conduzido por cientistas especializados através de testes manuais e extensivos, além de ser necessário conhecimento prévio em problemas semelhantes abordados anteriormente. O Aprendizado de Máquina Automatizado, ou AutoML, pode colaborar nesse processo, pois tem como um de seus objetivos buscar as arquiteturas mais adequadas para o problema fornecido como entrada de forma completamente automatizada, sem intervenção humana. No entanto, métodos de Aprendizado de Máquina, ou mesmo de AutoML, geralmente não levam em consideração características individuais das instâncias que fazem parte dos conjuntos de dados analisados. Ao considerar informações que refletem características de cada amostra, pode-se avaliar a complexidade e a habilidade dos métodos. A Teoria de Resposta ao Item (IRT) é uma abordagem da área de psicometria que pode ser adaptada ao Aprendizado de Máquina, podendo oferecer descrições de complexidade no nível das instâncias, além de caracterizar habilidades inerentes aos modelos. Neste trabalho, propõe-se uma metodologia inovadora baseada em AutoML e IRT, denominada NASirt, capaz de oferecer uma maior explicabilidade de modelos de Redes Neurais Convolucionais. O método seleciona automaticamente um conjunto de modelos com diferentes arquiteturas e submete, a cada modelo, instâncias específicas do conjunto de dados, baseando-se em informações fornecidas pela IRT. O NASirt pode determinar as arquiteturas de redes neurais convolucionais mais adequadas para um determinado problema e realizar a classificação de instâncias com acurácias médias maiores que outros métodos analisados. Além disso, por utilizar os conceitos de IRT, o NASirt pode determinar a complexidade de instâncias do conjunto de dados analisado e estimar os níveis de habilidade de modelos com diferentes arquiteturas, obtendo um avanço na explicabilidade de modelos. Diversos experimentos foram conduzidos para avaliar o comportamento e a viabilidade da metodologia em conjuntos de dados reais, comparando os resultados com outros métodos de benchmark. Os resultados mostram que o método proposto apresenta desempenho, na maioria dos casos, melhor que os métodos comparados. A metodologia proposta foi capaz de gerar acurácias médias de 96,96% para um conjunto de dados, enquanto um modelo de rede neural convolucional criado manualmente apresentou 78,43%, uma abordagem de votação com centenas de modelos apresentou 69,06% e um sistema AutoML já existente apresentou 91,81% de acurácia.
id UFMG_ad5c2eb5bb8131da7e5a6e0e51eb2b7c
oai_identifier_str oai:repositorio.ufmg.br:1843/35575
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Sérgio Vale Aguiar Camposhttp://lattes.cnpq.br/6438645213502821Ronnie Cley de Oliveira AlvesAdriano César Machado PereiraLeorges Moraes da FonsecaNalvo Franco de Almeida JuniorWaldeyr Mendes Cordeiro da Silvahttp://lattes.cnpq.br/6567946900630041Habib Asseiss Neto2021-04-07T20:45:11Z2021-04-07T20:45:11Z2020-12-07http://hdl.handle.net/1843/35575A análise de dados biológicos é uma tarefa importante, pois permite a obtenção de informações úteis e da expansão do conhecimento sobre determinado domínio biológico. Materiais biológicos podem ser analisados por diversas técnicas e um método amplamente utilizado para analisar a composição estrutural desses materiais é denominada análise de espectroscopia por infravermelho, que permite extrair informações através da emissão da luz infravermelha nas amostras. As técnicas de espectroscopia produzem um grande volume de dados, o que tornam complexas análises manuais por especialistas. A Ciência da Computação, através do Aprendizado de Máquina, pode ajudar nessa tarefa, oferecendo maneiras de compreender e produzir conhecimentos importantes a partir de amostras espectrais. As Redes Neurais Convolucionais, geralmente aplicadas com sucesso no reconhecimento de imagens, são especificamente adequadas para os dados espectrais das amostras, uma vez que as estruturas dos espectros podem ser vistas como uma imagem. Este trabalho conduz experimentos nos quais se procura detectar a ocorrência de adulteração no leite bovino através de análises de espectroscopia por infravermelho, utilizando, para isso, uma arquitetura proposta de rede neural convolucional e modelos ensemble de árvores de decisão. Nos experimentos realizados, dados espectrais de milhares de amostras, puras e adulteradas, do leite bovino foram submetidas à rede neural convolucional proposta, aos modelos ensemble e a outros métodos comumente utilizados para este fim, permitindo uma comparação de diferentes abordagens. A abordagem proposta foi capaz de detectar adulterantes com acurácia de até 98,76% para os métodos de rede neural convolucional e ensemble de árvores, enquanto os métodos de baseline comumente utilizados produziram acurácias médias de 65,88%. Apesar do bom desempenho da rede neural convolucional para o problema abordado, elaborar arquiteturas de redes neurais que ofereçam bom desempenho para problemas genéricos é uma tarefa desafiadora. Geralmente, a busca por uma arquitetura adequada é um processo específico para o problema abordado e é conduzido por cientistas especializados através de testes manuais e extensivos, além de ser necessário conhecimento prévio em problemas semelhantes abordados anteriormente. O Aprendizado de Máquina Automatizado, ou AutoML, pode colaborar nesse processo, pois tem como um de seus objetivos buscar as arquiteturas mais adequadas para o problema fornecido como entrada de forma completamente automatizada, sem intervenção humana. No entanto, métodos de Aprendizado de Máquina, ou mesmo de AutoML, geralmente não levam em consideração características individuais das instâncias que fazem parte dos conjuntos de dados analisados. Ao considerar informações que refletem características de cada amostra, pode-se avaliar a complexidade e a habilidade dos métodos. A Teoria de Resposta ao Item (IRT) é uma abordagem da área de psicometria que pode ser adaptada ao Aprendizado de Máquina, podendo oferecer descrições de complexidade no nível das instâncias, além de caracterizar habilidades inerentes aos modelos. Neste trabalho, propõe-se uma metodologia inovadora baseada em AutoML e IRT, denominada NASirt, capaz de oferecer uma maior explicabilidade de modelos de Redes Neurais Convolucionais. O método seleciona automaticamente um conjunto de modelos com diferentes arquiteturas e submete, a cada modelo, instâncias específicas do conjunto de dados, baseando-se em informações fornecidas pela IRT. O NASirt pode determinar as arquiteturas de redes neurais convolucionais mais adequadas para um determinado problema e realizar a classificação de instâncias com acurácias médias maiores que outros métodos analisados. Além disso, por utilizar os conceitos de IRT, o NASirt pode determinar a complexidade de instâncias do conjunto de dados analisado e estimar os níveis de habilidade de modelos com diferentes arquiteturas, obtendo um avanço na explicabilidade de modelos. Diversos experimentos foram conduzidos para avaliar o comportamento e a viabilidade da metodologia em conjuntos de dados reais, comparando os resultados com outros métodos de benchmark. Os resultados mostram que o método proposto apresenta desempenho, na maioria dos casos, melhor que os métodos comparados. A metodologia proposta foi capaz de gerar acurácias médias de 96,96% para um conjunto de dados, enquanto um modelo de rede neural convolucional criado manualmente apresentou 78,43%, uma abordagem de votação com centenas de modelos apresentou 69,06% e um sistema AutoML já existente apresentou 91,81% de acurácia.Analysis of biological data is a very important task since it allows one to obtain useful information and to expand knowledge about some biological domain. Biological materials can be analyzed by several techniques and a widely used method is the infrared spectroscopy analysis, which allows the information extraction through the emission of infrared light in the samples. Spectroscopy techniques produce a large volume of data, which make manual analysis by experts complex. Computer Science, through Machine Learning, can help in this task, o↵ering ways to understand and produce important knowledge from spectral samples. Convolutional Neural Networks, generally successfully applied to image recognition, are specifically suitable for spectral data of samples, since spectral structure can be seen as an image. This work conducts experiments in order to detect the occurrence of adulteration in bovine milk through infrared spectroscopy analyzes using a proposed convolutiona neural network architecture and ensemble decision trees models. In the experiments, spectral data from thousands of pure and adulterated samples of bovine milk were subjected to the proposed convolutional neural network, to the ensemblee models and to other commonly used methods for this purpose, allowing a comparison of di↵erent approaches. The proposed approach was able to detect adulterants with an accuracy of up to 98.76% for convolutional neural network and tree embedding, while the commonly used baseline methods produced average accuracy of 65.88%. Despite the good performance of the convolutional neural network for the milk problem, designing neural network architectures that o↵er good performance for generic problems is a challenging task. Generally, the search for an adequate architecture is a specific process for the problem addressed and it is conducted by specialized scientists through manual and extensive tests, and also prior knowledge on similar problems is required. Automated Machine Learning, or AutoML, can collaborate in this process, since its objectives is the search for the most adequate architectures for the input problem in an automated way and no human interaction. However, Machine Learning methods, or even AutoML methods, generally do not consider individual characteristics from instances that belong to the analyzed datasets. By considering information that reflects each sample’s characteristics, it is possible to evaluate the methods’ habilities. Item Response Theory (IRT) is a psychometrics approach that can be adapted to Machine Learning and can o↵er complexity descriptions on an instance level, and also characterize inherit abilities to Machine Learning models. In this work, we propose an innovative methodology based on AutoML and IRT that is capable of o↵ering high explicability of Convolutional Neural Network models. The method selects the most adequate instances to be submitted to di↵erent models, based on the diculty and discrimination information and also models abilities. Several experiments were conducted in order to evaluate the methodology viability on real datasets, comparing the results with other benchmark methods. Results show that the proposed method presents, in most cases, better performance over the other methods. The proposed methodology was capable of generating average accuracies of 96.96% for a specific dataset, while a Convolutional Neural Network manually created presented 78.43%, a voting approach with hundreds of models presented 69.06% and an already existing AutoML system presented 91.81% of accuracy.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de Minas GeraisPrograma de Pós-Graduação em Ciência da ComputaçãoUFMGBrasilICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃOhttp://creativecommons.org/licenses/by/3.0/pt/info:eu-repo/semantics/openAccessComputação – TesesAprendizado do computador – TesesRedes neurais convolucionais – TesesTeoria de Resposta ao Item – TesesLeite - Análise -TesesAprendizado de MáquinaAutoMLTeoria de Resposta ao ItemRedes Neurais ConvolucionaisMetodologia de aprendizado AutoML baseado em informações de complexidade de instânciasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALtese_habib_asseiss_neto_final.pdftese_habib_asseiss_neto_final.pdfapplication/pdf4368131https://repositorio.ufmg.br/bitstream/1843/35575/4/tese_habib_asseiss_neto_final.pdf401d937fb89112fd41615b190a9c6bb9MD54CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://repositorio.ufmg.br/bitstream/1843/35575/5/license_rdff9944a358a0c32770bd9bed185bb5395MD55LICENSElicense.txtlicense.txttext/plain; charset=utf-82119https://repositorio.ufmg.br/bitstream/1843/35575/6/license.txt34badce4be7e31e3adb4575ae96af679MD561843/355752021-04-07 17:45:11.918oai:repositorio.ufmg.br:1843/35575TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEgRE8gUkVQT1NJVMOTUklPIElOU1RJVFVDSU9OQUwgREEgVUZNRwoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZSBpcnJldm9nw6F2ZWwgZGUgcmVwcm9kdXppciBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBkZWNsYXJhIHF1ZSBjb25oZWNlIGEgcG9sw610aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRlIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCk8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KCg==Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2021-04-07T20:45:11Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Metodologia de aprendizado AutoML baseado em informações de complexidade de instâncias
title Metodologia de aprendizado AutoML baseado em informações de complexidade de instâncias
spellingShingle Metodologia de aprendizado AutoML baseado em informações de complexidade de instâncias
Habib Asseiss Neto
Aprendizado de Máquina
AutoML
Teoria de Resposta ao Item
Redes Neurais Convolucionais
Computação – Teses
Aprendizado do computador – Teses
Redes neurais convolucionais – Teses
Teoria de Resposta ao Item – Teses
Leite - Análise -Teses
title_short Metodologia de aprendizado AutoML baseado em informações de complexidade de instâncias
title_full Metodologia de aprendizado AutoML baseado em informações de complexidade de instâncias
title_fullStr Metodologia de aprendizado AutoML baseado em informações de complexidade de instâncias
title_full_unstemmed Metodologia de aprendizado AutoML baseado em informações de complexidade de instâncias
title_sort Metodologia de aprendizado AutoML baseado em informações de complexidade de instâncias
author Habib Asseiss Neto
author_facet Habib Asseiss Neto
author_role author
dc.contributor.advisor1.fl_str_mv Sérgio Vale Aguiar Campos
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6438645213502821
dc.contributor.advisor-co1.fl_str_mv Ronnie Cley de Oliveira Alves
dc.contributor.referee1.fl_str_mv Adriano César Machado Pereira
dc.contributor.referee2.fl_str_mv Leorges Moraes da Fonseca
dc.contributor.referee3.fl_str_mv Nalvo Franco de Almeida Junior
dc.contributor.referee4.fl_str_mv Waldeyr Mendes Cordeiro da Silva
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/6567946900630041
dc.contributor.author.fl_str_mv Habib Asseiss Neto
contributor_str_mv Sérgio Vale Aguiar Campos
Ronnie Cley de Oliveira Alves
Adriano César Machado Pereira
Leorges Moraes da Fonseca
Nalvo Franco de Almeida Junior
Waldeyr Mendes Cordeiro da Silva
dc.subject.por.fl_str_mv Aprendizado de Máquina
AutoML
Teoria de Resposta ao Item
Redes Neurais Convolucionais
topic Aprendizado de Máquina
AutoML
Teoria de Resposta ao Item
Redes Neurais Convolucionais
Computação – Teses
Aprendizado do computador – Teses
Redes neurais convolucionais – Teses
Teoria de Resposta ao Item – Teses
Leite - Análise -Teses
dc.subject.other.pt_BR.fl_str_mv Computação – Teses
Aprendizado do computador – Teses
Redes neurais convolucionais – Teses
Teoria de Resposta ao Item – Teses
Leite - Análise -Teses
description A análise de dados biológicos é uma tarefa importante, pois permite a obtenção de informações úteis e da expansão do conhecimento sobre determinado domínio biológico. Materiais biológicos podem ser analisados por diversas técnicas e um método amplamente utilizado para analisar a composição estrutural desses materiais é denominada análise de espectroscopia por infravermelho, que permite extrair informações através da emissão da luz infravermelha nas amostras. As técnicas de espectroscopia produzem um grande volume de dados, o que tornam complexas análises manuais por especialistas. A Ciência da Computação, através do Aprendizado de Máquina, pode ajudar nessa tarefa, oferecendo maneiras de compreender e produzir conhecimentos importantes a partir de amostras espectrais. As Redes Neurais Convolucionais, geralmente aplicadas com sucesso no reconhecimento de imagens, são especificamente adequadas para os dados espectrais das amostras, uma vez que as estruturas dos espectros podem ser vistas como uma imagem. Este trabalho conduz experimentos nos quais se procura detectar a ocorrência de adulteração no leite bovino através de análises de espectroscopia por infravermelho, utilizando, para isso, uma arquitetura proposta de rede neural convolucional e modelos ensemble de árvores de decisão. Nos experimentos realizados, dados espectrais de milhares de amostras, puras e adulteradas, do leite bovino foram submetidas à rede neural convolucional proposta, aos modelos ensemble e a outros métodos comumente utilizados para este fim, permitindo uma comparação de diferentes abordagens. A abordagem proposta foi capaz de detectar adulterantes com acurácia de até 98,76% para os métodos de rede neural convolucional e ensemble de árvores, enquanto os métodos de baseline comumente utilizados produziram acurácias médias de 65,88%. Apesar do bom desempenho da rede neural convolucional para o problema abordado, elaborar arquiteturas de redes neurais que ofereçam bom desempenho para problemas genéricos é uma tarefa desafiadora. Geralmente, a busca por uma arquitetura adequada é um processo específico para o problema abordado e é conduzido por cientistas especializados através de testes manuais e extensivos, além de ser necessário conhecimento prévio em problemas semelhantes abordados anteriormente. O Aprendizado de Máquina Automatizado, ou AutoML, pode colaborar nesse processo, pois tem como um de seus objetivos buscar as arquiteturas mais adequadas para o problema fornecido como entrada de forma completamente automatizada, sem intervenção humana. No entanto, métodos de Aprendizado de Máquina, ou mesmo de AutoML, geralmente não levam em consideração características individuais das instâncias que fazem parte dos conjuntos de dados analisados. Ao considerar informações que refletem características de cada amostra, pode-se avaliar a complexidade e a habilidade dos métodos. A Teoria de Resposta ao Item (IRT) é uma abordagem da área de psicometria que pode ser adaptada ao Aprendizado de Máquina, podendo oferecer descrições de complexidade no nível das instâncias, além de caracterizar habilidades inerentes aos modelos. Neste trabalho, propõe-se uma metodologia inovadora baseada em AutoML e IRT, denominada NASirt, capaz de oferecer uma maior explicabilidade de modelos de Redes Neurais Convolucionais. O método seleciona automaticamente um conjunto de modelos com diferentes arquiteturas e submete, a cada modelo, instâncias específicas do conjunto de dados, baseando-se em informações fornecidas pela IRT. O NASirt pode determinar as arquiteturas de redes neurais convolucionais mais adequadas para um determinado problema e realizar a classificação de instâncias com acurácias médias maiores que outros métodos analisados. Além disso, por utilizar os conceitos de IRT, o NASirt pode determinar a complexidade de instâncias do conjunto de dados analisado e estimar os níveis de habilidade de modelos com diferentes arquiteturas, obtendo um avanço na explicabilidade de modelos. Diversos experimentos foram conduzidos para avaliar o comportamento e a viabilidade da metodologia em conjuntos de dados reais, comparando os resultados com outros métodos de benchmark. Os resultados mostram que o método proposto apresenta desempenho, na maioria dos casos, melhor que os métodos comparados. A metodologia proposta foi capaz de gerar acurácias médias de 96,96% para um conjunto de dados, enquanto um modelo de rede neural convolucional criado manualmente apresentou 78,43%, uma abordagem de votação com centenas de modelos apresentou 69,06% e um sistema AutoML já existente apresentou 91,81% de acurácia.
publishDate 2020
dc.date.issued.fl_str_mv 2020-12-07
dc.date.accessioned.fl_str_mv 2021-04-07T20:45:11Z
dc.date.available.fl_str_mv 2021-04-07T20:45:11Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/35575
url http://hdl.handle.net/1843/35575
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by/3.0/pt/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/3.0/pt/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv UFMG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/35575/4/tese_habib_asseiss_neto_final.pdf
https://repositorio.ufmg.br/bitstream/1843/35575/5/license_rdf
https://repositorio.ufmg.br/bitstream/1843/35575/6/license.txt
bitstream.checksum.fl_str_mv 401d937fb89112fd41615b190a9c6bb9
f9944a358a0c32770bd9bed185bb5395
34badce4be7e31e3adb4575ae96af679
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1801676838645268480