N3O : a NEAT expansion for improving classification and feature selection applied to microarray data

Detalhes bibliográficos
Autor(a) principal: Grisci, Bruno Iochins
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/215349
Resumo: Microarranjos são uma das principais técnicas empregadas no estudo de expressão gênica, mas a identificação de padrões de expressão a partir de conjuntos de dados de microarranjo é um desafio significativo a se superar. Neste trabalho, além de revisar a aplicação de aprendizado de máquina nas tarefas de classificação de microarranjos e seleção de genes, uma nova técnica utilizando Neuroevolução, um campo do aprendizado de máquina que combina redes neurais e computação evolutiva, é proposta para simultaneamente classificar dados de microarranjo e automaticamente selecionar o subconjunto de genes mais relevantes. O algoritmo FS-NEAT foi adaptado através da adição de três novos operadores estruturais projetados para melhor explorar este espaço de busca de alta dimensionalidade. Um rigoroso protocolo de filtragem e preprocessamento foi empregado para selecionar conjuntos de dados de microarranjo de qualidade para os experimentos, selecionando 13 conjuntos de dados de três tipos diferentes de câncer (mama, colorretal e leucemia). Os resultados de diferentes experimentos mostram que o método proposto foi capaz de classificar amostras de microarranjos satisfatoriamente quando comparado com outras alternativas da literatura, incluindo FS-NEAT padrão e SVM, enquanto também encontrando subconjuntos de genes que podem ser generalizados para outros algoritmos e carregam informação biológica relevante. Esta abordagem detectou 177 genes capazes de diferenciar classes, dos quais 82 já foram associados aos seus respectivos tipos de câncer na literatura e 44 foram associados a outros tipos de câncer, tornando-se alvos em potencial a serem explorados como biomarcadores de câncer.
id URGS_4875d74048cf34616ba653f34a05505b
oai_identifier_str oai:www.lume.ufrgs.br:10183/215349
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Grisci, Bruno IochinsDorn, MárcioInostroza-Ponta, Mario2020-11-21T04:25:30Z2018http://hdl.handle.net/10183/215349001078230Microarranjos são uma das principais técnicas empregadas no estudo de expressão gênica, mas a identificação de padrões de expressão a partir de conjuntos de dados de microarranjo é um desafio significativo a se superar. Neste trabalho, além de revisar a aplicação de aprendizado de máquina nas tarefas de classificação de microarranjos e seleção de genes, uma nova técnica utilizando Neuroevolução, um campo do aprendizado de máquina que combina redes neurais e computação evolutiva, é proposta para simultaneamente classificar dados de microarranjo e automaticamente selecionar o subconjunto de genes mais relevantes. O algoritmo FS-NEAT foi adaptado através da adição de três novos operadores estruturais projetados para melhor explorar este espaço de busca de alta dimensionalidade. Um rigoroso protocolo de filtragem e preprocessamento foi empregado para selecionar conjuntos de dados de microarranjo de qualidade para os experimentos, selecionando 13 conjuntos de dados de três tipos diferentes de câncer (mama, colorretal e leucemia). Os resultados de diferentes experimentos mostram que o método proposto foi capaz de classificar amostras de microarranjos satisfatoriamente quando comparado com outras alternativas da literatura, incluindo FS-NEAT padrão e SVM, enquanto também encontrando subconjuntos de genes que podem ser generalizados para outros algoritmos e carregam informação biológica relevante. Esta abordagem detectou 177 genes capazes de diferenciar classes, dos quais 82 já foram associados aos seus respectivos tipos de câncer na literatura e 44 foram associados a outros tipos de câncer, tornando-se alvos em potencial a serem explorados como biomarcadores de câncer.Microarrays are one of the major techniques employed in the study of genes expression, but the identification of expression patterns from microarray datasets is a significant challenge to overcome. In this work, besides reviewing the application of machine learning in the tasks of microarray classification and gene selection, a new approach using Neuroevolution, a machine learning field that combines neural networks and evolutionary computation, is proposed for simultaneously classifying microarray data and autonomously selecting the subset of more relevant genes. The algorithm FS-NEAT was adapted by the addition of three new structural operators designed for better exploring this high dimensional space. A rigorous filtering and preprocessing protocol was also employed to select quality microarray datasets for the experiments, selecting 13 datasets from three different cancer types (breast, colorectal, and leukemia). The results from different experiments show that the proposed method was able to successfully classify microarray samples when compared with other alternatives in the literature, including regular FS-NEAT and SVM, while also finding subsets of genes that can be generalized for other algorithms and carry relevant biological information. This approach detected 177 genes capable of differing classes, 82 of them already being associated to their respective cancer types in the literature and 44 being associated to other types of cancer, becoming potential targets to be explored as cancer biomarkers.application/pdfengInteligência artificialAprendizado : máquinaMachine learningNeuroevolutionFeature selectionSupervised learningNEATMicroarrayGene expressioGene selectionN3O : a NEAT expansion for improving classification and feature selection applied to microarray dataN3O : uma expansão de NEAT para melhorar a classificação e seleção de caracteristicos aplicada a dados de microarranjo info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2018mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001078230.pdf.txt001078230.pdf.txtExtracted Texttext/plain431262http://www.lume.ufrgs.br/bitstream/10183/215349/2/001078230.pdf.txt4645395a7ba335a4f1d4a1fd1ddf66e5MD52ORIGINAL001078230.pdfTexto completo (inglês)application/pdf9379278http://www.lume.ufrgs.br/bitstream/10183/215349/1/001078230.pdf0e4e9acd602f9ddf18bbec21c4f8d9f5MD5110183/2153492020-11-22 05:14:10.391562oai:www.lume.ufrgs.br:10183/215349Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532020-11-22T07:14:10Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv N3O : a NEAT expansion for improving classification and feature selection applied to microarray data
dc.title.alternative.pt.fl_str_mv N3O : uma expansão de NEAT para melhorar a classificação e seleção de caracteristicos aplicada a dados de microarranjo
title N3O : a NEAT expansion for improving classification and feature selection applied to microarray data
spellingShingle N3O : a NEAT expansion for improving classification and feature selection applied to microarray data
Grisci, Bruno Iochins
Inteligência artificial
Aprendizado : máquina
Machine learning
Neuroevolution
Feature selection
Supervised learning
NEAT
Microarray
Gene expressio
Gene selection
title_short N3O : a NEAT expansion for improving classification and feature selection applied to microarray data
title_full N3O : a NEAT expansion for improving classification and feature selection applied to microarray data
title_fullStr N3O : a NEAT expansion for improving classification and feature selection applied to microarray data
title_full_unstemmed N3O : a NEAT expansion for improving classification and feature selection applied to microarray data
title_sort N3O : a NEAT expansion for improving classification and feature selection applied to microarray data
author Grisci, Bruno Iochins
author_facet Grisci, Bruno Iochins
author_role author
dc.contributor.author.fl_str_mv Grisci, Bruno Iochins
dc.contributor.advisor1.fl_str_mv Dorn, Márcio
dc.contributor.advisor-co1.fl_str_mv Inostroza-Ponta, Mario
contributor_str_mv Dorn, Márcio
Inostroza-Ponta, Mario
dc.subject.por.fl_str_mv Inteligência artificial
Aprendizado : máquina
topic Inteligência artificial
Aprendizado : máquina
Machine learning
Neuroevolution
Feature selection
Supervised learning
NEAT
Microarray
Gene expressio
Gene selection
dc.subject.eng.fl_str_mv Machine learning
Neuroevolution
Feature selection
Supervised learning
NEAT
Microarray
Gene expressio
Gene selection
description Microarranjos são uma das principais técnicas empregadas no estudo de expressão gênica, mas a identificação de padrões de expressão a partir de conjuntos de dados de microarranjo é um desafio significativo a se superar. Neste trabalho, além de revisar a aplicação de aprendizado de máquina nas tarefas de classificação de microarranjos e seleção de genes, uma nova técnica utilizando Neuroevolução, um campo do aprendizado de máquina que combina redes neurais e computação evolutiva, é proposta para simultaneamente classificar dados de microarranjo e automaticamente selecionar o subconjunto de genes mais relevantes. O algoritmo FS-NEAT foi adaptado através da adição de três novos operadores estruturais projetados para melhor explorar este espaço de busca de alta dimensionalidade. Um rigoroso protocolo de filtragem e preprocessamento foi empregado para selecionar conjuntos de dados de microarranjo de qualidade para os experimentos, selecionando 13 conjuntos de dados de três tipos diferentes de câncer (mama, colorretal e leucemia). Os resultados de diferentes experimentos mostram que o método proposto foi capaz de classificar amostras de microarranjos satisfatoriamente quando comparado com outras alternativas da literatura, incluindo FS-NEAT padrão e SVM, enquanto também encontrando subconjuntos de genes que podem ser generalizados para outros algoritmos e carregam informação biológica relevante. Esta abordagem detectou 177 genes capazes de diferenciar classes, dos quais 82 já foram associados aos seus respectivos tipos de câncer na literatura e 44 foram associados a outros tipos de câncer, tornando-se alvos em potencial a serem explorados como biomarcadores de câncer.
publishDate 2018
dc.date.issued.fl_str_mv 2018
dc.date.accessioned.fl_str_mv 2020-11-21T04:25:30Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/215349
dc.identifier.nrb.pt_BR.fl_str_mv 001078230
url http://hdl.handle.net/10183/215349
identifier_str_mv 001078230
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/215349/2/001078230.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/215349/1/001078230.pdf
bitstream.checksum.fl_str_mv 4645395a7ba335a4f1d4a1fd1ddf66e5
0e4e9acd602f9ddf18bbec21c4f8d9f5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1800309172736098304