N3O : a NEAT expansion for improving classification and feature selection applied to microarray data
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/215349 |
Resumo: | Microarranjos são uma das principais técnicas empregadas no estudo de expressão gênica, mas a identificação de padrões de expressão a partir de conjuntos de dados de microarranjo é um desafio significativo a se superar. Neste trabalho, além de revisar a aplicação de aprendizado de máquina nas tarefas de classificação de microarranjos e seleção de genes, uma nova técnica utilizando Neuroevolução, um campo do aprendizado de máquina que combina redes neurais e computação evolutiva, é proposta para simultaneamente classificar dados de microarranjo e automaticamente selecionar o subconjunto de genes mais relevantes. O algoritmo FS-NEAT foi adaptado através da adição de três novos operadores estruturais projetados para melhor explorar este espaço de busca de alta dimensionalidade. Um rigoroso protocolo de filtragem e preprocessamento foi empregado para selecionar conjuntos de dados de microarranjo de qualidade para os experimentos, selecionando 13 conjuntos de dados de três tipos diferentes de câncer (mama, colorretal e leucemia). Os resultados de diferentes experimentos mostram que o método proposto foi capaz de classificar amostras de microarranjos satisfatoriamente quando comparado com outras alternativas da literatura, incluindo FS-NEAT padrão e SVM, enquanto também encontrando subconjuntos de genes que podem ser generalizados para outros algoritmos e carregam informação biológica relevante. Esta abordagem detectou 177 genes capazes de diferenciar classes, dos quais 82 já foram associados aos seus respectivos tipos de câncer na literatura e 44 foram associados a outros tipos de câncer, tornando-se alvos em potencial a serem explorados como biomarcadores de câncer. |
id |
URGS_4875d74048cf34616ba653f34a05505b |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/215349 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Grisci, Bruno IochinsDorn, MárcioInostroza-Ponta, Mario2020-11-21T04:25:30Z2018http://hdl.handle.net/10183/215349001078230Microarranjos são uma das principais técnicas empregadas no estudo de expressão gênica, mas a identificação de padrões de expressão a partir de conjuntos de dados de microarranjo é um desafio significativo a se superar. Neste trabalho, além de revisar a aplicação de aprendizado de máquina nas tarefas de classificação de microarranjos e seleção de genes, uma nova técnica utilizando Neuroevolução, um campo do aprendizado de máquina que combina redes neurais e computação evolutiva, é proposta para simultaneamente classificar dados de microarranjo e automaticamente selecionar o subconjunto de genes mais relevantes. O algoritmo FS-NEAT foi adaptado através da adição de três novos operadores estruturais projetados para melhor explorar este espaço de busca de alta dimensionalidade. Um rigoroso protocolo de filtragem e preprocessamento foi empregado para selecionar conjuntos de dados de microarranjo de qualidade para os experimentos, selecionando 13 conjuntos de dados de três tipos diferentes de câncer (mama, colorretal e leucemia). Os resultados de diferentes experimentos mostram que o método proposto foi capaz de classificar amostras de microarranjos satisfatoriamente quando comparado com outras alternativas da literatura, incluindo FS-NEAT padrão e SVM, enquanto também encontrando subconjuntos de genes que podem ser generalizados para outros algoritmos e carregam informação biológica relevante. Esta abordagem detectou 177 genes capazes de diferenciar classes, dos quais 82 já foram associados aos seus respectivos tipos de câncer na literatura e 44 foram associados a outros tipos de câncer, tornando-se alvos em potencial a serem explorados como biomarcadores de câncer.Microarrays are one of the major techniques employed in the study of genes expression, but the identification of expression patterns from microarray datasets is a significant challenge to overcome. In this work, besides reviewing the application of machine learning in the tasks of microarray classification and gene selection, a new approach using Neuroevolution, a machine learning field that combines neural networks and evolutionary computation, is proposed for simultaneously classifying microarray data and autonomously selecting the subset of more relevant genes. The algorithm FS-NEAT was adapted by the addition of three new structural operators designed for better exploring this high dimensional space. A rigorous filtering and preprocessing protocol was also employed to select quality microarray datasets for the experiments, selecting 13 datasets from three different cancer types (breast, colorectal, and leukemia). The results from different experiments show that the proposed method was able to successfully classify microarray samples when compared with other alternatives in the literature, including regular FS-NEAT and SVM, while also finding subsets of genes that can be generalized for other algorithms and carry relevant biological information. This approach detected 177 genes capable of differing classes, 82 of them already being associated to their respective cancer types in the literature and 44 being associated to other types of cancer, becoming potential targets to be explored as cancer biomarkers.application/pdfengInteligência artificialAprendizado : máquinaMachine learningNeuroevolutionFeature selectionSupervised learningNEATMicroarrayGene expressioGene selectionN3O : a NEAT expansion for improving classification and feature selection applied to microarray dataN3O : uma expansão de NEAT para melhorar a classificação e seleção de caracteristicos aplicada a dados de microarranjo info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2018mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001078230.pdf.txt001078230.pdf.txtExtracted Texttext/plain431262http://www.lume.ufrgs.br/bitstream/10183/215349/2/001078230.pdf.txt4645395a7ba335a4f1d4a1fd1ddf66e5MD52ORIGINAL001078230.pdfTexto completo (inglês)application/pdf9379278http://www.lume.ufrgs.br/bitstream/10183/215349/1/001078230.pdf0e4e9acd602f9ddf18bbec21c4f8d9f5MD5110183/2153492020-11-22 05:14:10.391562oai:www.lume.ufrgs.br:10183/215349Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532020-11-22T07:14:10Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
N3O : a NEAT expansion for improving classification and feature selection applied to microarray data |
dc.title.alternative.pt.fl_str_mv |
N3O : uma expansão de NEAT para melhorar a classificação e seleção de caracteristicos aplicada a dados de microarranjo |
title |
N3O : a NEAT expansion for improving classification and feature selection applied to microarray data |
spellingShingle |
N3O : a NEAT expansion for improving classification and feature selection applied to microarray data Grisci, Bruno Iochins Inteligência artificial Aprendizado : máquina Machine learning Neuroevolution Feature selection Supervised learning NEAT Microarray Gene expressio Gene selection |
title_short |
N3O : a NEAT expansion for improving classification and feature selection applied to microarray data |
title_full |
N3O : a NEAT expansion for improving classification and feature selection applied to microarray data |
title_fullStr |
N3O : a NEAT expansion for improving classification and feature selection applied to microarray data |
title_full_unstemmed |
N3O : a NEAT expansion for improving classification and feature selection applied to microarray data |
title_sort |
N3O : a NEAT expansion for improving classification and feature selection applied to microarray data |
author |
Grisci, Bruno Iochins |
author_facet |
Grisci, Bruno Iochins |
author_role |
author |
dc.contributor.author.fl_str_mv |
Grisci, Bruno Iochins |
dc.contributor.advisor1.fl_str_mv |
Dorn, Márcio |
dc.contributor.advisor-co1.fl_str_mv |
Inostroza-Ponta, Mario |
contributor_str_mv |
Dorn, Márcio Inostroza-Ponta, Mario |
dc.subject.por.fl_str_mv |
Inteligência artificial Aprendizado : máquina |
topic |
Inteligência artificial Aprendizado : máquina Machine learning Neuroevolution Feature selection Supervised learning NEAT Microarray Gene expressio Gene selection |
dc.subject.eng.fl_str_mv |
Machine learning Neuroevolution Feature selection Supervised learning NEAT Microarray Gene expressio Gene selection |
description |
Microarranjos são uma das principais técnicas empregadas no estudo de expressão gênica, mas a identificação de padrões de expressão a partir de conjuntos de dados de microarranjo é um desafio significativo a se superar. Neste trabalho, além de revisar a aplicação de aprendizado de máquina nas tarefas de classificação de microarranjos e seleção de genes, uma nova técnica utilizando Neuroevolução, um campo do aprendizado de máquina que combina redes neurais e computação evolutiva, é proposta para simultaneamente classificar dados de microarranjo e automaticamente selecionar o subconjunto de genes mais relevantes. O algoritmo FS-NEAT foi adaptado através da adição de três novos operadores estruturais projetados para melhor explorar este espaço de busca de alta dimensionalidade. Um rigoroso protocolo de filtragem e preprocessamento foi empregado para selecionar conjuntos de dados de microarranjo de qualidade para os experimentos, selecionando 13 conjuntos de dados de três tipos diferentes de câncer (mama, colorretal e leucemia). Os resultados de diferentes experimentos mostram que o método proposto foi capaz de classificar amostras de microarranjos satisfatoriamente quando comparado com outras alternativas da literatura, incluindo FS-NEAT padrão e SVM, enquanto também encontrando subconjuntos de genes que podem ser generalizados para outros algoritmos e carregam informação biológica relevante. Esta abordagem detectou 177 genes capazes de diferenciar classes, dos quais 82 já foram associados aos seus respectivos tipos de câncer na literatura e 44 foram associados a outros tipos de câncer, tornando-se alvos em potencial a serem explorados como biomarcadores de câncer. |
publishDate |
2018 |
dc.date.issued.fl_str_mv |
2018 |
dc.date.accessioned.fl_str_mv |
2020-11-21T04:25:30Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/215349 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001078230 |
url |
http://hdl.handle.net/10183/215349 |
identifier_str_mv |
001078230 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/215349/2/001078230.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/215349/1/001078230.pdf |
bitstream.checksum.fl_str_mv |
4645395a7ba335a4f1d4a1fd1ddf66e5 0e4e9acd602f9ddf18bbec21c4f8d9f5 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1800309172736098304 |