Predição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquina

Detalhes bibliográficos
Autor(a) principal: Reis, Esther Camilo dos [UNESP]
Data de Publicação: 2015
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/142957
http://www.athena.biblioteca.unesp.br/exlibris/bd/cathedra/05-07-2016/000865635.pdf
Resumo: An important question raised after the first complete genome sequencing was: how many genes are essential for the cell life? Single deletion experiments carried out with the bacteria Escherichia coli unveiled that less than 10% of their genes are essential, which means that the inativation of each one leads to the total bacteria inviability. The network theory provides an abstract representation of a biological system, where a set of nodes are the biological components (protein, genes, metabolites, etc) and the set of edges are the interactions (protein-protein physical interactions, metabolic interactions, transcriptional regulational interactions, etc) that link each two biological components. The position of the biological components in a network indicates its importance for the maintenance of the biological system. In general, components located in central positions in a network are those key components for the system integrity. In this work, we decided to survey the position of the 90% genes considered not essential in integrated network of gene interactions (INGI) of the E. coli. Specifically, we investigated the conditionally essential genes, i. e. those genes essential under some type of stress. Moreover, we also investigated the network position of gene pairs that constitute aggravating genetic interaction, i. e. genes pairs that when deleted simultaneously aggravates the organism viability. Using a purely computational approach based on machine learning and topological properties of the INGI, we created preditive decision trees models to define how those conditionally essential genes and the aggravating genetic interaction are distributed in the INGI. A list with the probability of classification for each gene/interaction were obtained. The performance evaluation of our models demonstrates that this methodology can be applied with success in predicting conditionally essential genes. The prediction of genetic interactions also ...
id UNSP_3b6eacc805d4e9e98b840a6ca2a9841d
oai_identifier_str oai:repositorio.unesp.br:11449/142957
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Predição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquinaSistemas biologicosEscherichia coliAprendizado do computadorFenotipoPredição (Logica)An important question raised after the first complete genome sequencing was: how many genes are essential for the cell life? Single deletion experiments carried out with the bacteria Escherichia coli unveiled that less than 10% of their genes are essential, which means that the inativation of each one leads to the total bacteria inviability. The network theory provides an abstract representation of a biological system, where a set of nodes are the biological components (protein, genes, metabolites, etc) and the set of edges are the interactions (protein-protein physical interactions, metabolic interactions, transcriptional regulational interactions, etc) that link each two biological components. The position of the biological components in a network indicates its importance for the maintenance of the biological system. In general, components located in central positions in a network are those key components for the system integrity. In this work, we decided to survey the position of the 90% genes considered not essential in integrated network of gene interactions (INGI) of the E. coli. Specifically, we investigated the conditionally essential genes, i. e. those genes essential under some type of stress. Moreover, we also investigated the network position of gene pairs that constitute aggravating genetic interaction, i. e. genes pairs that when deleted simultaneously aggravates the organism viability. Using a purely computational approach based on machine learning and topological properties of the INGI, we created preditive decision trees models to define how those conditionally essential genes and the aggravating genetic interaction are distributed in the INGI. A list with the probability of classification for each gene/interaction were obtained. The performance evaluation of our models demonstrates that this methodology can be applied with success in predicting conditionally essential genes. The prediction of genetic interactions also ...Uma importante questão levantada logo após o primeiro sequenciamento completo do genoma de um organismo foi: quantos genes são essenciais para a vida celular? Experimentos de deleção individual realizados com a bactéria Escherichia coli revelaram que menos de 10% dos seus genes apresentam essa condição, ou seja, a inativação de cada um deles leva a total inviabilidade da bactéria. A teoria de redes fornece uma representação abstrata de um sistema biológico, onde o conjunto de nodos são os componentes biológicos (proteínas, genes, metabólitos, etc) e o conjunto de arestas são as interações de natureza biológica (interação física entre proteínas, interações metabólicas, interações de regulação transcricional, etc) que conectam cada dois componentes biológicos. A posição dos componentes biológicos em uma rede indica sua importância para a manutenção do sistema biológico. De forma geral, componentes localizados em posições centrais em uma rede biológica são aqueles componentes chaves para a integridade do sistema. Neste trabalho, decidimos investigar a posição dos restantes 90% dos genes considerados não-essenciais na rede integrada de interações gênicas (RIG) de E. coli. Especificamente, investigamos os genes condicionalmente essenciais, isto é, genes que são essenciais somente em determinadas condições de estresse. Além disso, investigamos também a posição na rede de pares de genes que constituem interações genéticas agravantes, isto é, pares de genes que quando deletados conjuntamente agravam a viabilidade do organismo. Utilizando uma abordagem puramente computacional baseada em aprendizado de máquina e propriedades topológicas da RIG, nós criamos modelos preditivos de árvores de decisão para definirmos como esses genes condicionalmente essenciais e as interações genéticas agravantes estão distribuídas na RIG. Ainda, uma lista com as probabilidades de classificação de cada...Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)Universidade Estadual Paulista (Unesp)Lemke, Ney [UNESP]Acencio, Marcio Luis [UNESP]Universidade Estadual Paulista (Unesp)Reis, Esther Camilo dos [UNESP]2016-08-12T18:48:37Z2016-08-12T18:48:37Z2015-01-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis108 f.application/pdfREIS, Esther Camilo dos. Predição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquina. 2015. 108 f. Tese (doutorado) - Universidade Estadual Paulista Júlio de Mesquita Filho, Instituto de Biociências de Botucatu, 2015.http://hdl.handle.net/11449/142957000865635http://www.athena.biblioteca.unesp.br/exlibris/bd/cathedra/05-07-2016/000865635.pdf33004064026P97977035910952141Alephreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESPporinfo:eu-repo/semantics/openAccess2023-11-01T06:09:13Zoai:repositorio.unesp.br:11449/142957Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T16:35:30.217601Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Predição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquina
title Predição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquina
spellingShingle Predição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquina
Reis, Esther Camilo dos [UNESP]
Sistemas biologicos
Escherichia coli
Aprendizado do computador
Fenotipo
Predição (Logica)
title_short Predição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquina
title_full Predição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquina
title_fullStr Predição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquina
title_full_unstemmed Predição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquina
title_sort Predição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquina
author Reis, Esther Camilo dos [UNESP]
author_facet Reis, Esther Camilo dos [UNESP]
author_role author
dc.contributor.none.fl_str_mv Lemke, Ney [UNESP]
Acencio, Marcio Luis [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Reis, Esther Camilo dos [UNESP]
dc.subject.por.fl_str_mv Sistemas biologicos
Escherichia coli
Aprendizado do computador
Fenotipo
Predição (Logica)
topic Sistemas biologicos
Escherichia coli
Aprendizado do computador
Fenotipo
Predição (Logica)
description An important question raised after the first complete genome sequencing was: how many genes are essential for the cell life? Single deletion experiments carried out with the bacteria Escherichia coli unveiled that less than 10% of their genes are essential, which means that the inativation of each one leads to the total bacteria inviability. The network theory provides an abstract representation of a biological system, where a set of nodes are the biological components (protein, genes, metabolites, etc) and the set of edges are the interactions (protein-protein physical interactions, metabolic interactions, transcriptional regulational interactions, etc) that link each two biological components. The position of the biological components in a network indicates its importance for the maintenance of the biological system. In general, components located in central positions in a network are those key components for the system integrity. In this work, we decided to survey the position of the 90% genes considered not essential in integrated network of gene interactions (INGI) of the E. coli. Specifically, we investigated the conditionally essential genes, i. e. those genes essential under some type of stress. Moreover, we also investigated the network position of gene pairs that constitute aggravating genetic interaction, i. e. genes pairs that when deleted simultaneously aggravates the organism viability. Using a purely computational approach based on machine learning and topological properties of the INGI, we created preditive decision trees models to define how those conditionally essential genes and the aggravating genetic interaction are distributed in the INGI. A list with the probability of classification for each gene/interaction were obtained. The performance evaluation of our models demonstrates that this methodology can be applied with success in predicting conditionally essential genes. The prediction of genetic interactions also ...
publishDate 2015
dc.date.none.fl_str_mv 2015-01-23
2016-08-12T18:48:37Z
2016-08-12T18:48:37Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv REIS, Esther Camilo dos. Predição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquina. 2015. 108 f. Tese (doutorado) - Universidade Estadual Paulista Júlio de Mesquita Filho, Instituto de Biociências de Botucatu, 2015.
http://hdl.handle.net/11449/142957
000865635
http://www.athena.biblioteca.unesp.br/exlibris/bd/cathedra/05-07-2016/000865635.pdf
33004064026P9
7977035910952141
identifier_str_mv REIS, Esther Camilo dos. Predição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquina. 2015. 108 f. Tese (doutorado) - Universidade Estadual Paulista Júlio de Mesquita Filho, Instituto de Biociências de Botucatu, 2015.
000865635
33004064026P9
7977035910952141
url http://hdl.handle.net/11449/142957
http://www.athena.biblioteca.unesp.br/exlibris/bd/cathedra/05-07-2016/000865635.pdf
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 108 f.
application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv Aleph
reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808128675908943872