Combination of topological indices in network analysis: a computational approach

Detalhes bibliográficos
Autor(a) principal: Gouveia, Catarina Gomes Lisboa Marcelo
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/40165
Resumo: Tese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2019
id RCAP_afac6b00c27f49f0f80cb61a4f3f5ca4
oai_identifier_str oai:repositorio.ul.pt:10451/40165
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Combination of topological indices in network analysis: a computational approachBiologia de SistemasModelaçãoAnálise de RedesAnálise DinâmicaAprendizagem AutomáticaTeses de mestrado - 2019Departamento de Biologia AnimalTese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2019Ecosystems, and particularly, food webs have been subject of many studies in the last years. This is a hot topic if we consider the anthropogenic pressures and modifications that are increasingly prominent and notorious nowadays. Theoretical biologists try to figure out, in predictive analyses, how ecosystems will react if a species suddenly disappears. These analyses are often supported by a variety of different mathematical tools. Different mathematical tools are intended to give different biological answers. In fact, food webs are usually complex relationships of interactions and thus, it is very common, in any systems ecology work, to simplify these interactions. A common way to do it is to reduce the system under focus to a network form. In network representation, we usually have entities connected by links. These links can be weighted, directed, looped, and thus, allow us to add some detail to the analysis. In biology, a food web can also be depicted as a network: species or groups of species are depicted as entities and their trophic interactions are depicted as links. In general network analysis, there are a myriad of different centrality indices. Centrality indices allow us to identify the critical nodes in a network. In ecology these indices are also used and have been suggested to identify key organisms and to quantify their importance in food webs. All of these indices provide some information related to the centrality of a node in a network, but each of them is different. They express different aspects of being in the centre. Their relationships and also their biological meanings are often unclear. Another common way to evaluate the importance of a species to the food web is through dynamical simulations of system behaviour. We can test, based in mathematical expressions such as logistic models, how the whole system will behave, i.e., how all the species will react if we take one species almost to its extinction. This dissertation will analyse the correlation between centrality indices and the outcome of dynamical simulations, namely, community responses. The assumption is that the disturbance of more central species will generate larger community responses in the system. The goal is to understand if centrality indices are good enough to make predictions (closer to the ones we can get performing community response simulations). It is a major challenge to use simpler structural indicators to predict the outcome of much more complicated simulations. We approach these goals by using machine learning techniques to combine k centrality indices out of n in such a way that the correlation between the structural node centrality rank and the simulated node importance rank is the strongest. We ask which centrality indices should be chosen and how exactly they should be combined to best predict simulated food web dynamics. We also evaluate to what extent these correlations can be improved.Muitos sistemas biológicos têm visto um grande declínio desde que o ser humano entrou em cena há muitos milhares de anos. Estes sistemas têm sofrido particulares perturbações com o aumento da população mundial e o estilo de vida moderno. Vários ecossistemas têm sido atacados com a constante destruição de habitats, pesca excessiva ou aumento de poluição, que leva, inevitavelmente à decadência e extinção de muitas espécies e ecossistemas. De modo a tentar compreender como os ecossistemas funcionam, quais as interações entre os organismos e os sistemas abióticos que os circundam, tem-se tentado reduzir tais sistemas, geralmente complexos e intrincados, a simplificações que podem ser avaliadas de modo mais objetivo. Desta forma, a modelação de sistemas ecológicos é cada vez mais utilizada para perceber como as espécies se encontram interligadas nos seus habitats. Reduzir sistemas complexos a representações matemáticas como redes permite-nos quantificar as partes dentro do todo. Um exemplo desta modelação biológica consiste em reduzir cadeias alimentares complexas a redes simples, representadas por nós (ou vértices) ligados por arcos (ou arestas) – grafos. Neste tipo de representação é possível adicionar algum nível de detalhe como, por exemplo, pesos, direções ou ciclos. Esta simplificação constitui uma ferramenta importante para se estudar interações topológicas e dinâmicas em sistemas biológicos. A modelação ecológica tem por base noções matemáticas. Neste caso, utilizaram-se conceitos derivados do estudo de grafos. Através destes conceitos é possível simular o comportamento de sistemas através de simulações e análises computacionais quantitativas. As redes ou teias alimentares são simplificações usadas para representar interações tróficas entre organismos. As relações presa-predador permitem-nos entender a dinâmica e a resiliência das comunidades: interações alimentares dão-nos noções sobre taxas de vitalidade, de crescimento e de mortalidade. Por exemplo, se a população sob análise tem mais presas à sua disposição, terá tendência a crescer; no entanto, se a mesma população tiver de confrontar um grande número de predadores, provavelmente irá decair, visto que mais indivíduos serão ingeridos. A aplicação de estatística de redes, importada de áreas como a matemática, física e informática, a estas representações biológicas, permite-nos avaliar os ecossistemas. Existe uma miríade de índices de centralidade (ou índices topológicos) utilizados. Em ecologia, estes índices têm sido usados e sugeridos como métodos de identificação de organismos chave de modo a quantificar a sua importância em cadeias alimentares ou ecossistemas. Estes índices dão alguma informação sobre a centralidade de um nó na rede. No entanto, cada um é diferente – expressam aspetos diferentes de centralidade – e, quando aplicados a sistemas biológicos, podem representar também diferentes significados. Espécies classificadas como mais importantes terão, de um ponto de vista de uma ecologia mais funcional, uma maior importância de conservação. Isto acontece porque, se essa população sofrer níveis críticos de extinção, ou se for completamente extinta do(s) ecossistema(s), pode levar a perturbações em cascata, isto é, provocar a extinção de muitas outras espécies – direta ou indiretamente dependentes – ou até, em casos mais drásticos, o desaparecimento de toda a comunidade em que se inserem. No entanto, a aplicação destes índices para expressar relações biológicas e o seu significado ainda é pouco claro. Para além disto, estes índices permitem avaliar redes biológicas, de um modo teórico, a diferentes escalas. Índices topológicos globais, usados também em outras áreas de análise de grafos, permitem avaliar as redes como um todo. No entanto, estes índices oferecem menos detalhe no que toca a como cada indivíduo se interliga com os restantes nessa rede. A perspetiva local, do outro lado da escala, permite-nos entender melhor como cada indivíduo está conectado na rede. O problema é que, de uma perspetiva local, não temos compreensão sobre interações mais afastadas na rede, ou seja, sobre efeitos diretos ou indiretos que um indivíduo pode estar a causar aos outros indivíduos. Devido a isso, uma variedade de diferentes índices de escala intermédia têm surgido e sido utilizados. Estes, procuram acrescentar algumas dessas informações previamente ausentes – permitem analisar a posição topológica de cada espécie, mas com alguma perspetiva sobre os impactos diretos e ou indiretos que essa espécie tem no resto da comunidade. A representação simplificada destes sistemas pode ser vantajosa, em termos de análises teóricas mais objetivas. No entanto, utilizar índices estáticos – como é o caso dos índices topológicos – para avaliar sistemas que se encontram em constante mudança, pode ser falacioso: a vida não é estática e muito menos as complexas redes de interação entre espécies. Todas as espécies têm a sua taxa de crescimento, mortalidade e vitalidade, diferentes ciclos de reprodução, e, geralmente dependem de outras espécies para a sua sobrevivência. Para além disso, estas taxas variam ao longo do ciclo de vida de cada espécie. Deste modo, para entender como o tempo e as flutuações topológicas afetam as populações, outros tipos de análises matemáticas podem ser realizados. Estas análises, intituladas de análises dinâmicas (ou simulações), são frequentemente descritas por sistemas ordinários de equações diferenciais, que têm em conta diferentes parâmetros populacionais, adequados a cada espécie. No entanto, bancos de dados com informações relativas ao histórico de vida, informações demográficas e de interação de espécies, necessárias para parametrizar modelos de redes ecológicas raramente estão disponíveis, devido à sua grande complexidade de recolha, quer em termos de esforço quer em termos de escalas temporais – é difícil recolher dados relativamente a cada uma das espécies dentro das comunidades, durante todo o seu ciclo de vida (visto que pode ser um período relativamente extenso). Por este motivo, análises dinâmicas são muitas vezes preteridas relativamente a análises estáticas. Neste trabalho, pretendeu-se investigar, através da análise de clusters e correlações, quais as semelhanças entre alguns dos índices topológicos disponíveis e utilizados em modelação ecológica. Também se analisou como podemos utilizar estes índices, de maneira individual ou combinada, para prever quais são as espécies-chave (ou espécies críticas) numa rede alimentar. Utilizou-se, para isso, um algoritmo genético com regressão simbólica, e, como elemento alvo para esta comparação, uma simulação dinâmica. A simulação dinâmica usada tenta prever a resposta das espécies de uma comunidade quando uma delas é perturbada – simulação de resposta da comunidade. Para o uso desta simulação como “alvo”, partiu-se do pressuposto que esta seria a maneira mais correta de avaliar a importância de cada espécie dentro da rede. Devido à escassez de informação relativa a teias alimentares reais, utilizaram-se 1000 cadeias alimentares hipotéticas, constituídas por 15 espécies, 3 espécies basais e 4 espécies predadoras de topo. Os resultados obtidos fornecem novas maneiras de avaliar a ordem de importância de cada espécie, de acordo com simulações biológicas complexas. Podemos usar índices estruturais (topológicos) simples ou algumas combinações desses índices, variando dos mais simples aos mais complexos. Também foi percetível que o grau (D) e o índice de importância topológica ponderada de 5 etapas (WI5) foram os que mais emergiram nas combinações de índices obtidas. Estes resultados são interessantes se considerarmos que o grau é um índice simples, baseado em interações diretas. O índice de importância topológica ponderada de 5 etapas, por sua vez, é um índice mais complexo, ponderado, e que considera, também, interações indiretas. Além disso, descobrimos que este índice está simetricamente correlacionado com os resultados da simulação, contrariamente ao grau, que não se encontra correlacionado. São índices totalmente diferentes e, por isso, é interessante e conveniente combiná-los: permitem informações complementares e adequadas. Acreditamos que maneiras mais concisas e eficientes de identificar espécies-chave em redes ecológicas serão essenciais para o futuro da ecologia de sistemas que visa alcançar prioridades ou regulamentos objetivos de conservação e gestão de ecossistemas. A nossa abordagem, baseada na maximização do poder preditivo de análises estruturais, pode ser um grande passo em direção a pesquisas e análises rápidas e simples, mas bastante realistas sobre redes alimentares e espécies-chave nos ecossistemas.Jordán, FerencPinto, FranciscoRepositório da Universidade de LisboaGouveia, Catarina Gomes Lisboa Marcelo2019-11-18T16:40:06Z201920192019-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/40165TID:202374378enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:39:20Zoai:repositorio.ul.pt:10451/40165Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:53:53.895202Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Combination of topological indices in network analysis: a computational approach
title Combination of topological indices in network analysis: a computational approach
spellingShingle Combination of topological indices in network analysis: a computational approach
Gouveia, Catarina Gomes Lisboa Marcelo
Biologia de Sistemas
Modelação
Análise de Redes
Análise Dinâmica
Aprendizagem Automática
Teses de mestrado - 2019
Departamento de Biologia Animal
title_short Combination of topological indices in network analysis: a computational approach
title_full Combination of topological indices in network analysis: a computational approach
title_fullStr Combination of topological indices in network analysis: a computational approach
title_full_unstemmed Combination of topological indices in network analysis: a computational approach
title_sort Combination of topological indices in network analysis: a computational approach
author Gouveia, Catarina Gomes Lisboa Marcelo
author_facet Gouveia, Catarina Gomes Lisboa Marcelo
author_role author
dc.contributor.none.fl_str_mv Jordán, Ferenc
Pinto, Francisco
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Gouveia, Catarina Gomes Lisboa Marcelo
dc.subject.por.fl_str_mv Biologia de Sistemas
Modelação
Análise de Redes
Análise Dinâmica
Aprendizagem Automática
Teses de mestrado - 2019
Departamento de Biologia Animal
topic Biologia de Sistemas
Modelação
Análise de Redes
Análise Dinâmica
Aprendizagem Automática
Teses de mestrado - 2019
Departamento de Biologia Animal
description Tese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2019
publishDate 2019
dc.date.none.fl_str_mv 2019-11-18T16:40:06Z
2019
2019
2019-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/40165
TID:202374378
url http://hdl.handle.net/10451/40165
identifier_str_mv TID:202374378
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134478144110592