Testes estatísticos semi paramétricos para discriminação de grafos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113249/ |
Resumo: | Grafos são utilizados para modelar redes em diversos campos cientíticos. Ao longo dos anos, o interesse em modelar redes do mundo real vem crescendo, com aplicações em diferentes áreas, como biologia molecular (redes genéticas regulatórias, redes de interação proteína- proteína), neurociência (rede funcional cerebral)e ciências sociais (redes sociais como facebook, instagram, foursquare). As redes do mundo real não podem ser modeladas por grafos determinístico adequadamente, pois tais grafos não apresentam componente aleatório dese- jável nestas situações. Além disso, algoritmos tradicionais e abordagem clássicas para grafos apresentam dificuldades e limitações que prejudicam tais análises. Com isso, grafos aleatórios são mais indicados para modelar as redes do mundo real e procedimentos estatísticos precisam ser formalizados com o intuito de facilitar a análise de dados destes grafos, como por exemplo: como comparar dois grafos reais? Uma abordagem tradicional seria verificar o isomorfismo entre gráficos, no entanto, tal abordagem apresenta alguns problemas, como, por exemplo, o custo computacional é alto (não existe algoritmo polinomial) e não considera a flutuação intrínseca presente em processos que modelam eventos do mundo real. Portanto, uma solução é considerar que os grafos reais são gerados por por processos probabilísti- cos (modelo de grafo aleatório) e testar se os grafos foram gerados pelo mesmo modelo e conjunto de parâmetros. Neste trabalho revisaremos os modelos de grafos aleatórios e suas aplicações na modelagem de redes do mundo real, bem como a teoria espectral para grafos e diversos resultados, medidas derivadas do seu estudo e trabalhos recentes que utilizam métodos baseados em medidas espectrais para seleção do modelo em conjuntos de grafos. Finalmente, introduzimos abordagens paramétricas para testar a igualdade entre dois ou mais grafos aleatórios desde que sejam grandes o suficiente. Primeiro é proposto uma generalização de teste de razão de verossimilhança (likelihood ratio test - LRT), a seguir o teste t (t student) é generalizado para grafos e finalmente, a análise de variância (ANOVA) é desenvolvida para testar a igualdade de dois ou mais grafos. Os testes desenvolvidos utilizam medidas baseadas no espectro do grafo, como a entropia espectral e a divergência de Kullback-Leibler no estimador dos parâmetros do modelo. Para estimar a variância, é usado um bootstrap paramétrico. O poder do teste é ilustrado com uso de curvas ROC e a i ii utilidade do método é demonstrada através de sua aplicação na comparação de redes reais de interação proteína-proteína em seis espécies. |
id |
USP_2d6f660f656fcae7910755a5c59d4eb2 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-20230727-113249 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Testes estatísticos semi paramétricos para discriminação de grafosA semi parametrical statistics test to discriminate graphsGrafos AleatóriosTestes De HipótesesGrafos são utilizados para modelar redes em diversos campos cientíticos. Ao longo dos anos, o interesse em modelar redes do mundo real vem crescendo, com aplicações em diferentes áreas, como biologia molecular (redes genéticas regulatórias, redes de interação proteína- proteína), neurociência (rede funcional cerebral)e ciências sociais (redes sociais como facebook, instagram, foursquare). As redes do mundo real não podem ser modeladas por grafos determinístico adequadamente, pois tais grafos não apresentam componente aleatório dese- jável nestas situações. Além disso, algoritmos tradicionais e abordagem clássicas para grafos apresentam dificuldades e limitações que prejudicam tais análises. Com isso, grafos aleatórios são mais indicados para modelar as redes do mundo real e procedimentos estatísticos precisam ser formalizados com o intuito de facilitar a análise de dados destes grafos, como por exemplo: como comparar dois grafos reais? Uma abordagem tradicional seria verificar o isomorfismo entre gráficos, no entanto, tal abordagem apresenta alguns problemas, como, por exemplo, o custo computacional é alto (não existe algoritmo polinomial) e não considera a flutuação intrínseca presente em processos que modelam eventos do mundo real. Portanto, uma solução é considerar que os grafos reais são gerados por por processos probabilísti- cos (modelo de grafo aleatório) e testar se os grafos foram gerados pelo mesmo modelo e conjunto de parâmetros. Neste trabalho revisaremos os modelos de grafos aleatórios e suas aplicações na modelagem de redes do mundo real, bem como a teoria espectral para grafos e diversos resultados, medidas derivadas do seu estudo e trabalhos recentes que utilizam métodos baseados em medidas espectrais para seleção do modelo em conjuntos de grafos. Finalmente, introduzimos abordagens paramétricas para testar a igualdade entre dois ou mais grafos aleatórios desde que sejam grandes o suficiente. Primeiro é proposto uma generalização de teste de razão de verossimilhança (likelihood ratio test - LRT), a seguir o teste t (t student) é generalizado para grafos e finalmente, a análise de variância (ANOVA) é desenvolvida para testar a igualdade de dois ou mais grafos. Os testes desenvolvidos utilizam medidas baseadas no espectro do grafo, como a entropia espectral e a divergência de Kullback-Leibler no estimador dos parâmetros do modelo. Para estimar a variância, é usado um bootstrap paramétrico. O poder do teste é ilustrado com uso de curvas ROC e a i ii utilidade do método é demonstrada através de sua aplicação na comparação de redes reais de interação proteína-proteína em seis espécies.Graphs are used to model networks in various scientific fields. The interest to model real world data as graphs (networks) is increasing over the years. Several examples can be found with applications in different areas such as molecular biology (gene regulatory networks, protein-protein interaction networks), neuroscience (functional brain networks), and social science (social networks like facebook, instagram, foursquare). Different of deterministic graphs, real world graphs present a random component, which makes their analysis difficult by traditional computer science algorithms. In addition, traditional algorithms and classical approach to graphs present difficulties and limitations that undermine such analysis. Clas- sical approaches do not handle intrinsic randomness. Thus, formal statistical procedures for graphs become necessary. Therefore, random graphs are better suited to model real world networks. In this context, one simple question is: how to compare two (or more) real graphs? A traditional solution would be to verify the isomorphism. However, this approach presents at least two problems: (i) there is no polynomial algorithm to verify isomorphism between graphs|and (ii) it does not take into account the intrinsic fluctuation present in real world graphs. Therefore, one solution is to imagine that these natural graphs are generated by random processes (models) and test if the graphs are generated by the same model and set of parameters. We present a solution for this problem by proposing generalizations of a likelihood ratio test, a t-test, and an analysis of variance for graphs. We demonstrate their performance in Monte Carlo simulations and illustrate their application in protein-protein interaction networks.Biblioteca Digitais de Teses e Dissertações da USPFujita, AndréSoares, Gabriela Eleuterio2018-04-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113249/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-07-27T19:12:04Zoai:teses.usp.br:tde-20230727-113249Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-07-27T19:12:04Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Testes estatísticos semi paramétricos para discriminação de grafos A semi parametrical statistics test to discriminate graphs |
title |
Testes estatísticos semi paramétricos para discriminação de grafos |
spellingShingle |
Testes estatísticos semi paramétricos para discriminação de grafos Soares, Gabriela Eleuterio Grafos Aleatórios Testes De Hipóteses |
title_short |
Testes estatísticos semi paramétricos para discriminação de grafos |
title_full |
Testes estatísticos semi paramétricos para discriminação de grafos |
title_fullStr |
Testes estatísticos semi paramétricos para discriminação de grafos |
title_full_unstemmed |
Testes estatísticos semi paramétricos para discriminação de grafos |
title_sort |
Testes estatísticos semi paramétricos para discriminação de grafos |
author |
Soares, Gabriela Eleuterio |
author_facet |
Soares, Gabriela Eleuterio |
author_role |
author |
dc.contributor.none.fl_str_mv |
Fujita, André |
dc.contributor.author.fl_str_mv |
Soares, Gabriela Eleuterio |
dc.subject.por.fl_str_mv |
Grafos Aleatórios Testes De Hipóteses |
topic |
Grafos Aleatórios Testes De Hipóteses |
description |
Grafos são utilizados para modelar redes em diversos campos cientíticos. Ao longo dos anos, o interesse em modelar redes do mundo real vem crescendo, com aplicações em diferentes áreas, como biologia molecular (redes genéticas regulatórias, redes de interação proteína- proteína), neurociência (rede funcional cerebral)e ciências sociais (redes sociais como facebook, instagram, foursquare). As redes do mundo real não podem ser modeladas por grafos determinístico adequadamente, pois tais grafos não apresentam componente aleatório dese- jável nestas situações. Além disso, algoritmos tradicionais e abordagem clássicas para grafos apresentam dificuldades e limitações que prejudicam tais análises. Com isso, grafos aleatórios são mais indicados para modelar as redes do mundo real e procedimentos estatísticos precisam ser formalizados com o intuito de facilitar a análise de dados destes grafos, como por exemplo: como comparar dois grafos reais? Uma abordagem tradicional seria verificar o isomorfismo entre gráficos, no entanto, tal abordagem apresenta alguns problemas, como, por exemplo, o custo computacional é alto (não existe algoritmo polinomial) e não considera a flutuação intrínseca presente em processos que modelam eventos do mundo real. Portanto, uma solução é considerar que os grafos reais são gerados por por processos probabilísti- cos (modelo de grafo aleatório) e testar se os grafos foram gerados pelo mesmo modelo e conjunto de parâmetros. Neste trabalho revisaremos os modelos de grafos aleatórios e suas aplicações na modelagem de redes do mundo real, bem como a teoria espectral para grafos e diversos resultados, medidas derivadas do seu estudo e trabalhos recentes que utilizam métodos baseados em medidas espectrais para seleção do modelo em conjuntos de grafos. Finalmente, introduzimos abordagens paramétricas para testar a igualdade entre dois ou mais grafos aleatórios desde que sejam grandes o suficiente. Primeiro é proposto uma generalização de teste de razão de verossimilhança (likelihood ratio test - LRT), a seguir o teste t (t student) é generalizado para grafos e finalmente, a análise de variância (ANOVA) é desenvolvida para testar a igualdade de dois ou mais grafos. Os testes desenvolvidos utilizam medidas baseadas no espectro do grafo, como a entropia espectral e a divergência de Kullback-Leibler no estimador dos parâmetros do modelo. Para estimar a variância, é usado um bootstrap paramétrico. O poder do teste é ilustrado com uso de curvas ROC e a i ii utilidade do método é demonstrada através de sua aplicação na comparação de redes reais de interação proteína-proteína em seis espécies. |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-04-25 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113249/ |
url |
https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113249/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815257218898984960 |