Testes para erro de especificação em modelos para grafos aleatórios
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/56387 |
Resumo: | Nos últimos anos, houve um grande interesse em modelos de grafos aleatórios para modelar redes complexas nas mais diversas áreas como Ciências Sociais, Física, Biologia, Economia, Ecologia e Ciência da Computação. Uma classe de modelos que vêm sendo muito utilizados são os modelos de grafos aleatórios exponenciais (ERG), que formam uma família abrangente de modelos que inclui modelos de arestas independentes e diádicos, os grafos aleatórios de Markov e muitas outras distribuições de grafos, além de permitir a inclusão de covariáveis que podem levar a um ajuste melhor do modelo. Outra classe de modelos cada vez mais popular na análise estatística de redes são os modelos de blocos estocásticos (SBMs) . Eles podem ser usados para fins de agrupamento dos vertices em comunidades ou descobrir e analisar uma estrutura latente de uma rede. O modelo de bloco estocástico é um modelo generativo para grafos aleatórios que tende a produzir grafos contendo subconjuntos de vértices caracterizados por serem conectados uns aos outros, chamados comunidades. Muitos pesquisadores de várias áreas vêm usando ferramentas computacionais para o ajuste desses modelos sem, no entanto, fazer uma análise da adequação deles aos dados de redes que estão estudando. A complexidade envolvida no processo de estimação e nas metodologias de verificação de qualidade de ajuste pra esses modelos podem ser fatores que dificultam a análise de adequação e um possível descarte de um modelo em favor de outro. E é claro que os resultados obtidos através de um modelo não adequado podem levar o pesquisador a conclusões bastante equivocadas sobre o fenômeno estudado. A proposta deste trabalho é apresentar uma metodologia simples, baseada em Testes de Hipóteses, para verificar se há erro de especificação de modelo para esses dois casos bastante utilizados na literatura para representar redes complexas: o ERG e o SBM. Acreditamos que essa ferramenta pode ser bastante útil para aqueles que querem utilizar esses modelos de uma forma mais cuidadosa, verificando antes se os modelos são adequados aos dados em estudo. |
id |
UFMG_40b576cb6f4a86f199ffc0b7f4b8ff8a |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/56387 |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Denise Duarte Scarpa Magalhães Alveshttp://lattes.cnpq.br/1561403057993890Miguel Natalio AbadiLuiz Henrique DuczmalRodrigo LambertGuilherme Ost de Aguiarhttp://lattes.cnpq.br/7605478625114675Rafael Honório Pereira Alves2023-07-17T16:31:00Z2023-07-17T16:31:00Z2022-02-23http://hdl.handle.net/1843/56387Nos últimos anos, houve um grande interesse em modelos de grafos aleatórios para modelar redes complexas nas mais diversas áreas como Ciências Sociais, Física, Biologia, Economia, Ecologia e Ciência da Computação. Uma classe de modelos que vêm sendo muito utilizados são os modelos de grafos aleatórios exponenciais (ERG), que formam uma família abrangente de modelos que inclui modelos de arestas independentes e diádicos, os grafos aleatórios de Markov e muitas outras distribuições de grafos, além de permitir a inclusão de covariáveis que podem levar a um ajuste melhor do modelo. Outra classe de modelos cada vez mais popular na análise estatística de redes são os modelos de blocos estocásticos (SBMs) . Eles podem ser usados para fins de agrupamento dos vertices em comunidades ou descobrir e analisar uma estrutura latente de uma rede. O modelo de bloco estocástico é um modelo generativo para grafos aleatórios que tende a produzir grafos contendo subconjuntos de vértices caracterizados por serem conectados uns aos outros, chamados comunidades. Muitos pesquisadores de várias áreas vêm usando ferramentas computacionais para o ajuste desses modelos sem, no entanto, fazer uma análise da adequação deles aos dados de redes que estão estudando. A complexidade envolvida no processo de estimação e nas metodologias de verificação de qualidade de ajuste pra esses modelos podem ser fatores que dificultam a análise de adequação e um possível descarte de um modelo em favor de outro. E é claro que os resultados obtidos através de um modelo não adequado podem levar o pesquisador a conclusões bastante equivocadas sobre o fenômeno estudado. A proposta deste trabalho é apresentar uma metodologia simples, baseada em Testes de Hipóteses, para verificar se há erro de especificação de modelo para esses dois casos bastante utilizados na literatura para representar redes complexas: o ERG e o SBM. Acreditamos que essa ferramenta pode ser bastante útil para aqueles que querem utilizar esses modelos de uma forma mais cuidadosa, verificando antes se os modelos são adequados aos dados em estudo.In recent years, there has been a great interest in random graph models to model complex networks in the most diverse areas such as Social Sciences, Physics, Biology, Economics, Ecology and Computer Science. A class of models that have been widely used are the exponential random graph (ERG) models, which form a comprehensive family of models that include independent and dyadic edge models, Markov random graphs, and many other graph distributions, in addition to allow the inclusion of covariates that can lead to a better fit of the model. Another increasingly popular class of models in statistical network analysis are stochastic block models (SBMs). They can be used for the purpose of grouping nodes into communities or discovering and analyzing a latent structure of a network. The stochastic block model is a generative model for random graphs that tends to produce graphs containing subsets of nodes characterized by being connected to each other, called communities. Many researchers from various areas have been using computational tools to adjust these models without, however, analyzing their suitability for the data of the networks they are studying. The complexity involved in the estimation process and in the goodness-of-fit verification methodologies for these models can be factors that make the analysis of adequacy difficult and a possible discard of one model in favor of another. And it is clear that the results obtained through an inappropriate model can lead the researcher to very wrong conclusions about the phenomenon studied. The purpose of this work is to present a simple methodology, based on Hypothesis Tests, to verify if there is a model specification error for these two cases widely used in the literature to represent complex networks: the ERGM and the SBM. We believe that this tool can be very useful for those who want to use these models in a more careful way, verifying beforehand if the models are suitable for the data under study.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de Minas GeraisPrograma de Pós-Graduação em EstatísticaUFMGBrasilICX - DEPARTAMENTO DE MATEMÁTICAhttp://creativecommons.org/licenses/by-nc-nd/3.0/pt/info:eu-repo/semantics/openAccessEstatística – TesesRedes complexas – Modelagem – TesesSistemas estocasticos – TesesModelos de grafos exponenciais – TesesErro de especificação – TesesModelagem de redes complexasModelos de Blocos EstocásticosModelos de Grafos ExponenciaisErro de especificação de modeloTestes de HipótesesTestes para erro de especificação em modelos para grafos aleatóriosMiss specification tests in models for eandom graphsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALTestes para Erro de Especificação em Modelos para Grafos Aleatórios.pdfTestes para Erro de Especificação em Modelos para Grafos Aleatórios.pdfapplication/pdf1570004https://repositorio.ufmg.br/bitstream/1843/56387/1/Testes%20para%20Erro%20de%20Especifica%c3%a7%c3%a3o%20em%20Modelos%20para%20Grafos%20Aleat%c3%b3rios.pdfc4c069ff60d6b9d30d8f2ea6dab11a40MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufmg.br/bitstream/1843/56387/2/license_rdfcfd6801dba008cb6adbd9838b81582abMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82118https://repositorio.ufmg.br/bitstream/1843/56387/3/license.txtcda590c95a0b51b4d15f60c9642ca272MD531843/563872023-07-17 13:31:01.046oai:repositorio.ufmg.br:1843/56387TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEgRE8gUkVQT1NJVMOTUklPIElOU1RJVFVDSU9OQUwgREEgVUZNRwoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZSBpcnJldm9nw6F2ZWwgZGUgcmVwcm9kdXppciBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBkZWNsYXJhIHF1ZSBjb25oZWNlIGEgcG9sw610aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRlIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCk8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2023-07-17T16:31:01Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Testes para erro de especificação em modelos para grafos aleatórios |
dc.title.alternative.pt_BR.fl_str_mv |
Miss specification tests in models for eandom graphs |
title |
Testes para erro de especificação em modelos para grafos aleatórios |
spellingShingle |
Testes para erro de especificação em modelos para grafos aleatórios Rafael Honório Pereira Alves Modelagem de redes complexas Modelos de Blocos Estocásticos Modelos de Grafos Exponenciais Erro de especificação de modelo Testes de Hipóteses Estatística – Teses Redes complexas – Modelagem – Teses Sistemas estocasticos – Teses Modelos de grafos exponenciais – Teses Erro de especificação – Teses |
title_short |
Testes para erro de especificação em modelos para grafos aleatórios |
title_full |
Testes para erro de especificação em modelos para grafos aleatórios |
title_fullStr |
Testes para erro de especificação em modelos para grafos aleatórios |
title_full_unstemmed |
Testes para erro de especificação em modelos para grafos aleatórios |
title_sort |
Testes para erro de especificação em modelos para grafos aleatórios |
author |
Rafael Honório Pereira Alves |
author_facet |
Rafael Honório Pereira Alves |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Denise Duarte Scarpa Magalhães Alves |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/1561403057993890 |
dc.contributor.referee1.fl_str_mv |
Miguel Natalio Abadi |
dc.contributor.referee2.fl_str_mv |
Luiz Henrique Duczmal |
dc.contributor.referee3.fl_str_mv |
Rodrigo Lambert |
dc.contributor.referee4.fl_str_mv |
Guilherme Ost de Aguiar |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/7605478625114675 |
dc.contributor.author.fl_str_mv |
Rafael Honório Pereira Alves |
contributor_str_mv |
Denise Duarte Scarpa Magalhães Alves Miguel Natalio Abadi Luiz Henrique Duczmal Rodrigo Lambert Guilherme Ost de Aguiar |
dc.subject.por.fl_str_mv |
Modelagem de redes complexas Modelos de Blocos Estocásticos Modelos de Grafos Exponenciais Erro de especificação de modelo Testes de Hipóteses |
topic |
Modelagem de redes complexas Modelos de Blocos Estocásticos Modelos de Grafos Exponenciais Erro de especificação de modelo Testes de Hipóteses Estatística – Teses Redes complexas – Modelagem – Teses Sistemas estocasticos – Teses Modelos de grafos exponenciais – Teses Erro de especificação – Teses |
dc.subject.other.pt_BR.fl_str_mv |
Estatística – Teses Redes complexas – Modelagem – Teses Sistemas estocasticos – Teses Modelos de grafos exponenciais – Teses Erro de especificação – Teses |
description |
Nos últimos anos, houve um grande interesse em modelos de grafos aleatórios para modelar redes complexas nas mais diversas áreas como Ciências Sociais, Física, Biologia, Economia, Ecologia e Ciência da Computação. Uma classe de modelos que vêm sendo muito utilizados são os modelos de grafos aleatórios exponenciais (ERG), que formam uma família abrangente de modelos que inclui modelos de arestas independentes e diádicos, os grafos aleatórios de Markov e muitas outras distribuições de grafos, além de permitir a inclusão de covariáveis que podem levar a um ajuste melhor do modelo. Outra classe de modelos cada vez mais popular na análise estatística de redes são os modelos de blocos estocásticos (SBMs) . Eles podem ser usados para fins de agrupamento dos vertices em comunidades ou descobrir e analisar uma estrutura latente de uma rede. O modelo de bloco estocástico é um modelo generativo para grafos aleatórios que tende a produzir grafos contendo subconjuntos de vértices caracterizados por serem conectados uns aos outros, chamados comunidades. Muitos pesquisadores de várias áreas vêm usando ferramentas computacionais para o ajuste desses modelos sem, no entanto, fazer uma análise da adequação deles aos dados de redes que estão estudando. A complexidade envolvida no processo de estimação e nas metodologias de verificação de qualidade de ajuste pra esses modelos podem ser fatores que dificultam a análise de adequação e um possível descarte de um modelo em favor de outro. E é claro que os resultados obtidos através de um modelo não adequado podem levar o pesquisador a conclusões bastante equivocadas sobre o fenômeno estudado. A proposta deste trabalho é apresentar uma metodologia simples, baseada em Testes de Hipóteses, para verificar se há erro de especificação de modelo para esses dois casos bastante utilizados na literatura para representar redes complexas: o ERG e o SBM. Acreditamos que essa ferramenta pode ser bastante útil para aqueles que querem utilizar esses modelos de uma forma mais cuidadosa, verificando antes se os modelos são adequados aos dados em estudo. |
publishDate |
2022 |
dc.date.issued.fl_str_mv |
2022-02-23 |
dc.date.accessioned.fl_str_mv |
2023-07-17T16:31:00Z |
dc.date.available.fl_str_mv |
2023-07-17T16:31:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/56387 |
url |
http://hdl.handle.net/1843/56387 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/pt/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/pt/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Estatística |
dc.publisher.initials.fl_str_mv |
UFMG |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
ICX - DEPARTAMENTO DE MATEMÁTICA |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/56387/1/Testes%20para%20Erro%20de%20Especifica%c3%a7%c3%a3o%20em%20Modelos%20para%20Grafos%20Aleat%c3%b3rios.pdf https://repositorio.ufmg.br/bitstream/1843/56387/2/license_rdf https://repositorio.ufmg.br/bitstream/1843/56387/3/license.txt |
bitstream.checksum.fl_str_mv |
c4c069ff60d6b9d30d8f2ea6dab11a40 cfd6801dba008cb6adbd9838b81582ab cda590c95a0b51b4d15f60c9642ca272 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589255172194304 |