Spatial confounding beyond generalized linear mixed models: extension to shared components and spatial frailty models

Detalhes bibliográficos
Autor(a) principal: Douglas Roberto Mesquita Azevedo
Data de Publicação: 2020
Tipo de documento: Tese
Idioma: eng
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/37245
Resumo: Confundimento espacial é o nome dado para o confundimento entre efeitos fixos e aleatórios espaciais em modelos lineares generalizados mistos (MLGMs). O confundimento espacial vem sendo amplamente estudado e vem ganhando atenção na literatura nos últimos anos visto que esta limitação pode gerar resultados inesperados na modelagem. As abordagens baseadas em projeção, conhecidas por modelos restritos, aparecem como uma boa alternativa para contornar as limitações do confundimento espacial em MLGMs. Entretanto, quando o suporte dos efeitos fixos difere do suporte do efeito espacial ou então quando diversos efeitos espaciais estão presentes na análise, os modelos baseados em projeção não são diretamente aplicáveis. Neste trabalho são introduzidas soluções para amenizar o confundimento espacial em duas famílias de modelos estatísticos. Em modelos de componente compartilhado, diversas variáveis resposta de contagem são observadas em cada região em estudo e muitas vezes apresentam padrões espaciais similares. Desta forma, os efeitos espaciais podem ser compartilhados entre as respostas além da possível presença de efeitos espaciais específicos. Neste contexto, nossa proposta se baseia no uso de estruturas espaciais modificadas para cada um dos componentes compartilhados e também dos efeitos espaciais específicos. Já modelos de fragilidade espacial permitem incorporar efeitos espacialmente estruturados através de um termo de fragilidade. Além disso, é comum observar-se mais de um indivíduo por região o que implica que o número de observações é maior que o número de regiões em estudo. Neste contexto propomos um modelo de projeção reduzindo a dimensionalidade dos dados. Como um produto deste trabalho, foi criado um pacote em R chamado "RASCO: An R package to Alleviate Spatial Confounding" que fornece à comunidade uma ferramenta para alivar o confundimento espacial em MLGMs, modelos de componente compartilhado e modelos de fragilidade espacial. Para uma inferência Bayesiana à um custo computacional baixo, a metodologia INLA foi utilizada. Casos de cancêr de pulmão e brônquios na California foram estudados em ambos os modelos mostrando a eficiência dos métodos propostos.
id UFMG_ee91dc0197ddf01d7e518d83e65199ea
oai_identifier_str oai:repositorio.ufmg.br:1843/37245
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Marcos Oliveira Prateshttp://lattes.cnpq.br/7893235207392165Dipankar BandyopadhyayWagner Hugo BonatLeonardo Soares BastosRenato Martins AssunçãoVinícius Diniz Mayrinkhttp://lattes.cnpq.br/4950962679183856Douglas Roberto Mesquita Azevedo2021-08-04T11:20:58Z2021-08-04T11:20:58Z2020-02-28http://hdl.handle.net/1843/37245Confundimento espacial é o nome dado para o confundimento entre efeitos fixos e aleatórios espaciais em modelos lineares generalizados mistos (MLGMs). O confundimento espacial vem sendo amplamente estudado e vem ganhando atenção na literatura nos últimos anos visto que esta limitação pode gerar resultados inesperados na modelagem. As abordagens baseadas em projeção, conhecidas por modelos restritos, aparecem como uma boa alternativa para contornar as limitações do confundimento espacial em MLGMs. Entretanto, quando o suporte dos efeitos fixos difere do suporte do efeito espacial ou então quando diversos efeitos espaciais estão presentes na análise, os modelos baseados em projeção não são diretamente aplicáveis. Neste trabalho são introduzidas soluções para amenizar o confundimento espacial em duas famílias de modelos estatísticos. Em modelos de componente compartilhado, diversas variáveis resposta de contagem são observadas em cada região em estudo e muitas vezes apresentam padrões espaciais similares. Desta forma, os efeitos espaciais podem ser compartilhados entre as respostas além da possível presença de efeitos espaciais específicos. Neste contexto, nossa proposta se baseia no uso de estruturas espaciais modificadas para cada um dos componentes compartilhados e também dos efeitos espaciais específicos. Já modelos de fragilidade espacial permitem incorporar efeitos espacialmente estruturados através de um termo de fragilidade. Além disso, é comum observar-se mais de um indivíduo por região o que implica que o número de observações é maior que o número de regiões em estudo. Neste contexto propomos um modelo de projeção reduzindo a dimensionalidade dos dados. Como um produto deste trabalho, foi criado um pacote em R chamado "RASCO: An R package to Alleviate Spatial Confounding" que fornece à comunidade uma ferramenta para alivar o confundimento espacial em MLGMs, modelos de componente compartilhado e modelos de fragilidade espacial. Para uma inferência Bayesiana à um custo computacional baixo, a metodologia INLA foi utilizada. Casos de cancêr de pulmão e brônquios na California foram estudados em ambos os modelos mostrando a eficiência dos métodos propostos.Spatial confounding is the name given to the confounding between fixed and spatial random effects in generalized linear mixed models (GLMMs). It has been widely studied and it gained attention in the past years in the spatial statistics literature, as it may generate unexpected results in modeling. The projection-based approach, also known as restricted models, appears like a good way to overcome the spatial confounding in this kind of models. However, when the support of fixed effects is different from the spatial effect one or when multiple spatial effects are present in the modeling, this approach can no longer be applied directly. In this work, we introduce solutions to alleviate the spatial confounding for two families of statistical models. In shared component models, multiple count responses are recorded at each spatial location, which may exhibit similar spatial patterns. Therefore, the spatial effect terms may be shared between the outcomes in addition to specific spatial patterns. In this case, our proposal relies on the use of modified spatial structures for each shared component and specific effects. Spatial frailty models can incorporate spatially structured effects and it is common to observe more than one sample unit per area which means that the support of fixed and spatial effects differ. In this case, we introduce a projection-based approach reducing the dimensionality of the data. As a product of this work an R package named "RASCO: An R package to Alleviate Spatial Confounding" is provided and it allows the community to alleviate the spatial confounding in GLMMs, shared component models and spatial frailty models. To provide a fast inference for the parameters, we used the INLA methodology. Lung and bronchus cancer in the California state is investigated under both methodologies and the results prove the efficiency of the proposed models.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorengUniversidade Federal de Minas GeraisPrograma de Pós-Graduação em EstatísticaUFMGBrasilICX - DEPARTAMENTO DE ESTATÍSTICAEstatística - Teses.Análise de sobrevivência (Biometria) - Teses.Mapas de doenças - Teses.Multicolinearidade - TeseAnálise de sobrevivênciaMapa de doençasEfeitos latentesMulticolinearidadeSPOCKProjeçãoSpatial confounding beyond generalized linear mixed models: extension to shared components and spatial frailty modelsConfundimento espacial além dos modelos lineares generalizados mistos: extensão para os modelos de componentes compartilhados e modelos de fragilidade espacialinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALtese_douglas_azevedo.pdftese_douglas_azevedo.pdfapplication/pdf10335491https://repositorio.ufmg.br/bitstream/1843/37245/1/tese_douglas_azevedo.pdf269f53460bc49842e06cbc1db2f24b3bMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82119https://repositorio.ufmg.br/bitstream/1843/37245/2/license.txt34badce4be7e31e3adb4575ae96af679MD521843/372452021-08-04 08:20:58.44oai:repositorio.ufmg.br:1843/37245TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEgRE8gUkVQT1NJVMOTUklPIElOU1RJVFVDSU9OQUwgREEgVUZNRwoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZSBpcnJldm9nw6F2ZWwgZGUgcmVwcm9kdXppciBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBkZWNsYXJhIHF1ZSBjb25oZWNlIGEgcG9sw610aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRlIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCk8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KCg==Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2021-08-04T11:20:58Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Spatial confounding beyond generalized linear mixed models: extension to shared components and spatial frailty models
dc.title.alternative.pt_BR.fl_str_mv Confundimento espacial além dos modelos lineares generalizados mistos: extensão para os modelos de componentes compartilhados e modelos de fragilidade espacial
title Spatial confounding beyond generalized linear mixed models: extension to shared components and spatial frailty models
spellingShingle Spatial confounding beyond generalized linear mixed models: extension to shared components and spatial frailty models
Douglas Roberto Mesquita Azevedo
Análise de sobrevivência
Mapa de doenças
Efeitos latentes
Multicolinearidade
SPOCK
Projeção
Estatística - Teses.
Análise de sobrevivência (Biometria) - Teses.
Mapas de doenças - Teses.
Multicolinearidade - Tese
title_short Spatial confounding beyond generalized linear mixed models: extension to shared components and spatial frailty models
title_full Spatial confounding beyond generalized linear mixed models: extension to shared components and spatial frailty models
title_fullStr Spatial confounding beyond generalized linear mixed models: extension to shared components and spatial frailty models
title_full_unstemmed Spatial confounding beyond generalized linear mixed models: extension to shared components and spatial frailty models
title_sort Spatial confounding beyond generalized linear mixed models: extension to shared components and spatial frailty models
author Douglas Roberto Mesquita Azevedo
author_facet Douglas Roberto Mesquita Azevedo
author_role author
dc.contributor.advisor1.fl_str_mv Marcos Oliveira Prates
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/7893235207392165
dc.contributor.advisor-co1.fl_str_mv Dipankar Bandyopadhyay
dc.contributor.referee1.fl_str_mv Wagner Hugo Bonat
dc.contributor.referee2.fl_str_mv Leonardo Soares Bastos
dc.contributor.referee3.fl_str_mv Renato Martins Assunção
dc.contributor.referee4.fl_str_mv Vinícius Diniz Mayrink
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/4950962679183856
dc.contributor.author.fl_str_mv Douglas Roberto Mesquita Azevedo
contributor_str_mv Marcos Oliveira Prates
Dipankar Bandyopadhyay
Wagner Hugo Bonat
Leonardo Soares Bastos
Renato Martins Assunção
Vinícius Diniz Mayrink
dc.subject.por.fl_str_mv Análise de sobrevivência
Mapa de doenças
Efeitos latentes
Multicolinearidade
SPOCK
Projeção
topic Análise de sobrevivência
Mapa de doenças
Efeitos latentes
Multicolinearidade
SPOCK
Projeção
Estatística - Teses.
Análise de sobrevivência (Biometria) - Teses.
Mapas de doenças - Teses.
Multicolinearidade - Tese
dc.subject.other.pt_BR.fl_str_mv Estatística - Teses.
Análise de sobrevivência (Biometria) - Teses.
Mapas de doenças - Teses.
Multicolinearidade - Tese
description Confundimento espacial é o nome dado para o confundimento entre efeitos fixos e aleatórios espaciais em modelos lineares generalizados mistos (MLGMs). O confundimento espacial vem sendo amplamente estudado e vem ganhando atenção na literatura nos últimos anos visto que esta limitação pode gerar resultados inesperados na modelagem. As abordagens baseadas em projeção, conhecidas por modelos restritos, aparecem como uma boa alternativa para contornar as limitações do confundimento espacial em MLGMs. Entretanto, quando o suporte dos efeitos fixos difere do suporte do efeito espacial ou então quando diversos efeitos espaciais estão presentes na análise, os modelos baseados em projeção não são diretamente aplicáveis. Neste trabalho são introduzidas soluções para amenizar o confundimento espacial em duas famílias de modelos estatísticos. Em modelos de componente compartilhado, diversas variáveis resposta de contagem são observadas em cada região em estudo e muitas vezes apresentam padrões espaciais similares. Desta forma, os efeitos espaciais podem ser compartilhados entre as respostas além da possível presença de efeitos espaciais específicos. Neste contexto, nossa proposta se baseia no uso de estruturas espaciais modificadas para cada um dos componentes compartilhados e também dos efeitos espaciais específicos. Já modelos de fragilidade espacial permitem incorporar efeitos espacialmente estruturados através de um termo de fragilidade. Além disso, é comum observar-se mais de um indivíduo por região o que implica que o número de observações é maior que o número de regiões em estudo. Neste contexto propomos um modelo de projeção reduzindo a dimensionalidade dos dados. Como um produto deste trabalho, foi criado um pacote em R chamado "RASCO: An R package to Alleviate Spatial Confounding" que fornece à comunidade uma ferramenta para alivar o confundimento espacial em MLGMs, modelos de componente compartilhado e modelos de fragilidade espacial. Para uma inferência Bayesiana à um custo computacional baixo, a metodologia INLA foi utilizada. Casos de cancêr de pulmão e brônquios na California foram estudados em ambos os modelos mostrando a eficiência dos métodos propostos.
publishDate 2020
dc.date.issued.fl_str_mv 2020-02-28
dc.date.accessioned.fl_str_mv 2021-08-04T11:20:58Z
dc.date.available.fl_str_mv 2021-08-04T11:20:58Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/37245
url http://hdl.handle.net/1843/37245
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Estatística
dc.publisher.initials.fl_str_mv UFMG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv ICX - DEPARTAMENTO DE ESTATÍSTICA
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/37245/1/tese_douglas_azevedo.pdf
https://repositorio.ufmg.br/bitstream/1843/37245/2/license.txt
bitstream.checksum.fl_str_mv 269f53460bc49842e06cbc1db2f24b3b
34badce4be7e31e3adb4575ae96af679
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589332400865280