Modelos marginais para respostas binárias com estruturas hierárquicas de agrupamento

Detalhes bibliográficos
Autor(a) principal: André Gabriel Ferreira Calaça da Costa
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/48888
Resumo: Estudos que envolvem respostas binárias com estruturas hierárquicas de agrupamento são frequentemente encontrados nas diversas áreas do conhecimento. Em modelos de regressão essas estruturas de agrupamento devem ser devidamente tratadas, uma vez que violam o pressuposto básico de independência das observações. Quando o foco principal do estudo está na estrutura da média, os Modelos Marginais de primeira ordem, ajustados pelo método GEE1, propostos por Liang e Zeger (1986), oferecem uma solução elegante por sua facilidade na interpretação e ausência de suposições distribucionais. Entretanto com o método GEE1, não é possível acomodar satisfatoriamente estruturas hierárquicas ou múltiplas estruturas de agrupamento, podendo ocasionar perda de eficiência na estrutura da média. Para acomodar de forma satisfatória estruturas hierárquicas de agrupamento, o GEE1 foi estendido para o GEE2 (Prentice, 1988) com a introdução de uma segunda equação de estimação, o que possibilitou estimar e realizar inferências para os parâmetros de associação a partir de covariáveis. Quando o foco principal do estudo está na estrutura da associação e se tem estruturas hierárquicas de agrupamento, é muito comum `a presença de um grande número de observações nos grupos. Os métodos numéricos para GEE2 podem ser inviáveis computacionalmente se a quantidade de observações dentro dos grupos for grande, além de não permitir utilizar a razão de chances para interpretação da estrutura de associação, sendo possível utilizar somente o coeficiente de correlação. Com adequadas modificações na segunda equação de estimação, Carey, Zeger e Diggle (1993) desenvolveram o ALR e Zink (2003) o ORTH, que além de permitir utilizar a razão de chances para interpretação da estrutura de associação, exigem um menor esforço computacional quando comparados aos métodos já propostos. Neste trabalho apresentamos e comparamos os modelos marginais (GEE2, ALR e ORTH) em simulações e aplicações reais com estruturas hierárquicas de agrupamento em respostas binárias, com o foco da pesquisa não somente nos coeficientes da média, mas também nas medidas de associação. Nossos resultados indicaram que os métodos ALR e ORTH se mostraram eficazes para aplicações com respostas binárias na presença de múltiplas estruturas hierárquicas, especialmente nos casos com um grande número de observações nos grupos. Nossos resultados também indicaram que quando o objetivo principal da pesquisa estiver na estrutura de associação, deve-se ter um cuidado especial na modelagem da estrutura da média, pois sua mal especificação pode induzir uma falta de consistência nas medidas de associação.
id UFMG_45d3c937c63cc115473f1505e9118de1
oai_identifier_str oai:repositorio.ufmg.br:1843/48888
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Enrico Antonio Colosimohttp://lattes.cnpq.br/8074052644801438Julio da Motta SingerDenise Duarte Scarpa Magalhaes AlvesLeo Hellerhttp://lattes.cnpq.br/3452849349492493André Gabriel Ferreira Calaça da Costa2023-01-12T14:09:15Z2023-01-12T14:09:15Z2013-05-06http://hdl.handle.net/1843/48888Estudos que envolvem respostas binárias com estruturas hierárquicas de agrupamento são frequentemente encontrados nas diversas áreas do conhecimento. Em modelos de regressão essas estruturas de agrupamento devem ser devidamente tratadas, uma vez que violam o pressuposto básico de independência das observações. Quando o foco principal do estudo está na estrutura da média, os Modelos Marginais de primeira ordem, ajustados pelo método GEE1, propostos por Liang e Zeger (1986), oferecem uma solução elegante por sua facilidade na interpretação e ausência de suposições distribucionais. Entretanto com o método GEE1, não é possível acomodar satisfatoriamente estruturas hierárquicas ou múltiplas estruturas de agrupamento, podendo ocasionar perda de eficiência na estrutura da média. Para acomodar de forma satisfatória estruturas hierárquicas de agrupamento, o GEE1 foi estendido para o GEE2 (Prentice, 1988) com a introdução de uma segunda equação de estimação, o que possibilitou estimar e realizar inferências para os parâmetros de associação a partir de covariáveis. Quando o foco principal do estudo está na estrutura da associação e se tem estruturas hierárquicas de agrupamento, é muito comum `a presença de um grande número de observações nos grupos. Os métodos numéricos para GEE2 podem ser inviáveis computacionalmente se a quantidade de observações dentro dos grupos for grande, além de não permitir utilizar a razão de chances para interpretação da estrutura de associação, sendo possível utilizar somente o coeficiente de correlação. Com adequadas modificações na segunda equação de estimação, Carey, Zeger e Diggle (1993) desenvolveram o ALR e Zink (2003) o ORTH, que além de permitir utilizar a razão de chances para interpretação da estrutura de associação, exigem um menor esforço computacional quando comparados aos métodos já propostos. Neste trabalho apresentamos e comparamos os modelos marginais (GEE2, ALR e ORTH) em simulações e aplicações reais com estruturas hierárquicas de agrupamento em respostas binárias, com o foco da pesquisa não somente nos coeficientes da média, mas também nas medidas de associação. Nossos resultados indicaram que os métodos ALR e ORTH se mostraram eficazes para aplicações com respostas binárias na presença de múltiplas estruturas hierárquicas, especialmente nos casos com um grande número de observações nos grupos. Nossos resultados também indicaram que quando o objetivo principal da pesquisa estiver na estrutura de associação, deve-se ter um cuidado especial na modelagem da estrutura da média, pois sua mal especificação pode induzir uma falta de consistência nas medidas de associação.Studies involving binary responses with hierarchical clustering are often found in different areas of knowledge. In regression models clustering structures should be properly handled, once they violate basic assumption of independence of observations. When the main focus of the study lies in the mean structure, first order Marginal Models , known as GEE1 proposed by Liang and Zeger (1986), has no distributional assumptions and offers an ease interpretation solution. However with GEE1 method, it is not possible satisfactorily accommodate hierarchical structures or multiple clustering structures, which may cause loss of efficiency in the mean structure. In order to satisfactorily accommodate hierarchical clustering, GEE1 been extended to the GEE2 (Prentice, 1988) by introducing a second estimation equation, allowing to estimate and make inferences for association parameters starting from covariates. When the main focus of the study lies in association structure and there is a hierarchical clustering structures, it is very common the presence of a large number of observations in the clusters. Numerical methods for GEE2 can be computationally infeasible if the number of observations within the clusters is large, and do not allow use of odds ratio for interpretation of association structure, being possible only the of correlation coefficient. With appropriate modification in the second equation estimation, Carey, Zeger and Diggle (1993) developed the ALR and Zink (2003) the ORTH, that requires less computational effort when compared with existing methods allows the use of odds ratio for interpretation of association structure. Here we report the comparison of marginal models (GEE2, ALR and ORTH) in simulations and real applications cases with hierarchical clustering in binary responses, with the research focus not only on the coefficients of the mean, but also in the association measures. Our results indicate that the methods ALR and ORTH proved to be effective for studies with binary responses in the presence of multiple hierarchical structures, especially in cases with a large number of observations in the clusters. Our results also indicate that when the primary purpose of the research is association structure, one should take special care in modeling the structure of the mean, because its misspecification may inconsistency of the association measures.porUniversidade Federal de Minas GeraisPrograma de Pós-Graduação em EstatísticaUFMGBrasilICX - DEPARTAMENTO DE ESTATÍSTICAhttp://creativecommons.org/licenses/by-nc-nd/3.0/pt/info:eu-repo/semantics/openAccessEstatística - TesesAnálise de regressão - TesesRegressão logística - TesesAnálise multivariada - TesesRespostas bináriasEstruturas hierárquicas de agrupamentoModelos marginaisEquações de estimação generalizadaRegressão logística alternadaResíduos ortogonalizadosModelos marginais para respostas binárias com estruturas hierárquicas de agrupamentoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALDissertação André Gabriel.pdfDissertação André Gabriel.pdfapplication/pdf447265https://repositorio.ufmg.br/bitstream/1843/48888/1/Disserta%c3%a7%c3%a3o%20Andr%c3%a9%20Gabriel.pdf17dd8d276e59dbd730e3baf3729a256fMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufmg.br/bitstream/1843/48888/2/license_rdfcfd6801dba008cb6adbd9838b81582abMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82118https://repositorio.ufmg.br/bitstream/1843/48888/3/license.txtcda590c95a0b51b4d15f60c9642ca272MD531843/488882023-01-12 11:09:15.986oai:repositorio.ufmg.br:1843/48888TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEgRE8gUkVQT1NJVMOTUklPIElOU1RJVFVDSU9OQUwgREEgVUZNRwoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZSBpcnJldm9nw6F2ZWwgZGUgcmVwcm9kdXppciBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBkZWNsYXJhIHF1ZSBjb25oZWNlIGEgcG9sw610aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRlIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCk8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2023-01-12T14:09:15Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Modelos marginais para respostas binárias com estruturas hierárquicas de agrupamento
title Modelos marginais para respostas binárias com estruturas hierárquicas de agrupamento
spellingShingle Modelos marginais para respostas binárias com estruturas hierárquicas de agrupamento
André Gabriel Ferreira Calaça da Costa
Respostas binárias
Estruturas hierárquicas de agrupamento
Modelos marginais
Equações de estimação generalizada
Regressão logística alternada
Resíduos ortogonalizados
Estatística - Teses
Análise de regressão - Teses
Regressão logística - Teses
Análise multivariada - Teses
title_short Modelos marginais para respostas binárias com estruturas hierárquicas de agrupamento
title_full Modelos marginais para respostas binárias com estruturas hierárquicas de agrupamento
title_fullStr Modelos marginais para respostas binárias com estruturas hierárquicas de agrupamento
title_full_unstemmed Modelos marginais para respostas binárias com estruturas hierárquicas de agrupamento
title_sort Modelos marginais para respostas binárias com estruturas hierárquicas de agrupamento
author André Gabriel Ferreira Calaça da Costa
author_facet André Gabriel Ferreira Calaça da Costa
author_role author
dc.contributor.advisor1.fl_str_mv Enrico Antonio Colosimo
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8074052644801438
dc.contributor.referee1.fl_str_mv Julio da Motta Singer
dc.contributor.referee2.fl_str_mv Denise Duarte Scarpa Magalhaes Alves
dc.contributor.referee3.fl_str_mv Leo Heller
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/3452849349492493
dc.contributor.author.fl_str_mv André Gabriel Ferreira Calaça da Costa
contributor_str_mv Enrico Antonio Colosimo
Julio da Motta Singer
Denise Duarte Scarpa Magalhaes Alves
Leo Heller
dc.subject.por.fl_str_mv Respostas binárias
Estruturas hierárquicas de agrupamento
Modelos marginais
Equações de estimação generalizada
Regressão logística alternada
Resíduos ortogonalizados
topic Respostas binárias
Estruturas hierárquicas de agrupamento
Modelos marginais
Equações de estimação generalizada
Regressão logística alternada
Resíduos ortogonalizados
Estatística - Teses
Análise de regressão - Teses
Regressão logística - Teses
Análise multivariada - Teses
dc.subject.other.pt_BR.fl_str_mv Estatística - Teses
Análise de regressão - Teses
Regressão logística - Teses
Análise multivariada - Teses
description Estudos que envolvem respostas binárias com estruturas hierárquicas de agrupamento são frequentemente encontrados nas diversas áreas do conhecimento. Em modelos de regressão essas estruturas de agrupamento devem ser devidamente tratadas, uma vez que violam o pressuposto básico de independência das observações. Quando o foco principal do estudo está na estrutura da média, os Modelos Marginais de primeira ordem, ajustados pelo método GEE1, propostos por Liang e Zeger (1986), oferecem uma solução elegante por sua facilidade na interpretação e ausência de suposições distribucionais. Entretanto com o método GEE1, não é possível acomodar satisfatoriamente estruturas hierárquicas ou múltiplas estruturas de agrupamento, podendo ocasionar perda de eficiência na estrutura da média. Para acomodar de forma satisfatória estruturas hierárquicas de agrupamento, o GEE1 foi estendido para o GEE2 (Prentice, 1988) com a introdução de uma segunda equação de estimação, o que possibilitou estimar e realizar inferências para os parâmetros de associação a partir de covariáveis. Quando o foco principal do estudo está na estrutura da associação e se tem estruturas hierárquicas de agrupamento, é muito comum `a presença de um grande número de observações nos grupos. Os métodos numéricos para GEE2 podem ser inviáveis computacionalmente se a quantidade de observações dentro dos grupos for grande, além de não permitir utilizar a razão de chances para interpretação da estrutura de associação, sendo possível utilizar somente o coeficiente de correlação. Com adequadas modificações na segunda equação de estimação, Carey, Zeger e Diggle (1993) desenvolveram o ALR e Zink (2003) o ORTH, que além de permitir utilizar a razão de chances para interpretação da estrutura de associação, exigem um menor esforço computacional quando comparados aos métodos já propostos. Neste trabalho apresentamos e comparamos os modelos marginais (GEE2, ALR e ORTH) em simulações e aplicações reais com estruturas hierárquicas de agrupamento em respostas binárias, com o foco da pesquisa não somente nos coeficientes da média, mas também nas medidas de associação. Nossos resultados indicaram que os métodos ALR e ORTH se mostraram eficazes para aplicações com respostas binárias na presença de múltiplas estruturas hierárquicas, especialmente nos casos com um grande número de observações nos grupos. Nossos resultados também indicaram que quando o objetivo principal da pesquisa estiver na estrutura de associação, deve-se ter um cuidado especial na modelagem da estrutura da média, pois sua mal especificação pode induzir uma falta de consistência nas medidas de associação.
publishDate 2013
dc.date.issued.fl_str_mv 2013-05-06
dc.date.accessioned.fl_str_mv 2023-01-12T14:09:15Z
dc.date.available.fl_str_mv 2023-01-12T14:09:15Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/48888
url http://hdl.handle.net/1843/48888
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/pt/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/pt/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Estatística
dc.publisher.initials.fl_str_mv UFMG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv ICX - DEPARTAMENTO DE ESTATÍSTICA
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/48888/1/Disserta%c3%a7%c3%a3o%20Andr%c3%a9%20Gabriel.pdf
https://repositorio.ufmg.br/bitstream/1843/48888/2/license_rdf
https://repositorio.ufmg.br/bitstream/1843/48888/3/license.txt
bitstream.checksum.fl_str_mv 17dd8d276e59dbd730e3baf3729a256f
cfd6801dba008cb6adbd9838b81582ab
cda590c95a0b51b4d15f60c9642ca272
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1801677030354321408