Modelagem de dados longitudinais complexos no R: desenvolvimento de um pacote estatístico
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFJF |
Texto Completo: | https://repositorio.ufjf.br/jspui/handle/ufjf/13437 |
Resumo: | O surgimento dos computadores digitais a partir da segunda metade do século XX revolucionou o uso da estatística, pois, possibilitou que metodologias, antes inviáveis de serem colocadas em prática, fossem exploradas. Em particular, pesquisas longitudinais começaram a ser cada mais utilizadas em um contexto envolvendo grandes pesquisas. Surgiram então problemas sobre a incorporação do plano amostral das pesquisas às metodologias matemáticas e também a tradução de tais abstrações matemáticas para termos práticos computacionais. No que diz respeito a modelos longitudinais de efeitos fixos e aleatórios e modelos longitudinais de covariância estruturada, ambos envolvendo o plano amostral complexo, o presente trabalho visa apresentar técnicas computacionais capazes de solucionar a segunda parte do problema da modelagem estatística destacado anteriormente, por meio da discussão e criação de um pacote na linguagem de programação R, denominado ’clm’. Ao longo deste estudo foram discutidas boas práticas da programação que visam o desenvolvimento de um código limpo e sustentável e também possíveis estratégias a serem adotadas para solucionar o problema de implementação dos modelos longitudinais complexos, como por exemplo, o uso de fluxogramas. Ao final, foram apresentados os resultados de tais práticas analisando as principais funções do pacote desenvolvido e também uma aplicação exemplificando seu uso, buscando destacar os benefícios proporcionados por este trabalho. |
id |
UFJF_756593997b6266b34a5798b8fb3ce758 |
---|---|
oai_identifier_str |
oai:hermes.cpd.ufjf.br:ufjf/13437 |
network_acronym_str |
UFJF |
network_name_str |
Repositório Institucional da UFJF |
repository_id_str |
|
spelling |
Vieira, Marcel de Toledohttp://lattes.cnpq.br/1980385021266418Silva, Pedro Luis do Nascimentohttp://lattes.cnpq.br/9690266874045176Souza, Augusto Carvalhohttp://lattes.cnpq.br/4948010017164625http://lattes.cnpq.br/6198872347020685Pacheco, Pedro Henrique de Mesquita2021-09-20T21:27:07Z2021-09-172021-09-20T21:27:07Z2021-09-08https://repositorio.ufjf.br/jspui/handle/ufjf/13437O surgimento dos computadores digitais a partir da segunda metade do século XX revolucionou o uso da estatística, pois, possibilitou que metodologias, antes inviáveis de serem colocadas em prática, fossem exploradas. Em particular, pesquisas longitudinais começaram a ser cada mais utilizadas em um contexto envolvendo grandes pesquisas. Surgiram então problemas sobre a incorporação do plano amostral das pesquisas às metodologias matemáticas e também a tradução de tais abstrações matemáticas para termos práticos computacionais. No que diz respeito a modelos longitudinais de efeitos fixos e aleatórios e modelos longitudinais de covariância estruturada, ambos envolvendo o plano amostral complexo, o presente trabalho visa apresentar técnicas computacionais capazes de solucionar a segunda parte do problema da modelagem estatística destacado anteriormente, por meio da discussão e criação de um pacote na linguagem de programação R, denominado ’clm’. Ao longo deste estudo foram discutidas boas práticas da programação que visam o desenvolvimento de um código limpo e sustentável e também possíveis estratégias a serem adotadas para solucionar o problema de implementação dos modelos longitudinais complexos, como por exemplo, o uso de fluxogramas. Ao final, foram apresentados os resultados de tais práticas analisando as principais funções do pacote desenvolvido e também uma aplicação exemplificando seu uso, buscando destacar os benefícios proporcionados por este trabalho.The emergence of digital computers in the second half of the 20st century revolutionized the use of statistics, as it made it possible for methodologies, which were previously unfeasible to be put into practice, to be explored. In particular, longitudinal surveys began to be increasingly used in a context of large surveys. Problems then arose about incorporating the sampling design of the survey into mathematical methodologies and also the translation of such mathematical abstractions into practical computational terms. With regard to fixed and random effects longitudinal models and structured covariance longitudinal models, both involving the complex sampling scheme, the present work aims to present computational techniques capable of solving the second part of the statistical modeling problem highlighted above, through the discussion and creation of a package in the R programming language, called ’clm’. Throughout the study, good programming practices aimed at the development of a clean and sustainable code were discussed, as well as possible strategies to be adopted as the solution for the problem of implementing longitudinal models, such as the use of flowcharts. In the end, the results of such practices were presented analyzing the main functions of the developed package and also an application exemplifying its use, seeking to highlight the benefits provided by this work.porUniversidade Federal de Juiz de Fora (UFJF)UFJFBrasilICE – Instituto de Ciências Exatashttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICAModelos LongitudinaisLongitudinal ModelsAmostragem ComplexaComplex Sampling DesignProgramação em RR ProgrammingModelagem de dados longitudinais complexos no R: desenvolvimento de um pacote estatísticoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisreponame:Repositório Institucional da UFJFinstname:Universidade Federal de Juiz de Fora (UFJF)instacron:UFJFORIGINALpedrohenriquedemesquitapacheco.pdfpedrohenriquedemesquitapacheco.pdfPedro Henrique de Mesquita Pachecoapplication/pdf5493355https://repositorio.ufjf.br/jspui/bitstream/ufjf/13437/1/pedrohenriquedemesquitapacheco.pdfecb6b294a32227a041c391e61b1696ccMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufjf.br/jspui/bitstream/ufjf/13437/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufjf.br/jspui/bitstream/ufjf/13437/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53TEXTpedrohenriquedemesquitapacheco.pdf.txtpedrohenriquedemesquitapacheco.pdf.txtExtracted texttext/plain150450https://repositorio.ufjf.br/jspui/bitstream/ufjf/13437/4/pedrohenriquedemesquitapacheco.pdf.txt9cc7aff300d20a26a506479bb89f78d5MD54THUMBNAILpedrohenriquedemesquitapacheco.pdf.jpgpedrohenriquedemesquitapacheco.pdf.jpgGenerated Thumbnailimage/jpeg1181https://repositorio.ufjf.br/jspui/bitstream/ufjf/13437/5/pedrohenriquedemesquitapacheco.pdf.jpg613773081c04f6a900c16ee634177445MD55ufjf/134372021-09-21 03:24:02.531oai:hermes.cpd.ufjf.br:ufjf/13437Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufjf.br/oai/requestopendoar:2021-09-21T06:24:02Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF)false |
dc.title.pt_BR.fl_str_mv |
Modelagem de dados longitudinais complexos no R: desenvolvimento de um pacote estatístico |
title |
Modelagem de dados longitudinais complexos no R: desenvolvimento de um pacote estatístico |
spellingShingle |
Modelagem de dados longitudinais complexos no R: desenvolvimento de um pacote estatístico Pacheco, Pedro Henrique de Mesquita CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA Modelos Longitudinais Longitudinal Models Amostragem Complexa Complex Sampling Design Programação em R R Programming |
title_short |
Modelagem de dados longitudinais complexos no R: desenvolvimento de um pacote estatístico |
title_full |
Modelagem de dados longitudinais complexos no R: desenvolvimento de um pacote estatístico |
title_fullStr |
Modelagem de dados longitudinais complexos no R: desenvolvimento de um pacote estatístico |
title_full_unstemmed |
Modelagem de dados longitudinais complexos no R: desenvolvimento de um pacote estatístico |
title_sort |
Modelagem de dados longitudinais complexos no R: desenvolvimento de um pacote estatístico |
author |
Pacheco, Pedro Henrique de Mesquita |
author_facet |
Pacheco, Pedro Henrique de Mesquita |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Vieira, Marcel de Toledo |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/1980385021266418 |
dc.contributor.referee1.fl_str_mv |
Silva, Pedro Luis do Nascimento |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/9690266874045176 |
dc.contributor.referee2.fl_str_mv |
Souza, Augusto Carvalho |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/4948010017164625 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/6198872347020685 |
dc.contributor.author.fl_str_mv |
Pacheco, Pedro Henrique de Mesquita |
contributor_str_mv |
Vieira, Marcel de Toledo Silva, Pedro Luis do Nascimento Souza, Augusto Carvalho |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA Modelos Longitudinais Longitudinal Models Amostragem Complexa Complex Sampling Design Programação em R R Programming |
dc.subject.por.fl_str_mv |
Modelos Longitudinais Longitudinal Models Amostragem Complexa Complex Sampling Design Programação em R R Programming |
description |
O surgimento dos computadores digitais a partir da segunda metade do século XX revolucionou o uso da estatística, pois, possibilitou que metodologias, antes inviáveis de serem colocadas em prática, fossem exploradas. Em particular, pesquisas longitudinais começaram a ser cada mais utilizadas em um contexto envolvendo grandes pesquisas. Surgiram então problemas sobre a incorporação do plano amostral das pesquisas às metodologias matemáticas e também a tradução de tais abstrações matemáticas para termos práticos computacionais. No que diz respeito a modelos longitudinais de efeitos fixos e aleatórios e modelos longitudinais de covariância estruturada, ambos envolvendo o plano amostral complexo, o presente trabalho visa apresentar técnicas computacionais capazes de solucionar a segunda parte do problema da modelagem estatística destacado anteriormente, por meio da discussão e criação de um pacote na linguagem de programação R, denominado ’clm’. Ao longo deste estudo foram discutidas boas práticas da programação que visam o desenvolvimento de um código limpo e sustentável e também possíveis estratégias a serem adotadas para solucionar o problema de implementação dos modelos longitudinais complexos, como por exemplo, o uso de fluxogramas. Ao final, foram apresentados os resultados de tais práticas analisando as principais funções do pacote desenvolvido e também uma aplicação exemplificando seu uso, buscando destacar os benefícios proporcionados por este trabalho. |
publishDate |
2021 |
dc.date.accessioned.fl_str_mv |
2021-09-20T21:27:07Z |
dc.date.available.fl_str_mv |
2021-09-17 2021-09-20T21:27:07Z |
dc.date.issued.fl_str_mv |
2021-09-08 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufjf.br/jspui/handle/ufjf/13437 |
url |
https://repositorio.ufjf.br/jspui/handle/ufjf/13437 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Juiz de Fora (UFJF) |
dc.publisher.initials.fl_str_mv |
UFJF |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
ICE – Instituto de Ciências Exatas |
publisher.none.fl_str_mv |
Universidade Federal de Juiz de Fora (UFJF) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFJF instname:Universidade Federal de Juiz de Fora (UFJF) instacron:UFJF |
instname_str |
Universidade Federal de Juiz de Fora (UFJF) |
instacron_str |
UFJF |
institution |
UFJF |
reponame_str |
Repositório Institucional da UFJF |
collection |
Repositório Institucional da UFJF |
bitstream.url.fl_str_mv |
https://repositorio.ufjf.br/jspui/bitstream/ufjf/13437/1/pedrohenriquedemesquitapacheco.pdf https://repositorio.ufjf.br/jspui/bitstream/ufjf/13437/2/license_rdf https://repositorio.ufjf.br/jspui/bitstream/ufjf/13437/3/license.txt https://repositorio.ufjf.br/jspui/bitstream/ufjf/13437/4/pedrohenriquedemesquitapacheco.pdf.txt https://repositorio.ufjf.br/jspui/bitstream/ufjf/13437/5/pedrohenriquedemesquitapacheco.pdf.jpg |
bitstream.checksum.fl_str_mv |
ecb6b294a32227a041c391e61b1696cc e39d27027a6cc9cb039ad269a5db8e34 8a4605be74aa9ea9d79846c1fba20a33 9cc7aff300d20a26a506479bb89f78d5 613773081c04f6a900c16ee634177445 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF) |
repository.mail.fl_str_mv |
|
_version_ |
1813193861983371264 |