Métodos de estimação baseados em modelos na presença de dados faltantes

Detalhes bibliográficos
Autor(a) principal: Ribeiro, Taís Roberta
Data de Publicação: 2022
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/104/104131/tde-29112022-094513/
Resumo: Os dados faltantes são observações que deveriam ter sido feitas, mas não foram por algum motivo, reduzindo, assim, a capacidade de entender a natureza do fenômeno, além de dificultar a extração de informações através dos dados analisados, já que o impacto nos resultados dos estudos nem sempre são conhecidos. Como uma considerável parte das técnicas estatísticas foram desenvolvidas para analisar dados completos, os dados faltantes geralmente precisam ser tratados de maneira que o conjunto de dados resultante possa ser analisado por tais métodos já consolidados. Os métodos mais utilizados para lidar com dados faltantes se dividem, principalmente, entre métodos de remoção e de imputação de dados, sendo ambas as configurações, na maioria das vezes, desvantajosas em termos da análise do resultado final, seja por tornar os resultados viesados ou por termos que trabalhar com a incerteza associada à imputação de valores desconhecidos. Nesse trabalho, então, propomos alguns métodos baseados em modelos para a resolução do problema de dados ausentes para análise de regressão, sem que seja necessário recorrer à imputação ou à remoção de informações. Verificamos o desempenho das metodologias propostas em dados simulados sob diferentes cenários e comparamos com o desempenho de outras técnicas tradicionais de imputação e remoção de dados.
id USP_d71abc74508b3754288cc0f042e192e9
oai_identifier_str oai:teses.usp.br:tde-29112022-094513
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Métodos de estimação baseados em modelos na presença de dados faltantesModel-based estimation methods in the presence of missing data.Algoritmo EMData imputationEM algorithmImputação de dadosIntegração numéricaLinear and nonlinear regression modelsModelos lineares e não lineares de regressãoNumerical integrationOs dados faltantes são observações que deveriam ter sido feitas, mas não foram por algum motivo, reduzindo, assim, a capacidade de entender a natureza do fenômeno, além de dificultar a extração de informações através dos dados analisados, já que o impacto nos resultados dos estudos nem sempre são conhecidos. Como uma considerável parte das técnicas estatísticas foram desenvolvidas para analisar dados completos, os dados faltantes geralmente precisam ser tratados de maneira que o conjunto de dados resultante possa ser analisado por tais métodos já consolidados. Os métodos mais utilizados para lidar com dados faltantes se dividem, principalmente, entre métodos de remoção e de imputação de dados, sendo ambas as configurações, na maioria das vezes, desvantajosas em termos da análise do resultado final, seja por tornar os resultados viesados ou por termos que trabalhar com a incerteza associada à imputação de valores desconhecidos. Nesse trabalho, então, propomos alguns métodos baseados em modelos para a resolução do problema de dados ausentes para análise de regressão, sem que seja necessário recorrer à imputação ou à remoção de informações. Verificamos o desempenho das metodologias propostas em dados simulados sob diferentes cenários e comparamos com o desempenho de outras técnicas tradicionais de imputação e remoção de dados.The missing data are observations that should have been made, but were not for some reason, thus reducing the ability to understand the nature of the phenomenon, in addition to making it difficult to extract information from the analyzed data, since the impact on the results of the studies is not always known. As a considerable part of the statistical techniques were developed to analyze complete data, the missing data usually need to be treated in such a way that the resulting dataset can be analyzed by such established methods. The most used methods to deal with missing data are divided, mainly, between methods of data removal and imputation, being both configurations, in most cases, disadvantageous in terms of the analysis of the final result, either by making the results biased or because we have to work with the uncertainty associated with the imputation of unknown values. In this work, then, we propose some model-based methods for solving the problem of missing data for regression analysis, without having to resort to imputation or removal of information. We verified the performance of the proposed methodologies on simulated data under different scenarios and compared it with the performance of other traditional techniques of imputation and data removal.Biblioteca Digitais de Teses e Dissertações da USPZuanetti, Daiane AparecidaRibeiro, Taís Roberta2022-10-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/104/104131/tde-29112022-094513/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-11-29T11:48:02Zoai:teses.usp.br:tde-29112022-094513Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-11-29T11:48:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Métodos de estimação baseados em modelos na presença de dados faltantes
Model-based estimation methods in the presence of missing data.
title Métodos de estimação baseados em modelos na presença de dados faltantes
spellingShingle Métodos de estimação baseados em modelos na presença de dados faltantes
Ribeiro, Taís Roberta
Algoritmo EM
Data imputation
EM algorithm
Imputação de dados
Integração numérica
Linear and nonlinear regression models
Modelos lineares e não lineares de regressão
Numerical integration
title_short Métodos de estimação baseados em modelos na presença de dados faltantes
title_full Métodos de estimação baseados em modelos na presença de dados faltantes
title_fullStr Métodos de estimação baseados em modelos na presença de dados faltantes
title_full_unstemmed Métodos de estimação baseados em modelos na presença de dados faltantes
title_sort Métodos de estimação baseados em modelos na presença de dados faltantes
author Ribeiro, Taís Roberta
author_facet Ribeiro, Taís Roberta
author_role author
dc.contributor.none.fl_str_mv Zuanetti, Daiane Aparecida
dc.contributor.author.fl_str_mv Ribeiro, Taís Roberta
dc.subject.por.fl_str_mv Algoritmo EM
Data imputation
EM algorithm
Imputação de dados
Integração numérica
Linear and nonlinear regression models
Modelos lineares e não lineares de regressão
Numerical integration
topic Algoritmo EM
Data imputation
EM algorithm
Imputação de dados
Integração numérica
Linear and nonlinear regression models
Modelos lineares e não lineares de regressão
Numerical integration
description Os dados faltantes são observações que deveriam ter sido feitas, mas não foram por algum motivo, reduzindo, assim, a capacidade de entender a natureza do fenômeno, além de dificultar a extração de informações através dos dados analisados, já que o impacto nos resultados dos estudos nem sempre são conhecidos. Como uma considerável parte das técnicas estatísticas foram desenvolvidas para analisar dados completos, os dados faltantes geralmente precisam ser tratados de maneira que o conjunto de dados resultante possa ser analisado por tais métodos já consolidados. Os métodos mais utilizados para lidar com dados faltantes se dividem, principalmente, entre métodos de remoção e de imputação de dados, sendo ambas as configurações, na maioria das vezes, desvantajosas em termos da análise do resultado final, seja por tornar os resultados viesados ou por termos que trabalhar com a incerteza associada à imputação de valores desconhecidos. Nesse trabalho, então, propomos alguns métodos baseados em modelos para a resolução do problema de dados ausentes para análise de regressão, sem que seja necessário recorrer à imputação ou à remoção de informações. Verificamos o desempenho das metodologias propostas em dados simulados sob diferentes cenários e comparamos com o desempenho de outras técnicas tradicionais de imputação e remoção de dados.
publishDate 2022
dc.date.none.fl_str_mv 2022-10-14
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/104/104131/tde-29112022-094513/
url https://www.teses.usp.br/teses/disponiveis/104/104131/tde-29112022-094513/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257491770966016