Métodos de estimação baseados em modelos na presença de dados faltantes
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/104/104131/tde-29112022-094513/ |
Resumo: | Os dados faltantes são observações que deveriam ter sido feitas, mas não foram por algum motivo, reduzindo, assim, a capacidade de entender a natureza do fenômeno, além de dificultar a extração de informações através dos dados analisados, já que o impacto nos resultados dos estudos nem sempre são conhecidos. Como uma considerável parte das técnicas estatísticas foram desenvolvidas para analisar dados completos, os dados faltantes geralmente precisam ser tratados de maneira que o conjunto de dados resultante possa ser analisado por tais métodos já consolidados. Os métodos mais utilizados para lidar com dados faltantes se dividem, principalmente, entre métodos de remoção e de imputação de dados, sendo ambas as configurações, na maioria das vezes, desvantajosas em termos da análise do resultado final, seja por tornar os resultados viesados ou por termos que trabalhar com a incerteza associada à imputação de valores desconhecidos. Nesse trabalho, então, propomos alguns métodos baseados em modelos para a resolução do problema de dados ausentes para análise de regressão, sem que seja necessário recorrer à imputação ou à remoção de informações. Verificamos o desempenho das metodologias propostas em dados simulados sob diferentes cenários e comparamos com o desempenho de outras técnicas tradicionais de imputação e remoção de dados. |
id |
USP_d71abc74508b3754288cc0f042e192e9 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-29112022-094513 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Métodos de estimação baseados em modelos na presença de dados faltantesModel-based estimation methods in the presence of missing data.Algoritmo EMData imputationEM algorithmImputação de dadosIntegração numéricaLinear and nonlinear regression modelsModelos lineares e não lineares de regressãoNumerical integrationOs dados faltantes são observações que deveriam ter sido feitas, mas não foram por algum motivo, reduzindo, assim, a capacidade de entender a natureza do fenômeno, além de dificultar a extração de informações através dos dados analisados, já que o impacto nos resultados dos estudos nem sempre são conhecidos. Como uma considerável parte das técnicas estatísticas foram desenvolvidas para analisar dados completos, os dados faltantes geralmente precisam ser tratados de maneira que o conjunto de dados resultante possa ser analisado por tais métodos já consolidados. Os métodos mais utilizados para lidar com dados faltantes se dividem, principalmente, entre métodos de remoção e de imputação de dados, sendo ambas as configurações, na maioria das vezes, desvantajosas em termos da análise do resultado final, seja por tornar os resultados viesados ou por termos que trabalhar com a incerteza associada à imputação de valores desconhecidos. Nesse trabalho, então, propomos alguns métodos baseados em modelos para a resolução do problema de dados ausentes para análise de regressão, sem que seja necessário recorrer à imputação ou à remoção de informações. Verificamos o desempenho das metodologias propostas em dados simulados sob diferentes cenários e comparamos com o desempenho de outras técnicas tradicionais de imputação e remoção de dados.The missing data are observations that should have been made, but were not for some reason, thus reducing the ability to understand the nature of the phenomenon, in addition to making it difficult to extract information from the analyzed data, since the impact on the results of the studies is not always known. As a considerable part of the statistical techniques were developed to analyze complete data, the missing data usually need to be treated in such a way that the resulting dataset can be analyzed by such established methods. The most used methods to deal with missing data are divided, mainly, between methods of data removal and imputation, being both configurations, in most cases, disadvantageous in terms of the analysis of the final result, either by making the results biased or because we have to work with the uncertainty associated with the imputation of unknown values. In this work, then, we propose some model-based methods for solving the problem of missing data for regression analysis, without having to resort to imputation or removal of information. We verified the performance of the proposed methodologies on simulated data under different scenarios and compared it with the performance of other traditional techniques of imputation and data removal.Biblioteca Digitais de Teses e Dissertações da USPZuanetti, Daiane AparecidaRibeiro, Taís Roberta2022-10-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/104/104131/tde-29112022-094513/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-11-29T11:48:02Zoai:teses.usp.br:tde-29112022-094513Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-11-29T11:48:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Métodos de estimação baseados em modelos na presença de dados faltantes Model-based estimation methods in the presence of missing data. |
title |
Métodos de estimação baseados em modelos na presença de dados faltantes |
spellingShingle |
Métodos de estimação baseados em modelos na presença de dados faltantes Ribeiro, Taís Roberta Algoritmo EM Data imputation EM algorithm Imputação de dados Integração numérica Linear and nonlinear regression models Modelos lineares e não lineares de regressão Numerical integration |
title_short |
Métodos de estimação baseados em modelos na presença de dados faltantes |
title_full |
Métodos de estimação baseados em modelos na presença de dados faltantes |
title_fullStr |
Métodos de estimação baseados em modelos na presença de dados faltantes |
title_full_unstemmed |
Métodos de estimação baseados em modelos na presença de dados faltantes |
title_sort |
Métodos de estimação baseados em modelos na presença de dados faltantes |
author |
Ribeiro, Taís Roberta |
author_facet |
Ribeiro, Taís Roberta |
author_role |
author |
dc.contributor.none.fl_str_mv |
Zuanetti, Daiane Aparecida |
dc.contributor.author.fl_str_mv |
Ribeiro, Taís Roberta |
dc.subject.por.fl_str_mv |
Algoritmo EM Data imputation EM algorithm Imputação de dados Integração numérica Linear and nonlinear regression models Modelos lineares e não lineares de regressão Numerical integration |
topic |
Algoritmo EM Data imputation EM algorithm Imputação de dados Integração numérica Linear and nonlinear regression models Modelos lineares e não lineares de regressão Numerical integration |
description |
Os dados faltantes são observações que deveriam ter sido feitas, mas não foram por algum motivo, reduzindo, assim, a capacidade de entender a natureza do fenômeno, além de dificultar a extração de informações através dos dados analisados, já que o impacto nos resultados dos estudos nem sempre são conhecidos. Como uma considerável parte das técnicas estatísticas foram desenvolvidas para analisar dados completos, os dados faltantes geralmente precisam ser tratados de maneira que o conjunto de dados resultante possa ser analisado por tais métodos já consolidados. Os métodos mais utilizados para lidar com dados faltantes se dividem, principalmente, entre métodos de remoção e de imputação de dados, sendo ambas as configurações, na maioria das vezes, desvantajosas em termos da análise do resultado final, seja por tornar os resultados viesados ou por termos que trabalhar com a incerteza associada à imputação de valores desconhecidos. Nesse trabalho, então, propomos alguns métodos baseados em modelos para a resolução do problema de dados ausentes para análise de regressão, sem que seja necessário recorrer à imputação ou à remoção de informações. Verificamos o desempenho das metodologias propostas em dados simulados sob diferentes cenários e comparamos com o desempenho de outras técnicas tradicionais de imputação e remoção de dados. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-10-14 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/104/104131/tde-29112022-094513/ |
url |
https://www.teses.usp.br/teses/disponiveis/104/104131/tde-29112022-094513/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815257491770966016 |