Imputação múltipla utilizando o software SPSS
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/158042 |
Resumo: | Introdução: Muitos dos métodos estatísticos existentes, como por exemplo modelos de regressão, exigem informações completas para que os resultados sejam produzidos. Porém, sabemos que na prática muitas vezes este pressuposto não é facilmente atendido. Como forma de tratamento aos dados faltantes temos a Imputação Múltipla (IM). Basicamente a técnica da IM consiste em criarmos cópias do banco de dados onde os dados faltantes são substituídos por diferentes valores imputados. O objetivo deste trabalho será aplicar e descrever a técnica de Imputação Múltipla no software SPSS. Aplicação: Os dados utilizados se referem aos resultados obtidos em prova prática de candidatos a terem sua primeira habilitação para veículos de 4 rodas. Os dados originais não possuem valores faltantes, assim para proceder a IM no SPSS, perdas (5%, 10% e 20%) foram simuladas para uma variável preditora e para variável resposta correspondendo ao modelo de regressão utilizado. Para a qualificação das IM os bancos imputados foram analisados através de regressão logística e regressão de Poisson. Os resultados foram comparados entre os níveis de perda, e com os resultados obtidos para o banco completo. Resultados: Foi bastante satisfatório os resultados das regressões para os bancos com IM. As diferenças foram bem pequenas, então se realmente existisse a perda e a IM fosse necessária não teríamos grandes prejuízos nos resultados e suas respectivas interpretações. O software SPSS possui mais de um modelo de IM disponível e sua interface é bem intuitiva e amigável, o que facilita o uso da IM. |
id |
UFRGS-2_b43c713db02f13a6cf1edcf71fe5d0e6 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/158042 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Rodrigues, Natalia VaisNunes, Luciana Neves2017-05-17T02:35:50Z2016http://hdl.handle.net/10183/158042001020167Introdução: Muitos dos métodos estatísticos existentes, como por exemplo modelos de regressão, exigem informações completas para que os resultados sejam produzidos. Porém, sabemos que na prática muitas vezes este pressuposto não é facilmente atendido. Como forma de tratamento aos dados faltantes temos a Imputação Múltipla (IM). Basicamente a técnica da IM consiste em criarmos cópias do banco de dados onde os dados faltantes são substituídos por diferentes valores imputados. O objetivo deste trabalho será aplicar e descrever a técnica de Imputação Múltipla no software SPSS. Aplicação: Os dados utilizados se referem aos resultados obtidos em prova prática de candidatos a terem sua primeira habilitação para veículos de 4 rodas. Os dados originais não possuem valores faltantes, assim para proceder a IM no SPSS, perdas (5%, 10% e 20%) foram simuladas para uma variável preditora e para variável resposta correspondendo ao modelo de regressão utilizado. Para a qualificação das IM os bancos imputados foram analisados através de regressão logística e regressão de Poisson. Os resultados foram comparados entre os níveis de perda, e com os resultados obtidos para o banco completo. Resultados: Foi bastante satisfatório os resultados das regressões para os bancos com IM. As diferenças foram bem pequenas, então se realmente existisse a perda e a IM fosse necessária não teríamos grandes prejuízos nos resultados e suas respectivas interpretações. O software SPSS possui mais de um modelo de IM disponível e sua interface é bem intuitiva e amigável, o que facilita o uso da IM.Introduction: Several of the existing statistical methods, such as regression models, require complete information for the results to be produced. However, we know that in practice this assumption is often not easily accomplished. As a form of treatment to the missing data we have the Multiple Imputation (MI). Basically the MI technique consists on creating copies of the database where the missing data is replaced by different imputed values. The purpose of this paper will be to apply and describe the Multiple Imputation technique in SPSS software. Application: The used data refers to the results obtained in a practical test of candidates to have their first driver’s license for four wheeled vehicles. The original data does not have missing values, so to proceed to MI in SPSS, losses (5%, 10% and 20%) were simulated for a predictive variable and for response variable corresponding to the regression model used. In order to qualify MI, the imputed banks were analyzed through logistic regression and Poisson regression. The results were compared between the loss levels, and with the results obtained for the complete bank. Results: We found the results of the regressions for banks with MI were quite satisfactory. The differences were very small, so if there was indeed a loss and MI was necessary we would not have much damage in the results and their respective interpretations. SPSS software has more than one MI model available and its interface is intuitive and user-friendly, making it easy to use MI.application/pdfporImputação múltiplaRegressão logísticaMissing dataMultiple imputationSPSSLogistic regressionPoisson regressionImputação múltipla utilizando o software SPSSinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de Matemática e EstatísticaPorto Alegre, BR-RS2016Matemática: Licenciaturagraduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL001020167.pdf001020167.pdfTexto completoapplication/pdf1088677http://www.lume.ufrgs.br/bitstream/10183/158042/1/001020167.pdf867524fae8a644e63c017e52488db453MD51TEXT001020167.pdf.txt001020167.pdf.txtExtracted Texttext/plain58613http://www.lume.ufrgs.br/bitstream/10183/158042/2/001020167.pdf.txt8d46162c7361810d4c68ceffb47b187aMD52THUMBNAIL001020167.pdf.jpg001020167.pdf.jpgGenerated Thumbnailimage/jpeg1278http://www.lume.ufrgs.br/bitstream/10183/158042/3/001020167.pdf.jpgf23fe08486101be3e19322b33b6d2a03MD5310183/1580422018-10-30 08:06:01.215oai:www.lume.ufrgs.br:10183/158042Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2018-10-30T11:06:01Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Imputação múltipla utilizando o software SPSS |
title |
Imputação múltipla utilizando o software SPSS |
spellingShingle |
Imputação múltipla utilizando o software SPSS Rodrigues, Natalia Vais Imputação múltipla Regressão logística Missing data Multiple imputation SPSS Logistic regression Poisson regression |
title_short |
Imputação múltipla utilizando o software SPSS |
title_full |
Imputação múltipla utilizando o software SPSS |
title_fullStr |
Imputação múltipla utilizando o software SPSS |
title_full_unstemmed |
Imputação múltipla utilizando o software SPSS |
title_sort |
Imputação múltipla utilizando o software SPSS |
author |
Rodrigues, Natalia Vais |
author_facet |
Rodrigues, Natalia Vais |
author_role |
author |
dc.contributor.author.fl_str_mv |
Rodrigues, Natalia Vais |
dc.contributor.advisor1.fl_str_mv |
Nunes, Luciana Neves |
contributor_str_mv |
Nunes, Luciana Neves |
dc.subject.por.fl_str_mv |
Imputação múltipla Regressão logística |
topic |
Imputação múltipla Regressão logística Missing data Multiple imputation SPSS Logistic regression Poisson regression |
dc.subject.eng.fl_str_mv |
Missing data Multiple imputation SPSS Logistic regression Poisson regression |
description |
Introdução: Muitos dos métodos estatísticos existentes, como por exemplo modelos de regressão, exigem informações completas para que os resultados sejam produzidos. Porém, sabemos que na prática muitas vezes este pressuposto não é facilmente atendido. Como forma de tratamento aos dados faltantes temos a Imputação Múltipla (IM). Basicamente a técnica da IM consiste em criarmos cópias do banco de dados onde os dados faltantes são substituídos por diferentes valores imputados. O objetivo deste trabalho será aplicar e descrever a técnica de Imputação Múltipla no software SPSS. Aplicação: Os dados utilizados se referem aos resultados obtidos em prova prática de candidatos a terem sua primeira habilitação para veículos de 4 rodas. Os dados originais não possuem valores faltantes, assim para proceder a IM no SPSS, perdas (5%, 10% e 20%) foram simuladas para uma variável preditora e para variável resposta correspondendo ao modelo de regressão utilizado. Para a qualificação das IM os bancos imputados foram analisados através de regressão logística e regressão de Poisson. Os resultados foram comparados entre os níveis de perda, e com os resultados obtidos para o banco completo. Resultados: Foi bastante satisfatório os resultados das regressões para os bancos com IM. As diferenças foram bem pequenas, então se realmente existisse a perda e a IM fosse necessária não teríamos grandes prejuízos nos resultados e suas respectivas interpretações. O software SPSS possui mais de um modelo de IM disponível e sua interface é bem intuitiva e amigável, o que facilita o uso da IM. |
publishDate |
2016 |
dc.date.issued.fl_str_mv |
2016 |
dc.date.accessioned.fl_str_mv |
2017-05-17T02:35:50Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/158042 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001020167 |
url |
http://hdl.handle.net/10183/158042 |
identifier_str_mv |
001020167 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/158042/1/001020167.pdf http://www.lume.ufrgs.br/bitstream/10183/158042/2/001020167.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/158042/3/001020167.pdf.jpg |
bitstream.checksum.fl_str_mv |
867524fae8a644e63c017e52488db453 8d46162c7361810d4c68ceffb47b187a f23fe08486101be3e19322b33b6d2a03 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1801224531166101504 |