Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular
Autor(a) principal: | |
---|---|
Data de Publicação: | 2008 |
Outros Autores: | , |
Tipo de documento: | Artigo |
Idioma: | eng |
Título da fonte: | Scientia Agrícola (Online) |
Texto Completo: | https://www.revistas.usp.br/sa/article/view/22316 |
Resumo: | Algumas técnicas de análise estatística multivariada só podem ser realizadas com uma matriz de dados completa, porém o processo de coleta dos dados freqüentemente leva a uma matriz com dados ausentes. A imputação é uma técnica, na qual os dados ausentes são preenchidos com valores plausíveis, para uma posterior análise na matriz completa. Neste trabalho, nós propomos um método de imputação múltipla, baseado no método da decomposição por valores singulares (DVS) para imputação simples, desenvolvido por Krzanowski, e avaliado numa matriz de interação genótipos × ambientes (G × E), proveniente de um ensaio com o delineamento aleatorizado em blocos em multiambientes com genótipos de Eucalyptus grandis. Valores da altura de E. grandis da matriz completa de interação G × E foram retirados aleatoriamente em três diferentes proporções (5%, 10%, 30%), os quais foram imputados valores dados pelo método proposto. Os resultados obtidos por meio da medida geral de exatidão ou acurácia (Tacc) mostraram um viés pequeno, em relação aos valores originais. No entanto, seus valores foram maiores do que a variabilidade dos valores imputados em relação à sua média, indicando uma exatidão ou acurácia menor do método proposto em relação à sua precisão. A metodologia proposta utiliza o maior número de informação disponível, não possui qualquer restrição quanto ao padrão e mecanismo de ausência de dados e é livre de suposição sobre a distribuição ou estrutura dos dados. |
id |
USP-18_6e4ae3072878e07bb2b159f444a92394 |
---|---|
oai_identifier_str |
oai:revistas.usp.br:article/22316 |
network_acronym_str |
USP-18 |
network_name_str |
Scientia Agrícola (Online) |
repository_id_str |
|
spelling |
Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular Distribution-free multiple imputation in an interaction matrix through singular value decomposition dados ausentesnão-paramétricoautovalorautovetorgenótipo-ambientemissing datanonparametriceigenvalueeigenvectorgenotype-environment Algumas técnicas de análise estatística multivariada só podem ser realizadas com uma matriz de dados completa, porém o processo de coleta dos dados freqüentemente leva a uma matriz com dados ausentes. A imputação é uma técnica, na qual os dados ausentes são preenchidos com valores plausíveis, para uma posterior análise na matriz completa. Neste trabalho, nós propomos um método de imputação múltipla, baseado no método da decomposição por valores singulares (DVS) para imputação simples, desenvolvido por Krzanowski, e avaliado numa matriz de interação genótipos × ambientes (G × E), proveniente de um ensaio com o delineamento aleatorizado em blocos em multiambientes com genótipos de Eucalyptus grandis. Valores da altura de E. grandis da matriz completa de interação G × E foram retirados aleatoriamente em três diferentes proporções (5%, 10%, 30%), os quais foram imputados valores dados pelo método proposto. Os resultados obtidos por meio da medida geral de exatidão ou acurácia (Tacc) mostraram um viés pequeno, em relação aos valores originais. No entanto, seus valores foram maiores do que a variabilidade dos valores imputados em relação à sua média, indicando uma exatidão ou acurácia menor do método proposto em relação à sua precisão. A metodologia proposta utiliza o maior número de informação disponível, não possui qualquer restrição quanto ao padrão e mecanismo de ausência de dados e é livre de suposição sobre a distribuição ou estrutura dos dados. Some techniques of multivariate statistical analysis can only be conducted on a complete data matrix, but the process of data collection often misses some elements. Imputation is a technique by which the missing elements are replaced by plausible values, so that a valid analysis can be performed on the completed data set. A multiple imputation method is proposed based on a modification to the singular value decomposition (SVD) method for single imputation, developed by Krzanowski. The method was evaluated on a genotype × environment (G × E) interaction matrix obtained from a randomized blocks experiment on Eucalyptus grandis grown in multienvironments. Values of E. grandis heights in the G × E complete interaction matrix were deleted randomly at three different rates (5%, 10%, 30%) and were then imputed by the proposed methodology. The results were assessed by means of a general measure of performance (Tacc), and showed a small bias when compared to the original data. However, bias values were greater than the variability of imputations relative to their mean, indicating a smaller accuracy of the proposed method in relation to its precision. The proposed methodology uses the maximum amount of available information, does not have any restrictions regarding the pattern or mechanism of the missing values, and is free of assumptions on the data distribution or structure. Universidade de São Paulo. Escola Superior de Agricultura Luiz de Queiroz2008-01-01info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://www.revistas.usp.br/sa/article/view/2231610.1590/S0103-90162008000400015Scientia Agricola; v. 65 n. 4 (2008); 422-427Scientia Agricola; Vol. 65 Núm. 4 (2008); 422-427Scientia Agricola; Vol. 65 No. 4 (2008); 422-4271678-992X0103-9016reponame:Scientia Agrícola (Online)instname:Universidade de São Paulo (USP)instacron:USPenghttps://www.revistas.usp.br/sa/article/view/22316/24340Copyright (c) 2015 Scientia Agricolainfo:eu-repo/semantics/openAccessBergamo, Genevile CarifeDias, Carlos Tadeu dos SantosKrzanowski, Wojtek Janusz2015-07-07T18:02:27Zoai:revistas.usp.br:article/22316Revistahttp://revistas.usp.br/sa/indexPUBhttps://old.scielo.br/oai/scielo-oai.phpscientia@usp.br||alleoni@usp.br1678-992X0103-9016opendoar:2015-07-07T18:02:27Scientia Agrícola (Online) - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular Distribution-free multiple imputation in an interaction matrix through singular value decomposition |
title |
Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular |
spellingShingle |
Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular Bergamo, Genevile Carife dados ausentes não-paramétrico autovalor autovetor genótipo-ambiente missing data nonparametric eigenvalue eigenvector genotype-environment |
title_short |
Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular |
title_full |
Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular |
title_fullStr |
Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular |
title_full_unstemmed |
Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular |
title_sort |
Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular |
author |
Bergamo, Genevile Carife |
author_facet |
Bergamo, Genevile Carife Dias, Carlos Tadeu dos Santos Krzanowski, Wojtek Janusz |
author_role |
author |
author2 |
Dias, Carlos Tadeu dos Santos Krzanowski, Wojtek Janusz |
author2_role |
author author |
dc.contributor.author.fl_str_mv |
Bergamo, Genevile Carife Dias, Carlos Tadeu dos Santos Krzanowski, Wojtek Janusz |
dc.subject.por.fl_str_mv |
dados ausentes não-paramétrico autovalor autovetor genótipo-ambiente missing data nonparametric eigenvalue eigenvector genotype-environment |
topic |
dados ausentes não-paramétrico autovalor autovetor genótipo-ambiente missing data nonparametric eigenvalue eigenvector genotype-environment |
description |
Algumas técnicas de análise estatística multivariada só podem ser realizadas com uma matriz de dados completa, porém o processo de coleta dos dados freqüentemente leva a uma matriz com dados ausentes. A imputação é uma técnica, na qual os dados ausentes são preenchidos com valores plausíveis, para uma posterior análise na matriz completa. Neste trabalho, nós propomos um método de imputação múltipla, baseado no método da decomposição por valores singulares (DVS) para imputação simples, desenvolvido por Krzanowski, e avaliado numa matriz de interação genótipos × ambientes (G × E), proveniente de um ensaio com o delineamento aleatorizado em blocos em multiambientes com genótipos de Eucalyptus grandis. Valores da altura de E. grandis da matriz completa de interação G × E foram retirados aleatoriamente em três diferentes proporções (5%, 10%, 30%), os quais foram imputados valores dados pelo método proposto. Os resultados obtidos por meio da medida geral de exatidão ou acurácia (Tacc) mostraram um viés pequeno, em relação aos valores originais. No entanto, seus valores foram maiores do que a variabilidade dos valores imputados em relação à sua média, indicando uma exatidão ou acurácia menor do método proposto em relação à sua precisão. A metodologia proposta utiliza o maior número de informação disponível, não possui qualquer restrição quanto ao padrão e mecanismo de ausência de dados e é livre de suposição sobre a distribuição ou estrutura dos dados. |
publishDate |
2008 |
dc.date.none.fl_str_mv |
2008-01-01 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.revistas.usp.br/sa/article/view/22316 10.1590/S0103-90162008000400015 |
url |
https://www.revistas.usp.br/sa/article/view/22316 |
identifier_str_mv |
10.1590/S0103-90162008000400015 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
https://www.revistas.usp.br/sa/article/view/22316/24340 |
dc.rights.driver.fl_str_mv |
Copyright (c) 2015 Scientia Agricola info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Copyright (c) 2015 Scientia Agricola |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade de São Paulo. Escola Superior de Agricultura Luiz de Queiroz |
publisher.none.fl_str_mv |
Universidade de São Paulo. Escola Superior de Agricultura Luiz de Queiroz |
dc.source.none.fl_str_mv |
Scientia Agricola; v. 65 n. 4 (2008); 422-427 Scientia Agricola; Vol. 65 Núm. 4 (2008); 422-427 Scientia Agricola; Vol. 65 No. 4 (2008); 422-427 1678-992X 0103-9016 reponame:Scientia Agrícola (Online) instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Scientia Agrícola (Online) |
collection |
Scientia Agrícola (Online) |
repository.name.fl_str_mv |
Scientia Agrícola (Online) - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
scientia@usp.br||alleoni@usp.br |
_version_ |
1800222789204967424 |