Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular

Detalhes bibliográficos
Autor(a) principal: Bergamo, Genevile Carife
Data de Publicação: 2008
Outros Autores: Dias, Carlos Tadeu dos Santos, Krzanowski, Wojtek Janusz
Tipo de documento: Artigo
Idioma: eng
Título da fonte: Scientia Agrícola (Online)
Texto Completo: https://www.revistas.usp.br/sa/article/view/22316
Resumo: Algumas técnicas de análise estatística multivariada só podem ser realizadas com uma matriz de dados completa, porém o processo de coleta dos dados freqüentemente leva a uma matriz com dados ausentes. A imputação é uma técnica, na qual os dados ausentes são preenchidos com valores plausíveis, para uma posterior análise na matriz completa. Neste trabalho, nós propomos um método de imputação múltipla, baseado no método da decomposição por valores singulares (DVS) para imputação simples, desenvolvido por Krzanowski, e avaliado numa matriz de interação genótipos × ambientes (G × E), proveniente de um ensaio com o delineamento aleatorizado em blocos em multiambientes com genótipos de Eucalyptus grandis. Valores da altura de E. grandis da matriz completa de interação G × E foram retirados aleatoriamente em três diferentes proporções (5%, 10%, 30%), os quais foram imputados valores dados pelo método proposto. Os resultados obtidos por meio da medida geral de exatidão ou acurácia (Tacc) mostraram um viés pequeno, em relação aos valores originais. No entanto, seus valores foram maiores do que a variabilidade dos valores imputados em relação à sua média, indicando uma exatidão ou acurácia menor do método proposto em relação à sua precisão. A metodologia proposta utiliza o maior número de informação disponível, não possui qualquer restrição quanto ao padrão e mecanismo de ausência de dados e é livre de suposição sobre a distribuição ou estrutura dos dados.
id USP-18_6e4ae3072878e07bb2b159f444a92394
oai_identifier_str oai:revistas.usp.br:article/22316
network_acronym_str USP-18
network_name_str Scientia Agrícola (Online)
repository_id_str
spelling Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular Distribution-free multiple imputation in an interaction matrix through singular value decomposition dados ausentesnão-paramétricoautovalorautovetorgenótipo-ambientemissing datanonparametriceigenvalueeigenvectorgenotype-environment Algumas técnicas de análise estatística multivariada só podem ser realizadas com uma matriz de dados completa, porém o processo de coleta dos dados freqüentemente leva a uma matriz com dados ausentes. A imputação é uma técnica, na qual os dados ausentes são preenchidos com valores plausíveis, para uma posterior análise na matriz completa. Neste trabalho, nós propomos um método de imputação múltipla, baseado no método da decomposição por valores singulares (DVS) para imputação simples, desenvolvido por Krzanowski, e avaliado numa matriz de interação genótipos × ambientes (G × E), proveniente de um ensaio com o delineamento aleatorizado em blocos em multiambientes com genótipos de Eucalyptus grandis. Valores da altura de E. grandis da matriz completa de interação G × E foram retirados aleatoriamente em três diferentes proporções (5%, 10%, 30%), os quais foram imputados valores dados pelo método proposto. Os resultados obtidos por meio da medida geral de exatidão ou acurácia (Tacc) mostraram um viés pequeno, em relação aos valores originais. No entanto, seus valores foram maiores do que a variabilidade dos valores imputados em relação à sua média, indicando uma exatidão ou acurácia menor do método proposto em relação à sua precisão. A metodologia proposta utiliza o maior número de informação disponível, não possui qualquer restrição quanto ao padrão e mecanismo de ausência de dados e é livre de suposição sobre a distribuição ou estrutura dos dados. Some techniques of multivariate statistical analysis can only be conducted on a complete data matrix, but the process of data collection often misses some elements. Imputation is a technique by which the missing elements are replaced by plausible values, so that a valid analysis can be performed on the completed data set. A multiple imputation method is proposed based on a modification to the singular value decomposition (SVD) method for single imputation, developed by Krzanowski. The method was evaluated on a genotype × environment (G × E) interaction matrix obtained from a randomized blocks experiment on Eucalyptus grandis grown in multienvironments. Values of E. grandis heights in the G × E complete interaction matrix were deleted randomly at three different rates (5%, 10%, 30%) and were then imputed by the proposed methodology. The results were assessed by means of a general measure of performance (Tacc), and showed a small bias when compared to the original data. However, bias values were greater than the variability of imputations relative to their mean, indicating a smaller accuracy of the proposed method in relation to its precision. The proposed methodology uses the maximum amount of available information, does not have any restrictions regarding the pattern or mechanism of the missing values, and is free of assumptions on the data distribution or structure. Universidade de São Paulo. Escola Superior de Agricultura Luiz de Queiroz2008-01-01info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://www.revistas.usp.br/sa/article/view/2231610.1590/S0103-90162008000400015Scientia Agricola; v. 65 n. 4 (2008); 422-427Scientia Agricola; Vol. 65 Núm. 4 (2008); 422-427Scientia Agricola; Vol. 65 No. 4 (2008); 422-4271678-992X0103-9016reponame:Scientia Agrícola (Online)instname:Universidade de São Paulo (USP)instacron:USPenghttps://www.revistas.usp.br/sa/article/view/22316/24340Copyright (c) 2015 Scientia Agricolainfo:eu-repo/semantics/openAccessBergamo, Genevile CarifeDias, Carlos Tadeu dos SantosKrzanowski, Wojtek Janusz2015-07-07T18:02:27Zoai:revistas.usp.br:article/22316Revistahttp://revistas.usp.br/sa/indexPUBhttps://old.scielo.br/oai/scielo-oai.phpscientia@usp.br||alleoni@usp.br1678-992X0103-9016opendoar:2015-07-07T18:02:27Scientia Agrícola (Online) - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular
Distribution-free multiple imputation in an interaction matrix through singular value decomposition
title Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular
spellingShingle Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular
Bergamo, Genevile Carife
dados ausentes
não-paramétrico
autovalor
autovetor
genótipo-ambiente
missing data
nonparametric
eigenvalue
eigenvector
genotype-environment
title_short Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular
title_full Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular
title_fullStr Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular
title_full_unstemmed Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular
title_sort Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular
author Bergamo, Genevile Carife
author_facet Bergamo, Genevile Carife
Dias, Carlos Tadeu dos Santos
Krzanowski, Wojtek Janusz
author_role author
author2 Dias, Carlos Tadeu dos Santos
Krzanowski, Wojtek Janusz
author2_role author
author
dc.contributor.author.fl_str_mv Bergamo, Genevile Carife
Dias, Carlos Tadeu dos Santos
Krzanowski, Wojtek Janusz
dc.subject.por.fl_str_mv dados ausentes
não-paramétrico
autovalor
autovetor
genótipo-ambiente
missing data
nonparametric
eigenvalue
eigenvector
genotype-environment
topic dados ausentes
não-paramétrico
autovalor
autovetor
genótipo-ambiente
missing data
nonparametric
eigenvalue
eigenvector
genotype-environment
description Algumas técnicas de análise estatística multivariada só podem ser realizadas com uma matriz de dados completa, porém o processo de coleta dos dados freqüentemente leva a uma matriz com dados ausentes. A imputação é uma técnica, na qual os dados ausentes são preenchidos com valores plausíveis, para uma posterior análise na matriz completa. Neste trabalho, nós propomos um método de imputação múltipla, baseado no método da decomposição por valores singulares (DVS) para imputação simples, desenvolvido por Krzanowski, e avaliado numa matriz de interação genótipos × ambientes (G × E), proveniente de um ensaio com o delineamento aleatorizado em blocos em multiambientes com genótipos de Eucalyptus grandis. Valores da altura de E. grandis da matriz completa de interação G × E foram retirados aleatoriamente em três diferentes proporções (5%, 10%, 30%), os quais foram imputados valores dados pelo método proposto. Os resultados obtidos por meio da medida geral de exatidão ou acurácia (Tacc) mostraram um viés pequeno, em relação aos valores originais. No entanto, seus valores foram maiores do que a variabilidade dos valores imputados em relação à sua média, indicando uma exatidão ou acurácia menor do método proposto em relação à sua precisão. A metodologia proposta utiliza o maior número de informação disponível, não possui qualquer restrição quanto ao padrão e mecanismo de ausência de dados e é livre de suposição sobre a distribuição ou estrutura dos dados.
publishDate 2008
dc.date.none.fl_str_mv 2008-01-01
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.revistas.usp.br/sa/article/view/22316
10.1590/S0103-90162008000400015
url https://www.revistas.usp.br/sa/article/view/22316
identifier_str_mv 10.1590/S0103-90162008000400015
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv https://www.revistas.usp.br/sa/article/view/22316/24340
dc.rights.driver.fl_str_mv Copyright (c) 2015 Scientia Agricola
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2015 Scientia Agricola
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade de São Paulo. Escola Superior de Agricultura Luiz de Queiroz
publisher.none.fl_str_mv Universidade de São Paulo. Escola Superior de Agricultura Luiz de Queiroz
dc.source.none.fl_str_mv Scientia Agricola; v. 65 n. 4 (2008); 422-427
Scientia Agricola; Vol. 65 Núm. 4 (2008); 422-427
Scientia Agricola; Vol. 65 No. 4 (2008); 422-427
1678-992X
0103-9016
reponame:Scientia Agrícola (Online)
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Scientia Agrícola (Online)
collection Scientia Agrícola (Online)
repository.name.fl_str_mv Scientia Agrícola (Online) - Universidade de São Paulo (USP)
repository.mail.fl_str_mv scientia@usp.br||alleoni@usp.br
_version_ 1800222789204967424