Procedimentos numéricos e estimação de componentes de covariância em análise multivariada pelo método da máxima verossimilhança restrita - modelos mistos aplicados ao melhoramento animal
Autor(a) principal: | |
---|---|
Data de Publicação: | 1994 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://teses.usp.br/teses/disponiveis/11/11134/tde-20191220-135928/ |
Resumo: | Este trabalho tem por objetivos: a) descrever alguns procedimentos numéricos para obtenção de solução de sistemas de equações lineares, e para estimação de componentes de covariância, em análise multivariada, aplicados à área de melhoramento animal; b) realizar uma avaliação comparativa entre os três sistemas de processamento de dados: DFREML (Derivative Free Restricted Maximum Likelihood (MEYER, 1993), MTC (Multitrait REML Estimation) (MISZTAL, 1992) e MTDFREML (Multiple Traits Derivative Free Restricted Maximum Likelihood) (BOLDMAN et al., 1993); e c) sugerir estratégias de análises, utilizando os programas em avaliação. Esses sistemas visam estimar componentes de covariância, adotando-se o método da máxima verossimilhança restrita (REML). Realiza-se uma breve descrição dos métodos numéricos comumente empregados na solução de sistemas de equações lineares. São mostrados os métodos de maior aplicação na área de melhoramento animal e áreas afins. Descrevem-se os principais métodos de estimação de componentes de covariância, deduzindo-se, na maioria dos casos, a forma de obtenção dos estimadores para cada um dos métodos. Apresentam-se formas apropriadas para simulação de dados baseada em modelo animal, considerando-se ou não o parentesco entre indivíduos. Estimam-se os componentes de variância e covariância a partir de dados cedidos por autores de diversas pesquisas; dados simulados e dados de campo, provenientes de registros de produção de leite de rebanhos da raça Gir leiteiro, extraídos do arquivo zootécnico nacional, mantido no CNPGL/EMBRAPA. Foram simuladas até três características para cada experimento, admitindo-se diferentes modelos (com um ou dois fatores aleatórios além do erro) e várias matrizes de componentes de covariância. Os sistemas são rápidos e eficientes para estimação de variâncias em análise univariada. Em análise multivariada, os métodos livres de derivadas são eficientes para estimação de componentes de covariância, para o caso em que as características apresentem correlações não muito elevadas e quando os valores preliminares ou valores de partida representem uma boa aproximação das estimativas. Estes métodos, no entanto, não se mostram apropriados quando os valores iniciais utilizados são distantes das estimativas. Da mesma forma, para análise em que se inclui um número elevado de características (maior do que 3) e para situações em que a matriz de coeficientes do modelo linear misto não é esparsa, os métodos livres de derivadas, embora estimem adequadamente os parâmetros, tornam-se extremamente lentos. Por outro lado, estes sistemas são flexíveis, permitindo adotar diferentes estratégias de estimação, para aumentar a velocidade e eficiência do processo. É possível, por exemplo, executar uma análise univariada, seguida de análise multivariada, fixando-se alguns dos componentes. Posteriormente, adotando-se os parâmetros pré-estimados, pode-se realizar a análise multivariada repetidas vezes, sem se fixar qualquer componente. Este procedimento é denominado neste trabalho de estratégia B. Tal estratégia conduz a bons resultados, ou seja, é um procedimento que permite estimar componentes de covariância em menor tempo, menor número de iterações e de avaliações da verossimilhança. O sistema MTC que adota o método REML e o algoritmo EM (maximização de esperanças), com transformação canônica do vetor de observações multivariadas, mostra-se muito eficiente para análise de modelos mistos com um único fator aleatório além do erro (modelo animal ou modelo de touro). No entanto, para modelos em que se incluem efeitos aleatórios adicionais (efeito permanente de meio, por exemplo), principalmente quando não há a diagonalização perfeita da matriz de componentes de covariância G, este sistema fornece estimativas apenas aproximadas. Este também não permite análise de modelos com presença de efeito aleatório adicional correlacionado com animal (efeito materno, por exemplo) Além disso, em análise multivariada, o sistema exige igualdade de matriz de delineamento entre variáveis. Neste caso, a perda de um dado implica na perda total do registro. Trata-se de um método rápido para estimação de componentes de covariâncias e produz estimativas sempre no espaço de parâmetros. Quando a convergência ocorre próximo ao limite do espaço de parâmetros ou quando se trata de superfícies muito planas, o método de Powell, adotado no sistema DFREML, apresenta frequentemente convergência irregular ou prematura, não sendo de uso indicado nestes casos. Nos demais casos, ele apresenta-se como um método eficiente. O sistema MTDFREML mostra-se muito eficiente na procura de máximos da função de verossimilhança. No entanto, é o sistema que apresenta convergência mais lenta em análise multivariada, praticamente em todas situações avaliadas. Tal lentidão pode, em algumas situações, comprometer o uso deste, dependendo do tipo de modelo a ser analisado, número de equações e de características a serem avaliadas. No geral, os sistemas em avaliação constituem-se em ótimas ferramentas para estimação de componentes de covariância para modelos bem gerais, com grande número de classes de efeitos fixos e aleatórios. |
id |
USP_1f590a2bc6b75fc316f3eb270930a2ae |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-20191220-135928 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Procedimentos numéricos e estimação de componentes de covariância em análise multivariada pelo método da máxima verossimilhança restrita - modelos mistos aplicados ao melhoramento animalNumerical procedures and estimation of covariance in multivariate analysis by the method of restricted maximum likelihood - mixed models applied to animal breedingANÁLISE MULTIVARIADACOMPONENTES DE COVARIÂNCIAESTIMAÇÃOMÁXIMA VEROSIMILHANÇAMELHORAMENTO GENÉTICO ANIMALMODELOS LINEARES MISTOSSISTEMAS COMPUTACIONAISEste trabalho tem por objetivos: a) descrever alguns procedimentos numéricos para obtenção de solução de sistemas de equações lineares, e para estimação de componentes de covariância, em análise multivariada, aplicados à área de melhoramento animal; b) realizar uma avaliação comparativa entre os três sistemas de processamento de dados: DFREML (Derivative Free Restricted Maximum Likelihood (MEYER, 1993), MTC (Multitrait REML Estimation) (MISZTAL, 1992) e MTDFREML (Multiple Traits Derivative Free Restricted Maximum Likelihood) (BOLDMAN et al., 1993); e c) sugerir estratégias de análises, utilizando os programas em avaliação. Esses sistemas visam estimar componentes de covariância, adotando-se o método da máxima verossimilhança restrita (REML). Realiza-se uma breve descrição dos métodos numéricos comumente empregados na solução de sistemas de equações lineares. São mostrados os métodos de maior aplicação na área de melhoramento animal e áreas afins. Descrevem-se os principais métodos de estimação de componentes de covariância, deduzindo-se, na maioria dos casos, a forma de obtenção dos estimadores para cada um dos métodos. Apresentam-se formas apropriadas para simulação de dados baseada em modelo animal, considerando-se ou não o parentesco entre indivíduos. Estimam-se os componentes de variância e covariância a partir de dados cedidos por autores de diversas pesquisas; dados simulados e dados de campo, provenientes de registros de produção de leite de rebanhos da raça Gir leiteiro, extraídos do arquivo zootécnico nacional, mantido no CNPGL/EMBRAPA. Foram simuladas até três características para cada experimento, admitindo-se diferentes modelos (com um ou dois fatores aleatórios além do erro) e várias matrizes de componentes de covariância. Os sistemas são rápidos e eficientes para estimação de variâncias em análise univariada. Em análise multivariada, os métodos livres de derivadas são eficientes para estimação de componentes de covariância, para o caso em que as características apresentem correlações não muito elevadas e quando os valores preliminares ou valores de partida representem uma boa aproximação das estimativas. Estes métodos, no entanto, não se mostram apropriados quando os valores iniciais utilizados são distantes das estimativas. Da mesma forma, para análise em que se inclui um número elevado de características (maior do que 3) e para situações em que a matriz de coeficientes do modelo linear misto não é esparsa, os métodos livres de derivadas, embora estimem adequadamente os parâmetros, tornam-se extremamente lentos. Por outro lado, estes sistemas são flexíveis, permitindo adotar diferentes estratégias de estimação, para aumentar a velocidade e eficiência do processo. É possível, por exemplo, executar uma análise univariada, seguida de análise multivariada, fixando-se alguns dos componentes. Posteriormente, adotando-se os parâmetros pré-estimados, pode-se realizar a análise multivariada repetidas vezes, sem se fixar qualquer componente. Este procedimento é denominado neste trabalho de estratégia B. Tal estratégia conduz a bons resultados, ou seja, é um procedimento que permite estimar componentes de covariância em menor tempo, menor número de iterações e de avaliações da verossimilhança. O sistema MTC que adota o método REML e o algoritmo EM (maximização de esperanças), com transformação canônica do vetor de observações multivariadas, mostra-se muito eficiente para análise de modelos mistos com um único fator aleatório além do erro (modelo animal ou modelo de touro). No entanto, para modelos em que se incluem efeitos aleatórios adicionais (efeito permanente de meio, por exemplo), principalmente quando não há a diagonalização perfeita da matriz de componentes de covariância G, este sistema fornece estimativas apenas aproximadas. Este também não permite análise de modelos com presença de efeito aleatório adicional correlacionado com animal (efeito materno, por exemplo) Além disso, em análise multivariada, o sistema exige igualdade de matriz de delineamento entre variáveis. Neste caso, a perda de um dado implica na perda total do registro. Trata-se de um método rápido para estimação de componentes de covariâncias e produz estimativas sempre no espaço de parâmetros. Quando a convergência ocorre próximo ao limite do espaço de parâmetros ou quando se trata de superfícies muito planas, o método de Powell, adotado no sistema DFREML, apresenta frequentemente convergência irregular ou prematura, não sendo de uso indicado nestes casos. Nos demais casos, ele apresenta-se como um método eficiente. O sistema MTDFREML mostra-se muito eficiente na procura de máximos da função de verossimilhança. No entanto, é o sistema que apresenta convergência mais lenta em análise multivariada, praticamente em todas situações avaliadas. Tal lentidão pode, em algumas situações, comprometer o uso deste, dependendo do tipo de modelo a ser analisado, número de equações e de características a serem avaliadas. No geral, os sistemas em avaliação constituem-se em ótimas ferramentas para estimação de componentes de covariância para modelos bem gerais, com grande número de classes de efeitos fixos e aleatórios.This work has as it's objectives: a) to describe some numerical procedures for obtaining solutions to linear equations and for the estimation of the components of covariance in multivariate analysis applied to animal breeding; b) to make a comparative evaluation of three systems of data processing: DFREML (Derivative Free Restricted Maximum Likelihood (MEYER, 1993), MTC (Multitrait REML Estimation) (MISZTAL, 1992) e MTDFREML (Multiple Traits Derivative Free Restricted maximum Likelihood) (BOLDMAN et al., 1993); and c) to suggest strategies for analysis using the programs under evaluation. These systems purpose is to estimate covariance components using the restricted maximum likelihood method (REML). A brief description is given of the numerical methods commonly used in the solution of linear equations. The methods of particular application to animal breeding and related areas are highlighted. The principal methods for estimating the components of covariance are described, deducing, in the majority of cases, the form of obtaining the estimators for each of the methods. Appropriated form of data simulation are presented, based on animal models, with and without consideration of the relationship between individuals. The components of variance and covariance are estimated from data ceded by the authors of various research projects, simulated data and field data, derived from production records of the milking Gir breed, extracted from the national animal production register, maintained at the National Dairy Cattle Research Center (CNPGL) of the Brazilian National Agricultural Research Organization (EMBRAPA). Three traits were simulated in each experiment allowing for different models (with one or two random elements, apart from the error) and various matrices of the components of covariance. The systems are rapid and efficient for the estimation of variances in univariate analysis. In multivariate analysis the derivative free methods are efficient for the estimation of the components of covariance in those cases in which the traits show correlations which are not very high and when the prior or starting values represent a good approximation of the estimates. These methods, however, are not appropriate when the prior values are far from the estimates. In the same way, for analyses including greater number of traits (more than three) and for situations in which a matrix of coefficients of the mixed linear model is not sparse, the derivative free methods, although they estimate the parameters adequately, become extremely slow. On the other hand these systems are flexible, allowing for the adoption of different strategies of estimation, so as to increase the velocity and efficiency of the process. It is possible, for example, to execute a univariate analysis, followed by a multivariate analysis, fixing some of the components. Subsequently, adopting the previously estimated parameters, one may run execute a multivariate analysis several times, without fixing any component. This procedure is called Strategy B in this work. Such a strategy leads to good results, that is to say it is a procedure which allows the estimation of the components of covariance in less time and with a smaller number of iterations and of evaluations of likelihood. The MTC system, which uses the REML method and EM (expectation and maximization) algorithm, with canonical transformation of the vector of multivariate observation, shows itself very efficient with one random factor apart from the error (on animal model or sire model). However, for models in which additional random factors are included (the permanent effect of the environment, for example), mainly when there is not a perfect diagonalization of the matrix of components of G, this system provides estimates which are only approximated. Apart from that, in multivariate analysis, this system requires equality of the design matrix among variables. In this case, the loss of one trait implies the total loss of the record. It is, nevertheless, a rapid method for estimation of the components of covariance and produces estimates which are always within the parameter space. When the convergence occurs close to the limit of the parameter space or when one is concerned with very flat surfaces, Powell's method, adopted in the DFREML system, frequently results in an irregular or premature convergence, not being indicated for use in such cases. In other cases it shows itself to be an efficient method. The system MTDFREML shows itself very efficient in the search for the maximum of the likelihood funcion. However, it is the system which presents the slowest convergence in multivariate analysis, in practically all the situations evaluated. Such slowness can, in some situations, inhibit the use of this system, depending on the type of model to be analysed, the number of equations and traits of the system to be evaluated. In general, the systems evaluated constitute excellent tools for the estimation of the components of covariance in many types of model, with a large number of classes of fixed and random effects.Biblioteca Digitais de Teses e Dissertações da USPGodoi, Cassio Roberto de MeloVerneque, Rui da Silva1994-12-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/11/11134/tde-20191220-135928/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2019-12-21T02:59:02Zoai:teses.usp.br:tde-20191220-135928Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212019-12-21T02:59:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Procedimentos numéricos e estimação de componentes de covariância em análise multivariada pelo método da máxima verossimilhança restrita - modelos mistos aplicados ao melhoramento animal Numerical procedures and estimation of covariance in multivariate analysis by the method of restricted maximum likelihood - mixed models applied to animal breeding |
title |
Procedimentos numéricos e estimação de componentes de covariância em análise multivariada pelo método da máxima verossimilhança restrita - modelos mistos aplicados ao melhoramento animal |
spellingShingle |
Procedimentos numéricos e estimação de componentes de covariância em análise multivariada pelo método da máxima verossimilhança restrita - modelos mistos aplicados ao melhoramento animal Verneque, Rui da Silva ANÁLISE MULTIVARIADA COMPONENTES DE COVARIÂNCIA ESTIMAÇÃO MÁXIMA VEROSIMILHANÇA MELHORAMENTO GENÉTICO ANIMAL MODELOS LINEARES MISTOS SISTEMAS COMPUTACIONAIS |
title_short |
Procedimentos numéricos e estimação de componentes de covariância em análise multivariada pelo método da máxima verossimilhança restrita - modelos mistos aplicados ao melhoramento animal |
title_full |
Procedimentos numéricos e estimação de componentes de covariância em análise multivariada pelo método da máxima verossimilhança restrita - modelos mistos aplicados ao melhoramento animal |
title_fullStr |
Procedimentos numéricos e estimação de componentes de covariância em análise multivariada pelo método da máxima verossimilhança restrita - modelos mistos aplicados ao melhoramento animal |
title_full_unstemmed |
Procedimentos numéricos e estimação de componentes de covariância em análise multivariada pelo método da máxima verossimilhança restrita - modelos mistos aplicados ao melhoramento animal |
title_sort |
Procedimentos numéricos e estimação de componentes de covariância em análise multivariada pelo método da máxima verossimilhança restrita - modelos mistos aplicados ao melhoramento animal |
author |
Verneque, Rui da Silva |
author_facet |
Verneque, Rui da Silva |
author_role |
author |
dc.contributor.none.fl_str_mv |
Godoi, Cassio Roberto de Melo |
dc.contributor.author.fl_str_mv |
Verneque, Rui da Silva |
dc.subject.por.fl_str_mv |
ANÁLISE MULTIVARIADA COMPONENTES DE COVARIÂNCIA ESTIMAÇÃO MÁXIMA VEROSIMILHANÇA MELHORAMENTO GENÉTICO ANIMAL MODELOS LINEARES MISTOS SISTEMAS COMPUTACIONAIS |
topic |
ANÁLISE MULTIVARIADA COMPONENTES DE COVARIÂNCIA ESTIMAÇÃO MÁXIMA VEROSIMILHANÇA MELHORAMENTO GENÉTICO ANIMAL MODELOS LINEARES MISTOS SISTEMAS COMPUTACIONAIS |
description |
Este trabalho tem por objetivos: a) descrever alguns procedimentos numéricos para obtenção de solução de sistemas de equações lineares, e para estimação de componentes de covariância, em análise multivariada, aplicados à área de melhoramento animal; b) realizar uma avaliação comparativa entre os três sistemas de processamento de dados: DFREML (Derivative Free Restricted Maximum Likelihood (MEYER, 1993), MTC (Multitrait REML Estimation) (MISZTAL, 1992) e MTDFREML (Multiple Traits Derivative Free Restricted Maximum Likelihood) (BOLDMAN et al., 1993); e c) sugerir estratégias de análises, utilizando os programas em avaliação. Esses sistemas visam estimar componentes de covariância, adotando-se o método da máxima verossimilhança restrita (REML). Realiza-se uma breve descrição dos métodos numéricos comumente empregados na solução de sistemas de equações lineares. São mostrados os métodos de maior aplicação na área de melhoramento animal e áreas afins. Descrevem-se os principais métodos de estimação de componentes de covariância, deduzindo-se, na maioria dos casos, a forma de obtenção dos estimadores para cada um dos métodos. Apresentam-se formas apropriadas para simulação de dados baseada em modelo animal, considerando-se ou não o parentesco entre indivíduos. Estimam-se os componentes de variância e covariância a partir de dados cedidos por autores de diversas pesquisas; dados simulados e dados de campo, provenientes de registros de produção de leite de rebanhos da raça Gir leiteiro, extraídos do arquivo zootécnico nacional, mantido no CNPGL/EMBRAPA. Foram simuladas até três características para cada experimento, admitindo-se diferentes modelos (com um ou dois fatores aleatórios além do erro) e várias matrizes de componentes de covariância. Os sistemas são rápidos e eficientes para estimação de variâncias em análise univariada. Em análise multivariada, os métodos livres de derivadas são eficientes para estimação de componentes de covariância, para o caso em que as características apresentem correlações não muito elevadas e quando os valores preliminares ou valores de partida representem uma boa aproximação das estimativas. Estes métodos, no entanto, não se mostram apropriados quando os valores iniciais utilizados são distantes das estimativas. Da mesma forma, para análise em que se inclui um número elevado de características (maior do que 3) e para situações em que a matriz de coeficientes do modelo linear misto não é esparsa, os métodos livres de derivadas, embora estimem adequadamente os parâmetros, tornam-se extremamente lentos. Por outro lado, estes sistemas são flexíveis, permitindo adotar diferentes estratégias de estimação, para aumentar a velocidade e eficiência do processo. É possível, por exemplo, executar uma análise univariada, seguida de análise multivariada, fixando-se alguns dos componentes. Posteriormente, adotando-se os parâmetros pré-estimados, pode-se realizar a análise multivariada repetidas vezes, sem se fixar qualquer componente. Este procedimento é denominado neste trabalho de estratégia B. Tal estratégia conduz a bons resultados, ou seja, é um procedimento que permite estimar componentes de covariância em menor tempo, menor número de iterações e de avaliações da verossimilhança. O sistema MTC que adota o método REML e o algoritmo EM (maximização de esperanças), com transformação canônica do vetor de observações multivariadas, mostra-se muito eficiente para análise de modelos mistos com um único fator aleatório além do erro (modelo animal ou modelo de touro). No entanto, para modelos em que se incluem efeitos aleatórios adicionais (efeito permanente de meio, por exemplo), principalmente quando não há a diagonalização perfeita da matriz de componentes de covariância G, este sistema fornece estimativas apenas aproximadas. Este também não permite análise de modelos com presença de efeito aleatório adicional correlacionado com animal (efeito materno, por exemplo) Além disso, em análise multivariada, o sistema exige igualdade de matriz de delineamento entre variáveis. Neste caso, a perda de um dado implica na perda total do registro. Trata-se de um método rápido para estimação de componentes de covariâncias e produz estimativas sempre no espaço de parâmetros. Quando a convergência ocorre próximo ao limite do espaço de parâmetros ou quando se trata de superfícies muito planas, o método de Powell, adotado no sistema DFREML, apresenta frequentemente convergência irregular ou prematura, não sendo de uso indicado nestes casos. Nos demais casos, ele apresenta-se como um método eficiente. O sistema MTDFREML mostra-se muito eficiente na procura de máximos da função de verossimilhança. No entanto, é o sistema que apresenta convergência mais lenta em análise multivariada, praticamente em todas situações avaliadas. Tal lentidão pode, em algumas situações, comprometer o uso deste, dependendo do tipo de modelo a ser analisado, número de equações e de características a serem avaliadas. No geral, os sistemas em avaliação constituem-se em ótimas ferramentas para estimação de componentes de covariância para modelos bem gerais, com grande número de classes de efeitos fixos e aleatórios. |
publishDate |
1994 |
dc.date.none.fl_str_mv |
1994-12-12 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://teses.usp.br/teses/disponiveis/11/11134/tde-20191220-135928/ |
url |
https://teses.usp.br/teses/disponiveis/11/11134/tde-20191220-135928/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815257200068657152 |