Métodos de seleção de equações de regressão linear múltipla

Detalhes bibliográficos
Autor(a) principal: Mattiolli, Carlos Henrique
Data de Publicação: 1983
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://teses.usp.br/teses/disponiveis/11/11134/tde-20231122-100411/
Resumo: Utilizando dados relativos a danos físicos e químicos causados por Sitophilus oryzae em grãos de milho armazenados, foram determinadas equações para estimação de suas perdas de peso, através do cálculo de todas as possíveis regressões e dos componentes principais, objetivando demonstrar a importância da realização de análises mais refinadas na obtenção de equações mais confiáveis. Inicialmente foi verificada a existência de multicolinearidade para se determinar o método e o critério de seleção de variáveis mais convenientes. Esta escolha recaiu sobre o método de avaliação de todas as possíveis regressões e a estatística Cp própria ao mesmo, pela sua aplicabilidade em dados colineares, e por prover maior volume de informações. Ao contrário de se buscar somente equações com elevados coeficientes de determinação, os ajustamentos foram realizados levando-se em consideração a distribuição dos resíduos através de estudos gráficos e analíticos dos mesmos, verificando-se possíveis violações nas hipóteses básicas de independência, homocedasticidade e normalidade dos erros. Foram desenvolvidos algoritmos e programas em linguagens BASIC para total processamento dos cálculos em microcomputadores. Tendo sido constatada acentuada multicolinearidade, foram feitos ajustamentos de equações pelo método dos componentes principais, indicado para estas circunstâncias, extraindo-se e estudando seus resíduos. Os resultados obtidos nos fizeram concluir que: 1) Os métodos propostos, embora levando a equações com elevada explicabilidade, não foram adequados por apresentarem estimativas tendenciosas para as perdas de peso. 2) As seleções de todas as possíveis regressões, embora não adequadas, forneceram informações relevantes sobre a importância das variáveis estudadas. 3) As análises de resíduos foram imprescindíveis nas considerações sobre a inadequação das equações, demonstrando acentuados comportamentos não lineares dos mesmos. 4) A utilização dos programas desenvolvidos em linguagem BASIC para microcomputadores conduziu a bons resultados quanto à capacidade, precisão e tempo de processamento.
id USP_0219a3d60b26b8e8a83de014856ddb9c
oai_identifier_str oai:teses.usp.br:tde-20231122-100411
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Métodos de seleção de equações de regressão linear múltiplaSelection methods of multiple linear regression equationsREGRESSÃO LINEAR MÚLTIPLASELEÇÃOUtilizando dados relativos a danos físicos e químicos causados por Sitophilus oryzae em grãos de milho armazenados, foram determinadas equações para estimação de suas perdas de peso, através do cálculo de todas as possíveis regressões e dos componentes principais, objetivando demonstrar a importância da realização de análises mais refinadas na obtenção de equações mais confiáveis. Inicialmente foi verificada a existência de multicolinearidade para se determinar o método e o critério de seleção de variáveis mais convenientes. Esta escolha recaiu sobre o método de avaliação de todas as possíveis regressões e a estatística Cp própria ao mesmo, pela sua aplicabilidade em dados colineares, e por prover maior volume de informações. Ao contrário de se buscar somente equações com elevados coeficientes de determinação, os ajustamentos foram realizados levando-se em consideração a distribuição dos resíduos através de estudos gráficos e analíticos dos mesmos, verificando-se possíveis violações nas hipóteses básicas de independência, homocedasticidade e normalidade dos erros. Foram desenvolvidos algoritmos e programas em linguagens BASIC para total processamento dos cálculos em microcomputadores. Tendo sido constatada acentuada multicolinearidade, foram feitos ajustamentos de equações pelo método dos componentes principais, indicado para estas circunstâncias, extraindo-se e estudando seus resíduos. Os resultados obtidos nos fizeram concluir que: 1) Os métodos propostos, embora levando a equações com elevada explicabilidade, não foram adequados por apresentarem estimativas tendenciosas para as perdas de peso. 2) As seleções de todas as possíveis regressões, embora não adequadas, forneceram informações relevantes sobre a importância das variáveis estudadas. 3) As análises de resíduos foram imprescindíveis nas considerações sobre a inadequação das equações, demonstrando acentuados comportamentos não lineares dos mesmos. 4) A utilização dos programas desenvolvidos em linguagem BASIC para microcomputadores conduziu a bons resultados quanto à capacidade, precisão e tempo de processamento.Using data related to physical and chemical damage caused by Sitophilus oryzae in stored maize grains, equations have been determined to estimate loss in weight, by calculating all possible regressions and main components, with the objective of proving the importance of using more sophisticated analysis to obtain more reliable equations. The existence of multicollinearity was initially checked to determine the method and selection criterion of more convenient variables. The method chosen was the evaluation of all possible regressions and the corresponding appropriate Cp statistics, due to its applicability to collinearity and as a greater source of information. Instead of trying to find equations with high determination coefficients, adjustments were made taking into account the distribution of residues through graphic and analytical studies, which showed possible disturbance in the basic assumption of independence, homoscedasticity and normality. Algorithms and programs were developed in BASIC language to process microcomputer calculations. Since high multicollinearity was noticed, the equations were adjusted using the main components method, recommended under these circumstances, the residues being extracted and studied. ln view of the results obtained, it was concluded: 1. The proposed methods, although leading to highly explainable equations were not adequate, because of the presence of bias in the estimates of weight loss; 2. The selection of all possible regressions, although not adequate, supplied relevant information on the importance of the variables studied; 3. The analysis of the residues, indicating marked non-linear behaviour, was essential in the determination of the inadequacy of the equations; 4. The utilization of programs for microcomputers, developed in BASIC language, has led to good results as far as capacity, accuracy and processing time are concerned.Biblioteca Digitais de Teses e Dissertações da USPMoraes, Roberto SimionatoMattiolli, Carlos Henrique1983-07-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/11/11134/tde-20231122-100411/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-11-24T19:27:05Zoai:teses.usp.br:tde-20231122-100411Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-11-24T19:27:05Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Métodos de seleção de equações de regressão linear múltipla
Selection methods of multiple linear regression equations
title Métodos de seleção de equações de regressão linear múltipla
spellingShingle Métodos de seleção de equações de regressão linear múltipla
Mattiolli, Carlos Henrique
REGRESSÃO LINEAR MÚLTIPLA
SELEÇÃO
title_short Métodos de seleção de equações de regressão linear múltipla
title_full Métodos de seleção de equações de regressão linear múltipla
title_fullStr Métodos de seleção de equações de regressão linear múltipla
title_full_unstemmed Métodos de seleção de equações de regressão linear múltipla
title_sort Métodos de seleção de equações de regressão linear múltipla
author Mattiolli, Carlos Henrique
author_facet Mattiolli, Carlos Henrique
author_role author
dc.contributor.none.fl_str_mv Moraes, Roberto Simionato
dc.contributor.author.fl_str_mv Mattiolli, Carlos Henrique
dc.subject.por.fl_str_mv REGRESSÃO LINEAR MÚLTIPLA
SELEÇÃO
topic REGRESSÃO LINEAR MÚLTIPLA
SELEÇÃO
description Utilizando dados relativos a danos físicos e químicos causados por Sitophilus oryzae em grãos de milho armazenados, foram determinadas equações para estimação de suas perdas de peso, através do cálculo de todas as possíveis regressões e dos componentes principais, objetivando demonstrar a importância da realização de análises mais refinadas na obtenção de equações mais confiáveis. Inicialmente foi verificada a existência de multicolinearidade para se determinar o método e o critério de seleção de variáveis mais convenientes. Esta escolha recaiu sobre o método de avaliação de todas as possíveis regressões e a estatística Cp própria ao mesmo, pela sua aplicabilidade em dados colineares, e por prover maior volume de informações. Ao contrário de se buscar somente equações com elevados coeficientes de determinação, os ajustamentos foram realizados levando-se em consideração a distribuição dos resíduos através de estudos gráficos e analíticos dos mesmos, verificando-se possíveis violações nas hipóteses básicas de independência, homocedasticidade e normalidade dos erros. Foram desenvolvidos algoritmos e programas em linguagens BASIC para total processamento dos cálculos em microcomputadores. Tendo sido constatada acentuada multicolinearidade, foram feitos ajustamentos de equações pelo método dos componentes principais, indicado para estas circunstâncias, extraindo-se e estudando seus resíduos. Os resultados obtidos nos fizeram concluir que: 1) Os métodos propostos, embora levando a equações com elevada explicabilidade, não foram adequados por apresentarem estimativas tendenciosas para as perdas de peso. 2) As seleções de todas as possíveis regressões, embora não adequadas, forneceram informações relevantes sobre a importância das variáveis estudadas. 3) As análises de resíduos foram imprescindíveis nas considerações sobre a inadequação das equações, demonstrando acentuados comportamentos não lineares dos mesmos. 4) A utilização dos programas desenvolvidos em linguagem BASIC para microcomputadores conduziu a bons resultados quanto à capacidade, precisão e tempo de processamento.
publishDate 1983
dc.date.none.fl_str_mv 1983-07-08
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://teses.usp.br/teses/disponiveis/11/11134/tde-20231122-100411/
url https://teses.usp.br/teses/disponiveis/11/11134/tde-20231122-100411/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090940895232000