Ferramentas gráficas no processo de seleção de variáveis

Detalhes bibliográficos
Autor(a) principal: Ragiotto, Lucas
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/181782
Resumo: Em problemas de regressão, na busca por um modelo parcimonioso, o pesquisador pode se deparar com adversidades, por exemplo, a existência de colinearidade entre as regressoras, dificultando a seleção de variáveis. Dessa forma, com a implementação de ferramentas inspiradas nas propostas de Murray et al. (2013), Muller & Welsh (2010) e Jiang et al. (2009) no pacote mplot (Tarr et al., 2018) no software R, pode-se, gráfica e interativamente, estudar em detalhes a estabilidade e a importância de inclusão de covariáveis para a construção de modelos. Neste trabalho, medidas de estabilidade e probabilidade de inclusão de variáveis foram obtidas pelo método bootstrap. Medidas resumo de qualidade do ajuste são baseadas no critério de informação generalizado, que incorpora, como casos particulares, os critérios de informação de Akaike e o Bayesiano, e reflete a perda (associada ao ajuste de um modelo simplificado) mais uma penalização à complexidade do modelo. Ao aplicar a teoria de seleção de variáveis, utilizando as ferramentas gráficas no ajuste de um modelo de regressão linear Normal e regressão Binomial, foi possível reconhecer seu potencial e utilidade no processo de formulação de modelos, no qual a incorporação de conhecimento do especialista da área pode ser feita de maneira natural, já que o processo não é automático. Isso é mais um diferencial em relação aos métodos usuais de seleção de variáveis que também foram aplicados aos mesmos conjuntos de dados para efeito de discussão.
id UNSP_b50265049571f0c9813bb5194f64ab97
oai_identifier_str oai:repositorio.unesp.br:11449/181782
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Ferramentas gráficas no processo de seleção de variáveisGraphical tools in the process of variable selectionBootstrapCritério de informação generalizadoRegressão linearRegressão logísticaMétodo de cercaEm problemas de regressão, na busca por um modelo parcimonioso, o pesquisador pode se deparar com adversidades, por exemplo, a existência de colinearidade entre as regressoras, dificultando a seleção de variáveis. Dessa forma, com a implementação de ferramentas inspiradas nas propostas de Murray et al. (2013), Muller & Welsh (2010) e Jiang et al. (2009) no pacote mplot (Tarr et al., 2018) no software R, pode-se, gráfica e interativamente, estudar em detalhes a estabilidade e a importância de inclusão de covariáveis para a construção de modelos. Neste trabalho, medidas de estabilidade e probabilidade de inclusão de variáveis foram obtidas pelo método bootstrap. Medidas resumo de qualidade do ajuste são baseadas no critério de informação generalizado, que incorpora, como casos particulares, os critérios de informação de Akaike e o Bayesiano, e reflete a perda (associada ao ajuste de um modelo simplificado) mais uma penalização à complexidade do modelo. Ao aplicar a teoria de seleção de variáveis, utilizando as ferramentas gráficas no ajuste de um modelo de regressão linear Normal e regressão Binomial, foi possível reconhecer seu potencial e utilidade no processo de formulação de modelos, no qual a incorporação de conhecimento do especialista da área pode ser feita de maneira natural, já que o processo não é automático. Isso é mais um diferencial em relação aos métodos usuais de seleção de variáveis que também foram aplicados aos mesmos conjuntos de dados para efeito de discussão.In regression analysis, the search of a parsimonious model can be difficult due to collinearities among variables and other problems. Murray et al. (2013), Muller & Welsh (2010) e Jiang et al. (2009) proposed tools for model stability and variable inclusion plots that were re ned and implemented in the mplot package of Tarr et al. (2018), which allows interactive graphs and summaries of information relevant to model building. Stability measures and the probability of variable inclusion are obtained through bootstrapping. Goodness of fit measures are based on the generalized information criterion, which includes as particular cases the Akaike and Bayesian information criteria, given by a measure of loss of the fit and a penalization due to model complexity. Applying the method to t a Normal linear regression and a Binomial regression revealed its great potential and usefulness for model building, allowing expertise knowledge to be incorporated since the selection model is not automated. This is a further contrast to the usual selection methods which were also applied to the same datasets in order to discuss the differences.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Universidade Estadual Paulista (Unesp)Trinca, Luzia Aparecida [UNESP]Universidade Estadual Paulista (Unesp)Ragiotto, Lucas2019-04-25T18:25:35Z2019-04-25T18:25:35Z2019-03-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/11449/18178200091570833004064083P23720489366427955porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-10-02T06:03:34Zoai:repositorio.unesp.br:11449/181782Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T13:45:20.398452Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Ferramentas gráficas no processo de seleção de variáveis
Graphical tools in the process of variable selection
title Ferramentas gráficas no processo de seleção de variáveis
spellingShingle Ferramentas gráficas no processo de seleção de variáveis
Ragiotto, Lucas
Bootstrap
Critério de informação generalizado
Regressão linear
Regressão logística
Método de cerca
title_short Ferramentas gráficas no processo de seleção de variáveis
title_full Ferramentas gráficas no processo de seleção de variáveis
title_fullStr Ferramentas gráficas no processo de seleção de variáveis
title_full_unstemmed Ferramentas gráficas no processo de seleção de variáveis
title_sort Ferramentas gráficas no processo de seleção de variáveis
author Ragiotto, Lucas
author_facet Ragiotto, Lucas
author_role author
dc.contributor.none.fl_str_mv Trinca, Luzia Aparecida [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Ragiotto, Lucas
dc.subject.por.fl_str_mv Bootstrap
Critério de informação generalizado
Regressão linear
Regressão logística
Método de cerca
topic Bootstrap
Critério de informação generalizado
Regressão linear
Regressão logística
Método de cerca
description Em problemas de regressão, na busca por um modelo parcimonioso, o pesquisador pode se deparar com adversidades, por exemplo, a existência de colinearidade entre as regressoras, dificultando a seleção de variáveis. Dessa forma, com a implementação de ferramentas inspiradas nas propostas de Murray et al. (2013), Muller & Welsh (2010) e Jiang et al. (2009) no pacote mplot (Tarr et al., 2018) no software R, pode-se, gráfica e interativamente, estudar em detalhes a estabilidade e a importância de inclusão de covariáveis para a construção de modelos. Neste trabalho, medidas de estabilidade e probabilidade de inclusão de variáveis foram obtidas pelo método bootstrap. Medidas resumo de qualidade do ajuste são baseadas no critério de informação generalizado, que incorpora, como casos particulares, os critérios de informação de Akaike e o Bayesiano, e reflete a perda (associada ao ajuste de um modelo simplificado) mais uma penalização à complexidade do modelo. Ao aplicar a teoria de seleção de variáveis, utilizando as ferramentas gráficas no ajuste de um modelo de regressão linear Normal e regressão Binomial, foi possível reconhecer seu potencial e utilidade no processo de formulação de modelos, no qual a incorporação de conhecimento do especialista da área pode ser feita de maneira natural, já que o processo não é automático. Isso é mais um diferencial em relação aos métodos usuais de seleção de variáveis que também foram aplicados aos mesmos conjuntos de dados para efeito de discussão.
publishDate 2019
dc.date.none.fl_str_mv 2019-04-25T18:25:35Z
2019-04-25T18:25:35Z
2019-03-01
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/181782
000915708
33004064083P2
3720489366427955
url http://hdl.handle.net/11449/181782
identifier_str_mv 000915708
33004064083P2
3720489366427955
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808128272062480384