Selecção de modelos em amostragem por distâncias
Autor(a) principal: | |
---|---|
Data de Publicação: | 2008 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10174/18339 |
Resumo: | A selecção do modelo que se ajuste adequadamente a um conjunto de dados é uma parte fulcral no processo da inferência estatística. O critério mais comum para seleccionar uma função de detectabilidade, que se ajuste a um conjunto de dados de distâncias, baseado na informação K-L, denomina-se critério de informação de Akaike (AIC). Para avaliar a performance da rotina da selecção de modelos implementada no programa DISTANCE, realizaram-se simulações Monte Carlo para gerar dados de duas funções densidade de probabilidade frequentemente usadas. Aplicando esta metodologia, observou-se um enviesamento substancial na selecção do modelo, sendo os estimadores dos parâmetros baseados no modelo seleccionado frequentemente enviesados. Utilizaram-se duas abordagens na estimação dos parâmetros: selecção de modelos tradicional e ponderação de modelos. Para ilustrar a metodologia da selecção de modelos usaram-se dados provenientes de um estudo controlado. ABSTRACT; The selection of a model that adequately fits a data set is an important part in the statistical inference process. The most commonly used criterion to select a detectability function that fits a distance sampling data set, is based on the K-L information, and it is known as the Akaike information criterion (AIC). ln order to evaluate the performance of the model selection routine implemented in software DISTANCE, we carried out Monte Carlo simulations generating data from two frequently used probability density functions. We found substantial model selection biases when using this methodology. We further observed that parameter estimators based on the selected model were often biased. Parameter estimation was conducted under two approaches: traditional model selection and model averaging. We used data from a controlled field experiment to illustrate the model selection methodology. |
id |
RCAP_a15455877199848dd90a50259ae1c133 |
---|---|
oai_identifier_str |
oai:dspace.uevora.pt:10174/18339 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Selecção de modelos em amostragem por distânciasAmostragem por distânciasCritério de informação AkaikePonderação de modelosSelecção de modelosAkaike information criterionDistance samplingModel averagingModel selectionA selecção do modelo que se ajuste adequadamente a um conjunto de dados é uma parte fulcral no processo da inferência estatística. O critério mais comum para seleccionar uma função de detectabilidade, que se ajuste a um conjunto de dados de distâncias, baseado na informação K-L, denomina-se critério de informação de Akaike (AIC). Para avaliar a performance da rotina da selecção de modelos implementada no programa DISTANCE, realizaram-se simulações Monte Carlo para gerar dados de duas funções densidade de probabilidade frequentemente usadas. Aplicando esta metodologia, observou-se um enviesamento substancial na selecção do modelo, sendo os estimadores dos parâmetros baseados no modelo seleccionado frequentemente enviesados. Utilizaram-se duas abordagens na estimação dos parâmetros: selecção de modelos tradicional e ponderação de modelos. Para ilustrar a metodologia da selecção de modelos usaram-se dados provenientes de um estudo controlado. ABSTRACT; The selection of a model that adequately fits a data set is an important part in the statistical inference process. The most commonly used criterion to select a detectability function that fits a distance sampling data set, is based on the K-L information, and it is known as the Akaike information criterion (AIC). ln order to evaluate the performance of the model selection routine implemented in software DISTANCE, we carried out Monte Carlo simulations generating data from two frequently used probability density functions. We found substantial model selection biases when using this methodology. We further observed that parameter estimators based on the selected model were often biased. Parameter estimation was conducted under two approaches: traditional model selection and model averaging. We used data from a controlled field experiment to illustrate the model selection methodology.Universidade de Évora2016-05-02T15:30:52Z2016-05-022008-09-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10174/18339http://hdl.handle.net/10174/18339pordep. C. T.teses@bib.uevora.pt336Morgado, Maria de Fátima Romãoinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-01-03T19:06:25Zoai:dspace.uevora.pt:10174/18339Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T01:10:15.561428Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Selecção de modelos em amostragem por distâncias |
title |
Selecção de modelos em amostragem por distâncias |
spellingShingle |
Selecção de modelos em amostragem por distâncias Morgado, Maria de Fátima Romão Amostragem por distâncias Critério de informação Akaike Ponderação de modelos Selecção de modelos Akaike information criterion Distance sampling Model averaging Model selection |
title_short |
Selecção de modelos em amostragem por distâncias |
title_full |
Selecção de modelos em amostragem por distâncias |
title_fullStr |
Selecção de modelos em amostragem por distâncias |
title_full_unstemmed |
Selecção de modelos em amostragem por distâncias |
title_sort |
Selecção de modelos em amostragem por distâncias |
author |
Morgado, Maria de Fátima Romão |
author_facet |
Morgado, Maria de Fátima Romão |
author_role |
author |
dc.contributor.author.fl_str_mv |
Morgado, Maria de Fátima Romão |
dc.subject.por.fl_str_mv |
Amostragem por distâncias Critério de informação Akaike Ponderação de modelos Selecção de modelos Akaike information criterion Distance sampling Model averaging Model selection |
topic |
Amostragem por distâncias Critério de informação Akaike Ponderação de modelos Selecção de modelos Akaike information criterion Distance sampling Model averaging Model selection |
description |
A selecção do modelo que se ajuste adequadamente a um conjunto de dados é uma parte fulcral no processo da inferência estatística. O critério mais comum para seleccionar uma função de detectabilidade, que se ajuste a um conjunto de dados de distâncias, baseado na informação K-L, denomina-se critério de informação de Akaike (AIC). Para avaliar a performance da rotina da selecção de modelos implementada no programa DISTANCE, realizaram-se simulações Monte Carlo para gerar dados de duas funções densidade de probabilidade frequentemente usadas. Aplicando esta metodologia, observou-se um enviesamento substancial na selecção do modelo, sendo os estimadores dos parâmetros baseados no modelo seleccionado frequentemente enviesados. Utilizaram-se duas abordagens na estimação dos parâmetros: selecção de modelos tradicional e ponderação de modelos. Para ilustrar a metodologia da selecção de modelos usaram-se dados provenientes de um estudo controlado. ABSTRACT; The selection of a model that adequately fits a data set is an important part in the statistical inference process. The most commonly used criterion to select a detectability function that fits a distance sampling data set, is based on the K-L information, and it is known as the Akaike information criterion (AIC). ln order to evaluate the performance of the model selection routine implemented in software DISTANCE, we carried out Monte Carlo simulations generating data from two frequently used probability density functions. We found substantial model selection biases when using this methodology. We further observed that parameter estimators based on the selected model were often biased. Parameter estimation was conducted under two approaches: traditional model selection and model averaging. We used data from a controlled field experiment to illustrate the model selection methodology. |
publishDate |
2008 |
dc.date.none.fl_str_mv |
2008-09-01T00:00:00Z 2016-05-02T15:30:52Z 2016-05-02 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10174/18339 http://hdl.handle.net/10174/18339 |
url |
http://hdl.handle.net/10174/18339 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
dep. C. T. teses@bib.uevora.pt 336 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade de Évora |
publisher.none.fl_str_mv |
Universidade de Évora |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1817550380577325056 |