Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFJF |
Texto Completo: | https://repositorio.ufjf.br/jspui/handle/ufjf/11934 |
Resumo: | Esta tese teve como motivação conhecer o estado da arte em estimação nãoparamétrica de densidade de probabilidade, avaliar as técnicas mais proeminentes encontradas em publicações científicas, compará-las em diversas situações e avaliar seu impacto em classificação utilizando verossimilhança. Para isto, foi realizado um estudo sobre a escolha automática da largura de banda, principal parâmetro utilizado pelos quatro estimadores não-paramétricos de densidade clássicos: Histograma, Average Shifted Histogram (ASH), Polígono de Frequência (PF) e Kernel Density Estimation (KDE). Em linhas gerais, o método KDE mostrou os melhores resultados em todas as distribuições testadas e devido a esse desempenho sua análise foi mais aprofundada, adentrando nas teorias do KDE com largura de banda variável. Ademais, foi percebido nos diversos testes realizados que os seletores baseados em validação-cruzada são mais resilientes do que os métodos de Plug-In (PI), levando a melhores resultados de estimação e classificação em realidades complexas. Por fim, este trabalho teve como desdobramento algumas contribuições para o estado da arte no assunto de investigação, cujas principais são elencadas a seguir: aumento do conhecimento sobre alguns dos principais estimadores não-paramétricos discutidos no mundo científico; desenvolvimento de uma técnica de avaliação de estimadores de densidade, nomeada de Region of Interest Map (RoIMap); proposta de uma técnica automática híbrida para ajustar o seletor de largura de banda variável, denominada Region of Interest-based Kernel Density Estimation (ROIKDE); e avaliação do impacto da estimação não-paramétrica em classificação de amostras. |
id |
UFJF_59d2dfde510c8c648d6802f30a340bea |
---|---|
oai_identifier_str |
oai:hermes.cpd.ufjf.br:ufjf/11934 |
network_acronym_str |
UFJF |
network_name_str |
Repositório Institucional da UFJF |
repository_id_str |
|
spelling |
Nóbrega, Rafael Antuneshttp://lattes.cnpq.br/9217577296048418Andrade Filho, Luciano Manhães dehttp://lattes.cnpq.br/5454168673866452Gonzalez, Luis Fernando Gomezhttp://lattes.cnpq.br/4910241356954777Campos, Marcello Luiz Rodrigues dehttp://lattes.cnpq.br/2402401592333107Cerqueira, Augusto Santiagohttp://lattes.cnpq.br/3648221859200471http://lattes.cnpq.br/9760840142994953Souza, David de Melo2020-11-30T20:49:57Z2020-11-302020-11-30T20:49:57Z2020-04-15https://repositorio.ufjf.br/jspui/handle/ufjf/11934Esta tese teve como motivação conhecer o estado da arte em estimação nãoparamétrica de densidade de probabilidade, avaliar as técnicas mais proeminentes encontradas em publicações científicas, compará-las em diversas situações e avaliar seu impacto em classificação utilizando verossimilhança. Para isto, foi realizado um estudo sobre a escolha automática da largura de banda, principal parâmetro utilizado pelos quatro estimadores não-paramétricos de densidade clássicos: Histograma, Average Shifted Histogram (ASH), Polígono de Frequência (PF) e Kernel Density Estimation (KDE). Em linhas gerais, o método KDE mostrou os melhores resultados em todas as distribuições testadas e devido a esse desempenho sua análise foi mais aprofundada, adentrando nas teorias do KDE com largura de banda variável. Ademais, foi percebido nos diversos testes realizados que os seletores baseados em validação-cruzada são mais resilientes do que os métodos de Plug-In (PI), levando a melhores resultados de estimação e classificação em realidades complexas. Por fim, este trabalho teve como desdobramento algumas contribuições para o estado da arte no assunto de investigação, cujas principais são elencadas a seguir: aumento do conhecimento sobre alguns dos principais estimadores não-paramétricos discutidos no mundo científico; desenvolvimento de uma técnica de avaliação de estimadores de densidade, nomeada de Region of Interest Map (RoIMap); proposta de uma técnica automática híbrida para ajustar o seletor de largura de banda variável, denominada Region of Interest-based Kernel Density Estimation (ROIKDE); e avaliação do impacto da estimação não-paramétrica em classificação de amostras.The thesis initial motivation was to know the state-of-the-art in non-parametric density estimation, compare different situations and assess their impact on the likelihood-based classification. Therefore, a study was carried out related to the automatic choice of bandwidth, the main parameter used by the four classic non-parametric estimators: Histogram, Average Shifted Histogram, Frequency Polygon and Kernel Density Estimation (KDE). In general, the KDE method showed the best results in all tested distributions and, due to this performance, its analysis was further developed, entering into the variable KDE theories with variable bandwidth. Furthermore, several tests shown that the selectors based on cross-validation are more resilient than the Plug-In methods, leading to better density estimation and classification results in complex problems. Finally, this thesis unfolded in some contributions to the state-of-the-art in the investigation subject, whose main ones are listed below: increased knowledge about some of the main non-parametric estimators discussed in the scientific world; development of a technique for evaluating density estimators called the Region of Interest Map (RoIMap); proposal for a hybrid automatic technique to adjust the variable bandwidth selector called Region of interest-based kernel density estimation (ROIKDE); and impact evaluation of the nonparametric estimation in classifying samples.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de Juiz de Fora (UFJF)Programa de Pós-graduação em Engenharia ElétricaUFJFBrasilFaculdade de EngenhariaAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessCNPQ::ENGENHARIAS::ENGENHARIA ELETRICAEstimação não-paramétricaLargura de bandaKDEVerossimilhança naiveClassificaçãoNonparametric estimationBandwidthLikelihood naiveClassificationEstatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de bandainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFJFinstname:Universidade Federal de Juiz de Fora (UFJF)instacron:UFJFORIGINALdaviddemelosouza.pdfdaviddemelosouza.pdfPDF/Aapplication/pdf21851601https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/1/daviddemelosouza.pdf49a7706ee30a43591f6d68a49a0e3e84MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/2/license_rdf4d2950bda3d176f570a9f8b328dfbbefMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53TEXTdaviddemelosouza.pdf.txtdaviddemelosouza.pdf.txtExtracted texttext/plain289209https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/4/daviddemelosouza.pdf.txtb108f4591ee40b15eef87742ecd5c1b3MD54THUMBNAILdaviddemelosouza.pdf.jpgdaviddemelosouza.pdf.jpgGenerated Thumbnailimage/jpeg1209https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/5/daviddemelosouza.pdf.jpg8f5938bd68b95efdd988b79ea5169129MD55ufjf/119342020-12-01 04:08:23.814oai:hermes.cpd.ufjf.br:ufjf/11934Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufjf.br/oai/requestopendoar:2020-12-01T06:08:23Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF)false |
dc.title.pt_BR.fl_str_mv |
Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda |
title |
Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda |
spellingShingle |
Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda Souza, David de Melo CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA Estimação não-paramétrica Largura de banda KDE Verossimilhança naive Classificação Nonparametric estimation Bandwidth Likelihood naive Classification |
title_short |
Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda |
title_full |
Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda |
title_fullStr |
Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda |
title_full_unstemmed |
Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda |
title_sort |
Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda |
author |
Souza, David de Melo |
author_facet |
Souza, David de Melo |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Nóbrega, Rafael Antunes |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/9217577296048418 |
dc.contributor.referee2.fl_str_mv |
Andrade Filho, Luciano Manhães de |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/5454168673866452 |
dc.contributor.referee3.fl_str_mv |
Gonzalez, Luis Fernando Gomez |
dc.contributor.referee3Lattes.fl_str_mv |
http://lattes.cnpq.br/4910241356954777 |
dc.contributor.referee4.fl_str_mv |
Campos, Marcello Luiz Rodrigues de |
dc.contributor.referee4Lattes.fl_str_mv |
http://lattes.cnpq.br/2402401592333107 |
dc.contributor.referee5.fl_str_mv |
Cerqueira, Augusto Santiago |
dc.contributor.referee5Lattes.fl_str_mv |
http://lattes.cnpq.br/3648221859200471 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/9760840142994953 |
dc.contributor.author.fl_str_mv |
Souza, David de Melo |
contributor_str_mv |
Nóbrega, Rafael Antunes Andrade Filho, Luciano Manhães de Gonzalez, Luis Fernando Gomez Campos, Marcello Luiz Rodrigues de Cerqueira, Augusto Santiago |
dc.subject.cnpq.fl_str_mv |
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
topic |
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA Estimação não-paramétrica Largura de banda KDE Verossimilhança naive Classificação Nonparametric estimation Bandwidth Likelihood naive Classification |
dc.subject.por.fl_str_mv |
Estimação não-paramétrica Largura de banda KDE Verossimilhança naive Classificação Nonparametric estimation Bandwidth Likelihood naive Classification |
description |
Esta tese teve como motivação conhecer o estado da arte em estimação nãoparamétrica de densidade de probabilidade, avaliar as técnicas mais proeminentes encontradas em publicações científicas, compará-las em diversas situações e avaliar seu impacto em classificação utilizando verossimilhança. Para isto, foi realizado um estudo sobre a escolha automática da largura de banda, principal parâmetro utilizado pelos quatro estimadores não-paramétricos de densidade clássicos: Histograma, Average Shifted Histogram (ASH), Polígono de Frequência (PF) e Kernel Density Estimation (KDE). Em linhas gerais, o método KDE mostrou os melhores resultados em todas as distribuições testadas e devido a esse desempenho sua análise foi mais aprofundada, adentrando nas teorias do KDE com largura de banda variável. Ademais, foi percebido nos diversos testes realizados que os seletores baseados em validação-cruzada são mais resilientes do que os métodos de Plug-In (PI), levando a melhores resultados de estimação e classificação em realidades complexas. Por fim, este trabalho teve como desdobramento algumas contribuições para o estado da arte no assunto de investigação, cujas principais são elencadas a seguir: aumento do conhecimento sobre alguns dos principais estimadores não-paramétricos discutidos no mundo científico; desenvolvimento de uma técnica de avaliação de estimadores de densidade, nomeada de Region of Interest Map (RoIMap); proposta de uma técnica automática híbrida para ajustar o seletor de largura de banda variável, denominada Region of Interest-based Kernel Density Estimation (ROIKDE); e avaliação do impacto da estimação não-paramétrica em classificação de amostras. |
publishDate |
2020 |
dc.date.accessioned.fl_str_mv |
2020-11-30T20:49:57Z |
dc.date.available.fl_str_mv |
2020-11-30 2020-11-30T20:49:57Z |
dc.date.issued.fl_str_mv |
2020-04-15 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufjf.br/jspui/handle/ufjf/11934 |
url |
https://repositorio.ufjf.br/jspui/handle/ufjf/11934 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Juiz de Fora (UFJF) |
dc.publisher.program.fl_str_mv |
Programa de Pós-graduação em Engenharia Elétrica |
dc.publisher.initials.fl_str_mv |
UFJF |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Faculdade de Engenharia |
publisher.none.fl_str_mv |
Universidade Federal de Juiz de Fora (UFJF) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFJF instname:Universidade Federal de Juiz de Fora (UFJF) instacron:UFJF |
instname_str |
Universidade Federal de Juiz de Fora (UFJF) |
instacron_str |
UFJF |
institution |
UFJF |
reponame_str |
Repositório Institucional da UFJF |
collection |
Repositório Institucional da UFJF |
bitstream.url.fl_str_mv |
https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/1/daviddemelosouza.pdf https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/2/license_rdf https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/3/license.txt https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/4/daviddemelosouza.pdf.txt https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/5/daviddemelosouza.pdf.jpg |
bitstream.checksum.fl_str_mv |
49a7706ee30a43591f6d68a49a0e3e84 4d2950bda3d176f570a9f8b328dfbbef 8a4605be74aa9ea9d79846c1fba20a33 b108f4591ee40b15eef87742ecd5c1b3 8f5938bd68b95efdd988b79ea5169129 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF) |
repository.mail.fl_str_mv |
|
_version_ |
1813193902142783488 |