Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda

Detalhes bibliográficos
Autor(a) principal: Souza, David de Melo
Data de Publicação: 2020
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFJF
Texto Completo: https://repositorio.ufjf.br/jspui/handle/ufjf/11934
Resumo: Esta tese teve como motivação conhecer o estado da arte em estimação nãoparamétrica de densidade de probabilidade, avaliar as técnicas mais proeminentes encontradas em publicações científicas, compará-las em diversas situações e avaliar seu impacto em classificação utilizando verossimilhança. Para isto, foi realizado um estudo sobre a escolha automática da largura de banda, principal parâmetro utilizado pelos quatro estimadores não-paramétricos de densidade clássicos: Histograma, Average Shifted Histogram (ASH), Polígono de Frequência (PF) e Kernel Density Estimation (KDE). Em linhas gerais, o método KDE mostrou os melhores resultados em todas as distribuições testadas e devido a esse desempenho sua análise foi mais aprofundada, adentrando nas teorias do KDE com largura de banda variável. Ademais, foi percebido nos diversos testes realizados que os seletores baseados em validação-cruzada são mais resilientes do que os métodos de Plug-In (PI), levando a melhores resultados de estimação e classificação em realidades complexas. Por fim, este trabalho teve como desdobramento algumas contribuições para o estado da arte no assunto de investigação, cujas principais são elencadas a seguir: aumento do conhecimento sobre alguns dos principais estimadores não-paramétricos discutidos no mundo científico; desenvolvimento de uma técnica de avaliação de estimadores de densidade, nomeada de Region of Interest Map (RoIMap); proposta de uma técnica automática híbrida para ajustar o seletor de largura de banda variável, denominada Region of Interest-based Kernel Density Estimation (ROIKDE); e avaliação do impacto da estimação não-paramétrica em classificação de amostras.
id UFJF_59d2dfde510c8c648d6802f30a340bea
oai_identifier_str oai:hermes.cpd.ufjf.br:ufjf/11934
network_acronym_str UFJF
network_name_str Repositório Institucional da UFJF
repository_id_str
spelling Nóbrega, Rafael Antuneshttp://lattes.cnpq.br/9217577296048418Andrade Filho, Luciano Manhães dehttp://lattes.cnpq.br/5454168673866452Gonzalez, Luis Fernando Gomezhttp://lattes.cnpq.br/4910241356954777Campos, Marcello Luiz Rodrigues dehttp://lattes.cnpq.br/2402401592333107Cerqueira, Augusto Santiagohttp://lattes.cnpq.br/3648221859200471http://lattes.cnpq.br/9760840142994953Souza, David de Melo2020-11-30T20:49:57Z2020-11-302020-11-30T20:49:57Z2020-04-15https://repositorio.ufjf.br/jspui/handle/ufjf/11934Esta tese teve como motivação conhecer o estado da arte em estimação nãoparamétrica de densidade de probabilidade, avaliar as técnicas mais proeminentes encontradas em publicações científicas, compará-las em diversas situações e avaliar seu impacto em classificação utilizando verossimilhança. Para isto, foi realizado um estudo sobre a escolha automática da largura de banda, principal parâmetro utilizado pelos quatro estimadores não-paramétricos de densidade clássicos: Histograma, Average Shifted Histogram (ASH), Polígono de Frequência (PF) e Kernel Density Estimation (KDE). Em linhas gerais, o método KDE mostrou os melhores resultados em todas as distribuições testadas e devido a esse desempenho sua análise foi mais aprofundada, adentrando nas teorias do KDE com largura de banda variável. Ademais, foi percebido nos diversos testes realizados que os seletores baseados em validação-cruzada são mais resilientes do que os métodos de Plug-In (PI), levando a melhores resultados de estimação e classificação em realidades complexas. Por fim, este trabalho teve como desdobramento algumas contribuições para o estado da arte no assunto de investigação, cujas principais são elencadas a seguir: aumento do conhecimento sobre alguns dos principais estimadores não-paramétricos discutidos no mundo científico; desenvolvimento de uma técnica de avaliação de estimadores de densidade, nomeada de Region of Interest Map (RoIMap); proposta de uma técnica automática híbrida para ajustar o seletor de largura de banda variável, denominada Region of Interest-based Kernel Density Estimation (ROIKDE); e avaliação do impacto da estimação não-paramétrica em classificação de amostras.The thesis initial motivation was to know the state-of-the-art in non-parametric density estimation, compare different situations and assess their impact on the likelihood-based classification. Therefore, a study was carried out related to the automatic choice of bandwidth, the main parameter used by the four classic non-parametric estimators: Histogram, Average Shifted Histogram, Frequency Polygon and Kernel Density Estimation (KDE). In general, the KDE method showed the best results in all tested distributions and, due to this performance, its analysis was further developed, entering into the variable KDE theories with variable bandwidth. Furthermore, several tests shown that the selectors based on cross-validation are more resilient than the Plug-In methods, leading to better density estimation and classification results in complex problems. Finally, this thesis unfolded in some contributions to the state-of-the-art in the investigation subject, whose main ones are listed below: increased knowledge about some of the main non-parametric estimators discussed in the scientific world; development of a technique for evaluating density estimators called the Region of Interest Map (RoIMap); proposal for a hybrid automatic technique to adjust the variable bandwidth selector called Region of interest-based kernel density estimation (ROIKDE); and impact evaluation of the nonparametric estimation in classifying samples.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de Juiz de Fora (UFJF)Programa de Pós-graduação em Engenharia ElétricaUFJFBrasilFaculdade de EngenhariaAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessCNPQ::ENGENHARIAS::ENGENHARIA ELETRICAEstimação não-paramétricaLargura de bandaKDEVerossimilhança naiveClassificaçãoNonparametric estimationBandwidthLikelihood naiveClassificationEstatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de bandainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFJFinstname:Universidade Federal de Juiz de Fora (UFJF)instacron:UFJFORIGINALdaviddemelosouza.pdfdaviddemelosouza.pdfPDF/Aapplication/pdf21851601https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/1/daviddemelosouza.pdf49a7706ee30a43591f6d68a49a0e3e84MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/2/license_rdf4d2950bda3d176f570a9f8b328dfbbefMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53TEXTdaviddemelosouza.pdf.txtdaviddemelosouza.pdf.txtExtracted texttext/plain289209https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/4/daviddemelosouza.pdf.txtb108f4591ee40b15eef87742ecd5c1b3MD54THUMBNAILdaviddemelosouza.pdf.jpgdaviddemelosouza.pdf.jpgGenerated Thumbnailimage/jpeg1209https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/5/daviddemelosouza.pdf.jpg8f5938bd68b95efdd988b79ea5169129MD55ufjf/119342020-12-01 04:08:23.814oai:hermes.cpd.ufjf.br:ufjf/11934Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufjf.br/oai/requestopendoar:2020-12-01T06:08:23Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF)false
dc.title.pt_BR.fl_str_mv Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda
title Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda
spellingShingle Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda
Souza, David de Melo
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Estimação não-paramétrica
Largura de banda
KDE
Verossimilhança naive
Classificação
Nonparametric estimation
Bandwidth
Likelihood naive
Classification
title_short Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda
title_full Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda
title_fullStr Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda
title_full_unstemmed Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda
title_sort Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda
author Souza, David de Melo
author_facet Souza, David de Melo
author_role author
dc.contributor.advisor1.fl_str_mv Nóbrega, Rafael Antunes
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/9217577296048418
dc.contributor.referee2.fl_str_mv Andrade Filho, Luciano Manhães de
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/5454168673866452
dc.contributor.referee3.fl_str_mv Gonzalez, Luis Fernando Gomez
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/4910241356954777
dc.contributor.referee4.fl_str_mv Campos, Marcello Luiz Rodrigues de
dc.contributor.referee4Lattes.fl_str_mv http://lattes.cnpq.br/2402401592333107
dc.contributor.referee5.fl_str_mv Cerqueira, Augusto Santiago
dc.contributor.referee5Lattes.fl_str_mv http://lattes.cnpq.br/3648221859200471
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/9760840142994953
dc.contributor.author.fl_str_mv Souza, David de Melo
contributor_str_mv Nóbrega, Rafael Antunes
Andrade Filho, Luciano Manhães de
Gonzalez, Luis Fernando Gomez
Campos, Marcello Luiz Rodrigues de
Cerqueira, Augusto Santiago
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
topic CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Estimação não-paramétrica
Largura de banda
KDE
Verossimilhança naive
Classificação
Nonparametric estimation
Bandwidth
Likelihood naive
Classification
dc.subject.por.fl_str_mv Estimação não-paramétrica
Largura de banda
KDE
Verossimilhança naive
Classificação
Nonparametric estimation
Bandwidth
Likelihood naive
Classification
description Esta tese teve como motivação conhecer o estado da arte em estimação nãoparamétrica de densidade de probabilidade, avaliar as técnicas mais proeminentes encontradas em publicações científicas, compará-las em diversas situações e avaliar seu impacto em classificação utilizando verossimilhança. Para isto, foi realizado um estudo sobre a escolha automática da largura de banda, principal parâmetro utilizado pelos quatro estimadores não-paramétricos de densidade clássicos: Histograma, Average Shifted Histogram (ASH), Polígono de Frequência (PF) e Kernel Density Estimation (KDE). Em linhas gerais, o método KDE mostrou os melhores resultados em todas as distribuições testadas e devido a esse desempenho sua análise foi mais aprofundada, adentrando nas teorias do KDE com largura de banda variável. Ademais, foi percebido nos diversos testes realizados que os seletores baseados em validação-cruzada são mais resilientes do que os métodos de Plug-In (PI), levando a melhores resultados de estimação e classificação em realidades complexas. Por fim, este trabalho teve como desdobramento algumas contribuições para o estado da arte no assunto de investigação, cujas principais são elencadas a seguir: aumento do conhecimento sobre alguns dos principais estimadores não-paramétricos discutidos no mundo científico; desenvolvimento de uma técnica de avaliação de estimadores de densidade, nomeada de Region of Interest Map (RoIMap); proposta de uma técnica automática híbrida para ajustar o seletor de largura de banda variável, denominada Region of Interest-based Kernel Density Estimation (ROIKDE); e avaliação do impacto da estimação não-paramétrica em classificação de amostras.
publishDate 2020
dc.date.accessioned.fl_str_mv 2020-11-30T20:49:57Z
dc.date.available.fl_str_mv 2020-11-30
2020-11-30T20:49:57Z
dc.date.issued.fl_str_mv 2020-04-15
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufjf.br/jspui/handle/ufjf/11934
url https://repositorio.ufjf.br/jspui/handle/ufjf/11934
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Juiz de Fora (UFJF)
dc.publisher.program.fl_str_mv Programa de Pós-graduação em Engenharia Elétrica
dc.publisher.initials.fl_str_mv UFJF
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Faculdade de Engenharia
publisher.none.fl_str_mv Universidade Federal de Juiz de Fora (UFJF)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFJF
instname:Universidade Federal de Juiz de Fora (UFJF)
instacron:UFJF
instname_str Universidade Federal de Juiz de Fora (UFJF)
instacron_str UFJF
institution UFJF
reponame_str Repositório Institucional da UFJF
collection Repositório Institucional da UFJF
bitstream.url.fl_str_mv https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/1/daviddemelosouza.pdf
https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/2/license_rdf
https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/3/license.txt
https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/4/daviddemelosouza.pdf.txt
https://repositorio.ufjf.br/jspui/bitstream/ufjf/11934/5/daviddemelosouza.pdf.jpg
bitstream.checksum.fl_str_mv 49a7706ee30a43591f6d68a49a0e3e84
4d2950bda3d176f570a9f8b328dfbbef
8a4605be74aa9ea9d79846c1fba20a33
b108f4591ee40b15eef87742ecd5c1b3
8f5938bd68b95efdd988b79ea5169129
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF)
repository.mail.fl_str_mv
_version_ 1801661288336588800