Um classificador baseado em perturbações
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
dARK ID: | ark:/64986/001300000b70h |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/25856 |
Resumo: | Muitos algoritmos de reconhecimento de padrões são probabilísticos em sua construção e como tal, usam a inferência estatística para determinar o melhor rótulo para uma dada instância a ser classificada. A inferência estatística baseia-se em geral, na teoria de Bayes que por sua vez, utiliza fortemente dos vetores médios, μi, e matrizes de covariância, Σi, de classes existentes nos dados de treinamento. Estes parâmetros são desconhecidos e estimativas são realizadas seguindo vários algoritmos. Entretanto, as estimativas feitas exclusivamente a partir dos dados de treinamento são ainda as mais utilizadas. Por se tratarem de estimativas, os parâmetros μi e Σi sofrem perturbações quando se insere um novo vetor na classe à qual pertencem. Avaliando as perturbações ocorridas em todas as classes simulando uma possível inserção da instância a ser classificada nas mesmas, definimos neste trabalho uma nova regra de decisão a qual atribui a instância de teste à classe em que ocorrer a menor perturbação nos parâmetros μi e Σi ou numa combinação de ambos. Nesta área, várias abordagens são possíveis, entre elas merecem destaque as árvores de decisão, as redes neurais, o aprendizado baseado em instâncias e a máquina de vetores de suporte(SVM). Entretanto, até o momento da escrita deste texto, não foi encontrado na literatura, abordagens que utilizem as perturbações de parâmetros para a classificação de padrões. Em testes realizados inicialmente em dados sintéticos e posteriormente em 21 bancos de dados reais disponíveis no UCI Repository Learning, verificou-se que o classificador baseado em perturbações, o qual foi denominado PerC (Perturbation Classifier), apresentou performance significativamente superior às versões do SVM com kernels polinomiais de graus 2 e 3, e praticamente equivalente aos k-Nearest Neighboor com k=3 e k=5, Naïve Bayes, SVM com kernel gaussiano, CART e as redes neurais MLP, tendo o PerC o maior ranking segundo o teste estatístico de Friedman. Os resultados demonstraram que a abordagem baseada em perturbações são, portanto, úteis para a classificação de padrões. |
id |
UFPE_b696e541baab434bdbbae3176d1f5116 |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/25856 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
ARAÚJO, Edson Leitehttp://lattes.cnpq.br/9775974009786244http://lattes.cnpq.br/8577312109146354CAVALCANTI, George Darmiton da Cunha2018-08-24T21:24:41Z2018-08-24T21:24:41Z2017-04-10https://repositorio.ufpe.br/handle/123456789/25856ark:/64986/001300000b70hMuitos algoritmos de reconhecimento de padrões são probabilísticos em sua construção e como tal, usam a inferência estatística para determinar o melhor rótulo para uma dada instância a ser classificada. A inferência estatística baseia-se em geral, na teoria de Bayes que por sua vez, utiliza fortemente dos vetores médios, μi, e matrizes de covariância, Σi, de classes existentes nos dados de treinamento. Estes parâmetros são desconhecidos e estimativas são realizadas seguindo vários algoritmos. Entretanto, as estimativas feitas exclusivamente a partir dos dados de treinamento são ainda as mais utilizadas. Por se tratarem de estimativas, os parâmetros μi e Σi sofrem perturbações quando se insere um novo vetor na classe à qual pertencem. Avaliando as perturbações ocorridas em todas as classes simulando uma possível inserção da instância a ser classificada nas mesmas, definimos neste trabalho uma nova regra de decisão a qual atribui a instância de teste à classe em que ocorrer a menor perturbação nos parâmetros μi e Σi ou numa combinação de ambos. Nesta área, várias abordagens são possíveis, entre elas merecem destaque as árvores de decisão, as redes neurais, o aprendizado baseado em instâncias e a máquina de vetores de suporte(SVM). Entretanto, até o momento da escrita deste texto, não foi encontrado na literatura, abordagens que utilizem as perturbações de parâmetros para a classificação de padrões. Em testes realizados inicialmente em dados sintéticos e posteriormente em 21 bancos de dados reais disponíveis no UCI Repository Learning, verificou-se que o classificador baseado em perturbações, o qual foi denominado PerC (Perturbation Classifier), apresentou performance significativamente superior às versões do SVM com kernels polinomiais de graus 2 e 3, e praticamente equivalente aos k-Nearest Neighboor com k=3 e k=5, Naïve Bayes, SVM com kernel gaussiano, CART e as redes neurais MLP, tendo o PerC o maior ranking segundo o teste estatístico de Friedman. Os resultados demonstraram que a abordagem baseada em perturbações são, portanto, úteis para a classificação de padrões.Many pattern recognition algorithms are probabilistic in their structure and as such, they use statistical inference to determine the best label for a given instance to be classified. The statistical inference is based generally on Bayes theory which strongly uses the average vectors, μi, and covariance matrices, Σi, of existing classes in the training data. These parameters are unknown and estimates are made by following various algorithms. However, the estimates made exclusively from the training data are still the most used. Because they are estimates, the parameters μi and Σi are perturbed when a new vector is inserted into the class which they belong to. Evaluating the perturbations that occurred in all classes simulating a possible inclusion of the instance to be classified in the same one, we defined in this work a new decision rule which assigns the test instance to the class in which occurs the slightest perturbation μi and Σi parameters or the combination of both. In this area, several approaches are possible, it’s worth mentioning the decision trees, neural networks, instance-based learning and the support vector machine (SVM). However, until the moment of the writing of this text, was not found in the literature, approaches that use parameters perturbations to pattern’s classification. In tests performed initially on synthetic data and later on 21 real databases available in the UCI Repository Learning, was verified that perturbation-based classifier, which was denominated PerC (Perturbation Classifier), presented performance significantly superior to the versions of the SVM with polinomial kernels of degrees 2 and 3 and roughly equivalent to k-Nearest Neighboor with k = 3 and k = 5, Naïve Bayes, SVM with Gaussian kernel, CART and MLP neural networks, having the PerC the highest ranking according to the Friedman statistical test. The results demonstrated that the perturbation-based approach is therefore useful to pattern classification.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessInteligência artificialReconhecimento de padrãoUm classificador baseado em perturbaçõesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisdoutoradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILTESE Edson Leite de Araújo.pdf.jpgTESE Edson Leite de Araújo.pdf.jpgGenerated Thumbnailimage/jpeg1232https://repositorio.ufpe.br/bitstream/123456789/25856/5/TESE%20Edson%20Leite%20de%20Ara%c3%bajo.pdf.jpgab5f10ed105c09efdff3e0bb755e7eaaMD55ORIGINALTESE Edson Leite de Araújo.pdfTESE Edson Leite de Araújo.pdfapplication/pdf2460675https://repositorio.ufpe.br/bitstream/123456789/25856/1/TESE%20Edson%20Leite%20de%20Ara%c3%bajo.pdfc90cfbf77664407874232bd551663f9cMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/25856/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82311https://repositorio.ufpe.br/bitstream/123456789/25856/3/license.txt4b8a02c7f2818eaf00dcf2260dd5eb08MD53TEXTTESE Edson Leite de Araújo.pdf.txtTESE Edson Leite de Araújo.pdf.txtExtracted texttext/plain170658https://repositorio.ufpe.br/bitstream/123456789/25856/4/TESE%20Edson%20Leite%20de%20Ara%c3%bajo.pdf.txt10d06114aca5f9e64756b0a1f7f50297MD54123456789/258562019-10-25 09:19:46.424oai:repositorio.ufpe.br:123456789/25856TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLMKgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUEUgaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8ocykgbm9tZShzKSBkbyhzKSBhdXRvciAoZXMpIGRvcyBkaXJlaXRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRvIHByZXZpc3RvIG5hIGFsw61uZWEgYykuCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T12:19:46Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Um classificador baseado em perturbações |
title |
Um classificador baseado em perturbações |
spellingShingle |
Um classificador baseado em perturbações ARAÚJO, Edson Leite Inteligência artificial Reconhecimento de padrão |
title_short |
Um classificador baseado em perturbações |
title_full |
Um classificador baseado em perturbações |
title_fullStr |
Um classificador baseado em perturbações |
title_full_unstemmed |
Um classificador baseado em perturbações |
title_sort |
Um classificador baseado em perturbações |
author |
ARAÚJO, Edson Leite |
author_facet |
ARAÚJO, Edson Leite |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/9775974009786244 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/8577312109146354 |
dc.contributor.author.fl_str_mv |
ARAÚJO, Edson Leite |
dc.contributor.advisor1.fl_str_mv |
CAVALCANTI, George Darmiton da Cunha |
contributor_str_mv |
CAVALCANTI, George Darmiton da Cunha |
dc.subject.por.fl_str_mv |
Inteligência artificial Reconhecimento de padrão |
topic |
Inteligência artificial Reconhecimento de padrão |
description |
Muitos algoritmos de reconhecimento de padrões são probabilísticos em sua construção e como tal, usam a inferência estatística para determinar o melhor rótulo para uma dada instância a ser classificada. A inferência estatística baseia-se em geral, na teoria de Bayes que por sua vez, utiliza fortemente dos vetores médios, μi, e matrizes de covariância, Σi, de classes existentes nos dados de treinamento. Estes parâmetros são desconhecidos e estimativas são realizadas seguindo vários algoritmos. Entretanto, as estimativas feitas exclusivamente a partir dos dados de treinamento são ainda as mais utilizadas. Por se tratarem de estimativas, os parâmetros μi e Σi sofrem perturbações quando se insere um novo vetor na classe à qual pertencem. Avaliando as perturbações ocorridas em todas as classes simulando uma possível inserção da instância a ser classificada nas mesmas, definimos neste trabalho uma nova regra de decisão a qual atribui a instância de teste à classe em que ocorrer a menor perturbação nos parâmetros μi e Σi ou numa combinação de ambos. Nesta área, várias abordagens são possíveis, entre elas merecem destaque as árvores de decisão, as redes neurais, o aprendizado baseado em instâncias e a máquina de vetores de suporte(SVM). Entretanto, até o momento da escrita deste texto, não foi encontrado na literatura, abordagens que utilizem as perturbações de parâmetros para a classificação de padrões. Em testes realizados inicialmente em dados sintéticos e posteriormente em 21 bancos de dados reais disponíveis no UCI Repository Learning, verificou-se que o classificador baseado em perturbações, o qual foi denominado PerC (Perturbation Classifier), apresentou performance significativamente superior às versões do SVM com kernels polinomiais de graus 2 e 3, e praticamente equivalente aos k-Nearest Neighboor com k=3 e k=5, Naïve Bayes, SVM com kernel gaussiano, CART e as redes neurais MLP, tendo o PerC o maior ranking segundo o teste estatístico de Friedman. Os resultados demonstraram que a abordagem baseada em perturbações são, portanto, úteis para a classificação de padrões. |
publishDate |
2017 |
dc.date.issued.fl_str_mv |
2017-04-10 |
dc.date.accessioned.fl_str_mv |
2018-08-24T21:24:41Z |
dc.date.available.fl_str_mv |
2018-08-24T21:24:41Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/25856 |
dc.identifier.dark.fl_str_mv |
ark:/64986/001300000b70h |
url |
https://repositorio.ufpe.br/handle/123456789/25856 |
identifier_str_mv |
ark:/64986/001300000b70h |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Computacao |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/25856/5/TESE%20Edson%20Leite%20de%20Ara%c3%bajo.pdf.jpg https://repositorio.ufpe.br/bitstream/123456789/25856/1/TESE%20Edson%20Leite%20de%20Ara%c3%bajo.pdf https://repositorio.ufpe.br/bitstream/123456789/25856/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/25856/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/25856/4/TESE%20Edson%20Leite%20de%20Ara%c3%bajo.pdf.txt |
bitstream.checksum.fl_str_mv |
ab5f10ed105c09efdff3e0bb755e7eaa c90cfbf77664407874232bd551663f9c e39d27027a6cc9cb039ad269a5db8e34 4b8a02c7f2818eaf00dcf2260dd5eb08 10d06114aca5f9e64756b0a1f7f50297 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1815172776603942912 |