Aumentando o poder preditivo de classificadores lineares através de particionamento por classe

Detalhes bibliográficos
Autor(a) principal: Souza, Nahim Alves de
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/9530
Resumo: This work describes a new classification technique called P2C - Partitioning to Classify. The main goal is to achieve reasonable classification performances using linear prediction methods, even on datasets with non-linear separable data. The proposed technique, inspired by the division-and-conquer strategy, applies a clustering method on each partition made of samples of the same class. Subsequently, the union among the clusters inside each partition is performed, creating a single partition, where each group can contain linearly separable samples. Then, one or more linear classifiers are trained, according to the number of groups. Experiments performed using datasets with different structural and complexity level indicate the overall performance of the prediction is similar or superior to well-known non-linear classification methods. The main advantages of P2C technique are (i) the need for less effort and computational resources, and (ii) the possibility of treating large datasets due to the ease of parallelization of the steps.
id SCAR_7d49312812034493fab8a929e133f879
oai_identifier_str oai:repositorio.ufscar.br:ufscar/9530
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Souza, Nahim Alves deSakata, Tiemi Christinehttp://lattes.cnpq.br/3560505262283874Almeida, Tiago Agostinho dehttp://lattes.cnpq.br/5368680512020633http://lattes.cnpq.br/800142609171306618d24ca6-4493-4532-93e7-ca54211344862018-03-06T14:36:34Z2018-03-06T14:36:34Z2018-01-25SOUZA, Nahim Alves de. Aumentando o poder preditivo de classificadores lineares através de particionamento por classe. 2018. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, Sorocaba, 2018. Disponível em: https://repositorio.ufscar.br/handle/ufscar/9530.https://repositorio.ufscar.br/handle/ufscar/9530This work describes a new classification technique called P2C - Partitioning to Classify. The main goal is to achieve reasonable classification performances using linear prediction methods, even on datasets with non-linear separable data. The proposed technique, inspired by the division-and-conquer strategy, applies a clustering method on each partition made of samples of the same class. Subsequently, the union among the clusters inside each partition is performed, creating a single partition, where each group can contain linearly separable samples. Then, one or more linear classifiers are trained, according to the number of groups. Experiments performed using datasets with different structural and complexity level indicate the overall performance of the prediction is similar or superior to well-known non-linear classification methods. The main advantages of P2C technique are (i) the need for less effort and computational resources, and (ii) the possibility of treating large datasets due to the ease of parallelization of the steps.Este trabalho descreve uma nova técnica de classificação, denominada P2C - Partitioning to Classify, cujo objetivo é obter bom desempenho de classificação usando métodos de predição lineares, mesmo em bases com dados não separáveis linearmente. A técnica proposta, inspirada na estratégia de divisão-e-conquista, aplica um método de agrupamento sobre cada partição, constituídas por amostras de mesma classe. Posteriormente, a união dos clusters em cada partição é realizada, criando uma única partição, onde cada grupo pode conter amostras separáveis linearmente. Em seguida, um ou mais classificadores lineares são treinados, de acordo com o número de grupos. Experimentos realizados com bases de dados que possuem diferentes estruturas e níveis de complexidade demonstram que o desempenho geral da predição é muitas vezes semelhante ou superior aos métodos de classificação não-lineares. As principais vantagens da técnica P2C são (i) a necessidade de menor esforço e recursos computacionais, e (ii) a possibilidade de tratar bases de dados grandes, devido à facilidade de paralelização das etapas.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus SorocabaPrograma de Pós-Graduação em Ciência da Computação - PPGCC-SoUFSCarClassificação linearAgrupamentoAprendizado de máquinaAprendizado do computadorLinear classificationClusteringMachine learningCluster (Sistema de computador)CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOAumentando o poder preditivo de classificadores lineares através de particionamento por classeinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisOnline600600b53748a1-5dee-4169-8b3a-e8cb117ea9cfinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALSOUZA_NahimAlvesDe_dissertacao.pdfSOUZA_NahimAlvesDe_dissertacao.pdfDissertação - texto completoapplication/pdf3033545https://repositorio.ufscar.br/bitstream/ufscar/9530/1/SOUZA_NahimAlvesDe_dissertacao.pdf60083c7f3d8215872b0e38319be3f574MD51SOUZA_NahimAlvesDe_carta.pdfSOUZA_NahimAlvesDe_carta.pdfCarta do orientadorapplication/pdf104840https://repositorio.ufscar.br/bitstream/ufscar/9530/3/SOUZA_NahimAlvesDe_carta.pdf3a20f61b261ce90fdfcb20981af5b452MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81957https://repositorio.ufscar.br/bitstream/ufscar/9530/4/license.txtae0398b6f8b235e40ad82cba6c50031dMD54TEXTSOUZA_NahimAlvesDe_dissertacao.pdf.txtSOUZA_NahimAlvesDe_dissertacao.pdf.txtExtracted texttext/plain104328https://repositorio.ufscar.br/bitstream/ufscar/9530/5/SOUZA_NahimAlvesDe_dissertacao.pdf.txta3f624b0f67e6e95dfd6c29203099c95MD55SOUZA_NahimAlvesDe_carta.pdf.txtSOUZA_NahimAlvesDe_carta.pdf.txtExtracted texttext/plain1https://repositorio.ufscar.br/bitstream/ufscar/9530/6/SOUZA_NahimAlvesDe_carta.pdf.txt68b329da9893e34099c7d8ad5cb9c940MD56THUMBNAILSOUZA_NahimAlvesDe_dissertacao.pdf.jpgSOUZA_NahimAlvesDe_dissertacao.pdf.jpgIM Thumbnailimage/jpeg5697https://repositorio.ufscar.br/bitstream/ufscar/9530/7/SOUZA_NahimAlvesDe_dissertacao.pdf.jpg74df9349d53af537bd110b39b7c4142eMD57SOUZA_NahimAlvesDe_carta.pdf.jpgSOUZA_NahimAlvesDe_carta.pdf.jpgIM Thumbnailimage/jpeg12806https://repositorio.ufscar.br/bitstream/ufscar/9530/8/SOUZA_NahimAlvesDe_carta.pdf.jpg77cb6885b5ee85144c50313b9ee11d49MD58ufscar/95302023-09-18 18:31:13.95oai:repositorio.ufscar.br:ufscar/9530TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlCkZlZGVyYWwgZGUgU8OjbyBDYXJsb3MgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdQpkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlCmVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcyBmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZTQ2FyIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28KcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGU0NhciBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgYSBzdWEgdGVzZSBvdQpkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcwpuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldQpjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6oKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFVGU0NhcgpvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUKaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRlNDYXIsClZPQ8OKIERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJU8ODTyBDT01PClRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVRlNDYXIgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSAocykgb3UgbyhzKSBub21lKHMpIGRvKHMpCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzCmNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:13Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Aumentando o poder preditivo de classificadores lineares através de particionamento por classe
title Aumentando o poder preditivo de classificadores lineares através de particionamento por classe
spellingShingle Aumentando o poder preditivo de classificadores lineares através de particionamento por classe
Souza, Nahim Alves de
Classificação linear
Agrupamento
Aprendizado de máquina
Aprendizado do computador
Linear classification
Clustering
Machine learning
Cluster (Sistema de computador)
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
title_short Aumentando o poder preditivo de classificadores lineares através de particionamento por classe
title_full Aumentando o poder preditivo de classificadores lineares através de particionamento por classe
title_fullStr Aumentando o poder preditivo de classificadores lineares através de particionamento por classe
title_full_unstemmed Aumentando o poder preditivo de classificadores lineares através de particionamento por classe
title_sort Aumentando o poder preditivo de classificadores lineares através de particionamento por classe
author Souza, Nahim Alves de
author_facet Souza, Nahim Alves de
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/8001426091713066
dc.contributor.author.fl_str_mv Souza, Nahim Alves de
dc.contributor.advisor1.fl_str_mv Sakata, Tiemi Christine
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/3560505262283874
dc.contributor.advisor-co1.fl_str_mv Almeida, Tiago Agostinho de
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/5368680512020633
dc.contributor.authorID.fl_str_mv 18d24ca6-4493-4532-93e7-ca5421134486
contributor_str_mv Sakata, Tiemi Christine
Almeida, Tiago Agostinho de
dc.subject.por.fl_str_mv Classificação linear
Agrupamento
Aprendizado de máquina
Aprendizado do computador
topic Classificação linear
Agrupamento
Aprendizado de máquina
Aprendizado do computador
Linear classification
Clustering
Machine learning
Cluster (Sistema de computador)
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
dc.subject.eng.fl_str_mv Linear classification
Clustering
Machine learning
Cluster (Sistema de computador)
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
description This work describes a new classification technique called P2C - Partitioning to Classify. The main goal is to achieve reasonable classification performances using linear prediction methods, even on datasets with non-linear separable data. The proposed technique, inspired by the division-and-conquer strategy, applies a clustering method on each partition made of samples of the same class. Subsequently, the union among the clusters inside each partition is performed, creating a single partition, where each group can contain linearly separable samples. Then, one or more linear classifiers are trained, according to the number of groups. Experiments performed using datasets with different structural and complexity level indicate the overall performance of the prediction is similar or superior to well-known non-linear classification methods. The main advantages of P2C technique are (i) the need for less effort and computational resources, and (ii) the possibility of treating large datasets due to the ease of parallelization of the steps.
publishDate 2018
dc.date.accessioned.fl_str_mv 2018-03-06T14:36:34Z
dc.date.available.fl_str_mv 2018-03-06T14:36:34Z
dc.date.issued.fl_str_mv 2018-01-25
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SOUZA, Nahim Alves de. Aumentando o poder preditivo de classificadores lineares através de particionamento por classe. 2018. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, Sorocaba, 2018. Disponível em: https://repositorio.ufscar.br/handle/ufscar/9530.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/9530
identifier_str_mv SOUZA, Nahim Alves de. Aumentando o poder preditivo de classificadores lineares através de particionamento por classe. 2018. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, Sorocaba, 2018. Disponível em: https://repositorio.ufscar.br/handle/ufscar/9530.
url https://repositorio.ufscar.br/handle/ufscar/9530
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv 600
600
dc.relation.authority.fl_str_mv b53748a1-5dee-4169-8b3a-e8cb117ea9cf
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus Sorocaba
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC-So
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus Sorocaba
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/9530/1/SOUZA_NahimAlvesDe_dissertacao.pdf
https://repositorio.ufscar.br/bitstream/ufscar/9530/3/SOUZA_NahimAlvesDe_carta.pdf
https://repositorio.ufscar.br/bitstream/ufscar/9530/4/license.txt
https://repositorio.ufscar.br/bitstream/ufscar/9530/5/SOUZA_NahimAlvesDe_dissertacao.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/9530/6/SOUZA_NahimAlvesDe_carta.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/9530/7/SOUZA_NahimAlvesDe_dissertacao.pdf.jpg
https://repositorio.ufscar.br/bitstream/ufscar/9530/8/SOUZA_NahimAlvesDe_carta.pdf.jpg
bitstream.checksum.fl_str_mv 60083c7f3d8215872b0e38319be3f574
3a20f61b261ce90fdfcb20981af5b452
ae0398b6f8b235e40ad82cba6c50031d
a3f624b0f67e6e95dfd6c29203099c95
68b329da9893e34099c7d8ad5cb9c940
74df9349d53af537bd110b39b7c4142e
77cb6885b5ee85144c50313b9ee11d49
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1813715586689007616