Aumentando o poder preditivo de classificadores lineares através de particionamento por classe
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/9530 |
Resumo: | This work describes a new classification technique called P2C - Partitioning to Classify. The main goal is to achieve reasonable classification performances using linear prediction methods, even on datasets with non-linear separable data. The proposed technique, inspired by the division-and-conquer strategy, applies a clustering method on each partition made of samples of the same class. Subsequently, the union among the clusters inside each partition is performed, creating a single partition, where each group can contain linearly separable samples. Then, one or more linear classifiers are trained, according to the number of groups. Experiments performed using datasets with different structural and complexity level indicate the overall performance of the prediction is similar or superior to well-known non-linear classification methods. The main advantages of P2C technique are (i) the need for less effort and computational resources, and (ii) the possibility of treating large datasets due to the ease of parallelization of the steps. |
id |
SCAR_7d49312812034493fab8a929e133f879 |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/9530 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Souza, Nahim Alves deSakata, Tiemi Christinehttp://lattes.cnpq.br/3560505262283874Almeida, Tiago Agostinho dehttp://lattes.cnpq.br/5368680512020633http://lattes.cnpq.br/800142609171306618d24ca6-4493-4532-93e7-ca54211344862018-03-06T14:36:34Z2018-03-06T14:36:34Z2018-01-25SOUZA, Nahim Alves de. Aumentando o poder preditivo de classificadores lineares através de particionamento por classe. 2018. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, Sorocaba, 2018. Disponível em: https://repositorio.ufscar.br/handle/ufscar/9530.https://repositorio.ufscar.br/handle/ufscar/9530This work describes a new classification technique called P2C - Partitioning to Classify. The main goal is to achieve reasonable classification performances using linear prediction methods, even on datasets with non-linear separable data. The proposed technique, inspired by the division-and-conquer strategy, applies a clustering method on each partition made of samples of the same class. Subsequently, the union among the clusters inside each partition is performed, creating a single partition, where each group can contain linearly separable samples. Then, one or more linear classifiers are trained, according to the number of groups. Experiments performed using datasets with different structural and complexity level indicate the overall performance of the prediction is similar or superior to well-known non-linear classification methods. The main advantages of P2C technique are (i) the need for less effort and computational resources, and (ii) the possibility of treating large datasets due to the ease of parallelization of the steps.Este trabalho descreve uma nova técnica de classificação, denominada P2C - Partitioning to Classify, cujo objetivo é obter bom desempenho de classificação usando métodos de predição lineares, mesmo em bases com dados não separáveis linearmente. A técnica proposta, inspirada na estratégia de divisão-e-conquista, aplica um método de agrupamento sobre cada partição, constituídas por amostras de mesma classe. Posteriormente, a união dos clusters em cada partição é realizada, criando uma única partição, onde cada grupo pode conter amostras separáveis linearmente. Em seguida, um ou mais classificadores lineares são treinados, de acordo com o número de grupos. Experimentos realizados com bases de dados que possuem diferentes estruturas e níveis de complexidade demonstram que o desempenho geral da predição é muitas vezes semelhante ou superior aos métodos de classificação não-lineares. As principais vantagens da técnica P2C são (i) a necessidade de menor esforço e recursos computacionais, e (ii) a possibilidade de tratar bases de dados grandes, devido à facilidade de paralelização das etapas.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus SorocabaPrograma de Pós-Graduação em Ciência da Computação - PPGCC-SoUFSCarClassificação linearAgrupamentoAprendizado de máquinaAprendizado do computadorLinear classificationClusteringMachine learningCluster (Sistema de computador)CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOAumentando o poder preditivo de classificadores lineares através de particionamento por classeinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisOnline600600b53748a1-5dee-4169-8b3a-e8cb117ea9cfinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALSOUZA_NahimAlvesDe_dissertacao.pdfSOUZA_NahimAlvesDe_dissertacao.pdfDissertação - texto completoapplication/pdf3033545https://repositorio.ufscar.br/bitstream/ufscar/9530/1/SOUZA_NahimAlvesDe_dissertacao.pdf60083c7f3d8215872b0e38319be3f574MD51SOUZA_NahimAlvesDe_carta.pdfSOUZA_NahimAlvesDe_carta.pdfCarta do orientadorapplication/pdf104840https://repositorio.ufscar.br/bitstream/ufscar/9530/3/SOUZA_NahimAlvesDe_carta.pdf3a20f61b261ce90fdfcb20981af5b452MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81957https://repositorio.ufscar.br/bitstream/ufscar/9530/4/license.txtae0398b6f8b235e40ad82cba6c50031dMD54TEXTSOUZA_NahimAlvesDe_dissertacao.pdf.txtSOUZA_NahimAlvesDe_dissertacao.pdf.txtExtracted texttext/plain104328https://repositorio.ufscar.br/bitstream/ufscar/9530/5/SOUZA_NahimAlvesDe_dissertacao.pdf.txta3f624b0f67e6e95dfd6c29203099c95MD55SOUZA_NahimAlvesDe_carta.pdf.txtSOUZA_NahimAlvesDe_carta.pdf.txtExtracted texttext/plain1https://repositorio.ufscar.br/bitstream/ufscar/9530/6/SOUZA_NahimAlvesDe_carta.pdf.txt68b329da9893e34099c7d8ad5cb9c940MD56THUMBNAILSOUZA_NahimAlvesDe_dissertacao.pdf.jpgSOUZA_NahimAlvesDe_dissertacao.pdf.jpgIM Thumbnailimage/jpeg5697https://repositorio.ufscar.br/bitstream/ufscar/9530/7/SOUZA_NahimAlvesDe_dissertacao.pdf.jpg74df9349d53af537bd110b39b7c4142eMD57SOUZA_NahimAlvesDe_carta.pdf.jpgSOUZA_NahimAlvesDe_carta.pdf.jpgIM Thumbnailimage/jpeg12806https://repositorio.ufscar.br/bitstream/ufscar/9530/8/SOUZA_NahimAlvesDe_carta.pdf.jpg77cb6885b5ee85144c50313b9ee11d49MD58ufscar/95302023-09-18 18:31:13.95oai:repositorio.ufscar.br:ufscar/9530TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlCkZlZGVyYWwgZGUgU8OjbyBDYXJsb3MgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdQpkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlCmVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcyBmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZTQ2FyIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28KcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGU0NhciBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgYSBzdWEgdGVzZSBvdQpkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcwpuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldQpjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6oKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFVGU0NhcgpvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUKaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRlNDYXIsClZPQ8OKIERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJU8ODTyBDT01PClRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVRlNDYXIgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSAocykgb3UgbyhzKSBub21lKHMpIGRvKHMpCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzCmNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:13Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Aumentando o poder preditivo de classificadores lineares através de particionamento por classe |
title |
Aumentando o poder preditivo de classificadores lineares através de particionamento por classe |
spellingShingle |
Aumentando o poder preditivo de classificadores lineares através de particionamento por classe Souza, Nahim Alves de Classificação linear Agrupamento Aprendizado de máquina Aprendizado do computador Linear classification Clustering Machine learning Cluster (Sistema de computador) CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
title_short |
Aumentando o poder preditivo de classificadores lineares através de particionamento por classe |
title_full |
Aumentando o poder preditivo de classificadores lineares através de particionamento por classe |
title_fullStr |
Aumentando o poder preditivo de classificadores lineares através de particionamento por classe |
title_full_unstemmed |
Aumentando o poder preditivo de classificadores lineares através de particionamento por classe |
title_sort |
Aumentando o poder preditivo de classificadores lineares através de particionamento por classe |
author |
Souza, Nahim Alves de |
author_facet |
Souza, Nahim Alves de |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/8001426091713066 |
dc.contributor.author.fl_str_mv |
Souza, Nahim Alves de |
dc.contributor.advisor1.fl_str_mv |
Sakata, Tiemi Christine |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/3560505262283874 |
dc.contributor.advisor-co1.fl_str_mv |
Almeida, Tiago Agostinho de |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/5368680512020633 |
dc.contributor.authorID.fl_str_mv |
18d24ca6-4493-4532-93e7-ca5421134486 |
contributor_str_mv |
Sakata, Tiemi Christine Almeida, Tiago Agostinho de |
dc.subject.por.fl_str_mv |
Classificação linear Agrupamento Aprendizado de máquina Aprendizado do computador |
topic |
Classificação linear Agrupamento Aprendizado de máquina Aprendizado do computador Linear classification Clustering Machine learning Cluster (Sistema de computador) CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
dc.subject.eng.fl_str_mv |
Linear classification Clustering Machine learning Cluster (Sistema de computador) |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
description |
This work describes a new classification technique called P2C - Partitioning to Classify. The main goal is to achieve reasonable classification performances using linear prediction methods, even on datasets with non-linear separable data. The proposed technique, inspired by the division-and-conquer strategy, applies a clustering method on each partition made of samples of the same class. Subsequently, the union among the clusters inside each partition is performed, creating a single partition, where each group can contain linearly separable samples. Then, one or more linear classifiers are trained, according to the number of groups. Experiments performed using datasets with different structural and complexity level indicate the overall performance of the prediction is similar or superior to well-known non-linear classification methods. The main advantages of P2C technique are (i) the need for less effort and computational resources, and (ii) the possibility of treating large datasets due to the ease of parallelization of the steps. |
publishDate |
2018 |
dc.date.accessioned.fl_str_mv |
2018-03-06T14:36:34Z |
dc.date.available.fl_str_mv |
2018-03-06T14:36:34Z |
dc.date.issued.fl_str_mv |
2018-01-25 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SOUZA, Nahim Alves de. Aumentando o poder preditivo de classificadores lineares através de particionamento por classe. 2018. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, Sorocaba, 2018. Disponível em: https://repositorio.ufscar.br/handle/ufscar/9530. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/9530 |
identifier_str_mv |
SOUZA, Nahim Alves de. Aumentando o poder preditivo de classificadores lineares através de particionamento por classe. 2018. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, Sorocaba, 2018. Disponível em: https://repositorio.ufscar.br/handle/ufscar/9530. |
url |
https://repositorio.ufscar.br/handle/ufscar/9530 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
600 600 |
dc.relation.authority.fl_str_mv |
b53748a1-5dee-4169-8b3a-e8cb117ea9cf |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus Sorocaba |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC-So |
dc.publisher.initials.fl_str_mv |
UFSCar |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus Sorocaba |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/9530/1/SOUZA_NahimAlvesDe_dissertacao.pdf https://repositorio.ufscar.br/bitstream/ufscar/9530/3/SOUZA_NahimAlvesDe_carta.pdf https://repositorio.ufscar.br/bitstream/ufscar/9530/4/license.txt https://repositorio.ufscar.br/bitstream/ufscar/9530/5/SOUZA_NahimAlvesDe_dissertacao.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/9530/6/SOUZA_NahimAlvesDe_carta.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/9530/7/SOUZA_NahimAlvesDe_dissertacao.pdf.jpg https://repositorio.ufscar.br/bitstream/ufscar/9530/8/SOUZA_NahimAlvesDe_carta.pdf.jpg |
bitstream.checksum.fl_str_mv |
60083c7f3d8215872b0e38319be3f574 3a20f61b261ce90fdfcb20981af5b452 ae0398b6f8b235e40ad82cba6c50031d a3f624b0f67e6e95dfd6c29203099c95 68b329da9893e34099c7d8ad5cb9c940 74df9349d53af537bd110b39b7c4142e 77cb6885b5ee85144c50313b9ee11d49 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1813715586689007616 |