Funções de escolha social para elaboração de consenso em aprendizado de máquina descentralizado : um estudo em problemas de classificação multiclasse

Detalhes bibliográficos
Autor(a) principal: Boos, Rodrigo Augusto Scheller
Data de Publicação: 2017
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/168959
Resumo: Em alguns cenários envolvendo aprendizado de máquina, os dados a serem analisados podem estar sendo adquiridos e analisados de forma distribuída, tal que o conjunto de atributos de cada instância pode não estar completamente disponível em uma localização central, seja por motivos de confidencialidade ou de custos computacionais envolvidos na comunicação de grandes volumes de dados. Neste contexto, surge o problema de como realizar a classificação de novas instâncias de forma descentralizada, utilizando informações contidas em diferentes sítios ou bases de dados a fim de viabilizar a tarefa de classificação sem o comprometimento do seu desempenho. O objetivo principal deste trabalho é analisar diferentes abordagens baseadas na Teoria da Escolha Social para extrair um consenso a partir de um conjunto de modelos de classificação treinados em sítios distintos, utilizando apenas o subconjunto de atributos disponível localmente, focando especificamente em problemas de classificação multiclasse. Seguindo esta direção, a classificação de dados descentralizados ocorre em duas etapas: primeiramente os modelos treinados localmente são aplicados aos novos dados apresentados para predizer as classes correspondentes, e em um segundo momento estas predições são centralizadas e agregadas através de funções de escolha social a fim de se obter um resultado global. Os resultados dos experimentos realizados demonstram bom desempenho do método para diversos casos de teste obtidos do UCI Machine Learning Repository, tendo como principal conclusão que as funções de escolha social são boas agregadoras para conjuntos de dados com classes balanceadas, e que para cenários caracterizados por desbalanceamento de classes o método da pluralidade é mais promissor.
id UFRGS-2_2f95c812a628b319acab346b8a0fd756
oai_identifier_str oai:www.lume.ufrgs.br:10183/168959
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Boos, Rodrigo Augusto SchellerRecamonde-Mendoza, Mariana2017-09-28T02:27:44Z2017http://hdl.handle.net/10183/168959001048288Em alguns cenários envolvendo aprendizado de máquina, os dados a serem analisados podem estar sendo adquiridos e analisados de forma distribuída, tal que o conjunto de atributos de cada instância pode não estar completamente disponível em uma localização central, seja por motivos de confidencialidade ou de custos computacionais envolvidos na comunicação de grandes volumes de dados. Neste contexto, surge o problema de como realizar a classificação de novas instâncias de forma descentralizada, utilizando informações contidas em diferentes sítios ou bases de dados a fim de viabilizar a tarefa de classificação sem o comprometimento do seu desempenho. O objetivo principal deste trabalho é analisar diferentes abordagens baseadas na Teoria da Escolha Social para extrair um consenso a partir de um conjunto de modelos de classificação treinados em sítios distintos, utilizando apenas o subconjunto de atributos disponível localmente, focando especificamente em problemas de classificação multiclasse. Seguindo esta direção, a classificação de dados descentralizados ocorre em duas etapas: primeiramente os modelos treinados localmente são aplicados aos novos dados apresentados para predizer as classes correspondentes, e em um segundo momento estas predições são centralizadas e agregadas através de funções de escolha social a fim de se obter um resultado global. Os resultados dos experimentos realizados demonstram bom desempenho do método para diversos casos de teste obtidos do UCI Machine Learning Repository, tendo como principal conclusão que as funções de escolha social são boas agregadoras para conjuntos de dados com classes balanceadas, e que para cenários caracterizados por desbalanceamento de classes o método da pluralidade é mais promissor.In some scenarios involving machine learning, the data to be analyzed may be acquired and analyzed in a distributed fashion, such that the set of attributes of each instance may not be completely available in a central facility, either due to confidentiality reasons or computational costs involved in the communication of large volumes of data. In this context, the problem that arises is how to perform the classification of new instances in a decentralized way, using information contained in different sites or databases in order to enable the classification task without compromising its performance. The main goal of this work is to analyze different approaches based on the Social Choice Theory to extract a consensus from a set of classification models trained in distinct sites, using only the subset of features available locally, focusing specifically on multiclass classification problems. Following this direction, the classification of decentralized data takes place in two stages: locally trained models are applied to the new data presented, in order to predict their corresponding classes; and in a second moment these predictions are centralized and aggregated through social choice functions in order to obtain a global result. Our results demonstrate good performance of the proposed method for several test cases from the UCI Machine Learning Repository, and the main conclusion of this work is that the social choice functions are good aggregators for datasets with balanced classes, while plurality is the most promising aggregation method for datasets characterized by large class imbalance.application/pdfporSistemas : InformaçãoAprendizado : máquinaMachine learningMulticlass classificationDistributed classificationSocial choice functionsSupervised learningFunções de escolha social para elaboração de consenso em aprendizado de máquina descentralizado : um estudo em problemas de classificação multiclasseinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2017Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL001048288.pdf001048288.pdfTexto completoapplication/pdf2146824http://www.lume.ufrgs.br/bitstream/10183/168959/1/001048288.pdf926d0362ab15732d755f9d268f455f4aMD51TEXT001048288.pdf.txt001048288.pdf.txtExtracted Texttext/plain155677http://www.lume.ufrgs.br/bitstream/10183/168959/2/001048288.pdf.txt22a2b0ed8ea0da81b71996c04db1e8d3MD52THUMBNAIL001048288.pdf.jpg001048288.pdf.jpgGenerated Thumbnailimage/jpeg1083http://www.lume.ufrgs.br/bitstream/10183/168959/3/001048288.pdf.jpg50d92a2404d9dffe12d51ed21ae42284MD5310183/1689592018-10-29 08:01:23.569oai:www.lume.ufrgs.br:10183/168959Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2018-10-29T11:01:23Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Funções de escolha social para elaboração de consenso em aprendizado de máquina descentralizado : um estudo em problemas de classificação multiclasse
title Funções de escolha social para elaboração de consenso em aprendizado de máquina descentralizado : um estudo em problemas de classificação multiclasse
spellingShingle Funções de escolha social para elaboração de consenso em aprendizado de máquina descentralizado : um estudo em problemas de classificação multiclasse
Boos, Rodrigo Augusto Scheller
Sistemas : Informação
Aprendizado : máquina
Machine learning
Multiclass classification
Distributed classification
Social choice functions
Supervised learning
title_short Funções de escolha social para elaboração de consenso em aprendizado de máquina descentralizado : um estudo em problemas de classificação multiclasse
title_full Funções de escolha social para elaboração de consenso em aprendizado de máquina descentralizado : um estudo em problemas de classificação multiclasse
title_fullStr Funções de escolha social para elaboração de consenso em aprendizado de máquina descentralizado : um estudo em problemas de classificação multiclasse
title_full_unstemmed Funções de escolha social para elaboração de consenso em aprendizado de máquina descentralizado : um estudo em problemas de classificação multiclasse
title_sort Funções de escolha social para elaboração de consenso em aprendizado de máquina descentralizado : um estudo em problemas de classificação multiclasse
author Boos, Rodrigo Augusto Scheller
author_facet Boos, Rodrigo Augusto Scheller
author_role author
dc.contributor.author.fl_str_mv Boos, Rodrigo Augusto Scheller
dc.contributor.advisor1.fl_str_mv Recamonde-Mendoza, Mariana
contributor_str_mv Recamonde-Mendoza, Mariana
dc.subject.por.fl_str_mv Sistemas : Informação
Aprendizado : máquina
topic Sistemas : Informação
Aprendizado : máquina
Machine learning
Multiclass classification
Distributed classification
Social choice functions
Supervised learning
dc.subject.eng.fl_str_mv Machine learning
Multiclass classification
Distributed classification
Social choice functions
Supervised learning
description Em alguns cenários envolvendo aprendizado de máquina, os dados a serem analisados podem estar sendo adquiridos e analisados de forma distribuída, tal que o conjunto de atributos de cada instância pode não estar completamente disponível em uma localização central, seja por motivos de confidencialidade ou de custos computacionais envolvidos na comunicação de grandes volumes de dados. Neste contexto, surge o problema de como realizar a classificação de novas instâncias de forma descentralizada, utilizando informações contidas em diferentes sítios ou bases de dados a fim de viabilizar a tarefa de classificação sem o comprometimento do seu desempenho. O objetivo principal deste trabalho é analisar diferentes abordagens baseadas na Teoria da Escolha Social para extrair um consenso a partir de um conjunto de modelos de classificação treinados em sítios distintos, utilizando apenas o subconjunto de atributos disponível localmente, focando especificamente em problemas de classificação multiclasse. Seguindo esta direção, a classificação de dados descentralizados ocorre em duas etapas: primeiramente os modelos treinados localmente são aplicados aos novos dados apresentados para predizer as classes correspondentes, e em um segundo momento estas predições são centralizadas e agregadas através de funções de escolha social a fim de se obter um resultado global. Os resultados dos experimentos realizados demonstram bom desempenho do método para diversos casos de teste obtidos do UCI Machine Learning Repository, tendo como principal conclusão que as funções de escolha social são boas agregadoras para conjuntos de dados com classes balanceadas, e que para cenários caracterizados por desbalanceamento de classes o método da pluralidade é mais promissor.
publishDate 2017
dc.date.accessioned.fl_str_mv 2017-09-28T02:27:44Z
dc.date.issued.fl_str_mv 2017
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/168959
dc.identifier.nrb.pt_BR.fl_str_mv 001048288
url http://hdl.handle.net/10183/168959
identifier_str_mv 001048288
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/168959/1/001048288.pdf
http://www.lume.ufrgs.br/bitstream/10183/168959/2/001048288.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/168959/3/001048288.pdf.jpg
bitstream.checksum.fl_str_mv 926d0362ab15732d755f9d268f455f4a
22a2b0ed8ea0da81b71996c04db1e8d3
50d92a2404d9dffe12d51ed21ae42284
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801224537698729984