Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado

Rodrigues, Fillipe

Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado

Detalhes bibliográficos
Autor(a) principal:	Rodrigues, Fillipe
Data de Publicação:	2015
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Institucional Memoria (IFRN)
Texto Completo:	http://memoria.ifrn.edu.br/handle/1044/757
Resumo:	As técnicas de Aprendizado de Máquina são aplicadas em tarefas de classificação para a aquisição de conhecimento através de um conjunto de dados ou informações. Alguns métodos de aprendizado utilizados pela literatura são baseados em aprendizado semissupervisionado; este é representado por pequeno percentual de exemplos rotulados (aprendizado supervisionado) combinados com uma quantidade de exemplos rotulados e não rotulados (não-supervisionado) durante a fase de treinamento, reduzindo, portanto, a necessidade de uma grande quantidade de dados rotulados quando apenas um pequeno conjunto de exemplos rotulados está disponível para treinamento. O problema da escolha aleatória das instâncias é comum no aprendizado semissupervisionado, pois a maioria dos trabalhos usam a escolha aleatória dessas instâncias o que pode causar um impacto negativo. Por outro lado, grande parte dos métodos de aprendizado de máquina trata de problemas unirrótulo, ou seja, problemas onde exemplos de um determinado conjunto são associados a uma única classe. Entretanto, diante da necessidade existente de classificar dados em uma grande quantidade de domínios, ou em mais de uma classe, essa classificação citada é denominada classificação multirrótulo. Este trabalho apresenta uma análise experimental dos resultados obtidos por meio da utilização do aprendizado semissupervisionado em problemas de classificação multirrótulo usando um parâmetro de confiabilidade como auxílio na classificação dos dados. Dessa maneira, a utilização de técnicas de aprendizado semissupervisionado, bem como de métodos de classificação multirrótulos, foram imprescindíveis na apresentação dos resultados

Metadados do item

id	IFRN_82e8152415aede6cde5a52567005d1be
oai_identifier_str	oai:localhost:1044/757
network_acronym_str	IFRN
network_name_str	Repositório Institucional Memoria (IFRN)
repository_id_str
spelling	2016-02-18T19:20:17Z2015-02-202016-02-18T19:20:17Z2015-02-20http://memoria.ifrn.edu.br/handle/1044/757As técnicas de Aprendizado de Máquina são aplicadas em tarefas de classificação para a aquisição de conhecimento através de um conjunto de dados ou informações. Alguns métodos de aprendizado utilizados pela literatura são baseados em aprendizado semissupervisionado; este é representado por pequeno percentual de exemplos rotulados (aprendizado supervisionado) combinados com uma quantidade de exemplos rotulados e não rotulados (não-supervisionado) durante a fase de treinamento, reduzindo, portanto, a necessidade de uma grande quantidade de dados rotulados quando apenas um pequeno conjunto de exemplos rotulados está disponível para treinamento. O problema da escolha aleatória das instâncias é comum no aprendizado semissupervisionado, pois a maioria dos trabalhos usam a escolha aleatória dessas instâncias o que pode causar um impacto negativo. Por outro lado, grande parte dos métodos de aprendizado de máquina trata de problemas unirrótulo, ou seja, problemas onde exemplos de um determinado conjunto são associados a uma única classe. Entretanto, diante da necessidade existente de classificar dados em uma grande quantidade de domínios, ou em mais de uma classe, essa classificação citada é denominada classificação multirrótulo. Este trabalho apresenta uma análise experimental dos resultados obtidos por meio da utilização do aprendizado semissupervisionado em problemas de classificação multirrótulo usando um parâmetro de confiabilidade como auxílio na classificação dos dados. Dessa maneira, a utilização de técnicas de aprendizado semissupervisionado, bem como de métodos de classificação multirrótulos, foram imprescindíveis na apresentação dos resultadosThe techniques of Machine Learning are applied in classification tasks to acquire knowledge through a set of data or information. Some learning methods proposed in literature are methods based on semissupervised learning; this is represented by small percentage of labeled data (supervised learning) combined with a quantity of label and non-labeled examples (unsupervised learning) during the training phase, which reduces, therefore, the need for a large quantity of labeled instances when only small dataset of labeled instances is available for training. A commom problem in semi-supervised learning is as random selection of instances, since most of paper use a random selection technique which can cause a negative impact. Much of machine learning methods treat single-label problems, in other words, problems where a given set of data are associated with a single class; however, through the requirement existent to classify data in a lot of domain, or more than one class, this classification as called multi-label classification. This work presents an experimental analysis of the results obtained using semissupervised learning in troubles of multi-label classification using reliability parameter as an aid in the classification data. Thus, the use of techniques of semissupervised learning and besides methods of multi-label classification, were essential to show the results.Submitted by Fillipe Morais Rodrigues (fillipe.rodrigues@ifrn.edu.br) on 2016-02-18T16:27:45Z No. of bitstreams: 1 [Defesa]Fillipe_Versao_Final.pdf: 1178902 bytes, checksum: fbead9741158c5db451df06d17abafbd (MD5)Approved for entry into archive by Jose Yvan Pereira Leite (jyp.leite@ifrn.edu.br) on 2016-02-18T19:20:17Z (GMT) No. of bitstreams: 1 [Defesa]Fillipe_Versao_Final.pdf: 1178902 bytes, checksum: fbead9741158c5db451df06d17abafbd (MD5)Made available in DSpace on 2016-02-18T19:20:17Z (GMT). No. of bitstreams: 1 [Defesa]Fillipe_Versao_Final.pdf: 1178902 bytes, checksum: fbead9741158c5db451df06d17abafbd (MD5) Previous issue date: 2015-02-20CNPqporInstituto Federal de Educação, Ciência e Tecnologia do Rio Grande do NorteOutroPROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃOOutroIFRNBrasilParnamirimCiência da ComputaçãoInteligência ArtificialAprendizado de MáquinaAprendizado SemissupervisionadoClassificação MultirrótuloParâmetro de ConfiabilidadeUso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionadoUSO DE CONFIABILIDADE NA ROTULAÇÃO DE EXEMPLOS EM PROBLEMAS DE CLASSIFICAÇÃO MULTIRRÓTULO COM APRENDIZADO SEMISSUPERVISIONADOinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisCanuto, Annehttp://lattes.cnpq.br/1357887401899097Santos, Arakenhttp://lattes.cnpq.br/8059198436766378http://lattes.cnpq.br/4214726460957461Rodrigues, Fillipeinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional Memoria (IFRN)instname:Instituto Federal do Rio Grande do Norte (IFRN)instacron:IFRNTHUMBNAIL[Defesa]Fillipe_Versao_Final.pdf.jpg[Defesa]Fillipe_Versao_Final.pdf.jpgIM Thumbnailimage/jpeg4944http://localhost:8080/xmlui/bitstream/1044/757/4/%5BDefesa%5DFillipe_Versao_Final.pdf.jpg6a2959c631b91af14a3fd8ea48f015c5MD54TEXT[Defesa]Fillipe_Versao_Final.pdf.txt[Defesa]Fillipe_Versao_Final.pdf.txtExtracted texttext/plain215755http://localhost:8080/xmlui/bitstream/1044/757/3/%5BDefesa%5DFillipe_Versao_Final.pdf.txt84436828146fb4967997e7e813035f85MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://localhost:8080/xmlui/bitstream/1044/757/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINAL[Defesa]Fillipe_Versao_Final.pdf[Defesa]Fillipe_Versao_Final.pdfapplication/pdf1178902http://localhost:8080/xmlui/bitstream/1044/757/1/%5BDefesa%5DFillipe_Versao_Final.pdffbead9741158c5db451df06d17abafbdMD511044/7572020-08-25 17:32:14.956oai:localhost:1044/757Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://memoria.ifrn.edu.br/oai/memoria@ifrn.edu.bropendoar:2020-08-25T20:32:14Repositório Institucional Memoria (IFRN) - Instituto Federal do Rio Grande do Norte (IFRN)false
dc.title.pt_BR.fl_str_mv	Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado
dc.title.alternative.pt_BR.fl_str_mv	USO DE CONFIABILIDADE NA ROTULAÇÃO DE EXEMPLOS EM PROBLEMAS DE CLASSIFICAÇÃO MULTIRRÓTULO COM APRENDIZADO SEMISSUPERVISIONADO
title	Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado
spellingShingle	Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado Rodrigues, Fillipe Ciência da Computação Inteligência Artificial Aprendizado de Máquina Aprendizado Semissupervisionado Classificação Multirrótulo Parâmetro de Confiabilidade
title_short	Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado
title_full	Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado
title_fullStr	Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado
title_full_unstemmed	Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado
title_sort	Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado
author	Rodrigues, Fillipe
author_facet	Rodrigues, Fillipe
author_role	author
dc.contributor.advisor1.fl_str_mv	Canuto, Anne
dc.contributor.advisor1Lattes.fl_str_mv	http://lattes.cnpq.br/1357887401899097
dc.contributor.advisor-co1.fl_str_mv	Santos, Araken
dc.contributor.advisor-co1Lattes.fl_str_mv	http://lattes.cnpq.br/8059198436766378
dc.contributor.authorLattes.fl_str_mv	http://lattes.cnpq.br/4214726460957461
dc.contributor.author.fl_str_mv	Rodrigues, Fillipe
contributor_str_mv	Canuto, Anne Santos, Araken
dc.subject.cnpq.fl_str_mv	Ciência da Computação Inteligência Artificial
topic	Ciência da Computação Inteligência Artificial Aprendizado de Máquina Aprendizado Semissupervisionado Classificação Multirrótulo Parâmetro de Confiabilidade
dc.subject.por.fl_str_mv	Aprendizado de Máquina Aprendizado Semissupervisionado Classificação Multirrótulo Parâmetro de Confiabilidade
description	As técnicas de Aprendizado de Máquina são aplicadas em tarefas de classificação para a aquisição de conhecimento através de um conjunto de dados ou informações. Alguns métodos de aprendizado utilizados pela literatura são baseados em aprendizado semissupervisionado; este é representado por pequeno percentual de exemplos rotulados (aprendizado supervisionado) combinados com uma quantidade de exemplos rotulados e não rotulados (não-supervisionado) durante a fase de treinamento, reduzindo, portanto, a necessidade de uma grande quantidade de dados rotulados quando apenas um pequeno conjunto de exemplos rotulados está disponível para treinamento. O problema da escolha aleatória das instâncias é comum no aprendizado semissupervisionado, pois a maioria dos trabalhos usam a escolha aleatória dessas instâncias o que pode causar um impacto negativo. Por outro lado, grande parte dos métodos de aprendizado de máquina trata de problemas unirrótulo, ou seja, problemas onde exemplos de um determinado conjunto são associados a uma única classe. Entretanto, diante da necessidade existente de classificar dados em uma grande quantidade de domínios, ou em mais de uma classe, essa classificação citada é denominada classificação multirrótulo. Este trabalho apresenta uma análise experimental dos resultados obtidos por meio da utilização do aprendizado semissupervisionado em problemas de classificação multirrótulo usando um parâmetro de confiabilidade como auxílio na classificação dos dados. Dessa maneira, a utilização de técnicas de aprendizado semissupervisionado, bem como de métodos de classificação multirrótulos, foram imprescindíveis na apresentação dos resultados
publishDate	2015
dc.date.available.fl_str_mv	2015-02-20 2016-02-18T19:20:17Z
dc.date.issued.fl_str_mv	2015-02-20
dc.date.accessioned.fl_str_mv	2016-02-18T19:20:17Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://memoria.ifrn.edu.br/handle/1044/757
url	http://memoria.ifrn.edu.br/handle/1044/757
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte
dc.publisher.program.fl_str_mv	Outro PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO Outro
dc.publisher.initials.fl_str_mv	IFRN
dc.publisher.country.fl_str_mv	Brasil
dc.publisher.department.fl_str_mv	Parnamirim
publisher.none.fl_str_mv	Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte
dc.source.none.fl_str_mv	reponame:Repositório Institucional Memoria (IFRN) instname:Instituto Federal do Rio Grande do Norte (IFRN) instacron:IFRN
instname_str	Instituto Federal do Rio Grande do Norte (IFRN)
instacron_str	IFRN
institution	IFRN
reponame_str	Repositório Institucional Memoria (IFRN)
collection	Repositório Institucional Memoria (IFRN)
bitstream.url.fl_str_mv	http://localhost:8080/xmlui/bitstream/1044/757/4/%5BDefesa%5DFillipe_Versao_Final.pdf.jpg http://localhost:8080/xmlui/bitstream/1044/757/3/%5BDefesa%5DFillipe_Versao_Final.pdf.txt http://localhost:8080/xmlui/bitstream/1044/757/2/license.txt http://localhost:8080/xmlui/bitstream/1044/757/1/%5BDefesa%5DFillipe_Versao_Final.pdf
bitstream.checksum.fl_str_mv	6a2959c631b91af14a3fd8ea48f015c5 84436828146fb4967997e7e813035f85 8a4605be74aa9ea9d79846c1fba20a33 fbead9741158c5db451df06d17abafbd
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5 MD5
repository.name.fl_str_mv	Repositório Institucional Memoria (IFRN) - Instituto Federal do Rio Grande do Norte (IFRN)
repository.mail.fl_str_mv	memoria@ifrn.edu.br
_version_	1797135034940915712

Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado

Registros relacionados