Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado

Detalhes bibliográficos
Autor(a) principal: Rodrigues, Fillipe Morais
Data de Publicação: 2014
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/jspui/handle/123456789/18097
Resumo: The techniques of Machine Learning are applied in classification tasks to acquire knowledge through a set of data or information. Some learning methods proposed in literature are methods based on semissupervised learning; this is represented by small percentage of labeled data (supervised learning) combined with a quantity of label and non-labeled examples (unsupervised learning) during the training phase, which reduces, therefore, the need for a large quantity of labeled instances when only small dataset of labeled instances is available for training. A commom problem in semi-supervised learning is as random selection of instances, since most of paper use a random selection technique which can cause a negative impact. Much of machine learning methods treat single-label problems, in other words, problems where a given set of data are associated with a single class; however, through the requirement existent to classify data in a lot of domain, or more than one class, this classification as called multi-label classification. This work presents an experimental analysis of the results obtained using semissupervised learning in troubles of multi-label classification using reliability parameter as an aid in the classification data. Thus, the use of techniques of semissupervised learning and besides methods of multi-label classification, were essential to show the results
id UFRN_3139725db31fe055086b5ca8836968b7
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/18097
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Rodrigues, Fillipe Moraishttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4366670P0http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8Santos, Araken de Medeiroshttp://lattes.cnpq.br/8059198436766378Xavier Júnior, João Carloshttp://lattes.cnpq.br/5088238300241110Bernardini, Flavia Cristinahttp://lattes.cnpq.br/5935862634033333Canuto, Anne Magaly de Paula2014-12-17T15:48:09Z2014-11-052014-12-17T15:48:09Z2014-02-21RODRIGUES, Fillipe Morais. Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado. 2014. 118 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014.https://repositorio.ufrn.br/jspui/handle/123456789/18097The techniques of Machine Learning are applied in classification tasks to acquire knowledge through a set of data or information. Some learning methods proposed in literature are methods based on semissupervised learning; this is represented by small percentage of labeled data (supervised learning) combined with a quantity of label and non-labeled examples (unsupervised learning) during the training phase, which reduces, therefore, the need for a large quantity of labeled instances when only small dataset of labeled instances is available for training. A commom problem in semi-supervised learning is as random selection of instances, since most of paper use a random selection technique which can cause a negative impact. Much of machine learning methods treat single-label problems, in other words, problems where a given set of data are associated with a single class; however, through the requirement existent to classify data in a lot of domain, or more than one class, this classification as called multi-label classification. This work presents an experimental analysis of the results obtained using semissupervised learning in troubles of multi-label classification using reliability parameter as an aid in the classification data. Thus, the use of techniques of semissupervised learning and besides methods of multi-label classification, were essential to show the resultsAs técnicas de Aprendizado de Máquina são aplicadas em tarefas de classificação para a aquisição de conhecimento através de um conjunto de dados ou informações. Alguns métodos de aprendizado utilizados pela literatura são baseados em aprendizado semissupervisionado; este é representado por pequeno percentual de exemplos rotulados (aprendizado supervisionado) combinados com uma quantidade de exemplos rotulados e não rotulados (não-supervisionado) durante a fase de treinamento, reduzindo, portanto, a necessidade de uma grande quantidade de dados rotulados quando apenas um pequeno conjunto de exemplos rotulados está disponível para treinamento. O problema da escolha aleatória das instâncias é comum no aprendizado semissupervisionado, pois a maioria dos trabalhos usam a escolha aleatória dessas instâncias o que pode causar um impacto negativo. Por outro lado, grande parte dos métodos de aprendizado de máquina trata de problemas unirrótulo, ou seja, problemas onde exemplos de um determinado conjunto são associados a uma única classe. Entretanto, diante da necessidade existente de classificar dados em uma grande quantidade de domínios, ou em mais de uma classe, essa classificação citada é denominada classificação multirrótulo. Este trabalho apresenta uma análise experimental dos resultados obtidos por meio da utilização do aprendizado semissupervisionado em problemas de classificação multirrótulo usando um parâmetro de confiabilidade como auxílio na classificação dos dados. Dessa maneira, a utilização de técnicas de aprendizado semissupervisionado, bem como de métodos de classificação multirrótulos, foram imprescindíveis na apresentação dos resultadosConselho Nacional de Desenvolvimento Científico e Tecnológicoapplication/pdfporUniversidade Federal do Rio Grande do NortePrograma de Pós-Graduação em Sistemas e ComputaçãoUFRNBRCiência da ComputaçãoAprendizado de máquina. Aprendizado semissupervisionado. Classificação multirrótulo. Parâmetro de confiabilidadeMachine Learning. Semissupervised learning. Multi-label classification. Reliability ParameterCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOUso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionadoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALFillipeMR_DISSERT.pdfFillipeMR_DISSERT.pdfapplication/pdf1204555https://repositorio.ufrn.br/bitstream/123456789/18097/1/FillipeMR_DISSERT.pdf0136f7df7002f1bc6d7f4ae416876794MD51TEXTFillipeMR_DISSERT.pdf.txtFillipeMR_DISSERT.pdf.txtExtracted texttext/plain216815https://repositorio.ufrn.br/bitstream/123456789/18097/6/FillipeMR_DISSERT.pdf.txtde31e04b36450e5273060049094e788bMD56THUMBNAILFillipeMR_DISSERT.pdf.jpgFillipeMR_DISSERT.pdf.jpgIM Thumbnailimage/jpeg2624https://repositorio.ufrn.br/bitstream/123456789/18097/7/FillipeMR_DISSERT.pdf.jpg5c174392cd97699e5b246ecfcdfe48b6MD57123456789/180972017-11-04 13:21:09.38oai:https://repositorio.ufrn.br:123456789/18097Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2017-11-04T16:21:09Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.por.fl_str_mv Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado
title Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado
spellingShingle Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado
Rodrigues, Fillipe Morais
Aprendizado de máquina. Aprendizado semissupervisionado. Classificação multirrótulo. Parâmetro de confiabilidade
Machine Learning. Semissupervised learning. Multi-label classification. Reliability Parameter
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
title_short Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado
title_full Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado
title_fullStr Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado
title_full_unstemmed Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado
title_sort Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado
author Rodrigues, Fillipe Morais
author_facet Rodrigues, Fillipe Morais
author_role author
dc.contributor.authorID.por.fl_str_mv
dc.contributor.authorLattes.por.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4366670P0
dc.contributor.advisorID.por.fl_str_mv
dc.contributor.advisorLattes.por.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8
dc.contributor.advisor-co1ID.por.fl_str_mv
dc.contributor.referees1.pt_BR.fl_str_mv Xavier Júnior, João Carlos
dc.contributor.referees1ID.por.fl_str_mv
dc.contributor.referees1Lattes.por.fl_str_mv http://lattes.cnpq.br/5088238300241110
dc.contributor.referees2.pt_BR.fl_str_mv Bernardini, Flavia Cristina
dc.contributor.referees2ID.por.fl_str_mv
dc.contributor.referees2Lattes.por.fl_str_mv http://lattes.cnpq.br/5935862634033333
dc.contributor.author.fl_str_mv Rodrigues, Fillipe Morais
dc.contributor.advisor-co1.fl_str_mv Santos, Araken de Medeiros
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/8059198436766378
dc.contributor.advisor1.fl_str_mv Canuto, Anne Magaly de Paula
contributor_str_mv Santos, Araken de Medeiros
Canuto, Anne Magaly de Paula
dc.subject.por.fl_str_mv Aprendizado de máquina. Aprendizado semissupervisionado. Classificação multirrótulo. Parâmetro de confiabilidade
topic Aprendizado de máquina. Aprendizado semissupervisionado. Classificação multirrótulo. Parâmetro de confiabilidade
Machine Learning. Semissupervised learning. Multi-label classification. Reliability Parameter
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
dc.subject.eng.fl_str_mv Machine Learning. Semissupervised learning. Multi-label classification. Reliability Parameter
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
description The techniques of Machine Learning are applied in classification tasks to acquire knowledge through a set of data or information. Some learning methods proposed in literature are methods based on semissupervised learning; this is represented by small percentage of labeled data (supervised learning) combined with a quantity of label and non-labeled examples (unsupervised learning) during the training phase, which reduces, therefore, the need for a large quantity of labeled instances when only small dataset of labeled instances is available for training. A commom problem in semi-supervised learning is as random selection of instances, since most of paper use a random selection technique which can cause a negative impact. Much of machine learning methods treat single-label problems, in other words, problems where a given set of data are associated with a single class; however, through the requirement existent to classify data in a lot of domain, or more than one class, this classification as called multi-label classification. This work presents an experimental analysis of the results obtained using semissupervised learning in troubles of multi-label classification using reliability parameter as an aid in the classification data. Thus, the use of techniques of semissupervised learning and besides methods of multi-label classification, were essential to show the results
publishDate 2014
dc.date.accessioned.fl_str_mv 2014-12-17T15:48:09Z
dc.date.available.fl_str_mv 2014-11-05
2014-12-17T15:48:09Z
dc.date.issued.fl_str_mv 2014-02-21
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv RODRIGUES, Fillipe Morais. Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado. 2014. 118 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/jspui/handle/123456789/18097
identifier_str_mv RODRIGUES, Fillipe Morais. Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado. 2014. 118 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014.
url https://repositorio.ufrn.br/jspui/handle/123456789/18097
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Sistemas e Computação
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Ciência da Computação
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/18097/1/FillipeMR_DISSERT.pdf
https://repositorio.ufrn.br/bitstream/123456789/18097/6/FillipeMR_DISSERT.pdf.txt
https://repositorio.ufrn.br/bitstream/123456789/18097/7/FillipeMR_DISSERT.pdf.jpg
bitstream.checksum.fl_str_mv 0136f7df7002f1bc6d7f4ae416876794
de31e04b36450e5273060049094e788b
5c174392cd97699e5b246ecfcdfe48b6
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1814832650563616768