Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado

Tavares, Alan de Medeiros

Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado

Detalhes bibliográficos
Autor(a) principal:	Tavares, Alan de Medeiros
Data de Publicação:	2018
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da UFRN
Texto Completo:	https://repositorio.ufrn.br/handle/123456789/42852
Resumo:	A construção de modelos de aprendizagem de dados trata de um aspecto importante para o Aprendizado de Máquina. Entretanto, a dificuldade encontrada no processo de classificação de dados ainda é um problema relativo a essa área, devido, principalmente, ao número limitado de exemplos das bases de dados e a complexidade da escolha dos exemplos a serem utilizados durante a etapa de treinamento. Por outro lado, o aprendizado semissupervisionado possibilita a construção de modelos de aprendizagem a partir de um conjunto pequeno de exemplos rotulados. Dentro deste tipo de aprendizado existe o algoritmo self-training, que, de maneira iterativa, realiza a classificação de dados no modelo semissupervisionado. Diversos trabalhos têm sido desenvolvidos com intuito de melhorar a classificação dos dados deste algoritmo, dentre eles um que propõe uma modificação no algoritmo original, a fim de atualizar a taxa de inclusão de novos exemplos ao conjunto de treinamento gradativamente, atingindo um número maior de exemplos. Neste contexto, este trabalho tem por objetivo estudar a influência do parâmetro de redução do limiar de confiança no método citado (denominado FlexCon-G). Para avaliar esse estudo, experimentos foram realizados usando 30 bases de dados distintas e com diferentes valores para redução do limiar de confiança. Cada uma delas foi configurada com uma porcentagem diferente dos padrões inicialmente rotulados e treinadas usando os classificadores naive bayes e árvore de decisão. Os resultados obtidos mostraram que os valores avaliados obtiveram melhor desempenho que a proposta original.

Metadados do item

id	UFRN_e2524046a8dcafa02b06946274852441
oai_identifier_str	oai:https://repositorio.ufrn.br:123456789/42852
network_acronym_str	UFRN
network_name_str	Repositório Institucional da UFRN
repository_id_str
spelling	Tavares, Alan de MedeirosKarliane Medeiros Ovidio Vale .Rabelo, HumbertoLucena, AmarildoVale, Karliane de Medeiros OvídioGorgônio, Flavius da Luz2018-12-27T16:24:05Z2021-10-05T15:39:05Z2018-12-27T16:24:05Z2021-10-05T15:39:05Z2018-12-062015082267TAVARES, Alan de Medeiros. UM ESTUDO SOBRE A VARIAÇÃO DO LIMIAR DE CONFIANÇA DO MÉTODO FLEXCON-G PARA A CLASSIFICAÇÃO DE DADOS UTILIZANDO APRENDIZADO SEMISSUPERVISIONADO. 2018. 52 f. TCC (Graduação) - Curso de Sistemas da Informação, Universidade Federal do Rio Grande do Norte, Caicó, 2018.https://repositorio.ufrn.br/handle/123456789/42852A construção de modelos de aprendizagem de dados trata de um aspecto importante para o Aprendizado de Máquina. Entretanto, a dificuldade encontrada no processo de classificação de dados ainda é um problema relativo a essa área, devido, principalmente, ao número limitado de exemplos das bases de dados e a complexidade da escolha dos exemplos a serem utilizados durante a etapa de treinamento. Por outro lado, o aprendizado semissupervisionado possibilita a construção de modelos de aprendizagem a partir de um conjunto pequeno de exemplos rotulados. Dentro deste tipo de aprendizado existe o algoritmo self-training, que, de maneira iterativa, realiza a classificação de dados no modelo semissupervisionado. Diversos trabalhos têm sido desenvolvidos com intuito de melhorar a classificação dos dados deste algoritmo, dentre eles um que propõe uma modificação no algoritmo original, a fim de atualizar a taxa de inclusão de novos exemplos ao conjunto de treinamento gradativamente, atingindo um número maior de exemplos. Neste contexto, este trabalho tem por objetivo estudar a influência do parâmetro de redução do limiar de confiança no método citado (denominado FlexCon-G). Para avaliar esse estudo, experimentos foram realizados usando 30 bases de dados distintas e com diferentes valores para redução do limiar de confiança. Cada uma delas foi configurada com uma porcentagem diferente dos padrões inicialmente rotulados e treinadas usando os classificadores naive bayes e árvore de decisão. Os resultados obtidos mostraram que os valores avaliados obtiveram melhor desempenho que a proposta original.The construction of data learning models is an important aspect of Machine Learning. However, the difficulty encountered in the data classification process is still a problem related to this area, mainly due to the limited number of examples in the databases and the complexity of choosing the examples to be used during the training phase. On the other hand, semi-supervised learning enables the construction of learning models from a small set of labeled examples. Within this type of learning there is the self-training algorithm, which, iteratively, performs data classification in the semi-supervised model. Several studies have been developed with the purpose of improving the classification of the data of this algorithm, among them one that proposes a modification in the original algorithm, in order to update the inclusion rate of new examples to the training set gradually, reaching a greater number of examples . In this context, this study aims to study the influence of the confidence threshold reduction parameter in the cited method (called FlexCon-G). To evaluate this study, experiments were performed using 30 different databases and with different values to reduce the confidence threshold. Each one was set up with a different percentage of the standards initially labeled and trained using the naive-bayes and decision tree classifiers. The obtained results showed that the evaluated values obtained better performance than the original proposal.Universidade Federal do Rio Grande do NorteUFRNBrasilSistemas de InformaçãoClassification of dataSemi-supervised learningFlexCon-G method.Classificação de DadosAprendizado SemissupervisionadoMétodo FlexCon-GUm estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionadoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNinfo:eu-repo/semantics/openAccessTEXTUmEstudoSobreAVariaçãoDolimiar_Tavares_2018.pdf.txtExtracted texttext/plain1133https://repositorio.ufrn.br/bitstream/123456789/42852/1/UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_2018.pdf.txt013c4bf23b49d36ac4672dc1f303cad9MD51UmEstudoSobreAVariaçãoDolimiar_Tavares_2018.txtExtracted texttext/plain1133https://repositorio.ufrn.br/bitstream/123456789/42852/2/UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_2018.txt013c4bf23b49d36ac4672dc1f303cad9MD52ORIGINAL1_UmEstudoSobreAVariaçãoDolimiar_Tavares_2018application/pdf7465189https://repositorio.ufrn.br/bitstream/123456789/42852/3/1_UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_201845e0a26d99a7f862ede71d16ad544352MD53CC-LICENSElicense_rdfapplication/octet-stream701https://repositorio.ufrn.br/bitstream/123456789/42852/4/license_rdf42fd4ad1e89814f5e4a476b409eb708cMD54LICENSElicense.txttext/plain714https://repositorio.ufrn.br/bitstream/123456789/42852/5/license.txt7278bab9c5c886812fa7d225dc807888MD55123456789/428522023-02-23 16:06:32.145oai:https://repositorio.ufrn.br:123456789/42852PGNlbnRlcj48c3Ryb25nPkZFREVSQUwgVU5JVkVSU0lUWSBPRiBSSU8gR1JBTkRFIERPIE5PUlRFPC9zdHJvbmc+PC9jZW50ZXI+CjxjZW50ZXI+PHN0cm9uZz5ESUdJVEFMIE1PTk9HUkFQSFMgTElCUkFSWTwvc3Ryb25nPjwvY2VudGVyPgoKPGNlbnRlcj5BdXRob3JpemF0aW9uIFRlcm0gZm9yIHRoZSBhdmFpbGFiaWxpdHkgb2YgTW9ub2dyYXBocyBmb3IgVW5kZXJncmFkdWF0ZSBhbmQgU3BlY2lhbGl6YXRpb24gaW4gdGhlIERpZ2l0YWwgTGlicmFyeSBvZiBNb25vZ3JhcGhzIChCRE0pPC9jZW50ZXI+CgpBcyB0aGUgY29weXJpZ2h0IG93bmVyIG9mIHRoZSBtb25vZ3JhcGgsIEkgYXV0aG9yaXplIHRoZSBGZWRlcmFsIFVuaXZlcnNpdHkgb2YgUmlvIEdyYW5kZSBkbyBOb3J0ZSAoVUZSTikgdG8gbWFrZSBhdmFpbGFibGUgdGhyb3VnaCB0aGUgRGlnaXRhbCBMaWJyYXJ5IG9mIE1vbm9ncmFwaHMgb2YgVUZSTiwgd2l0aG91dCByZWltYnVyc2VtZW50IG9mIGNvcHlyaWdodCwgYWNjb3JkaW5nIHRvIExhdyA5NjEwLzk4ICwgdGhlIGZ1bGwgdGV4dCBvZiB0aGUgd29yayBzdWJtaXR0ZWQgZm9yIHRoZSBwdXJwb3NlIG9mIHJlYWRpbmcsIHByaW50aW5nIGFuZCAvIG9yIGRvd25sb2FkaW5nLCBhcyBhIG1lYW5zIG9mIGRpc3NlbWluYXRpbmcgQnJhemlsaWFuIHNjaWVudGlmaWMgcHJvZHVjdGlvbiwgYXMgb2YgdGhlIGRhdGUgb2Ygc3VibWlzc2lvbi4KRepositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2023-02-23T19:06:32Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv	Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado
title	Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado
spellingShingle	Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado Tavares, Alan de Medeiros Classification of data Semi-supervised learning FlexCon-G method. Classificação de Dados Aprendizado Semissupervisionado Método FlexCon-G
title_short	Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado
title_full	Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado
title_fullStr	Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado
title_full_unstemmed	Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado
title_sort	Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado
author	Tavares, Alan de Medeiros
author_facet	Tavares, Alan de Medeiros
author_role	author
dc.contributor.referees1.none.fl_str_mv	Rabelo, Humberto
dc.contributor.referees2.none.fl_str_mv	Lucena, Amarildo
dc.contributor.referees3.none.fl_str_mv	Vale, Karliane de Medeiros Ovídio
dc.contributor.author.fl_str_mv	Tavares, Alan de Medeiros
dc.contributor.advisor-co1.fl_str_mv	Karliane Medeiros Ovidio Vale .
dc.contributor.advisor1.fl_str_mv	Gorgônio, Flavius da Luz
contributor_str_mv	Karliane Medeiros Ovidio Vale . Gorgônio, Flavius da Luz
dc.subject.por.fl_str_mv	Classification of data Semi-supervised learning FlexCon-G method. Classificação de Dados Aprendizado Semissupervisionado Método FlexCon-G
topic	Classification of data Semi-supervised learning FlexCon-G method. Classificação de Dados Aprendizado Semissupervisionado Método FlexCon-G
description	A construção de modelos de aprendizagem de dados trata de um aspecto importante para o Aprendizado de Máquina. Entretanto, a dificuldade encontrada no processo de classificação de dados ainda é um problema relativo a essa área, devido, principalmente, ao número limitado de exemplos das bases de dados e a complexidade da escolha dos exemplos a serem utilizados durante a etapa de treinamento. Por outro lado, o aprendizado semissupervisionado possibilita a construção de modelos de aprendizagem a partir de um conjunto pequeno de exemplos rotulados. Dentro deste tipo de aprendizado existe o algoritmo self-training, que, de maneira iterativa, realiza a classificação de dados no modelo semissupervisionado. Diversos trabalhos têm sido desenvolvidos com intuito de melhorar a classificação dos dados deste algoritmo, dentre eles um que propõe uma modificação no algoritmo original, a fim de atualizar a taxa de inclusão de novos exemplos ao conjunto de treinamento gradativamente, atingindo um número maior de exemplos. Neste contexto, este trabalho tem por objetivo estudar a influência do parâmetro de redução do limiar de confiança no método citado (denominado FlexCon-G). Para avaliar esse estudo, experimentos foram realizados usando 30 bases de dados distintas e com diferentes valores para redução do limiar de confiança. Cada uma delas foi configurada com uma porcentagem diferente dos padrões inicialmente rotulados e treinadas usando os classificadores naive bayes e árvore de decisão. Os resultados obtidos mostraram que os valores avaliados obtiveram melhor desempenho que a proposta original.
publishDate	2018
dc.date.accessioned.fl_str_mv	2018-12-27T16:24:05Z 2021-10-05T15:39:05Z
dc.date.available.fl_str_mv	2018-12-27T16:24:05Z 2021-10-05T15:39:05Z
dc.date.issued.fl_str_mv	2018-12-06
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.pt_BR.fl_str_mv	2015082267
dc.identifier.citation.fl_str_mv	TAVARES, Alan de Medeiros. UM ESTUDO SOBRE A VARIAÇÃO DO LIMIAR DE CONFIANÇA DO MÉTODO FLEXCON-G PARA A CLASSIFICAÇÃO DE DADOS UTILIZANDO APRENDIZADO SEMISSUPERVISIONADO. 2018. 52 f. TCC (Graduação) - Curso de Sistemas da Informação, Universidade Federal do Rio Grande do Norte, Caicó, 2018.
dc.identifier.uri.fl_str_mv	https://repositorio.ufrn.br/handle/123456789/42852
identifier_str_mv	2015082267 TAVARES, Alan de Medeiros. UM ESTUDO SOBRE A VARIAÇÃO DO LIMIAR DE CONFIANÇA DO MÉTODO FLEXCON-G PARA A CLASSIFICAÇÃO DE DADOS UTILIZANDO APRENDIZADO SEMISSUPERVISIONADO. 2018. 52 f. TCC (Graduação) - Curso de Sistemas da Informação, Universidade Federal do Rio Grande do Norte, Caicó, 2018.
url	https://repositorio.ufrn.br/handle/123456789/42852
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal do Rio Grande do Norte
dc.publisher.initials.fl_str_mv	UFRN
dc.publisher.country.fl_str_mv	Brasil
dc.publisher.department.fl_str_mv	Sistemas de Informação
publisher.none.fl_str_mv	Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN
instname_str	Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str	UFRN
institution	UFRN
reponame_str	Repositório Institucional da UFRN
collection	Repositório Institucional da UFRN
bitstream.url.fl_str_mv	https://repositorio.ufrn.br/bitstream/123456789/42852/1/UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_2018.pdf.txt https://repositorio.ufrn.br/bitstream/123456789/42852/2/UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_2018.txt https://repositorio.ufrn.br/bitstream/123456789/42852/3/1_UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_2018 https://repositorio.ufrn.br/bitstream/123456789/42852/4/license_rdf https://repositorio.ufrn.br/bitstream/123456789/42852/5/license.txt
bitstream.checksum.fl_str_mv	013c4bf23b49d36ac4672dc1f303cad9 013c4bf23b49d36ac4672dc1f303cad9 45e0a26d99a7f862ede71d16ad544352 42fd4ad1e89814f5e4a476b409eb708c 7278bab9c5c886812fa7d225dc807888
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5 MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_	1814832961249345536

Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado

Registros relacionados