Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado

Detalhes bibliográficos
Autor(a) principal: Tavares, Alan de Medeiros
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/42852
Resumo: A construção de modelos de aprendizagem de dados trata de um aspecto importante para o Aprendizado de Máquina. Entretanto, a dificuldade encontrada no processo de classificação de dados ainda é um problema relativo a essa área, devido, principalmente, ao número limitado de exemplos das bases de dados e a complexidade da escolha dos exemplos a serem utilizados durante a etapa de treinamento. Por outro lado, o aprendizado semissupervisionado possibilita a construção de modelos de aprendizagem a partir de um conjunto pequeno de exemplos rotulados. Dentro deste tipo de aprendizado existe o algoritmo self-training, que, de maneira iterativa, realiza a classificação de dados no modelo semissupervisionado. Diversos trabalhos têm sido desenvolvidos com intuito de melhorar a classificação dos dados deste algoritmo, dentre eles um que propõe uma modificação no algoritmo original, a fim de atualizar a taxa de inclusão de novos exemplos ao conjunto de treinamento gradativamente, atingindo um número maior de exemplos. Neste contexto, este trabalho tem por objetivo estudar a influência do parâmetro de redução do limiar de confiança no método citado (denominado FlexCon-G). Para avaliar esse estudo, experimentos foram realizados usando 30 bases de dados distintas e com diferentes valores para redução do limiar de confiança. Cada uma delas foi configurada com uma porcentagem diferente dos padrões inicialmente rotulados e treinadas usando os classificadores naive bayes e árvore de decisão. Os resultados obtidos mostraram que os valores avaliados obtiveram melhor desempenho que a proposta original.
id UFRN_e2524046a8dcafa02b06946274852441
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/42852
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Tavares, Alan de MedeirosKarliane Medeiros Ovidio Vale .Rabelo, HumbertoLucena, AmarildoVale, Karliane de Medeiros OvídioGorgônio, Flavius da Luz2018-12-27T16:24:05Z2021-10-05T15:39:05Z2018-12-27T16:24:05Z2021-10-05T15:39:05Z2018-12-062015082267TAVARES, Alan de Medeiros. UM ESTUDO SOBRE A VARIAÇÃO DO LIMIAR DE CONFIANÇA DO MÉTODO FLEXCON-G PARA A CLASSIFICAÇÃO DE DADOS UTILIZANDO APRENDIZADO SEMISSUPERVISIONADO. 2018. 52 f. TCC (Graduação) - Curso de Sistemas da Informação, Universidade Federal do Rio Grande do Norte, Caicó, 2018.https://repositorio.ufrn.br/handle/123456789/42852A construção de modelos de aprendizagem de dados trata de um aspecto importante para o Aprendizado de Máquina. Entretanto, a dificuldade encontrada no processo de classificação de dados ainda é um problema relativo a essa área, devido, principalmente, ao número limitado de exemplos das bases de dados e a complexidade da escolha dos exemplos a serem utilizados durante a etapa de treinamento. Por outro lado, o aprendizado semissupervisionado possibilita a construção de modelos de aprendizagem a partir de um conjunto pequeno de exemplos rotulados. Dentro deste tipo de aprendizado existe o algoritmo self-training, que, de maneira iterativa, realiza a classificação de dados no modelo semissupervisionado. Diversos trabalhos têm sido desenvolvidos com intuito de melhorar a classificação dos dados deste algoritmo, dentre eles um que propõe uma modificação no algoritmo original, a fim de atualizar a taxa de inclusão de novos exemplos ao conjunto de treinamento gradativamente, atingindo um número maior de exemplos. Neste contexto, este trabalho tem por objetivo estudar a influência do parâmetro de redução do limiar de confiança no método citado (denominado FlexCon-G). Para avaliar esse estudo, experimentos foram realizados usando 30 bases de dados distintas e com diferentes valores para redução do limiar de confiança. Cada uma delas foi configurada com uma porcentagem diferente dos padrões inicialmente rotulados e treinadas usando os classificadores naive bayes e árvore de decisão. Os resultados obtidos mostraram que os valores avaliados obtiveram melhor desempenho que a proposta original.The construction of data learning models is an important aspect of Machine Learning. However, the difficulty encountered in the data classification process is still a problem related to this area, mainly due to the limited number of examples in the databases and the complexity of choosing the examples to be used during the training phase. On the other hand, semi-supervised learning enables the construction of learning models from a small set of labeled examples. Within this type of learning there is the self-training algorithm, which, iteratively, performs data classification in the semi-supervised model. Several studies have been developed with the purpose of improving the classification of the data of this algorithm, among them one that proposes a modification in the original algorithm, in order to update the inclusion rate of new examples to the training set gradually, reaching a greater number of examples . In this context, this study aims to study the influence of the confidence threshold reduction parameter in the cited method (called FlexCon-G). To evaluate this study, experiments were performed using 30 different databases and with different values to reduce the confidence threshold. Each one was set up with a different percentage of the standards initially labeled and trained using the naive-bayes and decision tree classifiers. The obtained results showed that the evaluated values obtained better performance than the original proposal.Universidade Federal do Rio Grande do NorteUFRNBrasilSistemas de InformaçãoClassification of dataSemi-supervised learningFlexCon-G method.Classificação de DadosAprendizado SemissupervisionadoMétodo FlexCon-GUm estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionadoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNinfo:eu-repo/semantics/openAccessTEXTUmEstudoSobreAVariaçãoDolimiar_Tavares_2018.pdf.txtExtracted texttext/plain1133https://repositorio.ufrn.br/bitstream/123456789/42852/1/UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_2018.pdf.txt013c4bf23b49d36ac4672dc1f303cad9MD51UmEstudoSobreAVariaçãoDolimiar_Tavares_2018.txtExtracted texttext/plain1133https://repositorio.ufrn.br/bitstream/123456789/42852/2/UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_2018.txt013c4bf23b49d36ac4672dc1f303cad9MD52ORIGINAL1_UmEstudoSobreAVariaçãoDolimiar_Tavares_2018application/pdf7465189https://repositorio.ufrn.br/bitstream/123456789/42852/3/1_UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_201845e0a26d99a7f862ede71d16ad544352MD53CC-LICENSElicense_rdfapplication/octet-stream701https://repositorio.ufrn.br/bitstream/123456789/42852/4/license_rdf42fd4ad1e89814f5e4a476b409eb708cMD54LICENSElicense.txttext/plain714https://repositorio.ufrn.br/bitstream/123456789/42852/5/license.txt7278bab9c5c886812fa7d225dc807888MD55123456789/428522023-02-23 16:06:32.145oai:https://repositorio.ufrn.br:123456789/42852PGNlbnRlcj48c3Ryb25nPkZFREVSQUwgVU5JVkVSU0lUWSBPRiBSSU8gR1JBTkRFIERPIE5PUlRFPC9zdHJvbmc+PC9jZW50ZXI+CjxjZW50ZXI+PHN0cm9uZz5ESUdJVEFMIE1PTk9HUkFQSFMgTElCUkFSWTwvc3Ryb25nPjwvY2VudGVyPgoKPGNlbnRlcj5BdXRob3JpemF0aW9uIFRlcm0gZm9yIHRoZSBhdmFpbGFiaWxpdHkgb2YgTW9ub2dyYXBocyBmb3IgVW5kZXJncmFkdWF0ZSBhbmQgU3BlY2lhbGl6YXRpb24gaW4gdGhlIERpZ2l0YWwgTGlicmFyeSBvZiBNb25vZ3JhcGhzIChCRE0pPC9jZW50ZXI+CgpBcyB0aGUgY29weXJpZ2h0IG93bmVyIG9mIHRoZSBtb25vZ3JhcGgsIEkgYXV0aG9yaXplIHRoZSBGZWRlcmFsIFVuaXZlcnNpdHkgb2YgUmlvIEdyYW5kZSBkbyBOb3J0ZSAoVUZSTikgdG8gbWFrZSBhdmFpbGFibGUgdGhyb3VnaCB0aGUgRGlnaXRhbCBMaWJyYXJ5IG9mIE1vbm9ncmFwaHMgb2YgVUZSTiwgd2l0aG91dCByZWltYnVyc2VtZW50IG9mIGNvcHlyaWdodCwgYWNjb3JkaW5nIHRvIExhdyA5NjEwLzk4ICwgdGhlIGZ1bGwgdGV4dCBvZiB0aGUgd29yayBzdWJtaXR0ZWQgZm9yIHRoZSBwdXJwb3NlIG9mIHJlYWRpbmcsIHByaW50aW5nIGFuZCAvIG9yIGRvd25sb2FkaW5nLCBhcyBhIG1lYW5zIG9mIGRpc3NlbWluYXRpbmcgQnJhemlsaWFuIHNjaWVudGlmaWMgcHJvZHVjdGlvbiwgYXMgb2YgdGhlIGRhdGUgb2Ygc3VibWlzc2lvbi4KRepositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2023-02-23T19:06:32Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado
title Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado
spellingShingle Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado
Tavares, Alan de Medeiros
Classification of data
Semi-supervised learning
FlexCon-G method.
Classificação de Dados
Aprendizado Semissupervisionado
Método FlexCon-G
title_short Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado
title_full Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado
title_fullStr Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado
title_full_unstemmed Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado
title_sort Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado
author Tavares, Alan de Medeiros
author_facet Tavares, Alan de Medeiros
author_role author
dc.contributor.referees1.none.fl_str_mv Rabelo, Humberto
dc.contributor.referees2.none.fl_str_mv Lucena, Amarildo
dc.contributor.referees3.none.fl_str_mv Vale, Karliane de Medeiros Ovídio
dc.contributor.author.fl_str_mv Tavares, Alan de Medeiros
dc.contributor.advisor-co1.fl_str_mv Karliane Medeiros Ovidio Vale .
dc.contributor.advisor1.fl_str_mv Gorgônio, Flavius da Luz
contributor_str_mv Karliane Medeiros Ovidio Vale .
Gorgônio, Flavius da Luz
dc.subject.por.fl_str_mv Classification of data
Semi-supervised learning
FlexCon-G method.
Classificação de Dados
Aprendizado Semissupervisionado
Método FlexCon-G
topic Classification of data
Semi-supervised learning
FlexCon-G method.
Classificação de Dados
Aprendizado Semissupervisionado
Método FlexCon-G
description A construção de modelos de aprendizagem de dados trata de um aspecto importante para o Aprendizado de Máquina. Entretanto, a dificuldade encontrada no processo de classificação de dados ainda é um problema relativo a essa área, devido, principalmente, ao número limitado de exemplos das bases de dados e a complexidade da escolha dos exemplos a serem utilizados durante a etapa de treinamento. Por outro lado, o aprendizado semissupervisionado possibilita a construção de modelos de aprendizagem a partir de um conjunto pequeno de exemplos rotulados. Dentro deste tipo de aprendizado existe o algoritmo self-training, que, de maneira iterativa, realiza a classificação de dados no modelo semissupervisionado. Diversos trabalhos têm sido desenvolvidos com intuito de melhorar a classificação dos dados deste algoritmo, dentre eles um que propõe uma modificação no algoritmo original, a fim de atualizar a taxa de inclusão de novos exemplos ao conjunto de treinamento gradativamente, atingindo um número maior de exemplos. Neste contexto, este trabalho tem por objetivo estudar a influência do parâmetro de redução do limiar de confiança no método citado (denominado FlexCon-G). Para avaliar esse estudo, experimentos foram realizados usando 30 bases de dados distintas e com diferentes valores para redução do limiar de confiança. Cada uma delas foi configurada com uma porcentagem diferente dos padrões inicialmente rotulados e treinadas usando os classificadores naive bayes e árvore de decisão. Os resultados obtidos mostraram que os valores avaliados obtiveram melhor desempenho que a proposta original.
publishDate 2018
dc.date.accessioned.fl_str_mv 2018-12-27T16:24:05Z
2021-10-05T15:39:05Z
dc.date.available.fl_str_mv 2018-12-27T16:24:05Z
2021-10-05T15:39:05Z
dc.date.issued.fl_str_mv 2018-12-06
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.pt_BR.fl_str_mv 2015082267
dc.identifier.citation.fl_str_mv TAVARES, Alan de Medeiros. UM ESTUDO SOBRE A VARIAÇÃO DO LIMIAR DE CONFIANÇA DO MÉTODO FLEXCON-G PARA A CLASSIFICAÇÃO DE DADOS UTILIZANDO APRENDIZADO SEMISSUPERVISIONADO. 2018. 52 f. TCC (Graduação) - Curso de Sistemas da Informação, Universidade Federal do Rio Grande do Norte, Caicó, 2018.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/42852
identifier_str_mv 2015082267
TAVARES, Alan de Medeiros. UM ESTUDO SOBRE A VARIAÇÃO DO LIMIAR DE CONFIANÇA DO MÉTODO FLEXCON-G PARA A CLASSIFICAÇÃO DE DADOS UTILIZANDO APRENDIZADO SEMISSUPERVISIONADO. 2018. 52 f. TCC (Graduação) - Curso de Sistemas da Informação, Universidade Federal do Rio Grande do Norte, Caicó, 2018.
url https://repositorio.ufrn.br/handle/123456789/42852
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Sistemas de Informação
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/42852/1/UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_2018.pdf.txt
https://repositorio.ufrn.br/bitstream/123456789/42852/2/UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_2018.txt
https://repositorio.ufrn.br/bitstream/123456789/42852/3/1_UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_2018
https://repositorio.ufrn.br/bitstream/123456789/42852/4/license_rdf
https://repositorio.ufrn.br/bitstream/123456789/42852/5/license.txt
bitstream.checksum.fl_str_mv 013c4bf23b49d36ac4672dc1f303cad9
013c4bf23b49d36ac4672dc1f303cad9
45e0a26d99a7f862ede71d16ad544352
42fd4ad1e89814f5e4a476b409eb708c
7278bab9c5c886812fa7d225dc807888
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1814832961249345536