Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/handle/123456789/42852 |
Resumo: | A construção de modelos de aprendizagem de dados trata de um aspecto importante para o Aprendizado de Máquina. Entretanto, a dificuldade encontrada no processo de classificação de dados ainda é um problema relativo a essa área, devido, principalmente, ao número limitado de exemplos das bases de dados e a complexidade da escolha dos exemplos a serem utilizados durante a etapa de treinamento. Por outro lado, o aprendizado semissupervisionado possibilita a construção de modelos de aprendizagem a partir de um conjunto pequeno de exemplos rotulados. Dentro deste tipo de aprendizado existe o algoritmo self-training, que, de maneira iterativa, realiza a classificação de dados no modelo semissupervisionado. Diversos trabalhos têm sido desenvolvidos com intuito de melhorar a classificação dos dados deste algoritmo, dentre eles um que propõe uma modificação no algoritmo original, a fim de atualizar a taxa de inclusão de novos exemplos ao conjunto de treinamento gradativamente, atingindo um número maior de exemplos. Neste contexto, este trabalho tem por objetivo estudar a influência do parâmetro de redução do limiar de confiança no método citado (denominado FlexCon-G). Para avaliar esse estudo, experimentos foram realizados usando 30 bases de dados distintas e com diferentes valores para redução do limiar de confiança. Cada uma delas foi configurada com uma porcentagem diferente dos padrões inicialmente rotulados e treinadas usando os classificadores naive bayes e árvore de decisão. Os resultados obtidos mostraram que os valores avaliados obtiveram melhor desempenho que a proposta original. |
id |
UFRN_e2524046a8dcafa02b06946274852441 |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/42852 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Tavares, Alan de MedeirosKarliane Medeiros Ovidio Vale .Rabelo, HumbertoLucena, AmarildoVale, Karliane de Medeiros OvídioGorgônio, Flavius da Luz2018-12-27T16:24:05Z2021-10-05T15:39:05Z2018-12-27T16:24:05Z2021-10-05T15:39:05Z2018-12-062015082267TAVARES, Alan de Medeiros. UM ESTUDO SOBRE A VARIAÇÃO DO LIMIAR DE CONFIANÇA DO MÉTODO FLEXCON-G PARA A CLASSIFICAÇÃO DE DADOS UTILIZANDO APRENDIZADO SEMISSUPERVISIONADO. 2018. 52 f. TCC (Graduação) - Curso de Sistemas da Informação, Universidade Federal do Rio Grande do Norte, Caicó, 2018.https://repositorio.ufrn.br/handle/123456789/42852A construção de modelos de aprendizagem de dados trata de um aspecto importante para o Aprendizado de Máquina. Entretanto, a dificuldade encontrada no processo de classificação de dados ainda é um problema relativo a essa área, devido, principalmente, ao número limitado de exemplos das bases de dados e a complexidade da escolha dos exemplos a serem utilizados durante a etapa de treinamento. Por outro lado, o aprendizado semissupervisionado possibilita a construção de modelos de aprendizagem a partir de um conjunto pequeno de exemplos rotulados. Dentro deste tipo de aprendizado existe o algoritmo self-training, que, de maneira iterativa, realiza a classificação de dados no modelo semissupervisionado. Diversos trabalhos têm sido desenvolvidos com intuito de melhorar a classificação dos dados deste algoritmo, dentre eles um que propõe uma modificação no algoritmo original, a fim de atualizar a taxa de inclusão de novos exemplos ao conjunto de treinamento gradativamente, atingindo um número maior de exemplos. Neste contexto, este trabalho tem por objetivo estudar a influência do parâmetro de redução do limiar de confiança no método citado (denominado FlexCon-G). Para avaliar esse estudo, experimentos foram realizados usando 30 bases de dados distintas e com diferentes valores para redução do limiar de confiança. Cada uma delas foi configurada com uma porcentagem diferente dos padrões inicialmente rotulados e treinadas usando os classificadores naive bayes e árvore de decisão. Os resultados obtidos mostraram que os valores avaliados obtiveram melhor desempenho que a proposta original.The construction of data learning models is an important aspect of Machine Learning. However, the difficulty encountered in the data classification process is still a problem related to this area, mainly due to the limited number of examples in the databases and the complexity of choosing the examples to be used during the training phase. On the other hand, semi-supervised learning enables the construction of learning models from a small set of labeled examples. Within this type of learning there is the self-training algorithm, which, iteratively, performs data classification in the semi-supervised model. Several studies have been developed with the purpose of improving the classification of the data of this algorithm, among them one that proposes a modification in the original algorithm, in order to update the inclusion rate of new examples to the training set gradually, reaching a greater number of examples . In this context, this study aims to study the influence of the confidence threshold reduction parameter in the cited method (called FlexCon-G). To evaluate this study, experiments were performed using 30 different databases and with different values to reduce the confidence threshold. Each one was set up with a different percentage of the standards initially labeled and trained using the naive-bayes and decision tree classifiers. The obtained results showed that the evaluated values obtained better performance than the original proposal.Universidade Federal do Rio Grande do NorteUFRNBrasilSistemas de InformaçãoClassification of dataSemi-supervised learningFlexCon-G method.Classificação de DadosAprendizado SemissupervisionadoMétodo FlexCon-GUm estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionadoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNinfo:eu-repo/semantics/openAccessTEXTUmEstudoSobreAVariaçãoDolimiar_Tavares_2018.pdf.txtExtracted texttext/plain1133https://repositorio.ufrn.br/bitstream/123456789/42852/1/UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_2018.pdf.txt013c4bf23b49d36ac4672dc1f303cad9MD51UmEstudoSobreAVariaçãoDolimiar_Tavares_2018.txtExtracted texttext/plain1133https://repositorio.ufrn.br/bitstream/123456789/42852/2/UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_2018.txt013c4bf23b49d36ac4672dc1f303cad9MD52ORIGINAL1_UmEstudoSobreAVariaçãoDolimiar_Tavares_2018application/pdf7465189https://repositorio.ufrn.br/bitstream/123456789/42852/3/1_UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_201845e0a26d99a7f862ede71d16ad544352MD53CC-LICENSElicense_rdfapplication/octet-stream701https://repositorio.ufrn.br/bitstream/123456789/42852/4/license_rdf42fd4ad1e89814f5e4a476b409eb708cMD54LICENSElicense.txttext/plain714https://repositorio.ufrn.br/bitstream/123456789/42852/5/license.txt7278bab9c5c886812fa7d225dc807888MD55123456789/428522023-02-23 16:06:32.145oai:https://repositorio.ufrn.br:123456789/42852PGNlbnRlcj48c3Ryb25nPkZFREVSQUwgVU5JVkVSU0lUWSBPRiBSSU8gR1JBTkRFIERPIE5PUlRFPC9zdHJvbmc+PC9jZW50ZXI+CjxjZW50ZXI+PHN0cm9uZz5ESUdJVEFMIE1PTk9HUkFQSFMgTElCUkFSWTwvc3Ryb25nPjwvY2VudGVyPgoKPGNlbnRlcj5BdXRob3JpemF0aW9uIFRlcm0gZm9yIHRoZSBhdmFpbGFiaWxpdHkgb2YgTW9ub2dyYXBocyBmb3IgVW5kZXJncmFkdWF0ZSBhbmQgU3BlY2lhbGl6YXRpb24gaW4gdGhlIERpZ2l0YWwgTGlicmFyeSBvZiBNb25vZ3JhcGhzIChCRE0pPC9jZW50ZXI+CgpBcyB0aGUgY29weXJpZ2h0IG93bmVyIG9mIHRoZSBtb25vZ3JhcGgsIEkgYXV0aG9yaXplIHRoZSBGZWRlcmFsIFVuaXZlcnNpdHkgb2YgUmlvIEdyYW5kZSBkbyBOb3J0ZSAoVUZSTikgdG8gbWFrZSBhdmFpbGFibGUgdGhyb3VnaCB0aGUgRGlnaXRhbCBMaWJyYXJ5IG9mIE1vbm9ncmFwaHMgb2YgVUZSTiwgd2l0aG91dCByZWltYnVyc2VtZW50IG9mIGNvcHlyaWdodCwgYWNjb3JkaW5nIHRvIExhdyA5NjEwLzk4ICwgdGhlIGZ1bGwgdGV4dCBvZiB0aGUgd29yayBzdWJtaXR0ZWQgZm9yIHRoZSBwdXJwb3NlIG9mIHJlYWRpbmcsIHByaW50aW5nIGFuZCAvIG9yIGRvd25sb2FkaW5nLCBhcyBhIG1lYW5zIG9mIGRpc3NlbWluYXRpbmcgQnJhemlsaWFuIHNjaWVudGlmaWMgcHJvZHVjdGlvbiwgYXMgb2YgdGhlIGRhdGUgb2Ygc3VibWlzc2lvbi4KRepositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2023-02-23T19:06:32Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado |
title |
Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado |
spellingShingle |
Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado Tavares, Alan de Medeiros Classification of data Semi-supervised learning FlexCon-G method. Classificação de Dados Aprendizado Semissupervisionado Método FlexCon-G |
title_short |
Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado |
title_full |
Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado |
title_fullStr |
Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado |
title_full_unstemmed |
Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado |
title_sort |
Um estudo sobre a variação do limiar de confiança do método Flexcon-G para a classificação de dados utilizando aprendizado semissupervisionado |
author |
Tavares, Alan de Medeiros |
author_facet |
Tavares, Alan de Medeiros |
author_role |
author |
dc.contributor.referees1.none.fl_str_mv |
Rabelo, Humberto |
dc.contributor.referees2.none.fl_str_mv |
Lucena, Amarildo |
dc.contributor.referees3.none.fl_str_mv |
Vale, Karliane de Medeiros Ovídio |
dc.contributor.author.fl_str_mv |
Tavares, Alan de Medeiros |
dc.contributor.advisor-co1.fl_str_mv |
Karliane Medeiros Ovidio Vale . |
dc.contributor.advisor1.fl_str_mv |
Gorgônio, Flavius da Luz |
contributor_str_mv |
Karliane Medeiros Ovidio Vale . Gorgônio, Flavius da Luz |
dc.subject.por.fl_str_mv |
Classification of data Semi-supervised learning FlexCon-G method. Classificação de Dados Aprendizado Semissupervisionado Método FlexCon-G |
topic |
Classification of data Semi-supervised learning FlexCon-G method. Classificação de Dados Aprendizado Semissupervisionado Método FlexCon-G |
description |
A construção de modelos de aprendizagem de dados trata de um aspecto importante para o Aprendizado de Máquina. Entretanto, a dificuldade encontrada no processo de classificação de dados ainda é um problema relativo a essa área, devido, principalmente, ao número limitado de exemplos das bases de dados e a complexidade da escolha dos exemplos a serem utilizados durante a etapa de treinamento. Por outro lado, o aprendizado semissupervisionado possibilita a construção de modelos de aprendizagem a partir de um conjunto pequeno de exemplos rotulados. Dentro deste tipo de aprendizado existe o algoritmo self-training, que, de maneira iterativa, realiza a classificação de dados no modelo semissupervisionado. Diversos trabalhos têm sido desenvolvidos com intuito de melhorar a classificação dos dados deste algoritmo, dentre eles um que propõe uma modificação no algoritmo original, a fim de atualizar a taxa de inclusão de novos exemplos ao conjunto de treinamento gradativamente, atingindo um número maior de exemplos. Neste contexto, este trabalho tem por objetivo estudar a influência do parâmetro de redução do limiar de confiança no método citado (denominado FlexCon-G). Para avaliar esse estudo, experimentos foram realizados usando 30 bases de dados distintas e com diferentes valores para redução do limiar de confiança. Cada uma delas foi configurada com uma porcentagem diferente dos padrões inicialmente rotulados e treinadas usando os classificadores naive bayes e árvore de decisão. Os resultados obtidos mostraram que os valores avaliados obtiveram melhor desempenho que a proposta original. |
publishDate |
2018 |
dc.date.accessioned.fl_str_mv |
2018-12-27T16:24:05Z 2021-10-05T15:39:05Z |
dc.date.available.fl_str_mv |
2018-12-27T16:24:05Z 2021-10-05T15:39:05Z |
dc.date.issued.fl_str_mv |
2018-12-06 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.pt_BR.fl_str_mv |
2015082267 |
dc.identifier.citation.fl_str_mv |
TAVARES, Alan de Medeiros. UM ESTUDO SOBRE A VARIAÇÃO DO LIMIAR DE CONFIANÇA DO MÉTODO FLEXCON-G PARA A CLASSIFICAÇÃO DE DADOS UTILIZANDO APRENDIZADO SEMISSUPERVISIONADO. 2018. 52 f. TCC (Graduação) - Curso de Sistemas da Informação, Universidade Federal do Rio Grande do Norte, Caicó, 2018. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/handle/123456789/42852 |
identifier_str_mv |
2015082267 TAVARES, Alan de Medeiros. UM ESTUDO SOBRE A VARIAÇÃO DO LIMIAR DE CONFIANÇA DO MÉTODO FLEXCON-G PARA A CLASSIFICAÇÃO DE DADOS UTILIZANDO APRENDIZADO SEMISSUPERVISIONADO. 2018. 52 f. TCC (Graduação) - Curso de Sistemas da Informação, Universidade Federal do Rio Grande do Norte, Caicó, 2018. |
url |
https://repositorio.ufrn.br/handle/123456789/42852 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Sistemas de Informação |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/42852/1/UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_2018.pdf.txt https://repositorio.ufrn.br/bitstream/123456789/42852/2/UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_2018.txt https://repositorio.ufrn.br/bitstream/123456789/42852/3/1_UmEstudoSobreAVaria%c3%a7%c3%a3oDolimiar_Tavares_2018 https://repositorio.ufrn.br/bitstream/123456789/42852/4/license_rdf https://repositorio.ufrn.br/bitstream/123456789/42852/5/license.txt |
bitstream.checksum.fl_str_mv |
013c4bf23b49d36ac4672dc1f303cad9 013c4bf23b49d36ac4672dc1f303cad9 45e0a26d99a7f862ede71d16ad544352 42fd4ad1e89814f5e4a476b409eb708c 7278bab9c5c886812fa7d225dc807888 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1814832961249345536 |