[pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES

Detalhes bibliográficos
Autor(a) principal: JULIO CESAR DUARTE
Data de Publicação: 2017
Tipo de documento: Outros
Idioma: por
Título da fonte: Repositório Institucional da PUC-RIO (Projeto Maxwell)
Texto Completo: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@2
http://doi.org/10.17771/PUCRio.acad.31451
Resumo: [pt] Boosting é uma técnica de aprendizado de máquina que combina diversos classificadores fracos com o objetivo de melhorar a acurácia geral. Em cada iteração, o algoritmo atualiza os pesos dos exemplos e constrói um classificador adicional. Um esquema simples de votação é utilizado para combinar os classificadores. O algoritmo mais famoso baseado em Boosting é o AdaBoost. Este algoritmo aumenta os pesos dos exemplos em que os classificadores anteriores cometeram erros. Assim, foca o classificador adicional nos exemplos mais difíceis. Inicialmente, uma distribuição uniforme de pesos é atribúda aos exemplos. Entretanto, não existe garantia que essa seja a melhor escolha para a distribuição inicial. Neste trabalho, apresentamos o Boosting at Start (BAS), uma nova abordagem de aprendizado de máquina baseada em Boosting. O BAS generaliza o AdaBoost permitindo a utilização de uma distribuição inicial arbitrária. Também apresentamos esquemas para determinação de tal distribuição. Além disso, mostramos como adaptar o BAS para esquemas de Aprendizado Semi-supervisionado. Adicionalmente, descrevemos a aplicação do BAS em diferentes problemas de classificação de dados e de texto, comparando o seu desempenho com o algoritmo AdaBoost original e alguns algoritmos do estado-da-arte para tais tarefas. Os resultados experimentais indicam que uma modelagem simples usando o algoritmo BAS gera classificadores eficazes.
id PUC_RIO-1_c25bdf6d5ff8920ba7e3a786bae9e553
oai_identifier_str oai:MAXWELL.puc-rio.br:31451
network_acronym_str PUC_RIO-1
network_name_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository_id_str 534
spelling [pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES [en] THE BOOSTING AT START ALGORITHM AND ITS APPLICATIONS [pt] APRENDIZADO DE MAQUINA[pt] BOOSTING AT START[pt] ADABOOST[pt] ALGORITMOS DE COMITE[pt] PROCESSAMENTO DE LINGUAGEM NATURAL[pt] BOOSTING[en] MACHINE LEARNING[en] BOOSTING AT START[en] ADABOOST[en] ENSEMBLE ALGORITHMS[en] NATURAL LANGUAGE PROCESSING[en] BOOSTING[pt] Boosting é uma técnica de aprendizado de máquina que combina diversos classificadores fracos com o objetivo de melhorar a acurácia geral. Em cada iteração, o algoritmo atualiza os pesos dos exemplos e constrói um classificador adicional. Um esquema simples de votação é utilizado para combinar os classificadores. O algoritmo mais famoso baseado em Boosting é o AdaBoost. Este algoritmo aumenta os pesos dos exemplos em que os classificadores anteriores cometeram erros. Assim, foca o classificador adicional nos exemplos mais difíceis. Inicialmente, uma distribuição uniforme de pesos é atribúda aos exemplos. Entretanto, não existe garantia que essa seja a melhor escolha para a distribuição inicial. Neste trabalho, apresentamos o Boosting at Start (BAS), uma nova abordagem de aprendizado de máquina baseada em Boosting. O BAS generaliza o AdaBoost permitindo a utilização de uma distribuição inicial arbitrária. Também apresentamos esquemas para determinação de tal distribuição. Além disso, mostramos como adaptar o BAS para esquemas de Aprendizado Semi-supervisionado. Adicionalmente, descrevemos a aplicação do BAS em diferentes problemas de classificação de dados e de texto, comparando o seu desempenho com o algoritmo AdaBoost original e alguns algoritmos do estado-da-arte para tais tarefas. Os resultados experimentais indicam que uma modelagem simples usando o algoritmo BAS gera classificadores eficazes.[en] Boosting is a Machine Learning technique that combines several weak classifers with the goal of improving the overall accuracy. In each iteration, the algorithm updates the example weights and builds an additional classifer. A simple voting scheme is used to combine the classifers. The most famous Boosting-based algorithm is AdaBoost. This algorithm increases the weights of the examples that were misclassifed by the previous classifers. Thus, it focuses the additional classifer on the hardest examples. Initially, an uniform weight distribution is assigned to the examples. However, there is no guarantee that this is the best choice for the initial distribution. In this work, we present Boosting at Start (BAS), a new Machine Learning approach based on Boosting. BAS generalizes AdaBoost by allowing the use of an arbitrary initial distribution. We present schemes for the determination of such distribution. We also show how to adapt BAS to Semi-supervised learning schemes. Additionally, we describe the application of BAS in different problems of data and text classifcation, comparing its performance with the original AdaBoost algorithm and some state-of-the-art algorithms for such tasks. The experimental results indicate that a simple modelling using the BAS algorithm generates effective classifers.MAXWELLRUY LUIZ MILIDIUJULIO CESAR DUARTE2017-09-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/otherhttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@2http://doi.org/10.17771/PUCRio.acad.31451porreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2017-09-18T00:00:00Zoai:MAXWELL.puc-rio.br:31451Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342017-09-18T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false
dc.title.none.fl_str_mv [pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES
[en] THE BOOSTING AT START ALGORITHM AND ITS APPLICATIONS
title [pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES
spellingShingle [pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES
JULIO CESAR DUARTE
[pt] APRENDIZADO DE MAQUINA
[pt] BOOSTING AT START
[pt] ADABOOST
[pt] ALGORITMOS DE COMITE
[pt] PROCESSAMENTO DE LINGUAGEM NATURAL
[pt] BOOSTING
[en] MACHINE LEARNING
[en] BOOSTING AT START
[en] ADABOOST
[en] ENSEMBLE ALGORITHMS
[en] NATURAL LANGUAGE PROCESSING
[en] BOOSTING
title_short [pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES
title_full [pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES
title_fullStr [pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES
title_full_unstemmed [pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES
title_sort [pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES
author JULIO CESAR DUARTE
author_facet JULIO CESAR DUARTE
author_role author
dc.contributor.none.fl_str_mv RUY LUIZ MILIDIU
dc.contributor.author.fl_str_mv JULIO CESAR DUARTE
dc.subject.por.fl_str_mv [pt] APRENDIZADO DE MAQUINA
[pt] BOOSTING AT START
[pt] ADABOOST
[pt] ALGORITMOS DE COMITE
[pt] PROCESSAMENTO DE LINGUAGEM NATURAL
[pt] BOOSTING
[en] MACHINE LEARNING
[en] BOOSTING AT START
[en] ADABOOST
[en] ENSEMBLE ALGORITHMS
[en] NATURAL LANGUAGE PROCESSING
[en] BOOSTING
topic [pt] APRENDIZADO DE MAQUINA
[pt] BOOSTING AT START
[pt] ADABOOST
[pt] ALGORITMOS DE COMITE
[pt] PROCESSAMENTO DE LINGUAGEM NATURAL
[pt] BOOSTING
[en] MACHINE LEARNING
[en] BOOSTING AT START
[en] ADABOOST
[en] ENSEMBLE ALGORITHMS
[en] NATURAL LANGUAGE PROCESSING
[en] BOOSTING
description [pt] Boosting é uma técnica de aprendizado de máquina que combina diversos classificadores fracos com o objetivo de melhorar a acurácia geral. Em cada iteração, o algoritmo atualiza os pesos dos exemplos e constrói um classificador adicional. Um esquema simples de votação é utilizado para combinar os classificadores. O algoritmo mais famoso baseado em Boosting é o AdaBoost. Este algoritmo aumenta os pesos dos exemplos em que os classificadores anteriores cometeram erros. Assim, foca o classificador adicional nos exemplos mais difíceis. Inicialmente, uma distribuição uniforme de pesos é atribúda aos exemplos. Entretanto, não existe garantia que essa seja a melhor escolha para a distribuição inicial. Neste trabalho, apresentamos o Boosting at Start (BAS), uma nova abordagem de aprendizado de máquina baseada em Boosting. O BAS generaliza o AdaBoost permitindo a utilização de uma distribuição inicial arbitrária. Também apresentamos esquemas para determinação de tal distribuição. Além disso, mostramos como adaptar o BAS para esquemas de Aprendizado Semi-supervisionado. Adicionalmente, descrevemos a aplicação do BAS em diferentes problemas de classificação de dados e de texto, comparando o seu desempenho com o algoritmo AdaBoost original e alguns algoritmos do estado-da-arte para tais tarefas. Os resultados experimentais indicam que uma modelagem simples usando o algoritmo BAS gera classificadores eficazes.
publishDate 2017
dc.date.none.fl_str_mv 2017-09-15
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/other
format other
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@2
http://doi.org/10.17771/PUCRio.acad.31451
url https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@2
http://doi.org/10.17771/PUCRio.acad.31451
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv MAXWELL
publisher.none.fl_str_mv MAXWELL
dc.source.none.fl_str_mv reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)
instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron:PUC_RIO
instname_str Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron_str PUC_RIO
institution PUC_RIO
reponame_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
collection Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository.name.fl_str_mv Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
repository.mail.fl_str_mv
_version_ 1814822603689295872