[pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Outros |
Idioma: | por |
Título da fonte: | Repositório Institucional da PUC-RIO (Projeto Maxwell) |
Texto Completo: | https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@2 http://doi.org/10.17771/PUCRio.acad.31451 |
Resumo: | [pt] Boosting é uma técnica de aprendizado de máquina que combina diversos classificadores fracos com o objetivo de melhorar a acurácia geral. Em cada iteração, o algoritmo atualiza os pesos dos exemplos e constrói um classificador adicional. Um esquema simples de votação é utilizado para combinar os classificadores. O algoritmo mais famoso baseado em Boosting é o AdaBoost. Este algoritmo aumenta os pesos dos exemplos em que os classificadores anteriores cometeram erros. Assim, foca o classificador adicional nos exemplos mais difíceis. Inicialmente, uma distribuição uniforme de pesos é atribúda aos exemplos. Entretanto, não existe garantia que essa seja a melhor escolha para a distribuição inicial. Neste trabalho, apresentamos o Boosting at Start (BAS), uma nova abordagem de aprendizado de máquina baseada em Boosting. O BAS generaliza o AdaBoost permitindo a utilização de uma distribuição inicial arbitrária. Também apresentamos esquemas para determinação de tal distribuição. Além disso, mostramos como adaptar o BAS para esquemas de Aprendizado Semi-supervisionado. Adicionalmente, descrevemos a aplicação do BAS em diferentes problemas de classificação de dados e de texto, comparando o seu desempenho com o algoritmo AdaBoost original e alguns algoritmos do estado-da-arte para tais tarefas. Os resultados experimentais indicam que uma modelagem simples usando o algoritmo BAS gera classificadores eficazes. |
id |
PUC_RIO-1_c25bdf6d5ff8920ba7e3a786bae9e553 |
---|---|
oai_identifier_str |
oai:MAXWELL.puc-rio.br:31451 |
network_acronym_str |
PUC_RIO-1 |
network_name_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
repository_id_str |
534 |
spelling |
[pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES [en] THE BOOSTING AT START ALGORITHM AND ITS APPLICATIONS [pt] APRENDIZADO DE MAQUINA[pt] BOOSTING AT START[pt] ADABOOST[pt] ALGORITMOS DE COMITE[pt] PROCESSAMENTO DE LINGUAGEM NATURAL[pt] BOOSTING[en] MACHINE LEARNING[en] BOOSTING AT START[en] ADABOOST[en] ENSEMBLE ALGORITHMS[en] NATURAL LANGUAGE PROCESSING[en] BOOSTING[pt] Boosting é uma técnica de aprendizado de máquina que combina diversos classificadores fracos com o objetivo de melhorar a acurácia geral. Em cada iteração, o algoritmo atualiza os pesos dos exemplos e constrói um classificador adicional. Um esquema simples de votação é utilizado para combinar os classificadores. O algoritmo mais famoso baseado em Boosting é o AdaBoost. Este algoritmo aumenta os pesos dos exemplos em que os classificadores anteriores cometeram erros. Assim, foca o classificador adicional nos exemplos mais difíceis. Inicialmente, uma distribuição uniforme de pesos é atribúda aos exemplos. Entretanto, não existe garantia que essa seja a melhor escolha para a distribuição inicial. Neste trabalho, apresentamos o Boosting at Start (BAS), uma nova abordagem de aprendizado de máquina baseada em Boosting. O BAS generaliza o AdaBoost permitindo a utilização de uma distribuição inicial arbitrária. Também apresentamos esquemas para determinação de tal distribuição. Além disso, mostramos como adaptar o BAS para esquemas de Aprendizado Semi-supervisionado. Adicionalmente, descrevemos a aplicação do BAS em diferentes problemas de classificação de dados e de texto, comparando o seu desempenho com o algoritmo AdaBoost original e alguns algoritmos do estado-da-arte para tais tarefas. Os resultados experimentais indicam que uma modelagem simples usando o algoritmo BAS gera classificadores eficazes.[en] Boosting is a Machine Learning technique that combines several weak classifers with the goal of improving the overall accuracy. In each iteration, the algorithm updates the example weights and builds an additional classifer. A simple voting scheme is used to combine the classifers. The most famous Boosting-based algorithm is AdaBoost. This algorithm increases the weights of the examples that were misclassifed by the previous classifers. Thus, it focuses the additional classifer on the hardest examples. Initially, an uniform weight distribution is assigned to the examples. However, there is no guarantee that this is the best choice for the initial distribution. In this work, we present Boosting at Start (BAS), a new Machine Learning approach based on Boosting. BAS generalizes AdaBoost by allowing the use of an arbitrary initial distribution. We present schemes for the determination of such distribution. We also show how to adapt BAS to Semi-supervised learning schemes. Additionally, we describe the application of BAS in different problems of data and text classifcation, comparing its performance with the original AdaBoost algorithm and some state-of-the-art algorithms for such tasks. The experimental results indicate that a simple modelling using the BAS algorithm generates effective classifers.MAXWELLRUY LUIZ MILIDIUJULIO CESAR DUARTE2017-09-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/otherhttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@2http://doi.org/10.17771/PUCRio.acad.31451porreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2017-09-18T00:00:00Zoai:MAXWELL.puc-rio.br:31451Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342017-09-18T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false |
dc.title.none.fl_str_mv |
[pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES [en] THE BOOSTING AT START ALGORITHM AND ITS APPLICATIONS |
title |
[pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES |
spellingShingle |
[pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES JULIO CESAR DUARTE [pt] APRENDIZADO DE MAQUINA [pt] BOOSTING AT START [pt] ADABOOST [pt] ALGORITMOS DE COMITE [pt] PROCESSAMENTO DE LINGUAGEM NATURAL [pt] BOOSTING [en] MACHINE LEARNING [en] BOOSTING AT START [en] ADABOOST [en] ENSEMBLE ALGORITHMS [en] NATURAL LANGUAGE PROCESSING [en] BOOSTING |
title_short |
[pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES |
title_full |
[pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES |
title_fullStr |
[pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES |
title_full_unstemmed |
[pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES |
title_sort |
[pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES |
author |
JULIO CESAR DUARTE |
author_facet |
JULIO CESAR DUARTE |
author_role |
author |
dc.contributor.none.fl_str_mv |
RUY LUIZ MILIDIU |
dc.contributor.author.fl_str_mv |
JULIO CESAR DUARTE |
dc.subject.por.fl_str_mv |
[pt] APRENDIZADO DE MAQUINA [pt] BOOSTING AT START [pt] ADABOOST [pt] ALGORITMOS DE COMITE [pt] PROCESSAMENTO DE LINGUAGEM NATURAL [pt] BOOSTING [en] MACHINE LEARNING [en] BOOSTING AT START [en] ADABOOST [en] ENSEMBLE ALGORITHMS [en] NATURAL LANGUAGE PROCESSING [en] BOOSTING |
topic |
[pt] APRENDIZADO DE MAQUINA [pt] BOOSTING AT START [pt] ADABOOST [pt] ALGORITMOS DE COMITE [pt] PROCESSAMENTO DE LINGUAGEM NATURAL [pt] BOOSTING [en] MACHINE LEARNING [en] BOOSTING AT START [en] ADABOOST [en] ENSEMBLE ALGORITHMS [en] NATURAL LANGUAGE PROCESSING [en] BOOSTING |
description |
[pt] Boosting é uma técnica de aprendizado de máquina que combina diversos classificadores fracos com o objetivo de melhorar a acurácia geral. Em cada iteração, o algoritmo atualiza os pesos dos exemplos e constrói um classificador adicional. Um esquema simples de votação é utilizado para combinar os classificadores. O algoritmo mais famoso baseado em Boosting é o AdaBoost. Este algoritmo aumenta os pesos dos exemplos em que os classificadores anteriores cometeram erros. Assim, foca o classificador adicional nos exemplos mais difíceis. Inicialmente, uma distribuição uniforme de pesos é atribúda aos exemplos. Entretanto, não existe garantia que essa seja a melhor escolha para a distribuição inicial. Neste trabalho, apresentamos o Boosting at Start (BAS), uma nova abordagem de aprendizado de máquina baseada em Boosting. O BAS generaliza o AdaBoost permitindo a utilização de uma distribuição inicial arbitrária. Também apresentamos esquemas para determinação de tal distribuição. Além disso, mostramos como adaptar o BAS para esquemas de Aprendizado Semi-supervisionado. Adicionalmente, descrevemos a aplicação do BAS em diferentes problemas de classificação de dados e de texto, comparando o seu desempenho com o algoritmo AdaBoost original e alguns algoritmos do estado-da-arte para tais tarefas. Os resultados experimentais indicam que uma modelagem simples usando o algoritmo BAS gera classificadores eficazes. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-09-15 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/other |
format |
other |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@2 http://doi.org/10.17771/PUCRio.acad.31451 |
url |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@2 http://doi.org/10.17771/PUCRio.acad.31451 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
MAXWELL |
publisher.none.fl_str_mv |
MAXWELL |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell) instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) instacron:PUC_RIO |
instname_str |
Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
instacron_str |
PUC_RIO |
institution |
PUC_RIO |
reponame_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
collection |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
repository.name.fl_str_mv |
Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
repository.mail.fl_str_mv |
|
_version_ |
1814822603689295872 |