Aceleração do aprendizado por reforço em sistemas com múltiplos objetivos.

Helen Cristina de Mattos Senefonte

Aceleração do aprendizado por reforço em sistemas com múltiplos objetivos.

Detalhes bibliográficos
Autor(a) principal:	Helen Cristina de Mattos Senefonte
Data de Publicação:	2009
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações do ITA
Texto Completo:	http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=892
Resumo:	O objetivo deste trabalho é a implementação e análise de técnicas para aceleração do aprendizado por reforço em sistemas com múltiplos objetivos. Problemas com múltiplos objetivos, por sua vez, podem ser descritos de várias formas diferentes. O foco aqui é naqueles casos em que um único agente deve aprender simultaneamente e de modo online várias sub-tarefas independentes resultantes de uma decomposição a priori do problema em questão. O agente será responsável pelo aprendizado autônomo de um processo de seleção de ações em que pode ocorrer competição entre as várias sub-tarefas, cada uma das quais representada por um processo decisório distinto. O projeto envolve uma análise empírica baseada em resultados prévios da literatura, seguida de um estudo de variantes mistas de maximização de utilidade e minimização de custos associados às ações propostas pelos processos decisórios de Markov que compõem as sub-tarefas. Como resultado dessa análise são propostas as técnicas de aceleração do aprendizado baseadas em heurísticas testadas e estudadas no contexto de problemas de objetivos simples. Os resultados experimentais obtidos indicam que tais heurísticas adaptadas e aplicadas às políticas de ações dos MDPs são capazes de proporcionar aceleração da convergência dos algoritmos de aprendizado autônomo em problemas com múltiplos objetivos.

Metadados do item

id	ITA_a06a58ba84c79acfff5ff63b1fff1f54
oai_identifier_str	oai:agregador.ibict.br.BDTD_ITA:oai:ita.br:892
network_acronym_str	ITA
network_name_str	Biblioteca Digital de Teses e Dissertações do ITA
spelling	Aceleração do aprendizado por reforço em sistemas com múltiplos objetivos.Aprendizagem (inteligência artificial)Programação heurísticaAgentes de softwareOtimização de paretoEngenharia de softwareO objetivo deste trabalho é a implementação e análise de técnicas para aceleração do aprendizado por reforço em sistemas com múltiplos objetivos. Problemas com múltiplos objetivos, por sua vez, podem ser descritos de várias formas diferentes. O foco aqui é naqueles casos em que um único agente deve aprender simultaneamente e de modo online várias sub-tarefas independentes resultantes de uma decomposição a priori do problema em questão. O agente será responsável pelo aprendizado autônomo de um processo de seleção de ações em que pode ocorrer competição entre as várias sub-tarefas, cada uma das quais representada por um processo decisório distinto. O projeto envolve uma análise empírica baseada em resultados prévios da literatura, seguida de um estudo de variantes mistas de maximização de utilidade e minimização de custos associados às ações propostas pelos processos decisórios de Markov que compõem as sub-tarefas. Como resultado dessa análise são propostas as técnicas de aceleração do aprendizado baseadas em heurísticas testadas e estudadas no contexto de problemas de objetivos simples. Os resultados experimentais obtidos indicam que tais heurísticas adaptadas e aplicadas às políticas de ações dos MDPs são capazes de proporcionar aceleração da convergência dos algoritmos de aprendizado autônomo em problemas com múltiplos objetivos.Instituto Tecnológico de AeronáuticaCarlos Henrique Costa RibeiroHelen Cristina de Mattos Senefonte2009-11-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=892reponame:Biblioteca Digital de Teses e Dissertações do ITAinstname:Instituto Tecnológico de Aeronáuticainstacron:ITAporinfo:eu-repo/semantics/openAccessapplication/pdf2019-02-02T14:01:58Zoai:agregador.ibict.br.BDTD_ITA:oai:ita.br:892http://oai.bdtd.ibict.br/requestopendoar:null2020-05-28 19:34:37.926Biblioteca Digital de Teses e Dissertações do ITA - Instituto Tecnológico de Aeronáuticatrue
dc.title.none.fl_str_mv	Aceleração do aprendizado por reforço em sistemas com múltiplos objetivos.
title	Aceleração do aprendizado por reforço em sistemas com múltiplos objetivos.
spellingShingle	Aceleração do aprendizado por reforço em sistemas com múltiplos objetivos. Helen Cristina de Mattos Senefonte Aprendizagem (inteligência artificial) Programação heurística Agentes de software Otimização de pareto Engenharia de software
title_short	Aceleração do aprendizado por reforço em sistemas com múltiplos objetivos.
title_full	Aceleração do aprendizado por reforço em sistemas com múltiplos objetivos.
title_fullStr	Aceleração do aprendizado por reforço em sistemas com múltiplos objetivos.
title_full_unstemmed	Aceleração do aprendizado por reforço em sistemas com múltiplos objetivos.
title_sort	Aceleração do aprendizado por reforço em sistemas com múltiplos objetivos.
author	Helen Cristina de Mattos Senefonte
author_facet	Helen Cristina de Mattos Senefonte
author_role	author
dc.contributor.none.fl_str_mv	Carlos Henrique Costa Ribeiro
dc.contributor.author.fl_str_mv	Helen Cristina de Mattos Senefonte
dc.subject.por.fl_str_mv	Aprendizagem (inteligência artificial) Programação heurística Agentes de software Otimização de pareto Engenharia de software
topic	Aprendizagem (inteligência artificial) Programação heurística Agentes de software Otimização de pareto Engenharia de software
dc.description.none.fl_txt_mv	O objetivo deste trabalho é a implementação e análise de técnicas para aceleração do aprendizado por reforço em sistemas com múltiplos objetivos. Problemas com múltiplos objetivos, por sua vez, podem ser descritos de várias formas diferentes. O foco aqui é naqueles casos em que um único agente deve aprender simultaneamente e de modo online várias sub-tarefas independentes resultantes de uma decomposição a priori do problema em questão. O agente será responsável pelo aprendizado autônomo de um processo de seleção de ações em que pode ocorrer competição entre as várias sub-tarefas, cada uma das quais representada por um processo decisório distinto. O projeto envolve uma análise empírica baseada em resultados prévios da literatura, seguida de um estudo de variantes mistas de maximização de utilidade e minimização de custos associados às ações propostas pelos processos decisórios de Markov que compõem as sub-tarefas. Como resultado dessa análise são propostas as técnicas de aceleração do aprendizado baseadas em heurísticas testadas e estudadas no contexto de problemas de objetivos simples. Os resultados experimentais obtidos indicam que tais heurísticas adaptadas e aplicadas às políticas de ações dos MDPs são capazes de proporcionar aceleração da convergência dos algoritmos de aprendizado autônomo em problemas com múltiplos objetivos.
description	O objetivo deste trabalho é a implementação e análise de técnicas para aceleração do aprendizado por reforço em sistemas com múltiplos objetivos. Problemas com múltiplos objetivos, por sua vez, podem ser descritos de várias formas diferentes. O foco aqui é naqueles casos em que um único agente deve aprender simultaneamente e de modo online várias sub-tarefas independentes resultantes de uma decomposição a priori do problema em questão. O agente será responsável pelo aprendizado autônomo de um processo de seleção de ações em que pode ocorrer competição entre as várias sub-tarefas, cada uma das quais representada por um processo decisório distinto. O projeto envolve uma análise empírica baseada em resultados prévios da literatura, seguida de um estudo de variantes mistas de maximização de utilidade e minimização de custos associados às ações propostas pelos processos decisórios de Markov que compõem as sub-tarefas. Como resultado dessa análise são propostas as técnicas de aceleração do aprendizado baseadas em heurísticas testadas e estudadas no contexto de problemas de objetivos simples. Os resultados experimentais obtidos indicam que tais heurísticas adaptadas e aplicadas às políticas de ações dos MDPs são capazes de proporcionar aceleração da convergência dos algoritmos de aprendizado autônomo em problemas com múltiplos objetivos.
publishDate	2009
dc.date.none.fl_str_mv	2009-11-13
dc.type.driver.fl_str_mv	info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis
status_str	publishedVersion
format	masterThesis
dc.identifier.uri.fl_str_mv	http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=892
url	http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=892
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Instituto Tecnológico de Aeronáutica
publisher.none.fl_str_mv	Instituto Tecnológico de Aeronáutica
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações do ITA instname:Instituto Tecnológico de Aeronáutica instacron:ITA
reponame_str	Biblioteca Digital de Teses e Dissertações do ITA
collection	Biblioteca Digital de Teses e Dissertações do ITA
instname_str	Instituto Tecnológico de Aeronáutica
instacron_str	ITA
institution	ITA
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações do ITA - Instituto Tecnológico de Aeronáutica
repository.mail.fl_str_mv
subject_por_txtF_mv	Aprendizagem (inteligência artificial) Programação heurística Agentes de software Otimização de pareto Engenharia de software
_version_	1706809263758770176

Aceleração do aprendizado por reforço em sistemas com múltiplos objetivos.

Registros relacionados