Aprendizado de máquina: a partir da Teoria do Aprendizado Estatístico e aplicação em redes neurais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2024 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
Texto Completo: | https://app.uff.br/riuff/handle/1/33688 |
Resumo: | Teoria de Aprendizado Estatístico (TAE) permite uma abordagem do estudo do problema de aprendizado de máquina a partir de uma fundamentação matemática que utiliza conhecimentos da teoria da Probabilidade e Estatística. Ela fornece uma base teórica para entender o desempenho de vários algoritmos e modelos de aprendizado de máquina, bem como para desenvolver novos algoritmos e modelos capazes de aprender a partir de dados de maneira estatisticamente sólida. Neste trabalho abordamos os principais conceitos do Aprendizado de Máquina de uma perspectiva da Teoria de Aprendizado Estatístico. E realizamos um estudo aplicado em algoritmos de redes neurais dos tipos perceptron e perceptron multicamadas. No seu cerne, a Teoria do Aprendizado Estatístico está preocupada com o problema da generalização, que é a capacidade de um algoritmo de aprendizado de máquina fazer previsões precisas em novos dados não vistos com base em padrões aprendidos a partir de um conjunto finito de dados de treinamento. Visando desenvolver métodos que possam alcançar um bom desempenho de generalização, mesmo quando o número de exemplos de treinamento é limitado e os dados são ruidosos ou complexos. O objetivo deste trabalho, é a partir da formulação matemática e estatística fornecida pelas ferramentas da TAE, como as cotas probabilísticas de Hoeffdings e Chernoff e a Lei dos Grandes Números , provar resultados que garantem a consistência e desempenho de um algoritmo de aprendizado supervisionado e, posteriormente, implementar e testar um dos principais modelos desse tipo de algoritmo: as redes neurais Perceptron Multicamadas ou Multilayer Perceptron (MLP) em problemas de classificação |
id |
UFF-2_f47ab108a5ec390f78485119f0775d09 |
---|---|
oai_identifier_str |
oai:app.uff.br:1/33688 |
network_acronym_str |
UFF-2 |
network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository_id_str |
2120 |
spelling |
Aprendizado de máquina: a partir da Teoria do Aprendizado Estatístico e aplicação em redes neuraisAprendizado de máquinasAprendizado supervisionadoMinimização do risco empíricoDimensão VCPerceptron multicamadasCiência da computaçãoEstatísticaMachine learningSupervised learningEmpirical risk minimizationVC dimensionMultilayer perceptronTeoria de Aprendizado Estatístico (TAE) permite uma abordagem do estudo do problema de aprendizado de máquina a partir de uma fundamentação matemática que utiliza conhecimentos da teoria da Probabilidade e Estatística. Ela fornece uma base teórica para entender o desempenho de vários algoritmos e modelos de aprendizado de máquina, bem como para desenvolver novos algoritmos e modelos capazes de aprender a partir de dados de maneira estatisticamente sólida. Neste trabalho abordamos os principais conceitos do Aprendizado de Máquina de uma perspectiva da Teoria de Aprendizado Estatístico. E realizamos um estudo aplicado em algoritmos de redes neurais dos tipos perceptron e perceptron multicamadas. No seu cerne, a Teoria do Aprendizado Estatístico está preocupada com o problema da generalização, que é a capacidade de um algoritmo de aprendizado de máquina fazer previsões precisas em novos dados não vistos com base em padrões aprendidos a partir de um conjunto finito de dados de treinamento. Visando desenvolver métodos que possam alcançar um bom desempenho de generalização, mesmo quando o número de exemplos de treinamento é limitado e os dados são ruidosos ou complexos. O objetivo deste trabalho, é a partir da formulação matemática e estatística fornecida pelas ferramentas da TAE, como as cotas probabilísticas de Hoeffdings e Chernoff e a Lei dos Grandes Números , provar resultados que garantem a consistência e desempenho de um algoritmo de aprendizado supervisionado e, posteriormente, implementar e testar um dos principais modelos desse tipo de algoritmo: as redes neurais Perceptron Multicamadas ou Multilayer Perceptron (MLP) em problemas de classificaçãoStatistical Learning Theory (SLT) provides an approach to studying the problem of machine learning grounded in a mathematical foundation that utilizes knowledge from the fields of Probability and Statistics. It offers a theoretical basis for understanding the performance of various algorithms and machine learning models, as well as for developing new algorithms and models capable of learning from data in a statistically robust manner. In this work, we address the main concepts of Machine Learning from the perspective of Statistical Learning Theory. And a practical approach on the study of Perceptron and Multilayerperceptron neural network algorithms. At its core, statistical learning theory is concerned with the problem of generalization, which is the ability of a machine learning algorithm to make accurate predictions on new, unseen data based on patterns learned from a finite set of training data. Aiming to develop methods that can achieve strong generalization performance, even in cases where the number of training examples is limited and the data are too noisy or complex. The objective of this work is, starting from the mathematical and statistical formulation provided by the tools of SLT, such as Hoeffding’s and Chernoff’s probability bounds and the Law of Large Numbers, to prove results that ensure the consistency and performance of a supervised learning algorithm, and subsequently, to implement and test one of the principal models of this type of algorithm: the Multilayer Perceptron (MLP) networks in classification problems103 p.Paula, Alan Prata dehttp://lattes.cnpq.br/5563354983779002Freitas, Marina Sequeiros Dias dehttp://lattes.cnpq.br/6603538640938115Egea, Leandro Gineshttp://lattes.cnpq.br/4667573771934869Caminha, Vera Lúcia Prudênciahttp://lattes.cnpq.br/5192328854991448Mauhnoom, Yeonatan2024-07-26T12:56:16Z2024-07-26T12:56:16Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfMAUHNOOM, Yeonatan. Aprendizado de máquina: a partir da Teoria do Aprendizado Estatístico e aplicação em redes neurais 2023. 103 f. Trabalho de Conclusão de Curso (Graduação em Bacharelado em Matemática com Ênfase em Matemática Computacional) - Instituto de Ciências Exatas, Universidade Federal Fluminense, Volta Redonda, 2023.https://app.uff.br/riuff/handle/1/33688CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2024-07-26T12:56:20Zoai:app.uff.br:1/33688Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T11:18:07.990497Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
dc.title.none.fl_str_mv |
Aprendizado de máquina: a partir da Teoria do Aprendizado Estatístico e aplicação em redes neurais |
title |
Aprendizado de máquina: a partir da Teoria do Aprendizado Estatístico e aplicação em redes neurais |
spellingShingle |
Aprendizado de máquina: a partir da Teoria do Aprendizado Estatístico e aplicação em redes neurais Mauhnoom, Yeonatan Aprendizado de máquinas Aprendizado supervisionado Minimização do risco empírico Dimensão VC Perceptron multicamadas Ciência da computação Estatística Machine learning Supervised learning Empirical risk minimization VC dimension Multilayer perceptron |
title_short |
Aprendizado de máquina: a partir da Teoria do Aprendizado Estatístico e aplicação em redes neurais |
title_full |
Aprendizado de máquina: a partir da Teoria do Aprendizado Estatístico e aplicação em redes neurais |
title_fullStr |
Aprendizado de máquina: a partir da Teoria do Aprendizado Estatístico e aplicação em redes neurais |
title_full_unstemmed |
Aprendizado de máquina: a partir da Teoria do Aprendizado Estatístico e aplicação em redes neurais |
title_sort |
Aprendizado de máquina: a partir da Teoria do Aprendizado Estatístico e aplicação em redes neurais |
author |
Mauhnoom, Yeonatan |
author_facet |
Mauhnoom, Yeonatan |
author_role |
author |
dc.contributor.none.fl_str_mv |
Paula, Alan Prata de http://lattes.cnpq.br/5563354983779002 Freitas, Marina Sequeiros Dias de http://lattes.cnpq.br/6603538640938115 Egea, Leandro Gines http://lattes.cnpq.br/4667573771934869 Caminha, Vera Lúcia Prudência http://lattes.cnpq.br/5192328854991448 |
dc.contributor.author.fl_str_mv |
Mauhnoom, Yeonatan |
dc.subject.por.fl_str_mv |
Aprendizado de máquinas Aprendizado supervisionado Minimização do risco empírico Dimensão VC Perceptron multicamadas Ciência da computação Estatística Machine learning Supervised learning Empirical risk minimization VC dimension Multilayer perceptron |
topic |
Aprendizado de máquinas Aprendizado supervisionado Minimização do risco empírico Dimensão VC Perceptron multicamadas Ciência da computação Estatística Machine learning Supervised learning Empirical risk minimization VC dimension Multilayer perceptron |
description |
Teoria de Aprendizado Estatístico (TAE) permite uma abordagem do estudo do problema de aprendizado de máquina a partir de uma fundamentação matemática que utiliza conhecimentos da teoria da Probabilidade e Estatística. Ela fornece uma base teórica para entender o desempenho de vários algoritmos e modelos de aprendizado de máquina, bem como para desenvolver novos algoritmos e modelos capazes de aprender a partir de dados de maneira estatisticamente sólida. Neste trabalho abordamos os principais conceitos do Aprendizado de Máquina de uma perspectiva da Teoria de Aprendizado Estatístico. E realizamos um estudo aplicado em algoritmos de redes neurais dos tipos perceptron e perceptron multicamadas. No seu cerne, a Teoria do Aprendizado Estatístico está preocupada com o problema da generalização, que é a capacidade de um algoritmo de aprendizado de máquina fazer previsões precisas em novos dados não vistos com base em padrões aprendidos a partir de um conjunto finito de dados de treinamento. Visando desenvolver métodos que possam alcançar um bom desempenho de generalização, mesmo quando o número de exemplos de treinamento é limitado e os dados são ruidosos ou complexos. O objetivo deste trabalho, é a partir da formulação matemática e estatística fornecida pelas ferramentas da TAE, como as cotas probabilísticas de Hoeffdings e Chernoff e a Lei dos Grandes Números , provar resultados que garantem a consistência e desempenho de um algoritmo de aprendizado supervisionado e, posteriormente, implementar e testar um dos principais modelos desse tipo de algoritmo: as redes neurais Perceptron Multicamadas ou Multilayer Perceptron (MLP) em problemas de classificação |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024-07-26T12:56:16Z 2024-07-26T12:56:16Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
MAUHNOOM, Yeonatan. Aprendizado de máquina: a partir da Teoria do Aprendizado Estatístico e aplicação em redes neurais 2023. 103 f. Trabalho de Conclusão de Curso (Graduação em Bacharelado em Matemática com Ênfase em Matemática Computacional) - Instituto de Ciências Exatas, Universidade Federal Fluminense, Volta Redonda, 2023. https://app.uff.br/riuff/handle/1/33688 |
identifier_str_mv |
MAUHNOOM, Yeonatan. Aprendizado de máquina: a partir da Teoria do Aprendizado Estatístico e aplicação em redes neurais 2023. 103 f. Trabalho de Conclusão de Curso (Graduação em Bacharelado em Matemática com Ênfase em Matemática Computacional) - Instituto de Ciências Exatas, Universidade Federal Fluminense, Volta Redonda, 2023. |
url |
https://app.uff.br/riuff/handle/1/33688 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
CC-BY-SA info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
CC-BY-SA |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
instname_str |
Universidade Federal Fluminense (UFF) |
instacron_str |
UFF |
institution |
UFF |
reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
repository.mail.fl_str_mv |
riuff@id.uff.br |
_version_ |
1811823717246828544 |