Medindo a dificuldade de instâncias para classificação em aprendizado de máquina
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UNIFESP |
dARK ID: | ark:/48912/001300000jq3f |
Texto Completo: | https://repositorio.unifesp.br/handle/11600/70583 |
Resumo: | A abordagem clássica para criar modelos de Aprendizado de Máquina para a solução de problemas de classificação é uma abordagem centrada nos modelos, na qual altera-se a técnica e seus hiperparâmetros para tentar melhorar o seu desempenho. No entanto, a qualidade dos dados é crucial para ajustar os melhores modelos e obter estimativas de desempenho mais precisas. Mas como podemos melhorar a qualidade dos dados? Primeiro, precisamos saber avaliar sua qualidade, pois sem medidas de avaliação não podemos comparar diferentes abordagens ou aprimorar resultados. Nesta dissertação, procuramos explorar meios de medir o nível de dificuldade em classificar cada observação de um conjunto de dados. A motivação é que instâncias difíceis de classificar podem ter problemas de qualidade que afetam o desempenho preditivo dos modelos de classificação. O objetivo da dissertação está em entender as propriedades dos dados que indicam quando técnicas de Aprendizado de Máquina devem obter sucesso ou falha; em que tipo de conjunto de dados uma medida de avaliação de dificuldade é mais recomendada em relação à outra; e também estudos de casos de como essas medidas podem ser utilizadas para auxílio prático dos cientistas de dados. Os resultados relataram que algumas medidas se mostraram eficazes para detectar os problemas propostos e que a aplicação prática empregada em conjuntos reais revelaram respostas coerentes, identificando instâncias que possivelmente merecem uma melhor inspeção sobre sua qualidade. |
id |
UFSP_24ac2f38b2dc18ac6302a7e48c656c1c |
---|---|
oai_identifier_str |
oai:repositorio.unifesp.br/:11600/70583 |
network_acronym_str |
UFSP |
network_name_str |
Repositório Institucional da UNIFESP |
repository_id_str |
3465 |
spelling |
Medindo a dificuldade de instâncias para classificação em aprendizado de máquinameta-aprendizadoaprendizado de máquinainteligência artificialciências de dadosdificuldade de instânciamedidas de dificuldadeA abordagem clássica para criar modelos de Aprendizado de Máquina para a solução de problemas de classificação é uma abordagem centrada nos modelos, na qual altera-se a técnica e seus hiperparâmetros para tentar melhorar o seu desempenho. No entanto, a qualidade dos dados é crucial para ajustar os melhores modelos e obter estimativas de desempenho mais precisas. Mas como podemos melhorar a qualidade dos dados? Primeiro, precisamos saber avaliar sua qualidade, pois sem medidas de avaliação não podemos comparar diferentes abordagens ou aprimorar resultados. Nesta dissertação, procuramos explorar meios de medir o nível de dificuldade em classificar cada observação de um conjunto de dados. A motivação é que instâncias difíceis de classificar podem ter problemas de qualidade que afetam o desempenho preditivo dos modelos de classificação. O objetivo da dissertação está em entender as propriedades dos dados que indicam quando técnicas de Aprendizado de Máquina devem obter sucesso ou falha; em que tipo de conjunto de dados uma medida de avaliação de dificuldade é mais recomendada em relação à outra; e também estudos de casos de como essas medidas podem ser utilizadas para auxílio prático dos cientistas de dados. Os resultados relataram que algumas medidas se mostraram eficazes para detectar os problemas propostos e que a aplicação prática empregada em conjuntos reais revelaram respostas coerentes, identificando instâncias que possivelmente merecem uma melhor inspeção sobre sua qualidade.Não recebi financiamentoUniversidade Federal de São PauloLorena, Ana Carolinahttp://lattes.cnpq.br/3451628262694747http://lattes.cnpq.br/6394878155964687Torquette, Gustavo Pinto [UNIFESP]2024-01-18T17:04:23Z2024-01-18T17:04:23Z2023-12-08info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersion108application/pdfTORQUETTE, Gustavo P. Medindo a dificuldade de instâncias para classificação em aprendizado de máquina,2023.https://repositorio.unifesp.br/handle/11600/70583ark:/48912/001300000jq3fporinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIFESPinstname:Universidade Federal de São Paulo (UNIFESP)instacron:UNIFESP2024-08-13T18:56:59Zoai:repositorio.unifesp.br/:11600/70583Repositório InstitucionalPUBhttp://www.repositorio.unifesp.br/oai/requestbiblioteca.csp@unifesp.bropendoar:34652024-12-11T20:21:30.260656Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)false |
dc.title.none.fl_str_mv |
Medindo a dificuldade de instâncias para classificação em aprendizado de máquina |
title |
Medindo a dificuldade de instâncias para classificação em aprendizado de máquina |
spellingShingle |
Medindo a dificuldade de instâncias para classificação em aprendizado de máquina Torquette, Gustavo Pinto [UNIFESP] meta-aprendizado aprendizado de máquina inteligência artificial ciências de dados dificuldade de instância medidas de dificuldade |
title_short |
Medindo a dificuldade de instâncias para classificação em aprendizado de máquina |
title_full |
Medindo a dificuldade de instâncias para classificação em aprendizado de máquina |
title_fullStr |
Medindo a dificuldade de instâncias para classificação em aprendizado de máquina |
title_full_unstemmed |
Medindo a dificuldade de instâncias para classificação em aprendizado de máquina |
title_sort |
Medindo a dificuldade de instâncias para classificação em aprendizado de máquina |
author |
Torquette, Gustavo Pinto [UNIFESP] |
author_facet |
Torquette, Gustavo Pinto [UNIFESP] |
author_role |
author |
dc.contributor.none.fl_str_mv |
Lorena, Ana Carolina http://lattes.cnpq.br/3451628262694747 http://lattes.cnpq.br/6394878155964687 |
dc.contributor.author.fl_str_mv |
Torquette, Gustavo Pinto [UNIFESP] |
dc.subject.por.fl_str_mv |
meta-aprendizado aprendizado de máquina inteligência artificial ciências de dados dificuldade de instância medidas de dificuldade |
topic |
meta-aprendizado aprendizado de máquina inteligência artificial ciências de dados dificuldade de instância medidas de dificuldade |
description |
A abordagem clássica para criar modelos de Aprendizado de Máquina para a solução de problemas de classificação é uma abordagem centrada nos modelos, na qual altera-se a técnica e seus hiperparâmetros para tentar melhorar o seu desempenho. No entanto, a qualidade dos dados é crucial para ajustar os melhores modelos e obter estimativas de desempenho mais precisas. Mas como podemos melhorar a qualidade dos dados? Primeiro, precisamos saber avaliar sua qualidade, pois sem medidas de avaliação não podemos comparar diferentes abordagens ou aprimorar resultados. Nesta dissertação, procuramos explorar meios de medir o nível de dificuldade em classificar cada observação de um conjunto de dados. A motivação é que instâncias difíceis de classificar podem ter problemas de qualidade que afetam o desempenho preditivo dos modelos de classificação. O objetivo da dissertação está em entender as propriedades dos dados que indicam quando técnicas de Aprendizado de Máquina devem obter sucesso ou falha; em que tipo de conjunto de dados uma medida de avaliação de dificuldade é mais recomendada em relação à outra; e também estudos de casos de como essas medidas podem ser utilizadas para auxílio prático dos cientistas de dados. Os resultados relataram que algumas medidas se mostraram eficazes para detectar os problemas propostos e que a aplicação prática empregada em conjuntos reais revelaram respostas coerentes, identificando instâncias que possivelmente merecem uma melhor inspeção sobre sua qualidade. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-12-08 2024-01-18T17:04:23Z 2024-01-18T17:04:23Z |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
TORQUETTE, Gustavo P. Medindo a dificuldade de instâncias para classificação em aprendizado de máquina,2023. https://repositorio.unifesp.br/handle/11600/70583 |
dc.identifier.dark.fl_str_mv |
ark:/48912/001300000jq3f |
identifier_str_mv |
TORQUETTE, Gustavo P. Medindo a dificuldade de instâncias para classificação em aprendizado de máquina,2023. ark:/48912/001300000jq3f |
url |
https://repositorio.unifesp.br/handle/11600/70583 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
108 application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Paulo |
publisher.none.fl_str_mv |
Universidade Federal de São Paulo |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNIFESP instname:Universidade Federal de São Paulo (UNIFESP) instacron:UNIFESP |
instname_str |
Universidade Federal de São Paulo (UNIFESP) |
instacron_str |
UNIFESP |
institution |
UNIFESP |
reponame_str |
Repositório Institucional da UNIFESP |
collection |
Repositório Institucional da UNIFESP |
repository.name.fl_str_mv |
Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP) |
repository.mail.fl_str_mv |
biblioteca.csp@unifesp.br |
_version_ |
1818602473964699648 |