Medindo a dificuldade de instâncias para classificação em aprendizado de máquina

Torquette, Gustavo Pinto [UNIFESP]

Medindo a dificuldade de instâncias para classificação em aprendizado de máquina

Detalhes bibliográficos
Autor(a) principal:	Torquette, Gustavo Pinto [UNIFESP]
Data de Publicação:	2023
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Institucional da UNIFESP
dARK ID:	ark:/48912/001300000jq3f
Texto Completo:	https://repositorio.unifesp.br/handle/11600/70583
Resumo:	A abordagem clássica para criar modelos de Aprendizado de Máquina para a solução de problemas de classificação é uma abordagem centrada nos modelos, na qual altera-se a técnica e seus hiperparâmetros para tentar melhorar o seu desempenho. No entanto, a qualidade dos dados é crucial para ajustar os melhores modelos e obter estimativas de desempenho mais precisas. Mas como podemos melhorar a qualidade dos dados? Primeiro, precisamos saber avaliar sua qualidade, pois sem medidas de avaliação não podemos comparar diferentes abordagens ou aprimorar resultados. Nesta dissertação, procuramos explorar meios de medir o nível de dificuldade em classificar cada observação de um conjunto de dados. A motivação é que instâncias difíceis de classificar podem ter problemas de qualidade que afetam o desempenho preditivo dos modelos de classificação. O objetivo da dissertação está em entender as propriedades dos dados que indicam quando técnicas de Aprendizado de Máquina devem obter sucesso ou falha; em que tipo de conjunto de dados uma medida de avaliação de dificuldade é mais recomendada em relação à outra; e também estudos de casos de como essas medidas podem ser utilizadas para auxílio prático dos cientistas de dados. Os resultados relataram que algumas medidas se mostraram eficazes para detectar os problemas propostos e que a aplicação prática empregada em conjuntos reais revelaram respostas coerentes, identificando instâncias que possivelmente merecem uma melhor inspeção sobre sua qualidade.

Metadados do item

id	UFSP_24ac2f38b2dc18ac6302a7e48c656c1c
oai_identifier_str	oai:repositorio.unifesp.br/:11600/70583
network_acronym_str	UFSP
network_name_str	Repositório Institucional da UNIFESP
repository_id_str	3465
spelling	Medindo a dificuldade de instâncias para classificação em aprendizado de máquinameta-aprendizadoaprendizado de máquinainteligência artificialciências de dadosdificuldade de instânciamedidas de dificuldadeA abordagem clássica para criar modelos de Aprendizado de Máquina para a solução de problemas de classificação é uma abordagem centrada nos modelos, na qual altera-se a técnica e seus hiperparâmetros para tentar melhorar o seu desempenho. No entanto, a qualidade dos dados é crucial para ajustar os melhores modelos e obter estimativas de desempenho mais precisas. Mas como podemos melhorar a qualidade dos dados? Primeiro, precisamos saber avaliar sua qualidade, pois sem medidas de avaliação não podemos comparar diferentes abordagens ou aprimorar resultados. Nesta dissertação, procuramos explorar meios de medir o nível de dificuldade em classificar cada observação de um conjunto de dados. A motivação é que instâncias difíceis de classificar podem ter problemas de qualidade que afetam o desempenho preditivo dos modelos de classificação. O objetivo da dissertação está em entender as propriedades dos dados que indicam quando técnicas de Aprendizado de Máquina devem obter sucesso ou falha; em que tipo de conjunto de dados uma medida de avaliação de dificuldade é mais recomendada em relação à outra; e também estudos de casos de como essas medidas podem ser utilizadas para auxílio prático dos cientistas de dados. Os resultados relataram que algumas medidas se mostraram eficazes para detectar os problemas propostos e que a aplicação prática empregada em conjuntos reais revelaram respostas coerentes, identificando instâncias que possivelmente merecem uma melhor inspeção sobre sua qualidade.Não recebi financiamentoUniversidade Federal de São PauloLorena, Ana Carolinahttp://lattes.cnpq.br/3451628262694747http://lattes.cnpq.br/6394878155964687Torquette, Gustavo Pinto [UNIFESP]2024-01-18T17:04:23Z2024-01-18T17:04:23Z2023-12-08info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersion108application/pdfTORQUETTE, Gustavo P. Medindo a dificuldade de instâncias para classificação em aprendizado de máquina,2023.https://repositorio.unifesp.br/handle/11600/70583ark:/48912/001300000jq3fporinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIFESPinstname:Universidade Federal de São Paulo (UNIFESP)instacron:UNIFESP2024-08-13T18:56:59Zoai:repositorio.unifesp.br/:11600/70583Repositório InstitucionalPUBhttp://www.repositorio.unifesp.br/oai/requestbiblioteca.csp@unifesp.bropendoar:34652024-12-11T20:21:30.260656Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)false
dc.title.none.fl_str_mv	Medindo a dificuldade de instâncias para classificação em aprendizado de máquina
title	Medindo a dificuldade de instâncias para classificação em aprendizado de máquina
spellingShingle	Medindo a dificuldade de instâncias para classificação em aprendizado de máquina Torquette, Gustavo Pinto [UNIFESP] meta-aprendizado aprendizado de máquina inteligência artificial ciências de dados dificuldade de instância medidas de dificuldade
title_short	Medindo a dificuldade de instâncias para classificação em aprendizado de máquina
title_full	Medindo a dificuldade de instâncias para classificação em aprendizado de máquina
title_fullStr	Medindo a dificuldade de instâncias para classificação em aprendizado de máquina
title_full_unstemmed	Medindo a dificuldade de instâncias para classificação em aprendizado de máquina
title_sort	Medindo a dificuldade de instâncias para classificação em aprendizado de máquina
author	Torquette, Gustavo Pinto [UNIFESP]
author_facet	Torquette, Gustavo Pinto [UNIFESP]
author_role	author
dc.contributor.none.fl_str_mv	Lorena, Ana Carolina http://lattes.cnpq.br/3451628262694747 http://lattes.cnpq.br/6394878155964687
dc.contributor.author.fl_str_mv	Torquette, Gustavo Pinto [UNIFESP]
dc.subject.por.fl_str_mv	meta-aprendizado aprendizado de máquina inteligência artificial ciências de dados dificuldade de instância medidas de dificuldade
topic	meta-aprendizado aprendizado de máquina inteligência artificial ciências de dados dificuldade de instância medidas de dificuldade
description	A abordagem clássica para criar modelos de Aprendizado de Máquina para a solução de problemas de classificação é uma abordagem centrada nos modelos, na qual altera-se a técnica e seus hiperparâmetros para tentar melhorar o seu desempenho. No entanto, a qualidade dos dados é crucial para ajustar os melhores modelos e obter estimativas de desempenho mais precisas. Mas como podemos melhorar a qualidade dos dados? Primeiro, precisamos saber avaliar sua qualidade, pois sem medidas de avaliação não podemos comparar diferentes abordagens ou aprimorar resultados. Nesta dissertação, procuramos explorar meios de medir o nível de dificuldade em classificar cada observação de um conjunto de dados. A motivação é que instâncias difíceis de classificar podem ter problemas de qualidade que afetam o desempenho preditivo dos modelos de classificação. O objetivo da dissertação está em entender as propriedades dos dados que indicam quando técnicas de Aprendizado de Máquina devem obter sucesso ou falha; em que tipo de conjunto de dados uma medida de avaliação de dificuldade é mais recomendada em relação à outra; e também estudos de casos de como essas medidas podem ser utilizadas para auxílio prático dos cientistas de dados. Os resultados relataram que algumas medidas se mostraram eficazes para detectar os problemas propostos e que a aplicação prática empregada em conjuntos reais revelaram respostas coerentes, identificando instâncias que possivelmente merecem uma melhor inspeção sobre sua qualidade.
publishDate	2023
dc.date.none.fl_str_mv	2023-12-08 2024-01-18T17:04:23Z 2024-01-18T17:04:23Z
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	TORQUETTE, Gustavo P. Medindo a dificuldade de instâncias para classificação em aprendizado de máquina,2023. https://repositorio.unifesp.br/handle/11600/70583
dc.identifier.dark.fl_str_mv	ark:/48912/001300000jq3f
identifier_str_mv	TORQUETTE, Gustavo P. Medindo a dificuldade de instâncias para classificação em aprendizado de máquina,2023. ark:/48912/001300000jq3f
url	https://repositorio.unifesp.br/handle/11600/70583
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	108 application/pdf
dc.publisher.none.fl_str_mv	Universidade Federal de São Paulo
publisher.none.fl_str_mv	Universidade Federal de São Paulo
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UNIFESP instname:Universidade Federal de São Paulo (UNIFESP) instacron:UNIFESP
instname_str	Universidade Federal de São Paulo (UNIFESP)
instacron_str	UNIFESP
institution	UNIFESP
reponame_str	Repositório Institucional da UNIFESP
collection	Repositório Institucional da UNIFESP
repository.name.fl_str_mv	Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)
repository.mail.fl_str_mv	biblioteca.csp@unifesp.br
_version_	1818602473964699648

Medindo a dificuldade de instâncias para classificação em aprendizado de máquina

Registros relacionados