Aprendizado semissupervisionado aplicado ao problema de valores ausentes
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMS |
Texto Completo: | https://repositorio.ufms.br/handle/123456789/1603 |
Resumo: | Valores ausentes constituem um problema relativamente comum em bases de dados, devido a isso existem vários métodos para estimá-los. Essa estimativa é denominada imputação de valores ausentes. Os métodos que usam o aprendizado de máquina para realizar a tarefa imputação, costuman ser supervisionados e somente utilizam os exemplos rotulados para indução de hipotese, e desta forma não conseguem usar a informação contida nos dados não rotulados. Perdendo assim, uma potencial fonte de conhecimento. O aprendizado semissupervisionado é um paradigma de aprendizado que pode se valer tanto de dados não rotulados quanto de dados rotulados e desta maneira, teoricamente, obter um melhor desempenho em tarefas de imputação. Isso porque uma base de dados com atributos ausentes pode ser dividida em dados rotulados (exemplos sem atributos com valores ausentes) e não rotulados (exemplos com atributos com valores ausentes). Nesta dissertação é demonstrado que a imputação de dados em bases estáticas é uma tarefa de natureza intrinsicamente transdutiva e por ser a inferência trandutiva um conceito muito próximo ao aprendizado semissupervisionado é esperado que o aprendizado semissupervisionado obtenha um melhor desempenho em tarefas de imputação que outros paradigmas. Os experimentos realizados utilizando algoritmos semissupervisionados multivisão como o TRI-TRAINING com e sem seleção automática do classificador base, mostram resultados promissores quando comparados com os classificadores supervisionados J48, IBK (k-NN), naive Bayes e SMO (SVM) . Isso demonstra que o aprendizado semissupervisionado é uma boa opção para tarefas de imputação de valores ausentes. Palavras-chave: aprendizado semissupervisionado, imputação de valores ausentes, algoritmos multivisão, seleção automática de classificadores. |
id |
UFMS_6e322e49057c55cef4d3b6540c0d10f0 |
---|---|
oai_identifier_str |
oai:repositorio.ufms.br:123456789/1603 |
network_acronym_str |
UFMS |
network_name_str |
Repositório Institucional da UFMS |
repository_id_str |
2124 |
spelling |
2012-08-29T13:05:52Z2021-09-30T19:55:08Z2012https://repositorio.ufms.br/handle/123456789/1603Valores ausentes constituem um problema relativamente comum em bases de dados, devido a isso existem vários métodos para estimá-los. Essa estimativa é denominada imputação de valores ausentes. Os métodos que usam o aprendizado de máquina para realizar a tarefa imputação, costuman ser supervisionados e somente utilizam os exemplos rotulados para indução de hipotese, e desta forma não conseguem usar a informação contida nos dados não rotulados. Perdendo assim, uma potencial fonte de conhecimento. O aprendizado semissupervisionado é um paradigma de aprendizado que pode se valer tanto de dados não rotulados quanto de dados rotulados e desta maneira, teoricamente, obter um melhor desempenho em tarefas de imputação. Isso porque uma base de dados com atributos ausentes pode ser dividida em dados rotulados (exemplos sem atributos com valores ausentes) e não rotulados (exemplos com atributos com valores ausentes). Nesta dissertação é demonstrado que a imputação de dados em bases estáticas é uma tarefa de natureza intrinsicamente transdutiva e por ser a inferência trandutiva um conceito muito próximo ao aprendizado semissupervisionado é esperado que o aprendizado semissupervisionado obtenha um melhor desempenho em tarefas de imputação que outros paradigmas. Os experimentos realizados utilizando algoritmos semissupervisionados multivisão como o TRI-TRAINING com e sem seleção automática do classificador base, mostram resultados promissores quando comparados com os classificadores supervisionados J48, IBK (k-NN), naive Bayes e SMO (SVM) . Isso demonstra que o aprendizado semissupervisionado é uma boa opção para tarefas de imputação de valores ausentes. Palavras-chave: aprendizado semissupervisionado, imputação de valores ausentes, algoritmos multivisão, seleção automática de classificadores.porAprendizado do ComputadorInteligência ArtificialComputaçãoMachine LearningArtificial IntelligenceComputer ScienceAprendizado semissupervisionado aplicado ao problema de valores ausentesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisMatsubara, Edson TakashiGhinozzi, Glauder Guimarãesinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMSinstname:Universidade Federal de Mato Grosso do Sul (UFMS)instacron:UFMSTHUMBNAILmono.pdf.jpgmono.pdf.jpgGenerated Thumbnailimage/jpeg1064https://repositorio.ufms.br/bitstream/123456789/1603/4/mono.pdf.jpg6274d610f32e3980ac6791b70ba7934fMD54TEXTmono.pdf.txtmono.pdf.txtExtracted texttext/plain197201https://repositorio.ufms.br/bitstream/123456789/1603/3/mono.pdf.txt6436c206db141097de1b7d72f65568daMD53ORIGINALmono.pdfmono.pdfapplication/pdf6047477https://repositorio.ufms.br/bitstream/123456789/1603/1/mono.pdfb21844c996b0e609ddd281c7d7e297c6MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufms.br/bitstream/123456789/1603/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/16032021-09-30 15:55:08.416oai:repositorio.ufms.br:123456789/1603Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufms.br/oai/requestri.prograd@ufms.bropendoar:21242021-09-30T19:55:08Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)false |
dc.title.pt_BR.fl_str_mv |
Aprendizado semissupervisionado aplicado ao problema de valores ausentes |
title |
Aprendizado semissupervisionado aplicado ao problema de valores ausentes |
spellingShingle |
Aprendizado semissupervisionado aplicado ao problema de valores ausentes Ghinozzi, Glauder Guimarães Aprendizado do Computador Inteligência Artificial Computação Machine Learning Artificial Intelligence Computer Science |
title_short |
Aprendizado semissupervisionado aplicado ao problema de valores ausentes |
title_full |
Aprendizado semissupervisionado aplicado ao problema de valores ausentes |
title_fullStr |
Aprendizado semissupervisionado aplicado ao problema de valores ausentes |
title_full_unstemmed |
Aprendizado semissupervisionado aplicado ao problema de valores ausentes |
title_sort |
Aprendizado semissupervisionado aplicado ao problema de valores ausentes |
author |
Ghinozzi, Glauder Guimarães |
author_facet |
Ghinozzi, Glauder Guimarães |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Matsubara, Edson Takashi |
dc.contributor.author.fl_str_mv |
Ghinozzi, Glauder Guimarães |
contributor_str_mv |
Matsubara, Edson Takashi |
dc.subject.por.fl_str_mv |
Aprendizado do Computador Inteligência Artificial Computação Machine Learning Artificial Intelligence Computer Science |
topic |
Aprendizado do Computador Inteligência Artificial Computação Machine Learning Artificial Intelligence Computer Science |
description |
Valores ausentes constituem um problema relativamente comum em bases de dados, devido a isso existem vários métodos para estimá-los. Essa estimativa é denominada imputação de valores ausentes. Os métodos que usam o aprendizado de máquina para realizar a tarefa imputação, costuman ser supervisionados e somente utilizam os exemplos rotulados para indução de hipotese, e desta forma não conseguem usar a informação contida nos dados não rotulados. Perdendo assim, uma potencial fonte de conhecimento. O aprendizado semissupervisionado é um paradigma de aprendizado que pode se valer tanto de dados não rotulados quanto de dados rotulados e desta maneira, teoricamente, obter um melhor desempenho em tarefas de imputação. Isso porque uma base de dados com atributos ausentes pode ser dividida em dados rotulados (exemplos sem atributos com valores ausentes) e não rotulados (exemplos com atributos com valores ausentes). Nesta dissertação é demonstrado que a imputação de dados em bases estáticas é uma tarefa de natureza intrinsicamente transdutiva e por ser a inferência trandutiva um conceito muito próximo ao aprendizado semissupervisionado é esperado que o aprendizado semissupervisionado obtenha um melhor desempenho em tarefas de imputação que outros paradigmas. Os experimentos realizados utilizando algoritmos semissupervisionados multivisão como o TRI-TRAINING com e sem seleção automática do classificador base, mostram resultados promissores quando comparados com os classificadores supervisionados J48, IBK (k-NN), naive Bayes e SMO (SVM) . Isso demonstra que o aprendizado semissupervisionado é uma boa opção para tarefas de imputação de valores ausentes. Palavras-chave: aprendizado semissupervisionado, imputação de valores ausentes, algoritmos multivisão, seleção automática de classificadores. |
publishDate |
2012 |
dc.date.accessioned.fl_str_mv |
2012-08-29T13:05:52Z |
dc.date.issued.fl_str_mv |
2012 |
dc.date.available.fl_str_mv |
2021-09-30T19:55:08Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufms.br/handle/123456789/1603 |
url |
https://repositorio.ufms.br/handle/123456789/1603 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMS instname:Universidade Federal de Mato Grosso do Sul (UFMS) instacron:UFMS |
instname_str |
Universidade Federal de Mato Grosso do Sul (UFMS) |
instacron_str |
UFMS |
institution |
UFMS |
reponame_str |
Repositório Institucional da UFMS |
collection |
Repositório Institucional da UFMS |
bitstream.url.fl_str_mv |
https://repositorio.ufms.br/bitstream/123456789/1603/4/mono.pdf.jpg https://repositorio.ufms.br/bitstream/123456789/1603/3/mono.pdf.txt https://repositorio.ufms.br/bitstream/123456789/1603/1/mono.pdf https://repositorio.ufms.br/bitstream/123456789/1603/2/license.txt |
bitstream.checksum.fl_str_mv |
6274d610f32e3980ac6791b70ba7934f 6436c206db141097de1b7d72f65568da b21844c996b0e609ddd281c7d7e297c6 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS) |
repository.mail.fl_str_mv |
ri.prograd@ufms.br |
_version_ |
1807552805311873024 |