Aprendizado semissupervisionado aplicado ao problema de valores ausentes

Detalhes bibliográficos
Autor(a) principal: Ghinozzi, Glauder Guimarães
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMS
Texto Completo: https://repositorio.ufms.br/handle/123456789/1603
Resumo: Valores ausentes constituem um problema relativamente comum em bases de dados, devido a isso existem vários métodos para estimá-los. Essa estimativa é denominada imputação de valores ausentes. Os métodos que usam o aprendizado de máquina para realizar a tarefa imputação, costuman ser supervisionados e somente utilizam os exemplos rotulados para indução de hipotese, e desta forma não conseguem usar a informação contida nos dados não rotulados. Perdendo assim, uma potencial fonte de conhecimento. O aprendizado semissupervisionado é um paradigma de aprendizado que pode se valer tanto de dados não rotulados quanto de dados rotulados e desta maneira, teoricamente, obter um melhor desempenho em tarefas de imputação. Isso porque uma base de dados com atributos ausentes pode ser dividida em dados rotulados (exemplos sem atributos com valores ausentes) e não rotulados (exemplos com atributos com valores ausentes). Nesta dissertação é demonstrado que a imputação de dados em bases estáticas é uma tarefa de natureza intrinsicamente transdutiva e por ser a inferência trandutiva um conceito muito próximo ao aprendizado semissupervisionado é esperado que o aprendizado semissupervisionado obtenha um melhor desempenho em tarefas de imputação que outros paradigmas. Os experimentos realizados utilizando algoritmos semissupervisionados multivisão como o TRI-TRAINING com e sem seleção automática do classificador base, mostram resultados promissores quando comparados com os classificadores supervisionados J48, IBK (k-NN), naive Bayes e SMO (SVM) . Isso demonstra que o aprendizado semissupervisionado é uma boa opção para tarefas de imputação de valores ausentes. Palavras-chave: aprendizado semissupervisionado, imputação de valores ausentes, algoritmos multivisão, seleção automática de classificadores.
id UFMS_6e322e49057c55cef4d3b6540c0d10f0
oai_identifier_str oai:repositorio.ufms.br:123456789/1603
network_acronym_str UFMS
network_name_str Repositório Institucional da UFMS
repository_id_str 2124
spelling 2012-08-29T13:05:52Z2021-09-30T19:55:08Z2012https://repositorio.ufms.br/handle/123456789/1603Valores ausentes constituem um problema relativamente comum em bases de dados, devido a isso existem vários métodos para estimá-los. Essa estimativa é denominada imputação de valores ausentes. Os métodos que usam o aprendizado de máquina para realizar a tarefa imputação, costuman ser supervisionados e somente utilizam os exemplos rotulados para indução de hipotese, e desta forma não conseguem usar a informação contida nos dados não rotulados. Perdendo assim, uma potencial fonte de conhecimento. O aprendizado semissupervisionado é um paradigma de aprendizado que pode se valer tanto de dados não rotulados quanto de dados rotulados e desta maneira, teoricamente, obter um melhor desempenho em tarefas de imputação. Isso porque uma base de dados com atributos ausentes pode ser dividida em dados rotulados (exemplos sem atributos com valores ausentes) e não rotulados (exemplos com atributos com valores ausentes). Nesta dissertação é demonstrado que a imputação de dados em bases estáticas é uma tarefa de natureza intrinsicamente transdutiva e por ser a inferência trandutiva um conceito muito próximo ao aprendizado semissupervisionado é esperado que o aprendizado semissupervisionado obtenha um melhor desempenho em tarefas de imputação que outros paradigmas. Os experimentos realizados utilizando algoritmos semissupervisionados multivisão como o TRI-TRAINING com e sem seleção automática do classificador base, mostram resultados promissores quando comparados com os classificadores supervisionados J48, IBK (k-NN), naive Bayes e SMO (SVM) . Isso demonstra que o aprendizado semissupervisionado é uma boa opção para tarefas de imputação de valores ausentes. Palavras-chave: aprendizado semissupervisionado, imputação de valores ausentes, algoritmos multivisão, seleção automática de classificadores.porAprendizado do ComputadorInteligência ArtificialComputaçãoMachine LearningArtificial IntelligenceComputer ScienceAprendizado semissupervisionado aplicado ao problema de valores ausentesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisMatsubara, Edson TakashiGhinozzi, Glauder Guimarãesinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMSinstname:Universidade Federal de Mato Grosso do Sul (UFMS)instacron:UFMSTHUMBNAILmono.pdf.jpgmono.pdf.jpgGenerated Thumbnailimage/jpeg1064https://repositorio.ufms.br/bitstream/123456789/1603/4/mono.pdf.jpg6274d610f32e3980ac6791b70ba7934fMD54TEXTmono.pdf.txtmono.pdf.txtExtracted texttext/plain197201https://repositorio.ufms.br/bitstream/123456789/1603/3/mono.pdf.txt6436c206db141097de1b7d72f65568daMD53ORIGINALmono.pdfmono.pdfapplication/pdf6047477https://repositorio.ufms.br/bitstream/123456789/1603/1/mono.pdfb21844c996b0e609ddd281c7d7e297c6MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufms.br/bitstream/123456789/1603/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/16032021-09-30 15:55:08.416oai:repositorio.ufms.br:123456789/1603Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufms.br/oai/requestri.prograd@ufms.bropendoar:21242021-09-30T19:55:08Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)false
dc.title.pt_BR.fl_str_mv Aprendizado semissupervisionado aplicado ao problema de valores ausentes
title Aprendizado semissupervisionado aplicado ao problema de valores ausentes
spellingShingle Aprendizado semissupervisionado aplicado ao problema de valores ausentes
Ghinozzi, Glauder Guimarães
Aprendizado do Computador
Inteligência Artificial
Computação
Machine Learning
Artificial Intelligence
Computer Science
title_short Aprendizado semissupervisionado aplicado ao problema de valores ausentes
title_full Aprendizado semissupervisionado aplicado ao problema de valores ausentes
title_fullStr Aprendizado semissupervisionado aplicado ao problema de valores ausentes
title_full_unstemmed Aprendizado semissupervisionado aplicado ao problema de valores ausentes
title_sort Aprendizado semissupervisionado aplicado ao problema de valores ausentes
author Ghinozzi, Glauder Guimarães
author_facet Ghinozzi, Glauder Guimarães
author_role author
dc.contributor.advisor1.fl_str_mv Matsubara, Edson Takashi
dc.contributor.author.fl_str_mv Ghinozzi, Glauder Guimarães
contributor_str_mv Matsubara, Edson Takashi
dc.subject.por.fl_str_mv Aprendizado do Computador
Inteligência Artificial
Computação
Machine Learning
Artificial Intelligence
Computer Science
topic Aprendizado do Computador
Inteligência Artificial
Computação
Machine Learning
Artificial Intelligence
Computer Science
description Valores ausentes constituem um problema relativamente comum em bases de dados, devido a isso existem vários métodos para estimá-los. Essa estimativa é denominada imputação de valores ausentes. Os métodos que usam o aprendizado de máquina para realizar a tarefa imputação, costuman ser supervisionados e somente utilizam os exemplos rotulados para indução de hipotese, e desta forma não conseguem usar a informação contida nos dados não rotulados. Perdendo assim, uma potencial fonte de conhecimento. O aprendizado semissupervisionado é um paradigma de aprendizado que pode se valer tanto de dados não rotulados quanto de dados rotulados e desta maneira, teoricamente, obter um melhor desempenho em tarefas de imputação. Isso porque uma base de dados com atributos ausentes pode ser dividida em dados rotulados (exemplos sem atributos com valores ausentes) e não rotulados (exemplos com atributos com valores ausentes). Nesta dissertação é demonstrado que a imputação de dados em bases estáticas é uma tarefa de natureza intrinsicamente transdutiva e por ser a inferência trandutiva um conceito muito próximo ao aprendizado semissupervisionado é esperado que o aprendizado semissupervisionado obtenha um melhor desempenho em tarefas de imputação que outros paradigmas. Os experimentos realizados utilizando algoritmos semissupervisionados multivisão como o TRI-TRAINING com e sem seleção automática do classificador base, mostram resultados promissores quando comparados com os classificadores supervisionados J48, IBK (k-NN), naive Bayes e SMO (SVM) . Isso demonstra que o aprendizado semissupervisionado é uma boa opção para tarefas de imputação de valores ausentes. Palavras-chave: aprendizado semissupervisionado, imputação de valores ausentes, algoritmos multivisão, seleção automática de classificadores.
publishDate 2012
dc.date.accessioned.fl_str_mv 2012-08-29T13:05:52Z
dc.date.issued.fl_str_mv 2012
dc.date.available.fl_str_mv 2021-09-30T19:55:08Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufms.br/handle/123456789/1603
url https://repositorio.ufms.br/handle/123456789/1603
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMS
instname:Universidade Federal de Mato Grosso do Sul (UFMS)
instacron:UFMS
instname_str Universidade Federal de Mato Grosso do Sul (UFMS)
instacron_str UFMS
institution UFMS
reponame_str Repositório Institucional da UFMS
collection Repositório Institucional da UFMS
bitstream.url.fl_str_mv https://repositorio.ufms.br/bitstream/123456789/1603/4/mono.pdf.jpg
https://repositorio.ufms.br/bitstream/123456789/1603/3/mono.pdf.txt
https://repositorio.ufms.br/bitstream/123456789/1603/1/mono.pdf
https://repositorio.ufms.br/bitstream/123456789/1603/2/license.txt
bitstream.checksum.fl_str_mv 6274d610f32e3980ac6791b70ba7934f
6436c206db141097de1b7d72f65568da
b21844c996b0e609ddd281c7d7e297c6
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)
repository.mail.fl_str_mv ri.prograd@ufms.br
_version_ 1801678502608502784