Desenvolvimento de um algoritmo imunológico para agrupamento de dados

Detalhes bibliográficos
Autor(a) principal: Machado, Raquel de Lima
Data de Publicação: 2011
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UCS
Texto Completo: https://repositorio.ucs.br/handle/11338/1486
Resumo: A tarefa de agrupar dados é de grande valia no mundo atual, visto que a quantidade de dados armazenados e manipulados tem crescido muito. O principal objetivo de um processo de agrupamento é formar grupos de instâncias, de forma a aumentar a homogeneidade dentro do grupo e a heterogeneidade entre grupos. Um processo de agrupamento é composto por cinco etapas principais: (a) preparação dos dados, (b) escolha de uma medida de similaridade, (c) seleção de uma técnica de agrupamento, (d) validação dos grupos formados e por fim, (e) a interpretação dos resultados. Este trabalho apresenta uma revisão de cada uma dessas etapas separadamente. Sabe-se que cada problema de agrupamento pode ser melhor resolvido por um método adequado , porém nem todos os métodos conseguem resolver todos os problemas de uma maneira satisfatória. O objetivo deste trabalho é propor um algoritmo para agrupamento de dados com base no comportamento do sistema imunológico. Os sistemas imunológicos artificiais se baseiam nos processos do sistema imune dos vertebrados, em especial na teoria da seleção clonal, no princípio da seleção negativa e na teoria das redes imunológicas. Todas elas auxiliam na construção de novos algoritmos, como o sistema imunológico de reconhecimento de padrão e alguns algoritmos de agrupamento descritos neste trabalho. Partindo-se do estudo de agrupamento de dados e das teorias do sistema imunológico artificial é proposto um algoritmo que tem como entrada um dataset, e como saída um conjunto de grupos dos dados. O algoritmo foi desenvolvido utilizando a linguagem Java e sua arquitetura foi feita em três camadas. Foram realizados testes em três datasets públicos: Iris Plants Database, Wisconsin Breast Cancer Database e Diabetes Data Set. Os resultados obtidos de cada um dos datasets foram comparados com os resultados do algoritmo k-means. O algoritmo imunológico se mostrou tão ou mais eficiente que o algoritmo k-means em todos os datasets testados (sic).
id UCS_8ff9013fc71c7e5dbd58ba55bc4fa9b7
oai_identifier_str oai:repositorio.ucs.br:11338/1486
network_acronym_str UCS
network_name_str Repositório Institucional da UCS
repository_id_str
spelling Machado, Raquel de LimaNotari, Daniel LuísRibeiro, Helena GraziottinWeber, Carine Geltrudes2017-02-01T17:41:56Z2017-02-01T17:41:56Z2011https://repositorio.ucs.br/handle/11338/1486A tarefa de agrupar dados é de grande valia no mundo atual, visto que a quantidade de dados armazenados e manipulados tem crescido muito. O principal objetivo de um processo de agrupamento é formar grupos de instâncias, de forma a aumentar a homogeneidade dentro do grupo e a heterogeneidade entre grupos. Um processo de agrupamento é composto por cinco etapas principais: (a) preparação dos dados, (b) escolha de uma medida de similaridade, (c) seleção de uma técnica de agrupamento, (d) validação dos grupos formados e por fim, (e) a interpretação dos resultados. Este trabalho apresenta uma revisão de cada uma dessas etapas separadamente. Sabe-se que cada problema de agrupamento pode ser melhor resolvido por um método adequado , porém nem todos os métodos conseguem resolver todos os problemas de uma maneira satisfatória. O objetivo deste trabalho é propor um algoritmo para agrupamento de dados com base no comportamento do sistema imunológico. Os sistemas imunológicos artificiais se baseiam nos processos do sistema imune dos vertebrados, em especial na teoria da seleção clonal, no princípio da seleção negativa e na teoria das redes imunológicas. Todas elas auxiliam na construção de novos algoritmos, como o sistema imunológico de reconhecimento de padrão e alguns algoritmos de agrupamento descritos neste trabalho. Partindo-se do estudo de agrupamento de dados e das teorias do sistema imunológico artificial é proposto um algoritmo que tem como entrada um dataset, e como saída um conjunto de grupos dos dados. O algoritmo foi desenvolvido utilizando a linguagem Java e sua arquitetura foi feita em três camadas. Foram realizados testes em três datasets públicos: Iris Plants Database, Wisconsin Breast Cancer Database e Diabetes Data Set. Os resultados obtidos de cada um dos datasets foram comparados com os resultados do algoritmo k-means. O algoritmo imunológico se mostrou tão ou mais eficiente que o algoritmo k-means em todos os datasets testados (sic).Processamento eletrônico de dadosEstruturas de dados (Computação)Desenvolvimento de um algoritmo imunológico para agrupamento de dadosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UCSinstname:Universidade de Caxias do Sul (UCS)instacron:UCSinfo:eu-repo/semantics/openAccessUniversidade de Caxias do SulBacharelado em Ciência da ComputaçãoTEXTTCC Raquel de Lima Machado.pdf.txtTCC Raquel de Lima Machado.pdf.txtExtracted texttext/plain222365https://repositorio.ucs.br/xmlui/bitstream/11338/1486/3/TCC%20Raquel%20de%20Lima%20Machado.pdf.txtc6dc5e886f93aa672e43ff4343e855faMD53THUMBNAILTCC Raquel de Lima Machado.pdf.jpgTCC Raquel de Lima Machado.pdf.jpgGenerated Thumbnailimage/jpeg1222https://repositorio.ucs.br/xmlui/bitstream/11338/1486/4/TCC%20Raquel%20de%20Lima%20Machado.pdf.jpg241e47a83a34633959ac93546196e618MD54ORIGINALTCC Raquel de Lima Machado.pdfTCC Raquel de Lima Machado.pdfapplication/pdf3987735https://repositorio.ucs.br/xmlui/bitstream/11338/1486/1/TCC%20Raquel%20de%20Lima%20Machado.pdfb5aa400fd802a7cb2f6c5ddcac2c8e32MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ucs.br/xmlui/bitstream/11338/1486/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5211338/14862018-08-17 06:30:11.005oai:repositorio.ucs.br:11338/1486Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório de Publicaçõeshttp://repositorio.ucs.br/oai/requestopendoar:2018-08-17T06:30:11Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)false
dc.title.pt_BR.fl_str_mv Desenvolvimento de um algoritmo imunológico para agrupamento de dados
title Desenvolvimento de um algoritmo imunológico para agrupamento de dados
spellingShingle Desenvolvimento de um algoritmo imunológico para agrupamento de dados
Machado, Raquel de Lima
Processamento eletrônico de dados
Estruturas de dados (Computação)
title_short Desenvolvimento de um algoritmo imunológico para agrupamento de dados
title_full Desenvolvimento de um algoritmo imunológico para agrupamento de dados
title_fullStr Desenvolvimento de um algoritmo imunológico para agrupamento de dados
title_full_unstemmed Desenvolvimento de um algoritmo imunológico para agrupamento de dados
title_sort Desenvolvimento de um algoritmo imunológico para agrupamento de dados
author Machado, Raquel de Lima
author_facet Machado, Raquel de Lima
author_role author
dc.contributor.other.none.fl_str_mv Notari, Daniel Luís
Ribeiro, Helena Graziottin
dc.contributor.author.fl_str_mv Machado, Raquel de Lima
dc.contributor.advisor1.fl_str_mv Weber, Carine Geltrudes
contributor_str_mv Weber, Carine Geltrudes
dc.subject.por.fl_str_mv Processamento eletrônico de dados
Estruturas de dados (Computação)
topic Processamento eletrônico de dados
Estruturas de dados (Computação)
description A tarefa de agrupar dados é de grande valia no mundo atual, visto que a quantidade de dados armazenados e manipulados tem crescido muito. O principal objetivo de um processo de agrupamento é formar grupos de instâncias, de forma a aumentar a homogeneidade dentro do grupo e a heterogeneidade entre grupos. Um processo de agrupamento é composto por cinco etapas principais: (a) preparação dos dados, (b) escolha de uma medida de similaridade, (c) seleção de uma técnica de agrupamento, (d) validação dos grupos formados e por fim, (e) a interpretação dos resultados. Este trabalho apresenta uma revisão de cada uma dessas etapas separadamente. Sabe-se que cada problema de agrupamento pode ser melhor resolvido por um método adequado , porém nem todos os métodos conseguem resolver todos os problemas de uma maneira satisfatória. O objetivo deste trabalho é propor um algoritmo para agrupamento de dados com base no comportamento do sistema imunológico. Os sistemas imunológicos artificiais se baseiam nos processos do sistema imune dos vertebrados, em especial na teoria da seleção clonal, no princípio da seleção negativa e na teoria das redes imunológicas. Todas elas auxiliam na construção de novos algoritmos, como o sistema imunológico de reconhecimento de padrão e alguns algoritmos de agrupamento descritos neste trabalho. Partindo-se do estudo de agrupamento de dados e das teorias do sistema imunológico artificial é proposto um algoritmo que tem como entrada um dataset, e como saída um conjunto de grupos dos dados. O algoritmo foi desenvolvido utilizando a linguagem Java e sua arquitetura foi feita em três camadas. Foram realizados testes em três datasets públicos: Iris Plants Database, Wisconsin Breast Cancer Database e Diabetes Data Set. Os resultados obtidos de cada um dos datasets foram comparados com os resultados do algoritmo k-means. O algoritmo imunológico se mostrou tão ou mais eficiente que o algoritmo k-means em todos os datasets testados (sic).
publishDate 2011
dc.date.submitted.none.fl_str_mv 2011
dc.date.accessioned.fl_str_mv 2017-02-01T17:41:56Z
dc.date.available.fl_str_mv 2017-02-01T17:41:56Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ucs.br/handle/11338/1486
url https://repositorio.ucs.br/handle/11338/1486
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UCS
instname:Universidade de Caxias do Sul (UCS)
instacron:UCS
instname_str Universidade de Caxias do Sul (UCS)
instacron_str UCS
institution UCS
reponame_str Repositório Institucional da UCS
collection Repositório Institucional da UCS
bitstream.url.fl_str_mv https://repositorio.ucs.br/xmlui/bitstream/11338/1486/3/TCC%20Raquel%20de%20Lima%20Machado.pdf.txt
https://repositorio.ucs.br/xmlui/bitstream/11338/1486/4/TCC%20Raquel%20de%20Lima%20Machado.pdf.jpg
https://repositorio.ucs.br/xmlui/bitstream/11338/1486/1/TCC%20Raquel%20de%20Lima%20Machado.pdf
https://repositorio.ucs.br/xmlui/bitstream/11338/1486/2/license.txt
bitstream.checksum.fl_str_mv c6dc5e886f93aa672e43ff4343e855fa
241e47a83a34633959ac93546196e618
b5aa400fd802a7cb2f6c5ddcac2c8e32
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)
repository.mail.fl_str_mv
_version_ 1798308889135939584