Desenvolvimento de um algoritmo imunológico para agrupamento de dados
Autor(a) principal: | |
---|---|
Data de Publicação: | 2011 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UCS |
Texto Completo: | https://repositorio.ucs.br/handle/11338/1486 |
Resumo: | A tarefa de agrupar dados é de grande valia no mundo atual, visto que a quantidade de dados armazenados e manipulados tem crescido muito. O principal objetivo de um processo de agrupamento é formar grupos de instâncias, de forma a aumentar a homogeneidade dentro do grupo e a heterogeneidade entre grupos. Um processo de agrupamento é composto por cinco etapas principais: (a) preparação dos dados, (b) escolha de uma medida de similaridade, (c) seleção de uma técnica de agrupamento, (d) validação dos grupos formados e por fim, (e) a interpretação dos resultados. Este trabalho apresenta uma revisão de cada uma dessas etapas separadamente. Sabe-se que cada problema de agrupamento pode ser melhor resolvido por um método adequado , porém nem todos os métodos conseguem resolver todos os problemas de uma maneira satisfatória. O objetivo deste trabalho é propor um algoritmo para agrupamento de dados com base no comportamento do sistema imunológico. Os sistemas imunológicos artificiais se baseiam nos processos do sistema imune dos vertebrados, em especial na teoria da seleção clonal, no princípio da seleção negativa e na teoria das redes imunológicas. Todas elas auxiliam na construção de novos algoritmos, como o sistema imunológico de reconhecimento de padrão e alguns algoritmos de agrupamento descritos neste trabalho. Partindo-se do estudo de agrupamento de dados e das teorias do sistema imunológico artificial é proposto um algoritmo que tem como entrada um dataset, e como saída um conjunto de grupos dos dados. O algoritmo foi desenvolvido utilizando a linguagem Java e sua arquitetura foi feita em três camadas. Foram realizados testes em três datasets públicos: Iris Plants Database, Wisconsin Breast Cancer Database e Diabetes Data Set. Os resultados obtidos de cada um dos datasets foram comparados com os resultados do algoritmo k-means. O algoritmo imunológico se mostrou tão ou mais eficiente que o algoritmo k-means em todos os datasets testados (sic). |
id |
UCS_8ff9013fc71c7e5dbd58ba55bc4fa9b7 |
---|---|
oai_identifier_str |
oai:repositorio.ucs.br:11338/1486 |
network_acronym_str |
UCS |
network_name_str |
Repositório Institucional da UCS |
repository_id_str |
|
spelling |
Machado, Raquel de LimaNotari, Daniel LuísRibeiro, Helena GraziottinWeber, Carine Geltrudes2017-02-01T17:41:56Z2017-02-01T17:41:56Z2011https://repositorio.ucs.br/handle/11338/1486A tarefa de agrupar dados é de grande valia no mundo atual, visto que a quantidade de dados armazenados e manipulados tem crescido muito. O principal objetivo de um processo de agrupamento é formar grupos de instâncias, de forma a aumentar a homogeneidade dentro do grupo e a heterogeneidade entre grupos. Um processo de agrupamento é composto por cinco etapas principais: (a) preparação dos dados, (b) escolha de uma medida de similaridade, (c) seleção de uma técnica de agrupamento, (d) validação dos grupos formados e por fim, (e) a interpretação dos resultados. Este trabalho apresenta uma revisão de cada uma dessas etapas separadamente. Sabe-se que cada problema de agrupamento pode ser melhor resolvido por um método adequado , porém nem todos os métodos conseguem resolver todos os problemas de uma maneira satisfatória. O objetivo deste trabalho é propor um algoritmo para agrupamento de dados com base no comportamento do sistema imunológico. Os sistemas imunológicos artificiais se baseiam nos processos do sistema imune dos vertebrados, em especial na teoria da seleção clonal, no princípio da seleção negativa e na teoria das redes imunológicas. Todas elas auxiliam na construção de novos algoritmos, como o sistema imunológico de reconhecimento de padrão e alguns algoritmos de agrupamento descritos neste trabalho. Partindo-se do estudo de agrupamento de dados e das teorias do sistema imunológico artificial é proposto um algoritmo que tem como entrada um dataset, e como saída um conjunto de grupos dos dados. O algoritmo foi desenvolvido utilizando a linguagem Java e sua arquitetura foi feita em três camadas. Foram realizados testes em três datasets públicos: Iris Plants Database, Wisconsin Breast Cancer Database e Diabetes Data Set. Os resultados obtidos de cada um dos datasets foram comparados com os resultados do algoritmo k-means. O algoritmo imunológico se mostrou tão ou mais eficiente que o algoritmo k-means em todos os datasets testados (sic).Processamento eletrônico de dadosEstruturas de dados (Computação)Desenvolvimento de um algoritmo imunológico para agrupamento de dadosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UCSinstname:Universidade de Caxias do Sul (UCS)instacron:UCSinfo:eu-repo/semantics/openAccessUniversidade de Caxias do SulBacharelado em Ciência da ComputaçãoTEXTTCC Raquel de Lima Machado.pdf.txtTCC Raquel de Lima Machado.pdf.txtExtracted texttext/plain222365https://repositorio.ucs.br/xmlui/bitstream/11338/1486/3/TCC%20Raquel%20de%20Lima%20Machado.pdf.txtc6dc5e886f93aa672e43ff4343e855faMD53THUMBNAILTCC Raquel de Lima Machado.pdf.jpgTCC Raquel de Lima Machado.pdf.jpgGenerated Thumbnailimage/jpeg1222https://repositorio.ucs.br/xmlui/bitstream/11338/1486/4/TCC%20Raquel%20de%20Lima%20Machado.pdf.jpg241e47a83a34633959ac93546196e618MD54ORIGINALTCC Raquel de Lima Machado.pdfTCC Raquel de Lima Machado.pdfapplication/pdf3987735https://repositorio.ucs.br/xmlui/bitstream/11338/1486/1/TCC%20Raquel%20de%20Lima%20Machado.pdfb5aa400fd802a7cb2f6c5ddcac2c8e32MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ucs.br/xmlui/bitstream/11338/1486/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5211338/14862018-08-17 06:30:11.005oai:repositorio.ucs.br:11338/1486Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório de Publicaçõeshttp://repositorio.ucs.br/oai/requestopendoar:2018-08-17T06:30:11Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)false |
dc.title.pt_BR.fl_str_mv |
Desenvolvimento de um algoritmo imunológico para agrupamento de dados |
title |
Desenvolvimento de um algoritmo imunológico para agrupamento de dados |
spellingShingle |
Desenvolvimento de um algoritmo imunológico para agrupamento de dados Machado, Raquel de Lima Processamento eletrônico de dados Estruturas de dados (Computação) |
title_short |
Desenvolvimento de um algoritmo imunológico para agrupamento de dados |
title_full |
Desenvolvimento de um algoritmo imunológico para agrupamento de dados |
title_fullStr |
Desenvolvimento de um algoritmo imunológico para agrupamento de dados |
title_full_unstemmed |
Desenvolvimento de um algoritmo imunológico para agrupamento de dados |
title_sort |
Desenvolvimento de um algoritmo imunológico para agrupamento de dados |
author |
Machado, Raquel de Lima |
author_facet |
Machado, Raquel de Lima |
author_role |
author |
dc.contributor.other.none.fl_str_mv |
Notari, Daniel Luís Ribeiro, Helena Graziottin |
dc.contributor.author.fl_str_mv |
Machado, Raquel de Lima |
dc.contributor.advisor1.fl_str_mv |
Weber, Carine Geltrudes |
contributor_str_mv |
Weber, Carine Geltrudes |
dc.subject.por.fl_str_mv |
Processamento eletrônico de dados Estruturas de dados (Computação) |
topic |
Processamento eletrônico de dados Estruturas de dados (Computação) |
description |
A tarefa de agrupar dados é de grande valia no mundo atual, visto que a quantidade de dados armazenados e manipulados tem crescido muito. O principal objetivo de um processo de agrupamento é formar grupos de instâncias, de forma a aumentar a homogeneidade dentro do grupo e a heterogeneidade entre grupos. Um processo de agrupamento é composto por cinco etapas principais: (a) preparação dos dados, (b) escolha de uma medida de similaridade, (c) seleção de uma técnica de agrupamento, (d) validação dos grupos formados e por fim, (e) a interpretação dos resultados. Este trabalho apresenta uma revisão de cada uma dessas etapas separadamente. Sabe-se que cada problema de agrupamento pode ser melhor resolvido por um método adequado , porém nem todos os métodos conseguem resolver todos os problemas de uma maneira satisfatória. O objetivo deste trabalho é propor um algoritmo para agrupamento de dados com base no comportamento do sistema imunológico. Os sistemas imunológicos artificiais se baseiam nos processos do sistema imune dos vertebrados, em especial na teoria da seleção clonal, no princípio da seleção negativa e na teoria das redes imunológicas. Todas elas auxiliam na construção de novos algoritmos, como o sistema imunológico de reconhecimento de padrão e alguns algoritmos de agrupamento descritos neste trabalho. Partindo-se do estudo de agrupamento de dados e das teorias do sistema imunológico artificial é proposto um algoritmo que tem como entrada um dataset, e como saída um conjunto de grupos dos dados. O algoritmo foi desenvolvido utilizando a linguagem Java e sua arquitetura foi feita em três camadas. Foram realizados testes em três datasets públicos: Iris Plants Database, Wisconsin Breast Cancer Database e Diabetes Data Set. Os resultados obtidos de cada um dos datasets foram comparados com os resultados do algoritmo k-means. O algoritmo imunológico se mostrou tão ou mais eficiente que o algoritmo k-means em todos os datasets testados (sic). |
publishDate |
2011 |
dc.date.submitted.none.fl_str_mv |
2011 |
dc.date.accessioned.fl_str_mv |
2017-02-01T17:41:56Z |
dc.date.available.fl_str_mv |
2017-02-01T17:41:56Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ucs.br/handle/11338/1486 |
url |
https://repositorio.ucs.br/handle/11338/1486 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UCS instname:Universidade de Caxias do Sul (UCS) instacron:UCS |
instname_str |
Universidade de Caxias do Sul (UCS) |
instacron_str |
UCS |
institution |
UCS |
reponame_str |
Repositório Institucional da UCS |
collection |
Repositório Institucional da UCS |
bitstream.url.fl_str_mv |
https://repositorio.ucs.br/xmlui/bitstream/11338/1486/3/TCC%20Raquel%20de%20Lima%20Machado.pdf.txt https://repositorio.ucs.br/xmlui/bitstream/11338/1486/4/TCC%20Raquel%20de%20Lima%20Machado.pdf.jpg https://repositorio.ucs.br/xmlui/bitstream/11338/1486/1/TCC%20Raquel%20de%20Lima%20Machado.pdf https://repositorio.ucs.br/xmlui/bitstream/11338/1486/2/license.txt |
bitstream.checksum.fl_str_mv |
c6dc5e886f93aa672e43ff4343e855fa 241e47a83a34633959ac93546196e618 b5aa400fd802a7cb2f6c5ddcac2c8e32 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS) |
repository.mail.fl_str_mv |
|
_version_ |
1798308889135939584 |