Um sistema imunológico artificial para classificação hierárquica e multi-label de funções de proteínas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2010 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/1057 |
Resumo: | Esta tese propõe um novo algoritmo baseado em Sistemas Imunológicos Artificiais (SIA) para classificação hierárquica e multi-label, onde os classificadores gerados são representados na forma de regras SE-ENTÃO. A classificação hierárquica e multi-label é considerada desafiadora uma vez que um exemplo está associado a uma ou mais classes organizadas hierarquicamente, sendo que esta organização estrutural de classes deve ser considerada na construção dos classificadores. A técnica proposta aborda a construção de classificadores hierárquicos locais (onde cada classificador processa apenas exemplos de classes em uma região local da hierarquia) e globais (onde um único classificador processa exemplos de todas as classes ao mesmo tempo). A área de aplicação utilizada para validação desta tese foi a predição de função biológica de proteínas usando termos da ontologia gênica como classes a serem preditas pelo SIA. O desempenho do algoritmo é avaliado experimentalmente para 10 bases de proteínas. Os critérios de avaliação do algoritmo nos experimentos computacionais são a precisão preditiva (taxa de acerto e área da curva precision-recall) e a simplicidade do conhecimento descoberto (medida pelo número de regras e número total de condições nas regras descobertas). Os experimentos computacionais permitem identificar parâmetros e procedimentos que influenciam no desempenho da técnica proposta. Os testes comparativos com outras abordagens mostram que sobre alguns conjuntos de experimentos a abordagem proposta se mostrou superior, enquanto em outros conjuntos não foi possível superar a técnica da literatura usada para comparação. |
id |
UTFPR-12_ee94008f7da3b140b4b9fcb58346e41a |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/1057 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2015-02-09T18:46:47Z2015-02-09T18:46:47Z2010-02-26ALVES, Roberto Teixeira. Um sistema imunológico artificial para classificação hierárquica e multi-label de funções de proteínas. 2010. 219 f. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) – Universidade Tecnológica Federal do Paraná, Curitiba, 2010.http://repositorio.utfpr.edu.br/jspui/handle/1/1057Esta tese propõe um novo algoritmo baseado em Sistemas Imunológicos Artificiais (SIA) para classificação hierárquica e multi-label, onde os classificadores gerados são representados na forma de regras SE-ENTÃO. A classificação hierárquica e multi-label é considerada desafiadora uma vez que um exemplo está associado a uma ou mais classes organizadas hierarquicamente, sendo que esta organização estrutural de classes deve ser considerada na construção dos classificadores. A técnica proposta aborda a construção de classificadores hierárquicos locais (onde cada classificador processa apenas exemplos de classes em uma região local da hierarquia) e globais (onde um único classificador processa exemplos de todas as classes ao mesmo tempo). A área de aplicação utilizada para validação desta tese foi a predição de função biológica de proteínas usando termos da ontologia gênica como classes a serem preditas pelo SIA. O desempenho do algoritmo é avaliado experimentalmente para 10 bases de proteínas. Os critérios de avaliação do algoritmo nos experimentos computacionais são a precisão preditiva (taxa de acerto e área da curva precision-recall) e a simplicidade do conhecimento descoberto (medida pelo número de regras e número total de condições nas regras descobertas). Os experimentos computacionais permitem identificar parâmetros e procedimentos que influenciam no desempenho da técnica proposta. Os testes comparativos com outras abordagens mostram que sobre alguns conjuntos de experimentos a abordagem proposta se mostrou superior, enquanto em outros conjuntos não foi possível superar a técnica da literatura usada para comparação.This thesis proposes a new approach based on Artificial Immune System (AIS) for hierarchical multi-label classification, where the classifiers produced by the system are represented in the form of IF-THEN classification rules. Hierarchical multi-label classification is a challenging problem, because an example is associated with one or more classes organized into a hierarchy and the class hierarchy must be considered in the construction of the classifiers. The proposed method addresses the construction of local hierarchical classifiers (where each classifier processes only examples of classes in a local region of the hierarchy) and global hierarchical classifiers (where a single classifier processes examples of all classes at the same time). The application domain used to validate the proposed methods was the prediction of the biological function of proteins, using terms of the Gene Ontology as classes to be predicted by the AIS. The performance of the algorithm was evaluated in computational experiments with 10 datasets of proteins. The evaluation criteria in these experiments were the predictive accuracy (accuracy rate and the area under the precision-recall curve) and the simplicity of the discovered knowledge (measured by the number of rules and total number of conditions in the discovered rules). The computational experiments allowed the identification of parameter settings and procedures that significantly influence the performance of the proposed method. The experiments comparing the proposed method with other methods have shown that in some datasets the proposed method outperformed other methods, whilst in other datasets it was not possible to outperform other methods proposed in the literature.CAPESporUniversidade Tecnológica Federal do ParanáCuritibaPrograma de Pós-Graduação em Engenharia Elétrica e Informática IndustrialBioinformáticaSistema imunológico - Simulação por computadorMineração de dados (Computação)Engenharia elétricaBioinformaticsImmune system - Computer simulationData miningElectric engineeringUm sistema imunológico artificial para classificação hierárquica e multi-label de funções de proteínasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisCuritibaDoutoradoDelgado, Myriam Regattieri De Biase da SilvaFreitas, Alex AlvesAlves, Roberto Teixeirareponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRinfo:eu-repo/semantics/openAccessTHUMBNAILCT_CPGEI_D_Alves, Roberto Teixeira_2010.pdf.jpgCT_CPGEI_D_Alves, Roberto Teixeira_2010.pdf.jpgGenerated Thumbnailimage/jpeg1210http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/1057/4/CT_CPGEI_D_Alves%2c%20Roberto%20Teixeira_2010.pdf.jpgeb5637565f311535b5d7a9b252fe449bMD54ORIGINALCT_CPGEI_D_Alves, Roberto Teixeira_2010.pdfCT_CPGEI_D_Alves, Roberto Teixeira_2010.pdfapplication/pdf9000341http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/1057/1/CT_CPGEI_D_Alves%2c%20Roberto%20Teixeira_2010.pdf4bafccb0dd5cd319e0a1955000c3ff4fMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81292http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/1057/2/license.txt009f5cba5f69d75c09da00b6f53f483aMD52TEXTCT_CPGEI_D_Alves, Roberto Teixeira_2010.pdf.txtCT_CPGEI_D_Alves, Roberto Teixeira_2010.pdf.txtExtracted texttext/plain412681http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/1057/3/CT_CPGEI_D_Alves%2c%20Roberto%20Teixeira_2010.pdf.txta82851b6d620dd116825d95474077bbdMD531/10572021-12-16 18:18:57.512oai:repositorio.utfpr.edu.br:1/1057ICBOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IgZGEgcHVibGljYcOnw6NvLCBhdXRvcml6byBhIFVURlBSIGEgdmVpY3VsYXIsIAphdHJhdsOpcyBkbyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGVtIEFjZXNzbyBBYmVydG8gKFBJQUEpIGUgZG9zIENhdMOhbG9nb3MgZGFzIEJpYmxpb3RlY2FzIApkZXN0YSBJbnN0aXR1acOnw6NvLCBzZW0gcmVzc2FyY2ltZW50byBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIGRlIGFjb3JkbyBjb20gYSBMZWkgbm8gOS42MTAvOTgsIApvIHRleHRvIGRlc3RhIG9icmEsIG9ic2VydmFuZG8gYXMgY29uZGnDp8O1ZXMgZGUgZGlzcG9uaWJpbGl6YcOnw6NvIHJlZ2lzdHJhZGFzIG5vIGl0ZW0gNCBkbyAK4oCcVGVybW8gZGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBkZSBUcmFiYWxob3MgZGUgQ29uY2x1c8OjbyBkZSBDdXJzbyBkZSBHcmFkdWHDp8OjbyBlIApFc3BlY2lhbGl6YcOnw6NvLCBEaXNzZXJ0YcOnw7VlcyBlIFRlc2VzIG5vIFBvcnRhbCBkZSBJbmZvcm1hw6fDo28gZSBub3MgQ2F0w6Fsb2dvcyBFbGV0csO0bmljb3MgZG8gClNpc3RlbWEgZGUgQmlibGlvdGVjYXMgZGEgVVRGUFLigJ0sIHBhcmEgZmlucyBkZSBsZWl0dXJhLCBpbXByZXNzw6NvIGUvb3UgZG93bmxvYWQsIHZpc2FuZG8gYSAKZGl2dWxnYcOnw6NvIGRhIHByb2R1w6fDo28gY2llbnTDrWZpY2EgYnJhc2lsZWlyYS4KCiAgQXMgdmlhcyBvcmlnaW5haXMgZSBhc3NpbmFkYXMgcGVsbyhzKSBhdXRvcihlcykgZG8g4oCcVGVybW8gZGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBkZSAKVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSBFc3BlY2lhbGl6YcOnw6NvLCBEaXNzZXJ0YcOnw7VlcyBlIFRlc2VzIG5vIFBvcnRhbCAKZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIFNpc3RlbWEgZGUgQmlibGlvdGVjYXMgZGEgVVRGUFLigJ0gZSBkYSDigJxEZWNsYXJhw6fDo28gCmRlIEF1dG9yaWHigJ0gZW5jb250cmFtLXNlIGFycXVpdmFkYXMgbmEgQmlibGlvdGVjYSBkbyBDw6JtcHVzIG5vIHF1YWwgbyB0cmFiYWxobyBmb2kgZGVmZW5kaWRvLiAKTm8gY2FzbyBkZSBwdWJsaWNhw6fDtWVzIGRlIGF1dG9yaWEgY29sZXRpdmEgZSBtdWx0aWPDom1wdXMsIG9zIGRvY3VtZW50b3MgZmljYXLDo28gc29iIGd1YXJkYSBkYSAKQmlibGlvdGVjYSBjb20gYSBxdWFsIG8g4oCccHJpbWVpcm8gYXV0b3LigJ0gcG9zc3VhIHbDrW5jdWxvLgo=Repositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2021-12-16T20:18:57Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Um sistema imunológico artificial para classificação hierárquica e multi-label de funções de proteínas |
title |
Um sistema imunológico artificial para classificação hierárquica e multi-label de funções de proteínas |
spellingShingle |
Um sistema imunológico artificial para classificação hierárquica e multi-label de funções de proteínas Alves, Roberto Teixeira Bioinformática Sistema imunológico - Simulação por computador Mineração de dados (Computação) Engenharia elétrica Bioinformatics Immune system - Computer simulation Data mining Electric engineering |
title_short |
Um sistema imunológico artificial para classificação hierárquica e multi-label de funções de proteínas |
title_full |
Um sistema imunológico artificial para classificação hierárquica e multi-label de funções de proteínas |
title_fullStr |
Um sistema imunológico artificial para classificação hierárquica e multi-label de funções de proteínas |
title_full_unstemmed |
Um sistema imunológico artificial para classificação hierárquica e multi-label de funções de proteínas |
title_sort |
Um sistema imunológico artificial para classificação hierárquica e multi-label de funções de proteínas |
author |
Alves, Roberto Teixeira |
author_facet |
Alves, Roberto Teixeira |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Delgado, Myriam Regattieri De Biase da Silva |
dc.contributor.advisor-co1.fl_str_mv |
Freitas, Alex Alves |
dc.contributor.author.fl_str_mv |
Alves, Roberto Teixeira |
contributor_str_mv |
Delgado, Myriam Regattieri De Biase da Silva Freitas, Alex Alves |
dc.subject.por.fl_str_mv |
Bioinformática Sistema imunológico - Simulação por computador Mineração de dados (Computação) Engenharia elétrica Bioinformatics Immune system - Computer simulation Data mining Electric engineering |
topic |
Bioinformática Sistema imunológico - Simulação por computador Mineração de dados (Computação) Engenharia elétrica Bioinformatics Immune system - Computer simulation Data mining Electric engineering |
description |
Esta tese propõe um novo algoritmo baseado em Sistemas Imunológicos Artificiais (SIA) para classificação hierárquica e multi-label, onde os classificadores gerados são representados na forma de regras SE-ENTÃO. A classificação hierárquica e multi-label é considerada desafiadora uma vez que um exemplo está associado a uma ou mais classes organizadas hierarquicamente, sendo que esta organização estrutural de classes deve ser considerada na construção dos classificadores. A técnica proposta aborda a construção de classificadores hierárquicos locais (onde cada classificador processa apenas exemplos de classes em uma região local da hierarquia) e globais (onde um único classificador processa exemplos de todas as classes ao mesmo tempo). A área de aplicação utilizada para validação desta tese foi a predição de função biológica de proteínas usando termos da ontologia gênica como classes a serem preditas pelo SIA. O desempenho do algoritmo é avaliado experimentalmente para 10 bases de proteínas. Os critérios de avaliação do algoritmo nos experimentos computacionais são a precisão preditiva (taxa de acerto e área da curva precision-recall) e a simplicidade do conhecimento descoberto (medida pelo número de regras e número total de condições nas regras descobertas). Os experimentos computacionais permitem identificar parâmetros e procedimentos que influenciam no desempenho da técnica proposta. Os testes comparativos com outras abordagens mostram que sobre alguns conjuntos de experimentos a abordagem proposta se mostrou superior, enquanto em outros conjuntos não foi possível superar a técnica da literatura usada para comparação. |
publishDate |
2010 |
dc.date.issued.fl_str_mv |
2010-02-26 |
dc.date.accessioned.fl_str_mv |
2015-02-09T18:46:47Z |
dc.date.available.fl_str_mv |
2015-02-09T18:46:47Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
ALVES, Roberto Teixeira. Um sistema imunológico artificial para classificação hierárquica e multi-label de funções de proteínas. 2010. 219 f. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) – Universidade Tecnológica Federal do Paraná, Curitiba, 2010. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/1057 |
identifier_str_mv |
ALVES, Roberto Teixeira. Um sistema imunológico artificial para classificação hierárquica e multi-label de funções de proteínas. 2010. 219 f. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) – Universidade Tecnológica Federal do Paraná, Curitiba, 2010. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/1057 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Curitiba |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Curitiba |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/1057/4/CT_CPGEI_D_Alves%2c%20Roberto%20Teixeira_2010.pdf.jpg http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/1057/1/CT_CPGEI_D_Alves%2c%20Roberto%20Teixeira_2010.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/1057/2/license.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/1057/3/CT_CPGEI_D_Alves%2c%20Roberto%20Teixeira_2010.pdf.txt |
bitstream.checksum.fl_str_mv |
eb5637565f311535b5d7a9b252fe449b 4bafccb0dd5cd319e0a1955000c3ff4f 009f5cba5f69d75c09da00b6f53f483a a82851b6d620dd116825d95474077bbd |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1805923152083025920 |