Ellipsoid clustering machine: a front line to aid in disease diagnosis
Autor(a) principal: | |
---|---|
Data de Publicação: | 2007 |
Outros Autores: | , , , , |
Tipo de documento: | Artigo |
Idioma: | por eng |
Título da fonte: | RECIIS (Online) |
Texto Completo: | https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/926 |
Resumo: | This study presents a new machine learning strategy to address the disease diagnosis classification problem that comprises an unknown number of disease classes. This is exemplified by a software called Ellipsoid Clustering Machine (ECM) that identifies conserved regions in mass spectrometry proteomic profiles obtained from control subjects and uses these to estimate classification boundaries based on sample variance. The software can also be used for visual inspection of data reproducibility. ECM was evaluated using mass spectrometry protein profiles obtained from serum of Hodgkin’s disease patients (HD) and control subjects. According to the leave-one-out cross validation, ECM completely separated both groups based only on the information derived from four selected mass spectral peaks. Classification details and a 3D graphical model showing the separation between the control subject cluster and HD patients is also presented. The software is available on the project website together with online interactive models of the dataset and an animation demonstrating the method. |
id |
FIOCRUZ-6_e6f314032476377a8e6a665ead74be49 |
---|---|
oai_identifier_str |
oai:www.reciis.icict.fiocruz.br:article/926 |
network_acronym_str |
FIOCRUZ-6 |
network_name_str |
RECIIS (Online) |
repository_id_str |
|
spelling |
Ellipsoid clustering machine: a front line to aid in disease diagnosisMáquina de agrupamento por elipsóide: uma linha de frente para auxiliar no diagnóstico de doençasMass spectrometrymachine learningpattern recognitionclusteringHodgkin’s diseaseproteomicsEspectrometria de massaaprendizagem de máquinareconhecimento de padrõesclusteringdoença de HodgkinproteômicaThis study presents a new machine learning strategy to address the disease diagnosis classification problem that comprises an unknown number of disease classes. This is exemplified by a software called Ellipsoid Clustering Machine (ECM) that identifies conserved regions in mass spectrometry proteomic profiles obtained from control subjects and uses these to estimate classification boundaries based on sample variance. The software can also be used for visual inspection of data reproducibility. ECM was evaluated using mass spectrometry protein profiles obtained from serum of Hodgkin’s disease patients (HD) and control subjects. According to the leave-one-out cross validation, ECM completely separated both groups based only on the information derived from four selected mass spectral peaks. Classification details and a 3D graphical model showing the separation between the control subject cluster and HD patients is also presented. The software is available on the project website together with online interactive models of the dataset and an animation demonstrating the method.Este estudo apresenta nova estratégia de inferência direcionada a detectar presença de doenças em amostras biológicas. Diferencialmente dos métodos existentes, esta técnica é aplicável quando o número de patologias e as mesmas são desconhecidos. Esta é exemplificada através de software que denominamos “Máquina de Agrupamento por Elipsóide”, do inglês, Ellipsoid Clustering Machine (ECM). O mesmo identifica regiões conservadas em perfis proteômicos obtidos por espectrometria de massa de amostras biológicas de indivíduos controles e estima limites para classifica- ção baseando-se na variância da expressão protéica. O software também pode ser utilizado para inspeção visual de reprodutibilidade de dados. O ECM foi avaliado utilizando perfis protéicos do soro de pacientes com a doença de Hodgkin e de indivíduos controle. De acordo com a validação cruzada leave-one-out, o ECM separou corretamente os grupos se baseando apenas na informação de quatro picos espectrais selecionados. Este trabalho descreve o algoritmo e apresenta imagens de modelos 3D representativos da separação. O software está disponível na página do projeto na internet junto com modelos interativos e uma animação demonstrando o método.Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict/Fiocruz)2007-12-31info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionAvaliado pelos paresapplication/pdfapplication/pdfhttps://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/92610.3395/reciis.v1i2.926Revista Eletrônica de Comunicação, Informação & Inovação em Saúde; Vol. 1 No. 2 (2007): Suplemento - Bioinformática e SaúdeRevista Eletrônica de Comunicação, Informação e Inovação em Saúde; Vol. 1 Núm. 2 (2007): Suplemento - Bioinformática e SaúdeRevue de la Communication, de l'Information et de l'Innovation en santé; Vol. 1 No 2 (2007): Suplemento - Bioinformática e SaúdeRevista Eletrônica de Comunicação, Informação & Inovação em Saúde; v. 1 n. 2 (2007): Suplemento - Bioinformática e Saúde1981-6278reponame:RECIIS (Online)instname:Fundação Oswaldo Cruz (FIOCRUZ)instacron:FIOCRUZporenghttps://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/926/1571https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/926/1624Copyright (c) 2018 Revista Eletrônica de Comunicação, Informação & Inovação em Saúdeinfo:eu-repo/semantics/openAccessCarvalho, Paulo CostaFischer, Juliana de Saldanha GamaBarbosa, Valmir CarneiroDomont, Gilberto BarbosaDegrave, Wim Maurits SylvainCarvalho, Maria da Gloria da Costa2022-08-11T14:24:57Zoai:www.reciis.icict.fiocruz.br:article/926Revistahttps://www.reciis.icict.fiocruz.br/index.php/reciishttps://www.reciis.icict.fiocruz.br/index.php/reciis/oaireciis@icict.fiocruz.br1981-62781981-6278opendoar:2022-08-11T14:24:57RECIIS (Online) - Fundação Oswaldo Cruz (FIOCRUZ)false |
dc.title.none.fl_str_mv |
Ellipsoid clustering machine: a front line to aid in disease diagnosis Máquina de agrupamento por elipsóide: uma linha de frente para auxiliar no diagnóstico de doenças |
title |
Ellipsoid clustering machine: a front line to aid in disease diagnosis |
spellingShingle |
Ellipsoid clustering machine: a front line to aid in disease diagnosis Carvalho, Paulo Costa Mass spectrometry machine learning pattern recognition clustering Hodgkin’s disease proteomics Espectrometria de massa aprendizagem de máquina reconhecimento de padrões clustering doença de Hodgkin proteômica |
title_short |
Ellipsoid clustering machine: a front line to aid in disease diagnosis |
title_full |
Ellipsoid clustering machine: a front line to aid in disease diagnosis |
title_fullStr |
Ellipsoid clustering machine: a front line to aid in disease diagnosis |
title_full_unstemmed |
Ellipsoid clustering machine: a front line to aid in disease diagnosis |
title_sort |
Ellipsoid clustering machine: a front line to aid in disease diagnosis |
author |
Carvalho, Paulo Costa |
author_facet |
Carvalho, Paulo Costa Fischer, Juliana de Saldanha Gama Barbosa, Valmir Carneiro Domont, Gilberto Barbosa Degrave, Wim Maurits Sylvain Carvalho, Maria da Gloria da Costa |
author_role |
author |
author2 |
Fischer, Juliana de Saldanha Gama Barbosa, Valmir Carneiro Domont, Gilberto Barbosa Degrave, Wim Maurits Sylvain Carvalho, Maria da Gloria da Costa |
author2_role |
author author author author author |
dc.contributor.author.fl_str_mv |
Carvalho, Paulo Costa Fischer, Juliana de Saldanha Gama Barbosa, Valmir Carneiro Domont, Gilberto Barbosa Degrave, Wim Maurits Sylvain Carvalho, Maria da Gloria da Costa |
dc.subject.por.fl_str_mv |
Mass spectrometry machine learning pattern recognition clustering Hodgkin’s disease proteomics Espectrometria de massa aprendizagem de máquina reconhecimento de padrões clustering doença de Hodgkin proteômica |
topic |
Mass spectrometry machine learning pattern recognition clustering Hodgkin’s disease proteomics Espectrometria de massa aprendizagem de máquina reconhecimento de padrões clustering doença de Hodgkin proteômica |
description |
This study presents a new machine learning strategy to address the disease diagnosis classification problem that comprises an unknown number of disease classes. This is exemplified by a software called Ellipsoid Clustering Machine (ECM) that identifies conserved regions in mass spectrometry proteomic profiles obtained from control subjects and uses these to estimate classification boundaries based on sample variance. The software can also be used for visual inspection of data reproducibility. ECM was evaluated using mass spectrometry protein profiles obtained from serum of Hodgkin’s disease patients (HD) and control subjects. According to the leave-one-out cross validation, ECM completely separated both groups based only on the information derived from four selected mass spectral peaks. Classification details and a 3D graphical model showing the separation between the control subject cluster and HD patients is also presented. The software is available on the project website together with online interactive models of the dataset and an animation demonstrating the method. |
publishDate |
2007 |
dc.date.none.fl_str_mv |
2007-12-31 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Avaliado pelos pares |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/926 10.3395/reciis.v1i2.926 |
url |
https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/926 |
identifier_str_mv |
10.3395/reciis.v1i2.926 |
dc.language.iso.fl_str_mv |
por eng |
language |
por eng |
dc.relation.none.fl_str_mv |
https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/926/1571 https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/926/1624 |
dc.rights.driver.fl_str_mv |
Copyright (c) 2018 Revista Eletrônica de Comunicação, Informação & Inovação em Saúde info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Copyright (c) 2018 Revista Eletrônica de Comunicação, Informação & Inovação em Saúde |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf application/pdf |
dc.publisher.none.fl_str_mv |
Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict/Fiocruz) |
publisher.none.fl_str_mv |
Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict/Fiocruz) |
dc.source.none.fl_str_mv |
Revista Eletrônica de Comunicação, Informação & Inovação em Saúde; Vol. 1 No. 2 (2007): Suplemento - Bioinformática e Saúde Revista Eletrônica de Comunicação, Informação e Inovação em Saúde; Vol. 1 Núm. 2 (2007): Suplemento - Bioinformática e Saúde Revue de la Communication, de l'Information et de l'Innovation en santé; Vol. 1 No 2 (2007): Suplemento - Bioinformática e Saúde Revista Eletrônica de Comunicação, Informação & Inovação em Saúde; v. 1 n. 2 (2007): Suplemento - Bioinformática e Saúde 1981-6278 reponame:RECIIS (Online) instname:Fundação Oswaldo Cruz (FIOCRUZ) instacron:FIOCRUZ |
instname_str |
Fundação Oswaldo Cruz (FIOCRUZ) |
instacron_str |
FIOCRUZ |
institution |
FIOCRUZ |
reponame_str |
RECIIS (Online) |
collection |
RECIIS (Online) |
repository.name.fl_str_mv |
RECIIS (Online) - Fundação Oswaldo Cruz (FIOCRUZ) |
repository.mail.fl_str_mv |
reciis@icict.fiocruz.br |
_version_ |
1798942464130678784 |