Ellipsoid clustering machine: a front line to aid in disease diagnosis

Detalhes bibliográficos
Autor(a) principal: Carvalho, Paulo Costa
Data de Publicação: 2007
Outros Autores: Fischer, Juliana de Saldanha Gama, Barbosa, Valmir Carneiro, Domont, Gilberto Barbosa, Degrave, Wim Maurits Sylvain, Carvalho, Maria da Gloria da Costa
Tipo de documento: Artigo
Idioma: por
eng
Título da fonte: RECIIS (Online)
Texto Completo: https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/926
Resumo: This study presents a new machine learning strategy to address the disease diagnosis classification problem that comprises an unknown number of disease classes. This is exemplified by a software called Ellipsoid Clustering Machine (ECM) that identifies conserved regions in mass spectrometry proteomic profiles obtained from control subjects and uses these to estimate classification boundaries based on sample variance. The software can also be used for visual inspection of data reproducibility. ECM was evaluated using mass spectrometry protein profiles obtained from serum of Hodgkin’s disease patients (HD) and control subjects. According to the leave-one-out cross validation, ECM completely separated both groups based only on the information derived from four selected mass spectral peaks. Classification details and a 3D graphical model showing the separation between the control subject cluster and HD patients is also presented. The software is available on the project website together with online interactive models of the dataset and an animation demonstrating the method.
id FIOCRUZ-6_e6f314032476377a8e6a665ead74be49
oai_identifier_str oai:www.reciis.icict.fiocruz.br:article/926
network_acronym_str FIOCRUZ-6
network_name_str RECIIS (Online)
repository_id_str
spelling Ellipsoid clustering machine: a front line to aid in disease diagnosisMáquina de agrupamento por elipsóide: uma linha de frente para auxiliar no diagnóstico de doençasMass spectrometrymachine learningpattern recognitionclusteringHodgkin’s diseaseproteomicsEspectrometria de massaaprendizagem de máquinareconhecimento de padrõesclusteringdoença de HodgkinproteômicaThis study presents a new machine learning strategy to address the disease diagnosis classification problem that comprises an unknown number of disease classes. This is exemplified by a software called Ellipsoid Clustering Machine (ECM) that identifies conserved regions in mass spectrometry proteomic profiles obtained from control subjects and uses these to estimate classification boundaries based on sample variance. The software can also be used for visual inspection of data reproducibility. ECM was evaluated using mass spectrometry protein profiles obtained from serum of Hodgkin’s disease patients (HD) and control subjects. According to the leave-one-out cross validation, ECM completely separated both groups based only on the information derived from four selected mass spectral peaks. Classification details and a 3D graphical model showing the separation between the control subject cluster and HD patients is also presented. The software is available on the project website together with online interactive models of the dataset and an animation demonstrating the method.Este estudo apresenta nova estratégia de inferência direcionada a detectar presença de doenças em amostras biológicas. Diferencialmente dos métodos existentes, esta técnica é aplicável quando o número de patologias e as mesmas são desconhecidos. Esta é exemplificada através de software que denominamos “Máquina de Agrupamento por Elipsóide”, do inglês, Ellipsoid Clustering Machine (ECM). O mesmo identifica regiões conservadas em perfis proteômicos obtidos por espectrometria de massa de amostras biológicas de indivíduos controles e estima limites para classifica- ção baseando-se na variância da expressão protéica. O software também pode ser utilizado para inspeção visual de reprodutibilidade de dados. O ECM foi avaliado utilizando perfis protéicos do soro de pacientes com a doença de Hodgkin e de indivíduos controle. De acordo com a validação cruzada leave-one-out, o ECM separou corretamente os grupos se baseando apenas na informação de quatro picos espectrais selecionados. Este trabalho descreve o algoritmo e apresenta imagens de modelos 3D representativos da separação. O software está disponível na página do projeto na internet junto com modelos interativos e uma animação demonstrando o método.Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict/Fiocruz)2007-12-31info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionAvaliado pelos paresapplication/pdfapplication/pdfhttps://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/92610.3395/reciis.v1i2.926Revista Eletrônica de Comunicação, Informação & Inovação em Saúde; Vol. 1 No. 2 (2007): Suplemento - Bioinformática e SaúdeRevista Eletrônica de Comunicação, Informação e Inovação em Saúde; Vol. 1 Núm. 2 (2007): Suplemento - Bioinformática e SaúdeRevue de la Communication, de l'Information et de l'Innovation en santé; Vol. 1 No 2 (2007): Suplemento - Bioinformática e SaúdeRevista Eletrônica de Comunicação, Informação & Inovação em Saúde; v. 1 n. 2 (2007): Suplemento - Bioinformática e Saúde1981-6278reponame:RECIIS (Online)instname:Fundação Oswaldo Cruz (FIOCRUZ)instacron:FIOCRUZporenghttps://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/926/1571https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/926/1624Copyright (c) 2018 Revista Eletrônica de Comunicação, Informação & Inovação em Saúdeinfo:eu-repo/semantics/openAccessCarvalho, Paulo CostaFischer, Juliana de Saldanha GamaBarbosa, Valmir CarneiroDomont, Gilberto BarbosaDegrave, Wim Maurits SylvainCarvalho, Maria da Gloria da Costa2022-08-11T14:24:57Zoai:www.reciis.icict.fiocruz.br:article/926Revistahttps://www.reciis.icict.fiocruz.br/index.php/reciishttps://www.reciis.icict.fiocruz.br/index.php/reciis/oaireciis@icict.fiocruz.br1981-62781981-6278opendoar:2022-08-11T14:24:57RECIIS (Online) - Fundação Oswaldo Cruz (FIOCRUZ)false
dc.title.none.fl_str_mv Ellipsoid clustering machine: a front line to aid in disease diagnosis
Máquina de agrupamento por elipsóide: uma linha de frente para auxiliar no diagnóstico de doenças
title Ellipsoid clustering machine: a front line to aid in disease diagnosis
spellingShingle Ellipsoid clustering machine: a front line to aid in disease diagnosis
Carvalho, Paulo Costa
Mass spectrometry
machine learning
pattern recognition
clustering
Hodgkin’s disease
proteomics
Espectrometria de massa
aprendizagem de máquina
reconhecimento de padrões
clustering
doença de Hodgkin
proteômica
title_short Ellipsoid clustering machine: a front line to aid in disease diagnosis
title_full Ellipsoid clustering machine: a front line to aid in disease diagnosis
title_fullStr Ellipsoid clustering machine: a front line to aid in disease diagnosis
title_full_unstemmed Ellipsoid clustering machine: a front line to aid in disease diagnosis
title_sort Ellipsoid clustering machine: a front line to aid in disease diagnosis
author Carvalho, Paulo Costa
author_facet Carvalho, Paulo Costa
Fischer, Juliana de Saldanha Gama
Barbosa, Valmir Carneiro
Domont, Gilberto Barbosa
Degrave, Wim Maurits Sylvain
Carvalho, Maria da Gloria da Costa
author_role author
author2 Fischer, Juliana de Saldanha Gama
Barbosa, Valmir Carneiro
Domont, Gilberto Barbosa
Degrave, Wim Maurits Sylvain
Carvalho, Maria da Gloria da Costa
author2_role author
author
author
author
author
dc.contributor.author.fl_str_mv Carvalho, Paulo Costa
Fischer, Juliana de Saldanha Gama
Barbosa, Valmir Carneiro
Domont, Gilberto Barbosa
Degrave, Wim Maurits Sylvain
Carvalho, Maria da Gloria da Costa
dc.subject.por.fl_str_mv Mass spectrometry
machine learning
pattern recognition
clustering
Hodgkin’s disease
proteomics
Espectrometria de massa
aprendizagem de máquina
reconhecimento de padrões
clustering
doença de Hodgkin
proteômica
topic Mass spectrometry
machine learning
pattern recognition
clustering
Hodgkin’s disease
proteomics
Espectrometria de massa
aprendizagem de máquina
reconhecimento de padrões
clustering
doença de Hodgkin
proteômica
description This study presents a new machine learning strategy to address the disease diagnosis classification problem that comprises an unknown number of disease classes. This is exemplified by a software called Ellipsoid Clustering Machine (ECM) that identifies conserved regions in mass spectrometry proteomic profiles obtained from control subjects and uses these to estimate classification boundaries based on sample variance. The software can also be used for visual inspection of data reproducibility. ECM was evaluated using mass spectrometry protein profiles obtained from serum of Hodgkin’s disease patients (HD) and control subjects. According to the leave-one-out cross validation, ECM completely separated both groups based only on the information derived from four selected mass spectral peaks. Classification details and a 3D graphical model showing the separation between the control subject cluster and HD patients is also presented. The software is available on the project website together with online interactive models of the dataset and an animation demonstrating the method.
publishDate 2007
dc.date.none.fl_str_mv 2007-12-31
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Avaliado pelos pares
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/926
10.3395/reciis.v1i2.926
url https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/926
identifier_str_mv 10.3395/reciis.v1i2.926
dc.language.iso.fl_str_mv por
eng
language por
eng
dc.relation.none.fl_str_mv https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/926/1571
https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/926/1624
dc.rights.driver.fl_str_mv Copyright (c) 2018 Revista Eletrônica de Comunicação, Informação & Inovação em Saúde
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2018 Revista Eletrônica de Comunicação, Informação & Inovação em Saúde
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict/Fiocruz)
publisher.none.fl_str_mv Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict/Fiocruz)
dc.source.none.fl_str_mv Revista Eletrônica de Comunicação, Informação & Inovação em Saúde; Vol. 1 No. 2 (2007): Suplemento - Bioinformática e Saúde
Revista Eletrônica de Comunicação, Informação e Inovação em Saúde; Vol. 1 Núm. 2 (2007): Suplemento - Bioinformática e Saúde
Revue de la Communication, de l'Information et de l'Innovation en santé; Vol. 1 No 2 (2007): Suplemento - Bioinformática e Saúde
Revista Eletrônica de Comunicação, Informação & Inovação em Saúde; v. 1 n. 2 (2007): Suplemento - Bioinformática e Saúde
1981-6278
reponame:RECIIS (Online)
instname:Fundação Oswaldo Cruz (FIOCRUZ)
instacron:FIOCRUZ
instname_str Fundação Oswaldo Cruz (FIOCRUZ)
instacron_str FIOCRUZ
institution FIOCRUZ
reponame_str RECIIS (Online)
collection RECIIS (Online)
repository.name.fl_str_mv RECIIS (Online) - Fundação Oswaldo Cruz (FIOCRUZ)
repository.mail.fl_str_mv reciis@icict.fiocruz.br
_version_ 1798942464130678784