Topological data analysis: applications in machine learning

Detalhes bibliográficos
Autor(a) principal: Calcina, Sabrina Graciela Suárez
Data de Publicação: 2018
Tipo de documento: Tese
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-03012019-094950/
Resumo: Recently computational topology had an important development in data analysis giving birth to the field of Topological Data Analysis. Persistent homology appears as a fundamental tool based on the topology of data that can be represented as points in metric space. In this work, we apply techniques of Topological Data Analysis, more precisely, we use persistent homology to calculate topological features more persistent in data. In this sense, the persistence diagrams are processed as feature vectors for applying Machine Learning algorithms. In order to classification, we used the following classifiers: Partial Least Squares-Discriminant Analysis, Support Vector Machine, and Naive Bayes. For regression, we used Support Vector Regression and KNeighbors. Finally, we will give a certain statistical approach to analyze the accuracy of each classifier and regressor.
id USP_e1e6246c54f17ec288aefb0ddcd95fec
oai_identifier_str oai:teses.usp.br:tde-03012019-094950
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Topological data analysis: applications in machine learningAnálise topológica de dados: aplicações em aprendizado de máquinaBetti numbersClassificação de proteínasClassificador Naive BayesClassificador PLS-DAClassificador SVMDiagramas de persistenciaHomologia persistenteKNeighbors regressorNaive Bayes classifierNúmeros de BettiPersistence diagramsPersistent homologyPLS-DA classifierProtein classificationRegressor KNeighborsRegressor SVRSVM classifierSVR regressorRecently computational topology had an important development in data analysis giving birth to the field of Topological Data Analysis. Persistent homology appears as a fundamental tool based on the topology of data that can be represented as points in metric space. In this work, we apply techniques of Topological Data Analysis, more precisely, we use persistent homology to calculate topological features more persistent in data. In this sense, the persistence diagrams are processed as feature vectors for applying Machine Learning algorithms. In order to classification, we used the following classifiers: Partial Least Squares-Discriminant Analysis, Support Vector Machine, and Naive Bayes. For regression, we used Support Vector Regression and KNeighbors. Finally, we will give a certain statistical approach to analyze the accuracy of each classifier and regressor.Recentemente a topologia computacional teve um importante desenvolvimento na análise de dados dando origem ao campo da Análise Topológica de Dados. A homologia persistente aparece como uma ferramenta fundamental baseada na topologia de dados que possam ser representados como pontos num espaço métrico. Neste trabalho, aplicamos técnicas da Análise Topológica de Dados, mais precisamente, usamos homologia persistente para calcular características topológicas mais persistentes em dados. Nesse sentido, os diagramas de persistencia são processados como vetores de características para posteriormente aplicar algoritmos de Aprendizado de Máquina. Para classificação, foram utilizados os seguintes classificadores: Análise de Discriminantes de Minimos Quadrados Parciais, Máquina de Vetores de Suporte, e Naive Bayes. Para a regressão, usamos a Regressão de Vetores de Suporte e KNeighbors. Finalmente, daremos uma certa abordagem estatística para analisar a precisão de cada classificador e regressor.Biblioteca Digitais de Teses e Dissertações da USPGameiro, Márcio FuzetoCalcina, Sabrina Graciela Suárez2018-12-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/55/55134/tde-03012019-094950/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2019-04-09T23:21:59Zoai:teses.usp.br:tde-03012019-094950Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212019-04-09T23:21:59Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Topological data analysis: applications in machine learning
Análise topológica de dados: aplicações em aprendizado de máquina
title Topological data analysis: applications in machine learning
spellingShingle Topological data analysis: applications in machine learning
Calcina, Sabrina Graciela Suárez
Betti numbers
Classificação de proteínas
Classificador Naive Bayes
Classificador PLS-DA
Classificador SVM
Diagramas de persistencia
Homologia persistente
KNeighbors regressor
Naive Bayes classifier
Números de Betti
Persistence diagrams
Persistent homology
PLS-DA classifier
Protein classification
Regressor KNeighbors
Regressor SVR
SVM classifier
SVR regressor
title_short Topological data analysis: applications in machine learning
title_full Topological data analysis: applications in machine learning
title_fullStr Topological data analysis: applications in machine learning
title_full_unstemmed Topological data analysis: applications in machine learning
title_sort Topological data analysis: applications in machine learning
author Calcina, Sabrina Graciela Suárez
author_facet Calcina, Sabrina Graciela Suárez
author_role author
dc.contributor.none.fl_str_mv Gameiro, Márcio Fuzeto
dc.contributor.author.fl_str_mv Calcina, Sabrina Graciela Suárez
dc.subject.por.fl_str_mv Betti numbers
Classificação de proteínas
Classificador Naive Bayes
Classificador PLS-DA
Classificador SVM
Diagramas de persistencia
Homologia persistente
KNeighbors regressor
Naive Bayes classifier
Números de Betti
Persistence diagrams
Persistent homology
PLS-DA classifier
Protein classification
Regressor KNeighbors
Regressor SVR
SVM classifier
SVR regressor
topic Betti numbers
Classificação de proteínas
Classificador Naive Bayes
Classificador PLS-DA
Classificador SVM
Diagramas de persistencia
Homologia persistente
KNeighbors regressor
Naive Bayes classifier
Números de Betti
Persistence diagrams
Persistent homology
PLS-DA classifier
Protein classification
Regressor KNeighbors
Regressor SVR
SVM classifier
SVR regressor
description Recently computational topology had an important development in data analysis giving birth to the field of Topological Data Analysis. Persistent homology appears as a fundamental tool based on the topology of data that can be represented as points in metric space. In this work, we apply techniques of Topological Data Analysis, more precisely, we use persistent homology to calculate topological features more persistent in data. In this sense, the persistence diagrams are processed as feature vectors for applying Machine Learning algorithms. In order to classification, we used the following classifiers: Partial Least Squares-Discriminant Analysis, Support Vector Machine, and Naive Bayes. For regression, we used Support Vector Regression and KNeighbors. Finally, we will give a certain statistical approach to analyze the accuracy of each classifier and regressor.
publishDate 2018
dc.date.none.fl_str_mv 2018-12-05
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/55/55134/tde-03012019-094950/
url http://www.teses.usp.br/teses/disponiveis/55/55134/tde-03012019-094950/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815256625920868352