Topological data analysis: applications in machine learning
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Tese |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | http://www.teses.usp.br/teses/disponiveis/55/55134/tde-03012019-094950/ |
Resumo: | Recently computational topology had an important development in data analysis giving birth to the field of Topological Data Analysis. Persistent homology appears as a fundamental tool based on the topology of data that can be represented as points in metric space. In this work, we apply techniques of Topological Data Analysis, more precisely, we use persistent homology to calculate topological features more persistent in data. In this sense, the persistence diagrams are processed as feature vectors for applying Machine Learning algorithms. In order to classification, we used the following classifiers: Partial Least Squares-Discriminant Analysis, Support Vector Machine, and Naive Bayes. For regression, we used Support Vector Regression and KNeighbors. Finally, we will give a certain statistical approach to analyze the accuracy of each classifier and regressor. |
id |
USP_e1e6246c54f17ec288aefb0ddcd95fec |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-03012019-094950 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Topological data analysis: applications in machine learningAnálise topológica de dados: aplicações em aprendizado de máquinaBetti numbersClassificação de proteínasClassificador Naive BayesClassificador PLS-DAClassificador SVMDiagramas de persistenciaHomologia persistenteKNeighbors regressorNaive Bayes classifierNúmeros de BettiPersistence diagramsPersistent homologyPLS-DA classifierProtein classificationRegressor KNeighborsRegressor SVRSVM classifierSVR regressorRecently computational topology had an important development in data analysis giving birth to the field of Topological Data Analysis. Persistent homology appears as a fundamental tool based on the topology of data that can be represented as points in metric space. In this work, we apply techniques of Topological Data Analysis, more precisely, we use persistent homology to calculate topological features more persistent in data. In this sense, the persistence diagrams are processed as feature vectors for applying Machine Learning algorithms. In order to classification, we used the following classifiers: Partial Least Squares-Discriminant Analysis, Support Vector Machine, and Naive Bayes. For regression, we used Support Vector Regression and KNeighbors. Finally, we will give a certain statistical approach to analyze the accuracy of each classifier and regressor.Recentemente a topologia computacional teve um importante desenvolvimento na análise de dados dando origem ao campo da Análise Topológica de Dados. A homologia persistente aparece como uma ferramenta fundamental baseada na topologia de dados que possam ser representados como pontos num espaço métrico. Neste trabalho, aplicamos técnicas da Análise Topológica de Dados, mais precisamente, usamos homologia persistente para calcular características topológicas mais persistentes em dados. Nesse sentido, os diagramas de persistencia são processados como vetores de características para posteriormente aplicar algoritmos de Aprendizado de Máquina. Para classificação, foram utilizados os seguintes classificadores: Análise de Discriminantes de Minimos Quadrados Parciais, Máquina de Vetores de Suporte, e Naive Bayes. Para a regressão, usamos a Regressão de Vetores de Suporte e KNeighbors. Finalmente, daremos uma certa abordagem estatística para analisar a precisão de cada classificador e regressor.Biblioteca Digitais de Teses e Dissertações da USPGameiro, Márcio FuzetoCalcina, Sabrina Graciela Suárez2018-12-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/55/55134/tde-03012019-094950/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2019-04-09T23:21:59Zoai:teses.usp.br:tde-03012019-094950Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212019-04-09T23:21:59Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Topological data analysis: applications in machine learning Análise topológica de dados: aplicações em aprendizado de máquina |
title |
Topological data analysis: applications in machine learning |
spellingShingle |
Topological data analysis: applications in machine learning Calcina, Sabrina Graciela Suárez Betti numbers Classificação de proteínas Classificador Naive Bayes Classificador PLS-DA Classificador SVM Diagramas de persistencia Homologia persistente KNeighbors regressor Naive Bayes classifier Números de Betti Persistence diagrams Persistent homology PLS-DA classifier Protein classification Regressor KNeighbors Regressor SVR SVM classifier SVR regressor |
title_short |
Topological data analysis: applications in machine learning |
title_full |
Topological data analysis: applications in machine learning |
title_fullStr |
Topological data analysis: applications in machine learning |
title_full_unstemmed |
Topological data analysis: applications in machine learning |
title_sort |
Topological data analysis: applications in machine learning |
author |
Calcina, Sabrina Graciela Suárez |
author_facet |
Calcina, Sabrina Graciela Suárez |
author_role |
author |
dc.contributor.none.fl_str_mv |
Gameiro, Márcio Fuzeto |
dc.contributor.author.fl_str_mv |
Calcina, Sabrina Graciela Suárez |
dc.subject.por.fl_str_mv |
Betti numbers Classificação de proteínas Classificador Naive Bayes Classificador PLS-DA Classificador SVM Diagramas de persistencia Homologia persistente KNeighbors regressor Naive Bayes classifier Números de Betti Persistence diagrams Persistent homology PLS-DA classifier Protein classification Regressor KNeighbors Regressor SVR SVM classifier SVR regressor |
topic |
Betti numbers Classificação de proteínas Classificador Naive Bayes Classificador PLS-DA Classificador SVM Diagramas de persistencia Homologia persistente KNeighbors regressor Naive Bayes classifier Números de Betti Persistence diagrams Persistent homology PLS-DA classifier Protein classification Regressor KNeighbors Regressor SVR SVM classifier SVR regressor |
description |
Recently computational topology had an important development in data analysis giving birth to the field of Topological Data Analysis. Persistent homology appears as a fundamental tool based on the topology of data that can be represented as points in metric space. In this work, we apply techniques of Topological Data Analysis, more precisely, we use persistent homology to calculate topological features more persistent in data. In this sense, the persistence diagrams are processed as feature vectors for applying Machine Learning algorithms. In order to classification, we used the following classifiers: Partial Least Squares-Discriminant Analysis, Support Vector Machine, and Naive Bayes. For regression, we used Support Vector Regression and KNeighbors. Finally, we will give a certain statistical approach to analyze the accuracy of each classifier and regressor. |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-12-05 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://www.teses.usp.br/teses/disponiveis/55/55134/tde-03012019-094950/ |
url |
http://www.teses.usp.br/teses/disponiveis/55/55134/tde-03012019-094950/ |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256625920868352 |