Métodos espectrais para particionamento de dados e aplicações

Sibemberg, Lucas Siviero

Métodos espectrais para particionamento de dados e aplicações

Detalhes bibliográficos
Autor(a) principal:	Sibemberg, Lucas Siviero
Data de Publicação:	2022
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo:	http://hdl.handle.net/10183/241743
Resumo:	Atualmente temos uma grande quantidade de dados disponíveis e é uma tarefa muito difícil interpretá-los. Desta maneira, classificar esses dados em um pequeno número de grupos baseado em suas afinidades pode ajudar a obter informações valiosas sobre eles. Este é o objetivo dos algoritmos de clusterização (particionamento), que buscam dividir dados em um determinado número de clusters (grupos) de forma que dados que possuam mais afinidade fiquem no mesmo cluster e dados com menos afinidade fiquem em clusters diferentes. Nesta dissertação trabalhamos com métodos espectrais para particionamento de dados, que usam ingredientes de álgebra linear e teoria espectral de grafos. Em nossa primeira contribuição apresentamos os resultados que obtivemos em duas aplicações das técnicas espectrais. A primeira aplicação está relacionada ao mercado financeiro, onde apresentamos uma estratégia em que clusterizamos um conjunto de ações e utilizamos critérios relacionados ao factor investing para montar portfólios. A segunda aplicação está relacionada à pandemia da COVID-19, onde obtivemos uma classificação do estado do Rio Grande do Sul em três clusters (regiões) de risco, alto risco, médio risco e baixo risco. Terminamos apresentando um novo algoritmo de clusterização espectral, mais especificamente desenvolvemos uma nova medida de similaridade. A nossa medida apresenta uma série de vantagens: (1) o usuário não precisa definir nenhum parâmetro para utilizar a medida, tornando-a fácil de aplicar; (2) a medida é invariante sob translações e expansões; (3) a medida apresentou bom desempenho em conjuntos de dados sintéticos e, em situações reais, apresentou desempenho similar a outros métodos existentes, que precisam de pelo menos um parâmetro de escala definido pelo usuário para serem utilizados.

Metadados do item

id	URGS_657c034efd1d2835195c7c9f10efe08b
oai_identifier_str	oai:www.lume.ufrgs.br:10183/241743
network_acronym_str	URGS
network_name_str	Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str	1853
spelling	Sibemberg, Lucas SivieroAllem, Luiz EmílioHoppen, Carlos2022-07-05T05:07:51Z2022http://hdl.handle.net/10183/241743001143199Atualmente temos uma grande quantidade de dados disponíveis e é uma tarefa muito difícil interpretá-los. Desta maneira, classificar esses dados em um pequeno número de grupos baseado em suas afinidades pode ajudar a obter informações valiosas sobre eles. Este é o objetivo dos algoritmos de clusterização (particionamento), que buscam dividir dados em um determinado número de clusters (grupos) de forma que dados que possuam mais afinidade fiquem no mesmo cluster e dados com menos afinidade fiquem em clusters diferentes. Nesta dissertação trabalhamos com métodos espectrais para particionamento de dados, que usam ingredientes de álgebra linear e teoria espectral de grafos. Em nossa primeira contribuição apresentamos os resultados que obtivemos em duas aplicações das técnicas espectrais. A primeira aplicação está relacionada ao mercado financeiro, onde apresentamos uma estratégia em que clusterizamos um conjunto de ações e utilizamos critérios relacionados ao factor investing para montar portfólios. A segunda aplicação está relacionada à pandemia da COVID-19, onde obtivemos uma classificação do estado do Rio Grande do Sul em três clusters (regiões) de risco, alto risco, médio risco e baixo risco. Terminamos apresentando um novo algoritmo de clusterização espectral, mais especificamente desenvolvemos uma nova medida de similaridade. A nossa medida apresenta uma série de vantagens: (1) o usuário não precisa definir nenhum parâmetro para utilizar a medida, tornando-a fácil de aplicar; (2) a medida é invariante sob translações e expansões; (3) a medida apresentou bom desempenho em conjuntos de dados sintéticos e, em situações reais, apresentou desempenho similar a outros métodos existentes, que precisam de pelo menos um parâmetro de escala definido pelo usuário para serem utilizados.Nowadays we have a large amount of data available and it is a very difficult task to interpret it. In this way, classifying this data into a small number of groups based on their affinities can help to obtain valuable insight about them. This is the aim of clustering (partitioning) algorithms, which seek to split data into a certain number of clusters (groups) so that data with more affinity lie in the same cluster and data with less affinity lie in different clusters. In this dissertation we work with spectral methods for data partitioning, which use ingredients from linear algebra and spectral graph theory. In our first contribution we present the results we obtained in two applications of spectral techniques. The first application is related to the financial market, where we present a strategy in which we cluster a set of stocks and use criteria related to the factor investing to build portfolios. The second application is related to the COVID-19 pandemic, where we obtained a classification of the state of Rio Grande do Sul in three clusters (regions) of risk, high risk, medium risk and low risk. We finish presenting a new spectral clustering algorithm, more specifically, we developed a new similarity measure. Our measure has a number of advantages: (1) the user does not need to define any parameters to use the measure, making it easy to apply; (2) the measure is invariant under translations and expansions; (3) the measure performed well in synthetic data sets and, in real situations, it performed similarly to other existing methods, which need at least one user-defined scale parameter to be used.application/pdfporClusterMétodos espectraisParticionamentoGrafosMétodos espectrais para particionamento de dados e aplicaçõesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de Matemática e EstatísticaPrograma de Pós-Graduação em Matemática AplicadaPorto Alegre, BR-RS2022mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001143199.pdf.txt001143199.pdf.txtExtracted Texttext/plain202503http://www.lume.ufrgs.br/bitstream/10183/241743/2/001143199.pdf.txt86dbc9e5816536fc010e86aa576946abMD52ORIGINAL001143199.pdfTexto completoapplication/pdf3069522http://www.lume.ufrgs.br/bitstream/10183/241743/1/001143199.pdf259a8bc36a100cfb006793dfb0534942MD5110183/2417432022-07-06 04:57:56.483191oai:www.lume.ufrgs.br:10183/241743Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br\|\|lume@ufrgs.bropendoar:18532022-07-06T07:57:56Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv	Métodos espectrais para particionamento de dados e aplicações
title	Métodos espectrais para particionamento de dados e aplicações
spellingShingle	Métodos espectrais para particionamento de dados e aplicações Sibemberg, Lucas Siviero Cluster Métodos espectrais Particionamento Grafos
title_short	Métodos espectrais para particionamento de dados e aplicações
title_full	Métodos espectrais para particionamento de dados e aplicações
title_fullStr	Métodos espectrais para particionamento de dados e aplicações
title_full_unstemmed	Métodos espectrais para particionamento de dados e aplicações
title_sort	Métodos espectrais para particionamento de dados e aplicações
author	Sibemberg, Lucas Siviero
author_facet	Sibemberg, Lucas Siviero
author_role	author
dc.contributor.author.fl_str_mv	Sibemberg, Lucas Siviero
dc.contributor.advisor1.fl_str_mv	Allem, Luiz Emílio
dc.contributor.advisor-co1.fl_str_mv	Hoppen, Carlos
contributor_str_mv	Allem, Luiz Emílio Hoppen, Carlos
dc.subject.por.fl_str_mv	Cluster Métodos espectrais Particionamento Grafos
topic	Cluster Métodos espectrais Particionamento Grafos
description	Atualmente temos uma grande quantidade de dados disponíveis e é uma tarefa muito difícil interpretá-los. Desta maneira, classificar esses dados em um pequeno número de grupos baseado em suas afinidades pode ajudar a obter informações valiosas sobre eles. Este é o objetivo dos algoritmos de clusterização (particionamento), que buscam dividir dados em um determinado número de clusters (grupos) de forma que dados que possuam mais afinidade fiquem no mesmo cluster e dados com menos afinidade fiquem em clusters diferentes. Nesta dissertação trabalhamos com métodos espectrais para particionamento de dados, que usam ingredientes de álgebra linear e teoria espectral de grafos. Em nossa primeira contribuição apresentamos os resultados que obtivemos em duas aplicações das técnicas espectrais. A primeira aplicação está relacionada ao mercado financeiro, onde apresentamos uma estratégia em que clusterizamos um conjunto de ações e utilizamos critérios relacionados ao factor investing para montar portfólios. A segunda aplicação está relacionada à pandemia da COVID-19, onde obtivemos uma classificação do estado do Rio Grande do Sul em três clusters (regiões) de risco, alto risco, médio risco e baixo risco. Terminamos apresentando um novo algoritmo de clusterização espectral, mais especificamente desenvolvemos uma nova medida de similaridade. A nossa medida apresenta uma série de vantagens: (1) o usuário não precisa definir nenhum parâmetro para utilizar a medida, tornando-a fácil de aplicar; (2) a medida é invariante sob translações e expansões; (3) a medida apresentou bom desempenho em conjuntos de dados sintéticos e, em situações reais, apresentou desempenho similar a outros métodos existentes, que precisam de pelo menos um parâmetro de escala definido pelo usuário para serem utilizados.
publishDate	2022
dc.date.accessioned.fl_str_mv	2022-07-05T05:07:51Z
dc.date.issued.fl_str_mv	2022
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10183/241743
dc.identifier.nrb.pt_BR.fl_str_mv	001143199
url	http://hdl.handle.net/10183/241743
identifier_str_mv	001143199
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS
instname_str	Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str	UFRGS
institution	UFRGS
reponame_str	Biblioteca Digital de Teses e Dissertações da UFRGS
collection	Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv	http://www.lume.ufrgs.br/bitstream/10183/241743/2/001143199.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/241743/1/001143199.pdf
bitstream.checksum.fl_str_mv	86dbc9e5816536fc010e86aa576946ab 259a8bc36a100cfb006793dfb0534942
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv	lume@ufrgs.br\|\|lume@ufrgs.br
_version_	1800309198117928960

Métodos espectrais para particionamento de dados e aplicações

Registros relacionados