Machine learning methods for extracting cosmological information

Detalhes bibliográficos
Autor(a) principal: Santi, Natalí Soler Matubaro de
Data de Publicação: 2024
Tipo de documento: Tese
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/43/43134/tde-15072024-101341/
Resumo: The new era of cosmological observations is generating vast amounts of data, increasing the pressure for improvements in both existing and new techniques to analyze this data. Machine Learning (ML) methods are currently at the cutting edge in terms of new techniques and tools, often surpassing traditional methods. In this work, we employ a series of ML techniques to: (1) improve cosmological covariance matrices, (2) investigate the halo-galaxy connection, and (3) perform robust field-level likelihood-free inference with galaxies and halos. Parameter inference is a key aspect in Cosmology, and here we present two different approaches: the use of traditional methods, aimed at obtaining accurate and precise cosmological covariance matrices using image denoising techniques, and a novel approach, which involves deriving parameters directly by converting galaxy/halo catalogs into graphs, without cuts on scale, and then feeding these graphs into graph neural networks to predict the parameters. Simultaneously, the relationship between galaxies and halos is central to describing galaxy formation and is a fundamental step towards extracting precise cosmological information from galaxy maps. We address this problem with a sequence of approaches, ranging from using raw methods and augmenting the data set to stacking methods and converting a regression problem into a classification one, to recover galaxy properties along with their stochasticity. All of these projects aim at improving the extraction of information from simulations by enhancing the accuracy and precision of the derived constraints, thereby impacting cosmological parameters and the halo-galaxy connection. These are the initial steps before applying this new set of innovative methodologies to real data, for both current and next-generation surveys.
id USP_3eef05335e593e89fe17b619b57e3145
oai_identifier_str oai:teses.usp.br:tde-15072024-101341
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Machine learning methods for extracting cosmological informationMétodos de aprendizado de máquina para obtenção de informações cosmológicasAlgoritmos de aprendizado de máquinaConexão galáxia-haloCosmological parameters inferenceCosmological simulationsHalo-galaxy connectionInferência de parâmetros cosmológicosMachine learning algorithmsSimulações cosmológicasThe new era of cosmological observations is generating vast amounts of data, increasing the pressure for improvements in both existing and new techniques to analyze this data. Machine Learning (ML) methods are currently at the cutting edge in terms of new techniques and tools, often surpassing traditional methods. In this work, we employ a series of ML techniques to: (1) improve cosmological covariance matrices, (2) investigate the halo-galaxy connection, and (3) perform robust field-level likelihood-free inference with galaxies and halos. Parameter inference is a key aspect in Cosmology, and here we present two different approaches: the use of traditional methods, aimed at obtaining accurate and precise cosmological covariance matrices using image denoising techniques, and a novel approach, which involves deriving parameters directly by converting galaxy/halo catalogs into graphs, without cuts on scale, and then feeding these graphs into graph neural networks to predict the parameters. Simultaneously, the relationship between galaxies and halos is central to describing galaxy formation and is a fundamental step towards extracting precise cosmological information from galaxy maps. We address this problem with a sequence of approaches, ranging from using raw methods and augmenting the data set to stacking methods and converting a regression problem into a classification one, to recover galaxy properties along with their stochasticity. All of these projects aim at improving the extraction of information from simulations by enhancing the accuracy and precision of the derived constraints, thereby impacting cosmological parameters and the halo-galaxy connection. These are the initial steps before applying this new set of innovative methodologies to real data, for both current and next-generation surveys.A nova geração de observações cosmológicas está gerando uma enorme quantidade de dados e aumentando a pressão pelo desenvolvimento de novas e já existentes técnicas para a análise dos mesmos. Métodos de Aprendizado de Máquina (AM) tem se mostrado como uma excelente e revolucionária alternativa para essa função, muitas vezes superando os métodos tradicionais. Neste trabalho nós utilizamos uma série de técnicas de AM para: (1) melhorar matrizes de covariância cosmológicas, (2) investigar a conexão galáxia-halo, e (3) realizar uma inferência robusta de parâmetros cosmológicos, livre de verossimilhança, usando apenas o campo de galáxias e halos. A inferência de parâmetros é uma atividade central em Cosmologia e aqui nós apresentamos duas diferentes soluções: o uso de métodos tradicionais, para a obtenção de matrizes de covariância cosmológicas precisas e acuradas por meio uma técnica de remoção de ruído de imagens e um método novo, que envolve converter catálogos de galáxias e halos em grafos para alimentar uma rede neural gráfica capaz de diretamente inferir os parâmetros. Ao mesmo tempo, sabendo que a relação entre galáxias e halos é fundamental para descrever a formação de galáxias e para inferir informação cosmológica a partir das galáxias, nós desenvolvemos uma série de metodologias para obter essa conexão. Usamos métodos de AM diretamente nas propriedades de halos e galáxias, fizemos o mesmo para um conjunto de dados aumentado e usamos ambas as predições para obter modelos empilhados. Convertemos o problema de regressão em classificação, sendo capazes de recuperar não apenas as propriedades das galáxias, mas também sua estocasticidade. Todos esses diferentes projetos focam em aperfeiçoar a obtenção de informação cosmológica de simulações, melhorando sua acurácia e precisão, tanto para os parâmetros cosmológicos, quanto para a conexão galáxia-halo. Estes são os passos iniciais da futura aplicação de metodologias inovadoras em dados reais para a próxima e atual geração de observações.Biblioteca Digitais de Teses e Dissertações da USPAbramo, Luis Raul WeberSanti, Natalí Soler Matubaro de2024-07-04info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/43/43134/tde-15072024-101341/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2024-07-24T16:42:02Zoai:teses.usp.br:tde-15072024-101341Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-07-24T16:42:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Machine learning methods for extracting cosmological information
Métodos de aprendizado de máquina para obtenção de informações cosmológicas
title Machine learning methods for extracting cosmological information
spellingShingle Machine learning methods for extracting cosmological information
Santi, Natalí Soler Matubaro de
Algoritmos de aprendizado de máquina
Conexão galáxia-halo
Cosmological parameters inference
Cosmological simulations
Halo-galaxy connection
Inferência de parâmetros cosmológicos
Machine learning algorithms
Simulações cosmológicas
title_short Machine learning methods for extracting cosmological information
title_full Machine learning methods for extracting cosmological information
title_fullStr Machine learning methods for extracting cosmological information
title_full_unstemmed Machine learning methods for extracting cosmological information
title_sort Machine learning methods for extracting cosmological information
author Santi, Natalí Soler Matubaro de
author_facet Santi, Natalí Soler Matubaro de
author_role author
dc.contributor.none.fl_str_mv Abramo, Luis Raul Weber
dc.contributor.author.fl_str_mv Santi, Natalí Soler Matubaro de
dc.subject.por.fl_str_mv Algoritmos de aprendizado de máquina
Conexão galáxia-halo
Cosmological parameters inference
Cosmological simulations
Halo-galaxy connection
Inferência de parâmetros cosmológicos
Machine learning algorithms
Simulações cosmológicas
topic Algoritmos de aprendizado de máquina
Conexão galáxia-halo
Cosmological parameters inference
Cosmological simulations
Halo-galaxy connection
Inferência de parâmetros cosmológicos
Machine learning algorithms
Simulações cosmológicas
description The new era of cosmological observations is generating vast amounts of data, increasing the pressure for improvements in both existing and new techniques to analyze this data. Machine Learning (ML) methods are currently at the cutting edge in terms of new techniques and tools, often surpassing traditional methods. In this work, we employ a series of ML techniques to: (1) improve cosmological covariance matrices, (2) investigate the halo-galaxy connection, and (3) perform robust field-level likelihood-free inference with galaxies and halos. Parameter inference is a key aspect in Cosmology, and here we present two different approaches: the use of traditional methods, aimed at obtaining accurate and precise cosmological covariance matrices using image denoising techniques, and a novel approach, which involves deriving parameters directly by converting galaxy/halo catalogs into graphs, without cuts on scale, and then feeding these graphs into graph neural networks to predict the parameters. Simultaneously, the relationship between galaxies and halos is central to describing galaxy formation and is a fundamental step towards extracting precise cosmological information from galaxy maps. We address this problem with a sequence of approaches, ranging from using raw methods and augmenting the data set to stacking methods and converting a regression problem into a classification one, to recover galaxy properties along with their stochasticity. All of these projects aim at improving the extraction of information from simulations by enhancing the accuracy and precision of the derived constraints, thereby impacting cosmological parameters and the halo-galaxy connection. These are the initial steps before applying this new set of innovative methodologies to real data, for both current and next-generation surveys.
publishDate 2024
dc.date.none.fl_str_mv 2024-07-04
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/43/43134/tde-15072024-101341/
url https://www.teses.usp.br/teses/disponiveis/43/43134/tde-15072024-101341/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090746290012160