Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina

Detalhes bibliográficos
Autor(a) principal: Cernic, Vitor Martins
Data de Publicação: 2024
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/14/14131/tde-08042024-141320/
Resumo: Esse projeto tem como objetivo encontrar os parâmetros de populações estelares de galáxias (massa estelar, extinção de poeira, idades e metalicidades médias) a partir da fotometria do levantamento S-PLUS. Criamos um conjunto de treinamento a partir de uma aplicação do STARLIGHT que combinou os espectros do SDSS com a fotometria do GALEX, melhorando as sínteses espectrais. Após um pré-processamento dos dados que consistiu na adição das linhas espectrais, cálculo da fotometria, calibração com as magnitudes do S-PLUS e imputação de dados faltantes, criamos um conjunto de treinamento com 137,734 galáxias, cada uma com sua fotometria no sistema do S-PLUS e seus respectivos parâmetros de populações estelares fornecidos pelo STARLIGHT. Comparamos 5 algoritmos de regressão diferentes entre Regressão Linear, K-Nearest Neighbours, Random Forest, XGBoost e Redes Neurais. Acabamos escolhendo uma rede neural de Deep Learning para as estimativas, consistindo de uma camada de entrada com 13 neurônios (12 magnitudes do S-PLUS + 1 valor de redshift) seguido por 4 camadas ReLU com 256 neurônios cada e uma última camada final com 1 neurônio correspondente ao parâmetro de população estelar. Utilizando um método de Data Augmentation fomos capazes de gerar uma estimativa de erro para cada predição. Estimamos 6 parâmetros de populações estelares: massa estelar; absorção por poeira no visível; metalicidade média ponderada em fluxo e em massa; idade média ponderada em fluxo e em massa. Também estimamos as larguras equivalentes de 4 linhas de emissão: Halpha, Hbeta, [OIII]5007 Angstrom e [NII]6583 Angstrom. As estimativas são bem satisfatórias e condizem com métodos clássicos de SED fitting. Mostramos que o algoritmo é robusto em redshift até 0.1 mesmo para estimativas das larguras equivalentes. Realizamos uma aplicação a 182 galáxias do aglomerado de Fornax, obtendo suas relações de idade e metalicidade. Por fim, recriamos o diagrama BPT através da estimativa das larguras equivalentes das linhas de emissão e vimos que a rede consegue predizer em qual região do diagrama a galáxia pertence.
id USP_8a1707d12b11eab222b81390ed8cf12a
oai_identifier_str oai:teses.usp.br:tde-08042024-141320
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Síntese de populações estelares de galáxias com técnicas de aprendizado de máquinaStellar Populations Photometric Synthesis with AI of S-PLUS GalaxiesAprendizado de MáquinaAstronomia ExtragalácticaExtragalactic AstronomyMachine LearningPopulações EstelaresStellar PopulationsEsse projeto tem como objetivo encontrar os parâmetros de populações estelares de galáxias (massa estelar, extinção de poeira, idades e metalicidades médias) a partir da fotometria do levantamento S-PLUS. Criamos um conjunto de treinamento a partir de uma aplicação do STARLIGHT que combinou os espectros do SDSS com a fotometria do GALEX, melhorando as sínteses espectrais. Após um pré-processamento dos dados que consistiu na adição das linhas espectrais, cálculo da fotometria, calibração com as magnitudes do S-PLUS e imputação de dados faltantes, criamos um conjunto de treinamento com 137,734 galáxias, cada uma com sua fotometria no sistema do S-PLUS e seus respectivos parâmetros de populações estelares fornecidos pelo STARLIGHT. Comparamos 5 algoritmos de regressão diferentes entre Regressão Linear, K-Nearest Neighbours, Random Forest, XGBoost e Redes Neurais. Acabamos escolhendo uma rede neural de Deep Learning para as estimativas, consistindo de uma camada de entrada com 13 neurônios (12 magnitudes do S-PLUS + 1 valor de redshift) seguido por 4 camadas ReLU com 256 neurônios cada e uma última camada final com 1 neurônio correspondente ao parâmetro de população estelar. Utilizando um método de Data Augmentation fomos capazes de gerar uma estimativa de erro para cada predição. Estimamos 6 parâmetros de populações estelares: massa estelar; absorção por poeira no visível; metalicidade média ponderada em fluxo e em massa; idade média ponderada em fluxo e em massa. Também estimamos as larguras equivalentes de 4 linhas de emissão: Halpha, Hbeta, [OIII]5007 Angstrom e [NII]6583 Angstrom. As estimativas são bem satisfatórias e condizem com métodos clássicos de SED fitting. Mostramos que o algoritmo é robusto em redshift até 0.1 mesmo para estimativas das larguras equivalentes. Realizamos uma aplicação a 182 galáxias do aglomerado de Fornax, obtendo suas relações de idade e metalicidade. Por fim, recriamos o diagrama BPT através da estimativa das larguras equivalentes das linhas de emissão e vimos que a rede consegue predizer em qual região do diagrama a galáxia pertence.This project aims to obtain the stellar population\'s parameters of galaxies (stellar mass, dust attenuation, mean ages and metallicities) from the S-PLUS survey photometry. We\'ve created a training set from a STARLIGHT application that combined SDSS spectra with GALEX photometry, improving the spectral synthesis. After preprocessing the data, in which we added the emission lines, calculated the photometry, calibrated with S-PLUS data and dealt with missing data, we\'ve created a training set with 137,734 galaxies, each one with their respective S-PLUS-like photometry and their stellar population parameters obtained by STARLIGHT. We compared 5 different regression algorithms, including Linear Regression, K-Neares Neighbours, Random Forest, XGBoost and Neural Networks. We ended up choosing a Deep Learning Neural Network for the estimations, which consisted of an entry layer with 13 neurons (12 S-PLUS magnitudes + 1 redshift value) followed by 4 ReLU activation layers with 256 neurons each and a final layer with a single neuron corresponding to the stellar population parameter. Using a Data Augmentation method we were capable of obtaining an error estimation for each prediction. We\'ve estimated 6 stellar population parameters: stellar mass; dust attenuation; mean ages weighted by flux and mass; mean metallicity weighted by flux and mass. We\'ve also estimated the equivalent width of 4 emission lines: Halpha, Hbeta, [OIII]5007\\AA and [NII]6583\\AA. The estimations were satisfactory and are in line with classical SED fitting methods. The algorithm is robust up to a 0.1 redshift even for the emission lines estimation. We\'ve applied our models to a sample of 182 galaxies from the Fornax cluster, obtaining their color age relationship. Finally, we\'ve created the BPT diagram through the estimation of equivalent widths of the spectral lines and saw that the network can predict in which region of the diagram a galaxy belongs just from their photometry.Biblioteca Digitais de Teses e Dissertações da USPSodre Junior, LaerteCernic, Vitor Martins2024-02-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/14/14131/tde-08042024-141320/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-05-16T17:31:02Zoai:teses.usp.br:tde-08042024-141320Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-05-16T17:31:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina
Stellar Populations Photometric Synthesis with AI of S-PLUS Galaxies
title Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina
spellingShingle Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina
Cernic, Vitor Martins
Aprendizado de Máquina
Astronomia Extragaláctica
Extragalactic Astronomy
Machine Learning
Populações Estelares
Stellar Populations
title_short Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina
title_full Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina
title_fullStr Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina
title_full_unstemmed Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina
title_sort Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina
author Cernic, Vitor Martins
author_facet Cernic, Vitor Martins
author_role author
dc.contributor.none.fl_str_mv Sodre Junior, Laerte
dc.contributor.author.fl_str_mv Cernic, Vitor Martins
dc.subject.por.fl_str_mv Aprendizado de Máquina
Astronomia Extragaláctica
Extragalactic Astronomy
Machine Learning
Populações Estelares
Stellar Populations
topic Aprendizado de Máquina
Astronomia Extragaláctica
Extragalactic Astronomy
Machine Learning
Populações Estelares
Stellar Populations
description Esse projeto tem como objetivo encontrar os parâmetros de populações estelares de galáxias (massa estelar, extinção de poeira, idades e metalicidades médias) a partir da fotometria do levantamento S-PLUS. Criamos um conjunto de treinamento a partir de uma aplicação do STARLIGHT que combinou os espectros do SDSS com a fotometria do GALEX, melhorando as sínteses espectrais. Após um pré-processamento dos dados que consistiu na adição das linhas espectrais, cálculo da fotometria, calibração com as magnitudes do S-PLUS e imputação de dados faltantes, criamos um conjunto de treinamento com 137,734 galáxias, cada uma com sua fotometria no sistema do S-PLUS e seus respectivos parâmetros de populações estelares fornecidos pelo STARLIGHT. Comparamos 5 algoritmos de regressão diferentes entre Regressão Linear, K-Nearest Neighbours, Random Forest, XGBoost e Redes Neurais. Acabamos escolhendo uma rede neural de Deep Learning para as estimativas, consistindo de uma camada de entrada com 13 neurônios (12 magnitudes do S-PLUS + 1 valor de redshift) seguido por 4 camadas ReLU com 256 neurônios cada e uma última camada final com 1 neurônio correspondente ao parâmetro de população estelar. Utilizando um método de Data Augmentation fomos capazes de gerar uma estimativa de erro para cada predição. Estimamos 6 parâmetros de populações estelares: massa estelar; absorção por poeira no visível; metalicidade média ponderada em fluxo e em massa; idade média ponderada em fluxo e em massa. Também estimamos as larguras equivalentes de 4 linhas de emissão: Halpha, Hbeta, [OIII]5007 Angstrom e [NII]6583 Angstrom. As estimativas são bem satisfatórias e condizem com métodos clássicos de SED fitting. Mostramos que o algoritmo é robusto em redshift até 0.1 mesmo para estimativas das larguras equivalentes. Realizamos uma aplicação a 182 galáxias do aglomerado de Fornax, obtendo suas relações de idade e metalicidade. Por fim, recriamos o diagrama BPT através da estimativa das larguras equivalentes das linhas de emissão e vimos que a rede consegue predizer em qual região do diagrama a galáxia pertence.
publishDate 2024
dc.date.none.fl_str_mv 2024-02-09
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/14/14131/tde-08042024-141320/
url https://www.teses.usp.br/teses/disponiveis/14/14131/tde-08042024-141320/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815256799431884800