Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina
Autor(a) principal: | |
---|---|
Data de Publicação: | 2024 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/14/14131/tde-08042024-141320/ |
Resumo: | Esse projeto tem como objetivo encontrar os parâmetros de populações estelares de galáxias (massa estelar, extinção de poeira, idades e metalicidades médias) a partir da fotometria do levantamento S-PLUS. Criamos um conjunto de treinamento a partir de uma aplicação do STARLIGHT que combinou os espectros do SDSS com a fotometria do GALEX, melhorando as sínteses espectrais. Após um pré-processamento dos dados que consistiu na adição das linhas espectrais, cálculo da fotometria, calibração com as magnitudes do S-PLUS e imputação de dados faltantes, criamos um conjunto de treinamento com 137,734 galáxias, cada uma com sua fotometria no sistema do S-PLUS e seus respectivos parâmetros de populações estelares fornecidos pelo STARLIGHT. Comparamos 5 algoritmos de regressão diferentes entre Regressão Linear, K-Nearest Neighbours, Random Forest, XGBoost e Redes Neurais. Acabamos escolhendo uma rede neural de Deep Learning para as estimativas, consistindo de uma camada de entrada com 13 neurônios (12 magnitudes do S-PLUS + 1 valor de redshift) seguido por 4 camadas ReLU com 256 neurônios cada e uma última camada final com 1 neurônio correspondente ao parâmetro de população estelar. Utilizando um método de Data Augmentation fomos capazes de gerar uma estimativa de erro para cada predição. Estimamos 6 parâmetros de populações estelares: massa estelar; absorção por poeira no visível; metalicidade média ponderada em fluxo e em massa; idade média ponderada em fluxo e em massa. Também estimamos as larguras equivalentes de 4 linhas de emissão: Halpha, Hbeta, [OIII]5007 Angstrom e [NII]6583 Angstrom. As estimativas são bem satisfatórias e condizem com métodos clássicos de SED fitting. Mostramos que o algoritmo é robusto em redshift até 0.1 mesmo para estimativas das larguras equivalentes. Realizamos uma aplicação a 182 galáxias do aglomerado de Fornax, obtendo suas relações de idade e metalicidade. Por fim, recriamos o diagrama BPT através da estimativa das larguras equivalentes das linhas de emissão e vimos que a rede consegue predizer em qual região do diagrama a galáxia pertence. |
id |
USP_8a1707d12b11eab222b81390ed8cf12a |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-08042024-141320 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Síntese de populações estelares de galáxias com técnicas de aprendizado de máquinaStellar Populations Photometric Synthesis with AI of S-PLUS GalaxiesAprendizado de MáquinaAstronomia ExtragalácticaExtragalactic AstronomyMachine LearningPopulações EstelaresStellar PopulationsEsse projeto tem como objetivo encontrar os parâmetros de populações estelares de galáxias (massa estelar, extinção de poeira, idades e metalicidades médias) a partir da fotometria do levantamento S-PLUS. Criamos um conjunto de treinamento a partir de uma aplicação do STARLIGHT que combinou os espectros do SDSS com a fotometria do GALEX, melhorando as sínteses espectrais. Após um pré-processamento dos dados que consistiu na adição das linhas espectrais, cálculo da fotometria, calibração com as magnitudes do S-PLUS e imputação de dados faltantes, criamos um conjunto de treinamento com 137,734 galáxias, cada uma com sua fotometria no sistema do S-PLUS e seus respectivos parâmetros de populações estelares fornecidos pelo STARLIGHT. Comparamos 5 algoritmos de regressão diferentes entre Regressão Linear, K-Nearest Neighbours, Random Forest, XGBoost e Redes Neurais. Acabamos escolhendo uma rede neural de Deep Learning para as estimativas, consistindo de uma camada de entrada com 13 neurônios (12 magnitudes do S-PLUS + 1 valor de redshift) seguido por 4 camadas ReLU com 256 neurônios cada e uma última camada final com 1 neurônio correspondente ao parâmetro de população estelar. Utilizando um método de Data Augmentation fomos capazes de gerar uma estimativa de erro para cada predição. Estimamos 6 parâmetros de populações estelares: massa estelar; absorção por poeira no visível; metalicidade média ponderada em fluxo e em massa; idade média ponderada em fluxo e em massa. Também estimamos as larguras equivalentes de 4 linhas de emissão: Halpha, Hbeta, [OIII]5007 Angstrom e [NII]6583 Angstrom. As estimativas são bem satisfatórias e condizem com métodos clássicos de SED fitting. Mostramos que o algoritmo é robusto em redshift até 0.1 mesmo para estimativas das larguras equivalentes. Realizamos uma aplicação a 182 galáxias do aglomerado de Fornax, obtendo suas relações de idade e metalicidade. Por fim, recriamos o diagrama BPT através da estimativa das larguras equivalentes das linhas de emissão e vimos que a rede consegue predizer em qual região do diagrama a galáxia pertence.This project aims to obtain the stellar population\'s parameters of galaxies (stellar mass, dust attenuation, mean ages and metallicities) from the S-PLUS survey photometry. We\'ve created a training set from a STARLIGHT application that combined SDSS spectra with GALEX photometry, improving the spectral synthesis. After preprocessing the data, in which we added the emission lines, calculated the photometry, calibrated with S-PLUS data and dealt with missing data, we\'ve created a training set with 137,734 galaxies, each one with their respective S-PLUS-like photometry and their stellar population parameters obtained by STARLIGHT. We compared 5 different regression algorithms, including Linear Regression, K-Neares Neighbours, Random Forest, XGBoost and Neural Networks. We ended up choosing a Deep Learning Neural Network for the estimations, which consisted of an entry layer with 13 neurons (12 S-PLUS magnitudes + 1 redshift value) followed by 4 ReLU activation layers with 256 neurons each and a final layer with a single neuron corresponding to the stellar population parameter. Using a Data Augmentation method we were capable of obtaining an error estimation for each prediction. We\'ve estimated 6 stellar population parameters: stellar mass; dust attenuation; mean ages weighted by flux and mass; mean metallicity weighted by flux and mass. We\'ve also estimated the equivalent width of 4 emission lines: Halpha, Hbeta, [OIII]5007\\AA and [NII]6583\\AA. The estimations were satisfactory and are in line with classical SED fitting methods. The algorithm is robust up to a 0.1 redshift even for the emission lines estimation. We\'ve applied our models to a sample of 182 galaxies from the Fornax cluster, obtaining their color age relationship. Finally, we\'ve created the BPT diagram through the estimation of equivalent widths of the spectral lines and saw that the network can predict in which region of the diagram a galaxy belongs just from their photometry.Biblioteca Digitais de Teses e Dissertações da USPSodre Junior, LaerteCernic, Vitor Martins2024-02-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/14/14131/tde-08042024-141320/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-05-16T17:31:02Zoai:teses.usp.br:tde-08042024-141320Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-05-16T17:31:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina Stellar Populations Photometric Synthesis with AI of S-PLUS Galaxies |
title |
Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina |
spellingShingle |
Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina Cernic, Vitor Martins Aprendizado de Máquina Astronomia Extragaláctica Extragalactic Astronomy Machine Learning Populações Estelares Stellar Populations |
title_short |
Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina |
title_full |
Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina |
title_fullStr |
Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina |
title_full_unstemmed |
Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina |
title_sort |
Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina |
author |
Cernic, Vitor Martins |
author_facet |
Cernic, Vitor Martins |
author_role |
author |
dc.contributor.none.fl_str_mv |
Sodre Junior, Laerte |
dc.contributor.author.fl_str_mv |
Cernic, Vitor Martins |
dc.subject.por.fl_str_mv |
Aprendizado de Máquina Astronomia Extragaláctica Extragalactic Astronomy Machine Learning Populações Estelares Stellar Populations |
topic |
Aprendizado de Máquina Astronomia Extragaláctica Extragalactic Astronomy Machine Learning Populações Estelares Stellar Populations |
description |
Esse projeto tem como objetivo encontrar os parâmetros de populações estelares de galáxias (massa estelar, extinção de poeira, idades e metalicidades médias) a partir da fotometria do levantamento S-PLUS. Criamos um conjunto de treinamento a partir de uma aplicação do STARLIGHT que combinou os espectros do SDSS com a fotometria do GALEX, melhorando as sínteses espectrais. Após um pré-processamento dos dados que consistiu na adição das linhas espectrais, cálculo da fotometria, calibração com as magnitudes do S-PLUS e imputação de dados faltantes, criamos um conjunto de treinamento com 137,734 galáxias, cada uma com sua fotometria no sistema do S-PLUS e seus respectivos parâmetros de populações estelares fornecidos pelo STARLIGHT. Comparamos 5 algoritmos de regressão diferentes entre Regressão Linear, K-Nearest Neighbours, Random Forest, XGBoost e Redes Neurais. Acabamos escolhendo uma rede neural de Deep Learning para as estimativas, consistindo de uma camada de entrada com 13 neurônios (12 magnitudes do S-PLUS + 1 valor de redshift) seguido por 4 camadas ReLU com 256 neurônios cada e uma última camada final com 1 neurônio correspondente ao parâmetro de população estelar. Utilizando um método de Data Augmentation fomos capazes de gerar uma estimativa de erro para cada predição. Estimamos 6 parâmetros de populações estelares: massa estelar; absorção por poeira no visível; metalicidade média ponderada em fluxo e em massa; idade média ponderada em fluxo e em massa. Também estimamos as larguras equivalentes de 4 linhas de emissão: Halpha, Hbeta, [OIII]5007 Angstrom e [NII]6583 Angstrom. As estimativas são bem satisfatórias e condizem com métodos clássicos de SED fitting. Mostramos que o algoritmo é robusto em redshift até 0.1 mesmo para estimativas das larguras equivalentes. Realizamos uma aplicação a 182 galáxias do aglomerado de Fornax, obtendo suas relações de idade e metalicidade. Por fim, recriamos o diagrama BPT através da estimativa das larguras equivalentes das linhas de emissão e vimos que a rede consegue predizer em qual região do diagrama a galáxia pertence. |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024-02-09 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/14/14131/tde-08042024-141320/ |
url |
https://www.teses.usp.br/teses/disponiveis/14/14131/tde-08042024-141320/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256799431884800 |