Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado

Detalhes bibliográficos
Autor(a) principal: Gonçalves, Rodrigo Barros
Data de Publicação: 2022
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRJ
Texto Completo: http://hdl.handle.net/11422/19225
Resumo: A classificação espectral de estrelas de alta massa fornece diretamente uma ideia do status evolutivo de determinado objeto e de parâmetros físicos importantes, como a temperatura e luminosidade, e até mesmo da velocidade de rotação superficial. Neste trabalho, foram utilizadas técnicas de aprendizado de máquina não supervisionado para atacar o problema de classificação espectral em estrelas de alta massa com duas motivações principais: (i) aprender astrofísica de estrelas de alta massa e (ii) aprender técnicas de aprendizado de máquina não supervisionado. A implementação de algoritmos de aprendizado de máquina pode se tornar uma ferramenta muito útil para a extração de informações relevantes de grandes amostras e surveys (e.g., Gaia EDR3), não somente para fins de classificação espectroscópica, mas também com fotometria e outras grandezas físicas medidas (e.g., velocidades radiais, composições químicas). Uma amostra de 606 espectros de estrelas de tipo espectral O oriundas do mais amplo catálogo disponível - “Galactic O-Star Catalog” -, e também de diversas fontes listadas em Martins (2018) foi reunida. Larguras equivalentes de linhas espectrais em cada objeto de nossa amostra foram medidas. Em seguida, o espaço de largura de linhas (1 ponto no espaço N-dimensional correspondendo a 1 estrela com N linhas medidas) e suas aglomerações foram analizadas por meio de um algoritmo de aprendizado de máquina não supervisionado (k-means clustering). Posteriormente, a fim de testarmos efeitos relacionados ao tamanho da amostra, elaboramos uma estratégia para gerar estrelas artificiais, i.e., novas larguras equivalentes, a partir das observadas. Ao todo, ficamos com 47.000 estrelas e a análise anterior foi repetida. Nos testes conduzidos com a amostra original de 606 estrelas, encontramos que a qualidade da classificação deixa a desejar. Mesmo quando utilizamos apenas 3 features (com o silhouette score sugerindo uma boa classificação), a diferenciação das classes nos clusters encontrados permaneceu insatisfatória. Nos testes realizados com a amostra maior, os resultados melhoraram substancialmente, com exceção do caso em que usamos as 3 features, onde houve piora. Isso provavelmente se deve ao critério de junção das classes de luminosidade que adotamos, o que implica numa revisão e aprimoramento da análise destas classes. Em suma, verificamos que algoritmos não supervisionados podem fornecer uma classificação espectral prévia satisfatória em novos conjuntos de dados desde que a amostra seja suficientemente grande, o que já é bastante útil para análises posteriores.
id UFRJ_4c288b86f064beecd9b341081be4759c
oai_identifier_str oai:pantheon.ufrj.br:11422/19225
network_acronym_str UFRJ
network_name_str Repositório Institucional da UFRJ
repository_id_str
spelling Gonçalves, Rodrigo Barroshttp://lattes.cnpq.br/3484071295740741http://lattes.cnpq.br/2224902596323773Lopes, Paulo Afranio Augustohttp://lattes.cnpq.br/2912390244432645Pereira, Eduardo Machadohttp://lattes.cnpq.br/5667844934988317Marcolino, Wagner Luiz Ferreira2022-11-22T18:28:25Z2023-11-30T03:05:21Z2022-10-17GONÇALVES, Rodrigo Barros. Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado. 2022. 63 f. Trabalho de conclusão de curso (Bacharelado em Astronomia) - Observatório do Valongo, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2022.http://hdl.handle.net/11422/19225Submitted by Regina Moura (regina@ov.ufrj.br) on 2022-11-22T18:27:25Z No. of bitstreams: 1 RBGonçalves.pdf: 3644130 bytes, checksum: ddfefd912cb011fe1a423dd656f84d48 (MD5)Approved for entry into archive by Regina Moura (regina@ov.ufrj.br) on 2022-11-22T18:28:25Z (GMT) No. of bitstreams: 1 RBGonçalves.pdf: 3644130 bytes, checksum: ddfefd912cb011fe1a423dd656f84d48 (MD5)Made available in DSpace on 2022-11-22T18:28:25Z (GMT). No. of bitstreams: 1 RBGonçalves.pdf: 3644130 bytes, checksum: ddfefd912cb011fe1a423dd656f84d48 (MD5) Previous issue date: 2022-10-17A classificação espectral de estrelas de alta massa fornece diretamente uma ideia do status evolutivo de determinado objeto e de parâmetros físicos importantes, como a temperatura e luminosidade, e até mesmo da velocidade de rotação superficial. Neste trabalho, foram utilizadas técnicas de aprendizado de máquina não supervisionado para atacar o problema de classificação espectral em estrelas de alta massa com duas motivações principais: (i) aprender astrofísica de estrelas de alta massa e (ii) aprender técnicas de aprendizado de máquina não supervisionado. A implementação de algoritmos de aprendizado de máquina pode se tornar uma ferramenta muito útil para a extração de informações relevantes de grandes amostras e surveys (e.g., Gaia EDR3), não somente para fins de classificação espectroscópica, mas também com fotometria e outras grandezas físicas medidas (e.g., velocidades radiais, composições químicas). Uma amostra de 606 espectros de estrelas de tipo espectral O oriundas do mais amplo catálogo disponível - “Galactic O-Star Catalog” -, e também de diversas fontes listadas em Martins (2018) foi reunida. Larguras equivalentes de linhas espectrais em cada objeto de nossa amostra foram medidas. Em seguida, o espaço de largura de linhas (1 ponto no espaço N-dimensional correspondendo a 1 estrela com N linhas medidas) e suas aglomerações foram analizadas por meio de um algoritmo de aprendizado de máquina não supervisionado (k-means clustering). Posteriormente, a fim de testarmos efeitos relacionados ao tamanho da amostra, elaboramos uma estratégia para gerar estrelas artificiais, i.e., novas larguras equivalentes, a partir das observadas. Ao todo, ficamos com 47.000 estrelas e a análise anterior foi repetida. Nos testes conduzidos com a amostra original de 606 estrelas, encontramos que a qualidade da classificação deixa a desejar. Mesmo quando utilizamos apenas 3 features (com o silhouette score sugerindo uma boa classificação), a diferenciação das classes nos clusters encontrados permaneceu insatisfatória. Nos testes realizados com a amostra maior, os resultados melhoraram substancialmente, com exceção do caso em que usamos as 3 features, onde houve piora. Isso provavelmente se deve ao critério de junção das classes de luminosidade que adotamos, o que implica numa revisão e aprimoramento da análise destas classes. Em suma, verificamos que algoritmos não supervisionados podem fornecer uma classificação espectral prévia satisfatória em novos conjuntos de dados desde que a amostra seja suficientemente grande, o que já é bastante útil para análises posteriores.porUniversidade Federal do Rio de JaneiroUFRJBrasilObservatório do ValongoCNPQ::CIENCIAS EXATAS E DA TERRA::ASTRONOMIAAstrofísica estelarEstrelas de alta massaClassificação espectral de estrelasAprendizado de máquinaAlgorítmosPython (Linguagem de programação de computador)Stellar astrophysicsMassive StarsStellar spectral classificationMachine LearningAlgorithmsClassificação de estrelas de alta massa com aprendizado de máquina não supervisionadoClassification of massive stars with unsupervised machine learninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisabertoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJLICENSElicense.txtlicense.txttext/plain; charset=utf-81853http://pantheon.ufrj.br:80/bitstream/11422/19225/2/license.txtdd32849f2bfb22da963c3aac6e26e255MD52ORIGINALRBGonçalves.pdfRBGonçalves.pdfapplication/pdf3644130http://pantheon.ufrj.br:80/bitstream/11422/19225/1/RBGon%C3%A7alves.pdfddfefd912cb011fe1a423dd656f84d48MD5111422/192252023-11-30 00:05:21.398oai:pantheon.ufrj.br:11422/19225TElDRU7Dh0EgTsODTy1FWENMVVNJVkEgREUgRElTVFJJQlVJw4fDg08KCkFvIGFzc2luYXIgZSBlbnRyZWdhciBlc3RhIGxpY2Vuw6dhLCB2b2PDqihzKSBvKHMpIGF1dG9yKGVzKSBvdSBwcm9wcmlldMOhcmlvKHMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBjb25jZWRlKG0pIGFvIFJlcG9zaXTDs3JpbyBQYW50aGVvbiBkYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gZGUgSmFuZWlybyAoVUZSSikgbyBkaXJlaXRvIG7Do28gLSBleGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vKSBlbSB0b2RvIG8gbXVuZG8sIGVtIGZvcm1hdG8gZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8sIG1hcyBuw6NvIGxpbWl0YWRvIGEgw6F1ZGlvIGUvb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZSSiBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhZHV6aXIgYSBhcHJlc2VudGHDp8OjbyBkZSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gY29tIGEgZmluYWxpZGFkZSBkZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogdGFtYsOpbSBjb25jb3JkYSBxdWUgYSBVRlJKIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXNzYSBzdWJtaXNzw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8OjbyBkaWdpdGFsLgoKRGVjbGFyYSBxdWUgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgc2V1IHRyYWJhbGhvIG9yaWdpbmFsLCBlIHF1ZSB2b2PDqiB0ZW0gbyBkaXJlaXRvIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIGEgc3VhIGFwcmVzZW50YcOnw6NvLCBjb20gbyBtZWxob3IgZGUgc2V1cyBjb25oZWNpbWVudG9zLCBuw6NvIGluZnJpbmdpIGRpcmVpdG9zIGF1dG9yYWlzIGRlIHRlcmNlaXJvcy4KClNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCB2b2PDqiBuw6NvIHRlbSBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBlIGNvbmNlZGUgYSBVRlJKIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRhIHN1Ym1pc3PDo28uCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIHF1ZSBmb2ksIG91IHRlbSBzaWRvIHBhdHJvY2luYWRvIG91IGFwb2lhZG8gcG9yIHVtYSBhZ8OqbmNpYSBvdSBvdXRybyhzKSBvcmdhbmlzbW8ocykgcXVlIG7Do28gYSBVRlJKLCB2b2PDqiBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWxxdWVyIGRpcmVpdG8gZGUgUkVWSVPDg08gb3UgZGUgb3V0cmFzIG9icmlnYcOnw7VlcyByZXF1ZXJpZGFzIHBvciBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUkogaXLDoSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8ocykgc2V1KHMpIG5vbWUocykgY29tbyBhdXRvcihlcykgb3UgcHJvcHJpZXTDoXJpbyhzKSBkYSBzdWJtaXNzw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZGFzIHBlcm1pdGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EsIG5vIGF0byBkZSBzdWJtaXNzw6NvLgo=Repositório de PublicaçõesPUBhttp://www.pantheon.ufrj.br/oai/requestopendoar:2023-11-30T03:05:21Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false
dc.title.pt_BR.fl_str_mv Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado
dc.title.alternative.pt_BR.fl_str_mv Classification of massive stars with unsupervised machine learning
title Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado
spellingShingle Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado
Gonçalves, Rodrigo Barros
CNPQ::CIENCIAS EXATAS E DA TERRA::ASTRONOMIA
Astrofísica estelar
Estrelas de alta massa
Classificação espectral de estrelas
Aprendizado de máquina
Algorítmos
Python (Linguagem de programação de computador)
Stellar astrophysics
Massive Stars
Stellar spectral classification
Machine Learning
Algorithms
title_short Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado
title_full Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado
title_fullStr Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado
title_full_unstemmed Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado
title_sort Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado
author Gonçalves, Rodrigo Barros
author_facet Gonçalves, Rodrigo Barros
author_role author
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3484071295740741
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/2224902596323773
dc.contributor.author.fl_str_mv Gonçalves, Rodrigo Barros
dc.contributor.referee1.fl_str_mv Lopes, Paulo Afranio Augusto
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/2912390244432645
dc.contributor.referee2.fl_str_mv Pereira, Eduardo Machado
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/5667844934988317
dc.contributor.advisor1.fl_str_mv Marcolino, Wagner Luiz Ferreira
contributor_str_mv Lopes, Paulo Afranio Augusto
Pereira, Eduardo Machado
Marcolino, Wagner Luiz Ferreira
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::ASTRONOMIA
topic CNPQ::CIENCIAS EXATAS E DA TERRA::ASTRONOMIA
Astrofísica estelar
Estrelas de alta massa
Classificação espectral de estrelas
Aprendizado de máquina
Algorítmos
Python (Linguagem de programação de computador)
Stellar astrophysics
Massive Stars
Stellar spectral classification
Machine Learning
Algorithms
dc.subject.por.fl_str_mv Astrofísica estelar
Estrelas de alta massa
Classificação espectral de estrelas
Aprendizado de máquina
Algorítmos
Python (Linguagem de programação de computador)
Stellar astrophysics
Massive Stars
Stellar spectral classification
Machine Learning
Algorithms
description A classificação espectral de estrelas de alta massa fornece diretamente uma ideia do status evolutivo de determinado objeto e de parâmetros físicos importantes, como a temperatura e luminosidade, e até mesmo da velocidade de rotação superficial. Neste trabalho, foram utilizadas técnicas de aprendizado de máquina não supervisionado para atacar o problema de classificação espectral em estrelas de alta massa com duas motivações principais: (i) aprender astrofísica de estrelas de alta massa e (ii) aprender técnicas de aprendizado de máquina não supervisionado. A implementação de algoritmos de aprendizado de máquina pode se tornar uma ferramenta muito útil para a extração de informações relevantes de grandes amostras e surveys (e.g., Gaia EDR3), não somente para fins de classificação espectroscópica, mas também com fotometria e outras grandezas físicas medidas (e.g., velocidades radiais, composições químicas). Uma amostra de 606 espectros de estrelas de tipo espectral O oriundas do mais amplo catálogo disponível - “Galactic O-Star Catalog” -, e também de diversas fontes listadas em Martins (2018) foi reunida. Larguras equivalentes de linhas espectrais em cada objeto de nossa amostra foram medidas. Em seguida, o espaço de largura de linhas (1 ponto no espaço N-dimensional correspondendo a 1 estrela com N linhas medidas) e suas aglomerações foram analizadas por meio de um algoritmo de aprendizado de máquina não supervisionado (k-means clustering). Posteriormente, a fim de testarmos efeitos relacionados ao tamanho da amostra, elaboramos uma estratégia para gerar estrelas artificiais, i.e., novas larguras equivalentes, a partir das observadas. Ao todo, ficamos com 47.000 estrelas e a análise anterior foi repetida. Nos testes conduzidos com a amostra original de 606 estrelas, encontramos que a qualidade da classificação deixa a desejar. Mesmo quando utilizamos apenas 3 features (com o silhouette score sugerindo uma boa classificação), a diferenciação das classes nos clusters encontrados permaneceu insatisfatória. Nos testes realizados com a amostra maior, os resultados melhoraram substancialmente, com exceção do caso em que usamos as 3 features, onde houve piora. Isso provavelmente se deve ao critério de junção das classes de luminosidade que adotamos, o que implica numa revisão e aprimoramento da análise destas classes. Em suma, verificamos que algoritmos não supervisionados podem fornecer uma classificação espectral prévia satisfatória em novos conjuntos de dados desde que a amostra seja suficientemente grande, o que já é bastante útil para análises posteriores.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-11-22T18:28:25Z
dc.date.issued.fl_str_mv 2022-10-17
dc.date.available.fl_str_mv 2023-11-30T03:05:21Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv GONÇALVES, Rodrigo Barros. Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado. 2022. 63 f. Trabalho de conclusão de curso (Bacharelado em Astronomia) - Observatório do Valongo, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2022.
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11422/19225
identifier_str_mv GONÇALVES, Rodrigo Barros. Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado. 2022. 63 f. Trabalho de conclusão de curso (Bacharelado em Astronomia) - Observatório do Valongo, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2022.
url http://hdl.handle.net/11422/19225
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
dc.publisher.initials.fl_str_mv UFRJ
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Observatório do Valongo
publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRJ
instname:Universidade Federal do Rio de Janeiro (UFRJ)
instacron:UFRJ
instname_str Universidade Federal do Rio de Janeiro (UFRJ)
instacron_str UFRJ
institution UFRJ
reponame_str Repositório Institucional da UFRJ
collection Repositório Institucional da UFRJ
bitstream.url.fl_str_mv http://pantheon.ufrj.br:80/bitstream/11422/19225/2/license.txt
http://pantheon.ufrj.br:80/bitstream/11422/19225/1/RBGon%C3%A7alves.pdf
bitstream.checksum.fl_str_mv dd32849f2bfb22da963c3aac6e26e255
ddfefd912cb011fe1a423dd656f84d48
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)
repository.mail.fl_str_mv
_version_ 1784097272253906944