Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRJ |
Texto Completo: | http://hdl.handle.net/11422/19225 |
Resumo: | A classificação espectral de estrelas de alta massa fornece diretamente uma ideia do status evolutivo de determinado objeto e de parâmetros físicos importantes, como a temperatura e luminosidade, e até mesmo da velocidade de rotação superficial. Neste trabalho, foram utilizadas técnicas de aprendizado de máquina não supervisionado para atacar o problema de classificação espectral em estrelas de alta massa com duas motivações principais: (i) aprender astrofísica de estrelas de alta massa e (ii) aprender técnicas de aprendizado de máquina não supervisionado. A implementação de algoritmos de aprendizado de máquina pode se tornar uma ferramenta muito útil para a extração de informações relevantes de grandes amostras e surveys (e.g., Gaia EDR3), não somente para fins de classificação espectroscópica, mas também com fotometria e outras grandezas físicas medidas (e.g., velocidades radiais, composições químicas). Uma amostra de 606 espectros de estrelas de tipo espectral O oriundas do mais amplo catálogo disponível - “Galactic O-Star Catalog” -, e também de diversas fontes listadas em Martins (2018) foi reunida. Larguras equivalentes de linhas espectrais em cada objeto de nossa amostra foram medidas. Em seguida, o espaço de largura de linhas (1 ponto no espaço N-dimensional correspondendo a 1 estrela com N linhas medidas) e suas aglomerações foram analizadas por meio de um algoritmo de aprendizado de máquina não supervisionado (k-means clustering). Posteriormente, a fim de testarmos efeitos relacionados ao tamanho da amostra, elaboramos uma estratégia para gerar estrelas artificiais, i.e., novas larguras equivalentes, a partir das observadas. Ao todo, ficamos com 47.000 estrelas e a análise anterior foi repetida. Nos testes conduzidos com a amostra original de 606 estrelas, encontramos que a qualidade da classificação deixa a desejar. Mesmo quando utilizamos apenas 3 features (com o silhouette score sugerindo uma boa classificação), a diferenciação das classes nos clusters encontrados permaneceu insatisfatória. Nos testes realizados com a amostra maior, os resultados melhoraram substancialmente, com exceção do caso em que usamos as 3 features, onde houve piora. Isso provavelmente se deve ao critério de junção das classes de luminosidade que adotamos, o que implica numa revisão e aprimoramento da análise destas classes. Em suma, verificamos que algoritmos não supervisionados podem fornecer uma classificação espectral prévia satisfatória em novos conjuntos de dados desde que a amostra seja suficientemente grande, o que já é bastante útil para análises posteriores. |
id |
UFRJ_4c288b86f064beecd9b341081be4759c |
---|---|
oai_identifier_str |
oai:pantheon.ufrj.br:11422/19225 |
network_acronym_str |
UFRJ |
network_name_str |
Repositório Institucional da UFRJ |
repository_id_str |
|
spelling |
Gonçalves, Rodrigo Barroshttp://lattes.cnpq.br/3484071295740741http://lattes.cnpq.br/2224902596323773Lopes, Paulo Afranio Augustohttp://lattes.cnpq.br/2912390244432645Pereira, Eduardo Machadohttp://lattes.cnpq.br/5667844934988317Marcolino, Wagner Luiz Ferreira2022-11-22T18:28:25Z2023-11-30T03:05:21Z2022-10-17GONÇALVES, Rodrigo Barros. Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado. 2022. 63 f. Trabalho de conclusão de curso (Bacharelado em Astronomia) - Observatório do Valongo, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2022.http://hdl.handle.net/11422/19225Submitted by Regina Moura (regina@ov.ufrj.br) on 2022-11-22T18:27:25Z No. of bitstreams: 1 RBGonçalves.pdf: 3644130 bytes, checksum: ddfefd912cb011fe1a423dd656f84d48 (MD5)Approved for entry into archive by Regina Moura (regina@ov.ufrj.br) on 2022-11-22T18:28:25Z (GMT) No. of bitstreams: 1 RBGonçalves.pdf: 3644130 bytes, checksum: ddfefd912cb011fe1a423dd656f84d48 (MD5)Made available in DSpace on 2022-11-22T18:28:25Z (GMT). No. of bitstreams: 1 RBGonçalves.pdf: 3644130 bytes, checksum: ddfefd912cb011fe1a423dd656f84d48 (MD5) Previous issue date: 2022-10-17A classificação espectral de estrelas de alta massa fornece diretamente uma ideia do status evolutivo de determinado objeto e de parâmetros físicos importantes, como a temperatura e luminosidade, e até mesmo da velocidade de rotação superficial. Neste trabalho, foram utilizadas técnicas de aprendizado de máquina não supervisionado para atacar o problema de classificação espectral em estrelas de alta massa com duas motivações principais: (i) aprender astrofísica de estrelas de alta massa e (ii) aprender técnicas de aprendizado de máquina não supervisionado. A implementação de algoritmos de aprendizado de máquina pode se tornar uma ferramenta muito útil para a extração de informações relevantes de grandes amostras e surveys (e.g., Gaia EDR3), não somente para fins de classificação espectroscópica, mas também com fotometria e outras grandezas físicas medidas (e.g., velocidades radiais, composições químicas). Uma amostra de 606 espectros de estrelas de tipo espectral O oriundas do mais amplo catálogo disponível - “Galactic O-Star Catalog” -, e também de diversas fontes listadas em Martins (2018) foi reunida. Larguras equivalentes de linhas espectrais em cada objeto de nossa amostra foram medidas. Em seguida, o espaço de largura de linhas (1 ponto no espaço N-dimensional correspondendo a 1 estrela com N linhas medidas) e suas aglomerações foram analizadas por meio de um algoritmo de aprendizado de máquina não supervisionado (k-means clustering). Posteriormente, a fim de testarmos efeitos relacionados ao tamanho da amostra, elaboramos uma estratégia para gerar estrelas artificiais, i.e., novas larguras equivalentes, a partir das observadas. Ao todo, ficamos com 47.000 estrelas e a análise anterior foi repetida. Nos testes conduzidos com a amostra original de 606 estrelas, encontramos que a qualidade da classificação deixa a desejar. Mesmo quando utilizamos apenas 3 features (com o silhouette score sugerindo uma boa classificação), a diferenciação das classes nos clusters encontrados permaneceu insatisfatória. Nos testes realizados com a amostra maior, os resultados melhoraram substancialmente, com exceção do caso em que usamos as 3 features, onde houve piora. Isso provavelmente se deve ao critério de junção das classes de luminosidade que adotamos, o que implica numa revisão e aprimoramento da análise destas classes. Em suma, verificamos que algoritmos não supervisionados podem fornecer uma classificação espectral prévia satisfatória em novos conjuntos de dados desde que a amostra seja suficientemente grande, o que já é bastante útil para análises posteriores.porUniversidade Federal do Rio de JaneiroUFRJBrasilObservatório do ValongoCNPQ::CIENCIAS EXATAS E DA TERRA::ASTRONOMIAAstrofísica estelarEstrelas de alta massaClassificação espectral de estrelasAprendizado de máquinaAlgorítmosPython (Linguagem de programação de computador)Stellar astrophysicsMassive StarsStellar spectral classificationMachine LearningAlgorithmsClassificação de estrelas de alta massa com aprendizado de máquina não supervisionadoClassification of massive stars with unsupervised machine learninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisabertoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJLICENSElicense.txtlicense.txttext/plain; charset=utf-81853http://pantheon.ufrj.br:80/bitstream/11422/19225/2/license.txtdd32849f2bfb22da963c3aac6e26e255MD52ORIGINALRBGonçalves.pdfRBGonçalves.pdfapplication/pdf3644130http://pantheon.ufrj.br:80/bitstream/11422/19225/1/RBGon%C3%A7alves.pdfddfefd912cb011fe1a423dd656f84d48MD5111422/192252023-11-30 00:05:21.398oai:pantheon.ufrj.br:11422/19225TElDRU7Dh0EgTsODTy1FWENMVVNJVkEgREUgRElTVFJJQlVJw4fDg08KCkFvIGFzc2luYXIgZSBlbnRyZWdhciBlc3RhIGxpY2Vuw6dhLCB2b2PDqihzKSBvKHMpIGF1dG9yKGVzKSBvdSBwcm9wcmlldMOhcmlvKHMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBjb25jZWRlKG0pIGFvIFJlcG9zaXTDs3JpbyBQYW50aGVvbiBkYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gZGUgSmFuZWlybyAoVUZSSikgbyBkaXJlaXRvIG7Do28gLSBleGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vKSBlbSB0b2RvIG8gbXVuZG8sIGVtIGZvcm1hdG8gZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8sIG1hcyBuw6NvIGxpbWl0YWRvIGEgw6F1ZGlvIGUvb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZSSiBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhZHV6aXIgYSBhcHJlc2VudGHDp8OjbyBkZSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gY29tIGEgZmluYWxpZGFkZSBkZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogdGFtYsOpbSBjb25jb3JkYSBxdWUgYSBVRlJKIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXNzYSBzdWJtaXNzw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8OjbyBkaWdpdGFsLgoKRGVjbGFyYSBxdWUgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgc2V1IHRyYWJhbGhvIG9yaWdpbmFsLCBlIHF1ZSB2b2PDqiB0ZW0gbyBkaXJlaXRvIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIGEgc3VhIGFwcmVzZW50YcOnw6NvLCBjb20gbyBtZWxob3IgZGUgc2V1cyBjb25oZWNpbWVudG9zLCBuw6NvIGluZnJpbmdpIGRpcmVpdG9zIGF1dG9yYWlzIGRlIHRlcmNlaXJvcy4KClNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCB2b2PDqiBuw6NvIHRlbSBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBlIGNvbmNlZGUgYSBVRlJKIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRhIHN1Ym1pc3PDo28uCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIHF1ZSBmb2ksIG91IHRlbSBzaWRvIHBhdHJvY2luYWRvIG91IGFwb2lhZG8gcG9yIHVtYSBhZ8OqbmNpYSBvdSBvdXRybyhzKSBvcmdhbmlzbW8ocykgcXVlIG7Do28gYSBVRlJKLCB2b2PDqiBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWxxdWVyIGRpcmVpdG8gZGUgUkVWSVPDg08gb3UgZGUgb3V0cmFzIG9icmlnYcOnw7VlcyByZXF1ZXJpZGFzIHBvciBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUkogaXLDoSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8ocykgc2V1KHMpIG5vbWUocykgY29tbyBhdXRvcihlcykgb3UgcHJvcHJpZXTDoXJpbyhzKSBkYSBzdWJtaXNzw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZGFzIHBlcm1pdGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EsIG5vIGF0byBkZSBzdWJtaXNzw6NvLgo=Repositório de PublicaçõesPUBhttp://www.pantheon.ufrj.br/oai/requestopendoar:2023-11-30T03:05:21Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false |
dc.title.pt_BR.fl_str_mv |
Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado |
dc.title.alternative.pt_BR.fl_str_mv |
Classification of massive stars with unsupervised machine learning |
title |
Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado |
spellingShingle |
Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado Gonçalves, Rodrigo Barros CNPQ::CIENCIAS EXATAS E DA TERRA::ASTRONOMIA Astrofísica estelar Estrelas de alta massa Classificação espectral de estrelas Aprendizado de máquina Algorítmos Python (Linguagem de programação de computador) Stellar astrophysics Massive Stars Stellar spectral classification Machine Learning Algorithms |
title_short |
Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado |
title_full |
Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado |
title_fullStr |
Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado |
title_full_unstemmed |
Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado |
title_sort |
Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado |
author |
Gonçalves, Rodrigo Barros |
author_facet |
Gonçalves, Rodrigo Barros |
author_role |
author |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/3484071295740741 |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/2224902596323773 |
dc.contributor.author.fl_str_mv |
Gonçalves, Rodrigo Barros |
dc.contributor.referee1.fl_str_mv |
Lopes, Paulo Afranio Augusto |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/2912390244432645 |
dc.contributor.referee2.fl_str_mv |
Pereira, Eduardo Machado |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/5667844934988317 |
dc.contributor.advisor1.fl_str_mv |
Marcolino, Wagner Luiz Ferreira |
contributor_str_mv |
Lopes, Paulo Afranio Augusto Pereira, Eduardo Machado Marcolino, Wagner Luiz Ferreira |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::ASTRONOMIA |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::ASTRONOMIA Astrofísica estelar Estrelas de alta massa Classificação espectral de estrelas Aprendizado de máquina Algorítmos Python (Linguagem de programação de computador) Stellar astrophysics Massive Stars Stellar spectral classification Machine Learning Algorithms |
dc.subject.por.fl_str_mv |
Astrofísica estelar Estrelas de alta massa Classificação espectral de estrelas Aprendizado de máquina Algorítmos Python (Linguagem de programação de computador) Stellar astrophysics Massive Stars Stellar spectral classification Machine Learning Algorithms |
description |
A classificação espectral de estrelas de alta massa fornece diretamente uma ideia do status evolutivo de determinado objeto e de parâmetros físicos importantes, como a temperatura e luminosidade, e até mesmo da velocidade de rotação superficial. Neste trabalho, foram utilizadas técnicas de aprendizado de máquina não supervisionado para atacar o problema de classificação espectral em estrelas de alta massa com duas motivações principais: (i) aprender astrofísica de estrelas de alta massa e (ii) aprender técnicas de aprendizado de máquina não supervisionado. A implementação de algoritmos de aprendizado de máquina pode se tornar uma ferramenta muito útil para a extração de informações relevantes de grandes amostras e surveys (e.g., Gaia EDR3), não somente para fins de classificação espectroscópica, mas também com fotometria e outras grandezas físicas medidas (e.g., velocidades radiais, composições químicas). Uma amostra de 606 espectros de estrelas de tipo espectral O oriundas do mais amplo catálogo disponível - “Galactic O-Star Catalog” -, e também de diversas fontes listadas em Martins (2018) foi reunida. Larguras equivalentes de linhas espectrais em cada objeto de nossa amostra foram medidas. Em seguida, o espaço de largura de linhas (1 ponto no espaço N-dimensional correspondendo a 1 estrela com N linhas medidas) e suas aglomerações foram analizadas por meio de um algoritmo de aprendizado de máquina não supervisionado (k-means clustering). Posteriormente, a fim de testarmos efeitos relacionados ao tamanho da amostra, elaboramos uma estratégia para gerar estrelas artificiais, i.e., novas larguras equivalentes, a partir das observadas. Ao todo, ficamos com 47.000 estrelas e a análise anterior foi repetida. Nos testes conduzidos com a amostra original de 606 estrelas, encontramos que a qualidade da classificação deixa a desejar. Mesmo quando utilizamos apenas 3 features (com o silhouette score sugerindo uma boa classificação), a diferenciação das classes nos clusters encontrados permaneceu insatisfatória. Nos testes realizados com a amostra maior, os resultados melhoraram substancialmente, com exceção do caso em que usamos as 3 features, onde houve piora. Isso provavelmente se deve ao critério de junção das classes de luminosidade que adotamos, o que implica numa revisão e aprimoramento da análise destas classes. Em suma, verificamos que algoritmos não supervisionados podem fornecer uma classificação espectral prévia satisfatória em novos conjuntos de dados desde que a amostra seja suficientemente grande, o que já é bastante útil para análises posteriores. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-11-22T18:28:25Z |
dc.date.issued.fl_str_mv |
2022-10-17 |
dc.date.available.fl_str_mv |
2023-11-30T03:05:21Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
GONÇALVES, Rodrigo Barros. Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado. 2022. 63 f. Trabalho de conclusão de curso (Bacharelado em Astronomia) - Observatório do Valongo, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2022. |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11422/19225 |
identifier_str_mv |
GONÇALVES, Rodrigo Barros. Classificação de estrelas de alta massa com aprendizado de máquina não supervisionado. 2022. 63 f. Trabalho de conclusão de curso (Bacharelado em Astronomia) - Observatório do Valongo, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2022. |
url |
http://hdl.handle.net/11422/19225 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro |
dc.publisher.initials.fl_str_mv |
UFRJ |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Observatório do Valongo |
publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRJ instname:Universidade Federal do Rio de Janeiro (UFRJ) instacron:UFRJ |
instname_str |
Universidade Federal do Rio de Janeiro (UFRJ) |
instacron_str |
UFRJ |
institution |
UFRJ |
reponame_str |
Repositório Institucional da UFRJ |
collection |
Repositório Institucional da UFRJ |
bitstream.url.fl_str_mv |
http://pantheon.ufrj.br:80/bitstream/11422/19225/2/license.txt http://pantheon.ufrj.br:80/bitstream/11422/19225/1/RBGon%C3%A7alves.pdf |
bitstream.checksum.fl_str_mv |
dd32849f2bfb22da963c3aac6e26e255 ddfefd912cb011fe1a423dd656f84d48 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ) |
repository.mail.fl_str_mv |
|
_version_ |
1784097272253906944 |