Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP.

Detalhes bibliográficos
Autor(a) principal: RODRIGUES, Matheus Andrade.
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFCG
Texto Completo: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521
Resumo: Aplicamos PCA, t-SNE e UMAP nos datasets de calculadoras de interpretação genética com dados de grupos étnicos judaicos, de vários vizinhos não-judeus e de etnias correlacionadas, utilizando o software R. Realizamos uma comparação visual entre os resultados gerados e utilizamos o microbenchmark para verificar o tempo de execução dos métodos. O t-SNE e o UMAP são eficientes para trabalharmos com âmbitos locais da visualização, enquanto o PCA é adequado quando o número de amostras é reduzido. t-SNE e UMAP são capazes de formar agrupamentos que não veríamos somente utilizando o PCA. Apesar disso, são mais lentos que o PCA, e as visualizações geradas por eles mudam ao executar o algoritmo novamente.
id UFCG_281d80a29b59bc4e5ccd8b4f469d5138
oai_identifier_str oai:localhost:riufcg/30521
network_acronym_str UFCG
network_name_str Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str 4851
spelling MASSONI, Tiago Lima.MASSONI, T. L.http://lattes.cnpq.br/3563923906851611MACHADO, Patrícia Duarte de Lima.MACHADO, P. D. L.http://lattes.cnpq.br/2495918356675019BRASILEIRO, Francisco Vilar.BRASILEIRO, F. V.http://lattes.cnpq.br/5957855817378897RODRIGUES. M. A.RODRIGUES, Matheus Andrade.Aplicamos PCA, t-SNE e UMAP nos datasets de calculadoras de interpretação genética com dados de grupos étnicos judaicos, de vários vizinhos não-judeus e de etnias correlacionadas, utilizando o software R. Realizamos uma comparação visual entre os resultados gerados e utilizamos o microbenchmark para verificar o tempo de execução dos métodos. O t-SNE e o UMAP são eficientes para trabalharmos com âmbitos locais da visualização, enquanto o PCA é adequado quando o número de amostras é reduzido. t-SNE e UMAP são capazes de formar agrupamentos que não veríamos somente utilizando o PCA. Apesar disso, são mais lentos que o PCA, e as visualizações geradas por eles mudam ao executar o algoritmo novamente.We applied PCA, t-SNE, and UMAP to datasets from genetic interpretation calculators containing data of Jewish ethnic groups, various non-Jewish neighbors, and correlated ethnicities, using the R software. We conducted a visual comparison of the generated results and used microbenchmarking to measure the execution time of the methods. t-SNE and UMAP are efficient for working with local aspects of visualization, while PCA is suitable when the number of samples is small. t-SNE and UMAP are capable of forming clusters that would not be seen using PCA alone. However, they are slower than PCA, and the visualizations generated by them change when the algorithm is run again.Submitted by Élida Maeli Fernandes Quirino (maely_sax@hotmail.com) on 2023-07-03T14:57:50Z No. of bitstreams: 1 MATHEUS ANDRADE RODRIGUES - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2023.pdf: 1106702 bytes, checksum: 03c33aa61def3e5b2e325b34a1543724 (MD5)Made available in DSpace on 2023-07-03T14:57:50Z (GMT). No. of bitstreams: 1 MATHEUS ANDRADE RODRIGUES - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2023.pdf: 1106702 bytes, checksum: 03c33aa61def3e5b2e325b34a1543724 (MD5) Previous issue date: 2023-06-28Universidade Federal de Campina GrandeUFCGBrasilCentro de Engenharia Elétrica e Informática - CEEICiência da Computação.EtniasJudeusDNAt-SNEUMAPRedução de dimensionalidadeCalculadoras de interpretação genéticaGrupos étnicosSoftware R.MicrobanchmarkPCAEthnicitiesJewsDimensionality reductionGenetic Interpretation CalculatorsEthnic groupsR software.MicrobankmarkExplorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP.Exploring dimensionality reduction techniques in DNA analysis of jewish and other ethnic groups: a comparison of PCA, T-SNE, AND UMAP.2023-06-282023-07-03T14:57:50Z2023-07-032023-07-03T14:57:50Zhttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521RODRIGUES, Matheus Andrade. Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. 2023. 24f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCGLICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/30521/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALMATHEUS ANDRADE RODRIGUES - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2023.pdfMATHEUS ANDRADE RODRIGUES - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2023.pdfapplication/pdf1106702http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/30521/1/MATHEUS+ANDRADE+RODRIGUES+-+TCC+ARTIGO+CI%C3%8ANCIA+DA+COMPUTA%C3%87%C3%83O+CEEI+2023.pdf03c33aa61def3e5b2e325b34a1543724MD51riufcg/305212023-07-03 11:58:25.377oai:localhost:riufcg/30521Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512024-07-01T10:36:51.559402Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.pt_BR.fl_str_mv Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP.
dc.title.alternative.pt_BR.fl_str_mv Exploring dimensionality reduction techniques in DNA analysis of jewish and other ethnic groups: a comparison of PCA, T-SNE, AND UMAP.
title Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP.
spellingShingle Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP.
RODRIGUES, Matheus Andrade.
Ciência da Computação.
Etnias
Judeus
DNA
t-SNE
UMAP
Redução de dimensionalidade
Calculadoras de interpretação genética
Grupos étnicos
Software R.
Microbanchmark
PCA
Ethnicities
Jews
Dimensionality reduction
Genetic Interpretation Calculators
Ethnic groups
R software.
Microbankmark
title_short Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP.
title_full Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP.
title_fullStr Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP.
title_full_unstemmed Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP.
title_sort Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP.
author RODRIGUES, Matheus Andrade.
author_facet RODRIGUES, Matheus Andrade.
author_role author
dc.contributor.advisor1.fl_str_mv MASSONI, Tiago Lima.
dc.contributor.advisor1ID.fl_str_mv MASSONI, T. L.
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/3563923906851611
dc.contributor.referee1.fl_str_mv MACHADO, Patrícia Duarte de Lima.
dc.contributor.referee1ID.fl_str_mv MACHADO, P. D. L.
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/2495918356675019
dc.contributor.referee2.fl_str_mv BRASILEIRO, Francisco Vilar.
dc.contributor.referee2ID.fl_str_mv BRASILEIRO, F. V.
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/5957855817378897
dc.contributor.authorID.fl_str_mv RODRIGUES. M. A.
dc.contributor.author.fl_str_mv RODRIGUES, Matheus Andrade.
contributor_str_mv MASSONI, Tiago Lima.
MACHADO, Patrícia Duarte de Lima.
BRASILEIRO, Francisco Vilar.
dc.subject.cnpq.fl_str_mv Ciência da Computação.
topic Ciência da Computação.
Etnias
Judeus
DNA
t-SNE
UMAP
Redução de dimensionalidade
Calculadoras de interpretação genética
Grupos étnicos
Software R.
Microbanchmark
PCA
Ethnicities
Jews
Dimensionality reduction
Genetic Interpretation Calculators
Ethnic groups
R software.
Microbankmark
dc.subject.por.fl_str_mv Etnias
Judeus
DNA
t-SNE
UMAP
Redução de dimensionalidade
Calculadoras de interpretação genética
Grupos étnicos
Software R.
Microbanchmark
PCA
Ethnicities
Jews
Dimensionality reduction
Genetic Interpretation Calculators
Ethnic groups
R software.
Microbankmark
description Aplicamos PCA, t-SNE e UMAP nos datasets de calculadoras de interpretação genética com dados de grupos étnicos judaicos, de vários vizinhos não-judeus e de etnias correlacionadas, utilizando o software R. Realizamos uma comparação visual entre os resultados gerados e utilizamos o microbenchmark para verificar o tempo de execução dos métodos. O t-SNE e o UMAP são eficientes para trabalharmos com âmbitos locais da visualização, enquanto o PCA é adequado quando o número de amostras é reduzido. t-SNE e UMAP são capazes de formar agrupamentos que não veríamos somente utilizando o PCA. Apesar disso, são mais lentos que o PCA, e as visualizações geradas por eles mudam ao executar o algoritmo novamente.
publishDate 2023
dc.date.issued.fl_str_mv 2023-06-28
dc.date.accessioned.fl_str_mv 2023-07-03T14:57:50Z
dc.date.available.fl_str_mv 2023-07-03
2023-07-03T14:57:50Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521
dc.identifier.citation.fl_str_mv RODRIGUES, Matheus Andrade. Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. 2023. 24f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521
url http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521
identifier_str_mv RODRIGUES, Matheus Andrade. Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. 2023. 24f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
dc.publisher.initials.fl_str_mv UFCG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Centro de Engenharia Elétrica e Informática - CEEI
publisher.none.fl_str_mv Universidade Federal de Campina Grande
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFCG
instname:Universidade Federal de Campina Grande (UFCG)
instacron:UFCG
instname_str Universidade Federal de Campina Grande (UFCG)
instacron_str UFCG
institution UFCG
reponame_str Biblioteca Digital de Teses e Dissertações da UFCG
collection Biblioteca Digital de Teses e Dissertações da UFCG
bitstream.url.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/30521/2/license.txt
http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/30521/1/MATHEUS+ANDRADE+RODRIGUES+-+TCC+ARTIGO+CI%C3%8ANCIA+DA+COMPUTA%C3%87%C3%83O+CEEI+2023.pdf
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
03c33aa61def3e5b2e325b34a1543724
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br
_version_ 1803396877344833536