Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFCG |
Texto Completo: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521 |
Resumo: | Aplicamos PCA, t-SNE e UMAP nos datasets de calculadoras de interpretação genética com dados de grupos étnicos judaicos, de vários vizinhos não-judeus e de etnias correlacionadas, utilizando o software R. Realizamos uma comparação visual entre os resultados gerados e utilizamos o microbenchmark para verificar o tempo de execução dos métodos. O t-SNE e o UMAP são eficientes para trabalharmos com âmbitos locais da visualização, enquanto o PCA é adequado quando o número de amostras é reduzido. t-SNE e UMAP são capazes de formar agrupamentos que não veríamos somente utilizando o PCA. Apesar disso, são mais lentos que o PCA, e as visualizações geradas por eles mudam ao executar o algoritmo novamente. |
id |
UFCG_281d80a29b59bc4e5ccd8b4f469d5138 |
---|---|
oai_identifier_str |
oai:localhost:riufcg/30521 |
network_acronym_str |
UFCG |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
repository_id_str |
4851 |
spelling |
MASSONI, Tiago Lima.MASSONI, T. L.http://lattes.cnpq.br/3563923906851611MACHADO, Patrícia Duarte de Lima.MACHADO, P. D. L.http://lattes.cnpq.br/2495918356675019BRASILEIRO, Francisco Vilar.BRASILEIRO, F. V.http://lattes.cnpq.br/5957855817378897RODRIGUES. M. A.RODRIGUES, Matheus Andrade.Aplicamos PCA, t-SNE e UMAP nos datasets de calculadoras de interpretação genética com dados de grupos étnicos judaicos, de vários vizinhos não-judeus e de etnias correlacionadas, utilizando o software R. Realizamos uma comparação visual entre os resultados gerados e utilizamos o microbenchmark para verificar o tempo de execução dos métodos. O t-SNE e o UMAP são eficientes para trabalharmos com âmbitos locais da visualização, enquanto o PCA é adequado quando o número de amostras é reduzido. t-SNE e UMAP são capazes de formar agrupamentos que não veríamos somente utilizando o PCA. Apesar disso, são mais lentos que o PCA, e as visualizações geradas por eles mudam ao executar o algoritmo novamente.We applied PCA, t-SNE, and UMAP to datasets from genetic interpretation calculators containing data of Jewish ethnic groups, various non-Jewish neighbors, and correlated ethnicities, using the R software. We conducted a visual comparison of the generated results and used microbenchmarking to measure the execution time of the methods. t-SNE and UMAP are efficient for working with local aspects of visualization, while PCA is suitable when the number of samples is small. t-SNE and UMAP are capable of forming clusters that would not be seen using PCA alone. However, they are slower than PCA, and the visualizations generated by them change when the algorithm is run again.Submitted by Élida Maeli Fernandes Quirino (maely_sax@hotmail.com) on 2023-07-03T14:57:50Z No. of bitstreams: 1 MATHEUS ANDRADE RODRIGUES - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2023.pdf: 1106702 bytes, checksum: 03c33aa61def3e5b2e325b34a1543724 (MD5)Made available in DSpace on 2023-07-03T14:57:50Z (GMT). No. of bitstreams: 1 MATHEUS ANDRADE RODRIGUES - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2023.pdf: 1106702 bytes, checksum: 03c33aa61def3e5b2e325b34a1543724 (MD5) Previous issue date: 2023-06-28Universidade Federal de Campina GrandeUFCGBrasilCentro de Engenharia Elétrica e Informática - CEEICiência da Computação.EtniasJudeusDNAt-SNEUMAPRedução de dimensionalidadeCalculadoras de interpretação genéticaGrupos étnicosSoftware R.MicrobanchmarkPCAEthnicitiesJewsDimensionality reductionGenetic Interpretation CalculatorsEthnic groupsR software.MicrobankmarkExplorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP.Exploring dimensionality reduction techniques in DNA analysis of jewish and other ethnic groups: a comparison of PCA, T-SNE, AND UMAP.2023-06-282023-07-03T14:57:50Z2023-07-032023-07-03T14:57:50Zhttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521RODRIGUES, Matheus Andrade. Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. 2023. 24f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCGLICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/30521/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALMATHEUS ANDRADE RODRIGUES - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2023.pdfMATHEUS ANDRADE RODRIGUES - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2023.pdfapplication/pdf1106702http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/30521/1/MATHEUS+ANDRADE+RODRIGUES+-+TCC+ARTIGO+CI%C3%8ANCIA+DA+COMPUTA%C3%87%C3%83O+CEEI+2023.pdf03c33aa61def3e5b2e325b34a1543724MD51riufcg/305212023-07-03 11:58:25.377oai:localhost:riufcg/30521Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512024-07-01T10:36:51.559402Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false |
dc.title.pt_BR.fl_str_mv |
Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. |
dc.title.alternative.pt_BR.fl_str_mv |
Exploring dimensionality reduction techniques in DNA analysis of jewish and other ethnic groups: a comparison of PCA, T-SNE, AND UMAP. |
title |
Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. |
spellingShingle |
Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. RODRIGUES, Matheus Andrade. Ciência da Computação. Etnias Judeus DNA t-SNE UMAP Redução de dimensionalidade Calculadoras de interpretação genética Grupos étnicos Software R. Microbanchmark PCA Ethnicities Jews Dimensionality reduction Genetic Interpretation Calculators Ethnic groups R software. Microbankmark |
title_short |
Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. |
title_full |
Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. |
title_fullStr |
Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. |
title_full_unstemmed |
Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. |
title_sort |
Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. |
author |
RODRIGUES, Matheus Andrade. |
author_facet |
RODRIGUES, Matheus Andrade. |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
MASSONI, Tiago Lima. |
dc.contributor.advisor1ID.fl_str_mv |
MASSONI, T. L. |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/3563923906851611 |
dc.contributor.referee1.fl_str_mv |
MACHADO, Patrícia Duarte de Lima. |
dc.contributor.referee1ID.fl_str_mv |
MACHADO, P. D. L. |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/2495918356675019 |
dc.contributor.referee2.fl_str_mv |
BRASILEIRO, Francisco Vilar. |
dc.contributor.referee2ID.fl_str_mv |
BRASILEIRO, F. V. |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/5957855817378897 |
dc.contributor.authorID.fl_str_mv |
RODRIGUES. M. A. |
dc.contributor.author.fl_str_mv |
RODRIGUES, Matheus Andrade. |
contributor_str_mv |
MASSONI, Tiago Lima. MACHADO, Patrícia Duarte de Lima. BRASILEIRO, Francisco Vilar. |
dc.subject.cnpq.fl_str_mv |
Ciência da Computação. |
topic |
Ciência da Computação. Etnias Judeus DNA t-SNE UMAP Redução de dimensionalidade Calculadoras de interpretação genética Grupos étnicos Software R. Microbanchmark PCA Ethnicities Jews Dimensionality reduction Genetic Interpretation Calculators Ethnic groups R software. Microbankmark |
dc.subject.por.fl_str_mv |
Etnias Judeus DNA t-SNE UMAP Redução de dimensionalidade Calculadoras de interpretação genética Grupos étnicos Software R. Microbanchmark PCA Ethnicities Jews Dimensionality reduction Genetic Interpretation Calculators Ethnic groups R software. Microbankmark |
description |
Aplicamos PCA, t-SNE e UMAP nos datasets de calculadoras de interpretação genética com dados de grupos étnicos judaicos, de vários vizinhos não-judeus e de etnias correlacionadas, utilizando o software R. Realizamos uma comparação visual entre os resultados gerados e utilizamos o microbenchmark para verificar o tempo de execução dos métodos. O t-SNE e o UMAP são eficientes para trabalharmos com âmbitos locais da visualização, enquanto o PCA é adequado quando o número de amostras é reduzido. t-SNE e UMAP são capazes de formar agrupamentos que não veríamos somente utilizando o PCA. Apesar disso, são mais lentos que o PCA, e as visualizações geradas por eles mudam ao executar o algoritmo novamente. |
publishDate |
2023 |
dc.date.issued.fl_str_mv |
2023-06-28 |
dc.date.accessioned.fl_str_mv |
2023-07-03T14:57:50Z |
dc.date.available.fl_str_mv |
2023-07-03 2023-07-03T14:57:50Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521 |
dc.identifier.citation.fl_str_mv |
RODRIGUES, Matheus Andrade. Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. 2023. 24f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521 |
url |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521 |
identifier_str_mv |
RODRIGUES, Matheus Andrade. Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. 2023. 24f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Campina Grande |
dc.publisher.initials.fl_str_mv |
UFCG |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Centro de Engenharia Elétrica e Informática - CEEI |
publisher.none.fl_str_mv |
Universidade Federal de Campina Grande |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFCG instname:Universidade Federal de Campina Grande (UFCG) instacron:UFCG |
instname_str |
Universidade Federal de Campina Grande (UFCG) |
instacron_str |
UFCG |
institution |
UFCG |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
collection |
Biblioteca Digital de Teses e Dissertações da UFCG |
bitstream.url.fl_str_mv |
http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/30521/2/license.txt http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/30521/1/MATHEUS+ANDRADE+RODRIGUES+-+TCC+ARTIGO+CI%C3%8ANCIA+DA+COMPUTA%C3%87%C3%83O+CEEI+2023.pdf |
bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 03c33aa61def3e5b2e325b34a1543724 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG) |
repository.mail.fl_str_mv |
bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br |
_version_ |
1803396877344833536 |