Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFCG |
Texto Completo: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521 |
Resumo: | Aplicamos PCA, t-SNE e UMAP nos datasets de calculadoras de interpretação genética com dados de grupos étnicos judaicos, de vários vizinhos não-judeus e de etnias correlacionadas, utilizando o software R. Realizamos uma comparação visual entre os resultados gerados e utilizamos o microbenchmark para verificar o tempo de execução dos métodos. O t-SNE e o UMAP são eficientes para trabalharmos com âmbitos locais da visualização, enquanto o PCA é adequado quando o número de amostras é reduzido. t-SNE e UMAP são capazes de formar agrupamentos que não veríamos somente utilizando o PCA. Apesar disso, são mais lentos que o PCA, e as visualizações geradas por eles mudam ao executar o algoritmo novamente. |
id |
UFCG_281d80a29b59bc4e5ccd8b4f469d5138 |
---|---|
oai_identifier_str |
oai:localhost:riufcg/30521 |
network_acronym_str |
UFCG |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
repository_id_str |
4851 |
spelling |
Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP.Exploring dimensionality reduction techniques in DNA analysis of jewish and other ethnic groups: a comparison of PCA, T-SNE, AND UMAP.EtniasJudeusDNAt-SNEUMAPRedução de dimensionalidadeCalculadoras de interpretação genéticaGrupos étnicosSoftware R.MicrobanchmarkPCAEthnicitiesJewsDimensionality reductionGenetic Interpretation CalculatorsEthnic groupsR software.MicrobankmarkCiência da Computação.Aplicamos PCA, t-SNE e UMAP nos datasets de calculadoras de interpretação genética com dados de grupos étnicos judaicos, de vários vizinhos não-judeus e de etnias correlacionadas, utilizando o software R. Realizamos uma comparação visual entre os resultados gerados e utilizamos o microbenchmark para verificar o tempo de execução dos métodos. O t-SNE e o UMAP são eficientes para trabalharmos com âmbitos locais da visualização, enquanto o PCA é adequado quando o número de amostras é reduzido. t-SNE e UMAP são capazes de formar agrupamentos que não veríamos somente utilizando o PCA. Apesar disso, são mais lentos que o PCA, e as visualizações geradas por eles mudam ao executar o algoritmo novamente.We applied PCA, t-SNE, and UMAP to datasets from genetic interpretation calculators containing data of Jewish ethnic groups, various non-Jewish neighbors, and correlated ethnicities, using the R software. We conducted a visual comparison of the generated results and used microbenchmarking to measure the execution time of the methods. t-SNE and UMAP are efficient for working with local aspects of visualization, while PCA is suitable when the number of samples is small. t-SNE and UMAP are capable of forming clusters that would not be seen using PCA alone. However, they are slower than PCA, and the visualizations generated by them change when the algorithm is run again.Universidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIUFCGMASSONI, Tiago Lima.MASSONI, T. L.http://lattes.cnpq.br/3563923906851611MACHADO, Patrícia Duarte de Lima.MACHADO, P. D. L.http://lattes.cnpq.br/2495918356675019BRASILEIRO, Francisco Vilar.BRASILEIRO, F. V.http://lattes.cnpq.br/5957855817378897RODRIGUES, Matheus Andrade.2023-06-282023-07-03T14:57:50Z2023-07-032023-07-03T14:57:50Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521RODRIGUES, Matheus Andrade. Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. 2023. 24f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2023-07-03T14:58:25Zoai:localhost:riufcg/30521Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512023-07-03T14:58:25Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false |
dc.title.none.fl_str_mv |
Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. Exploring dimensionality reduction techniques in DNA analysis of jewish and other ethnic groups: a comparison of PCA, T-SNE, AND UMAP. |
title |
Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. |
spellingShingle |
Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. RODRIGUES, Matheus Andrade. Etnias Judeus DNA t-SNE UMAP Redução de dimensionalidade Calculadoras de interpretação genética Grupos étnicos Software R. Microbanchmark PCA Ethnicities Jews Dimensionality reduction Genetic Interpretation Calculators Ethnic groups R software. Microbankmark Ciência da Computação. |
title_short |
Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. |
title_full |
Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. |
title_fullStr |
Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. |
title_full_unstemmed |
Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. |
title_sort |
Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. |
author |
RODRIGUES, Matheus Andrade. |
author_facet |
RODRIGUES, Matheus Andrade. |
author_role |
author |
dc.contributor.none.fl_str_mv |
MASSONI, Tiago Lima. MASSONI, T. L. http://lattes.cnpq.br/3563923906851611 MACHADO, Patrícia Duarte de Lima. MACHADO, P. D. L. http://lattes.cnpq.br/2495918356675019 BRASILEIRO, Francisco Vilar. BRASILEIRO, F. V. http://lattes.cnpq.br/5957855817378897 |
dc.contributor.author.fl_str_mv |
RODRIGUES, Matheus Andrade. |
dc.subject.por.fl_str_mv |
Etnias Judeus DNA t-SNE UMAP Redução de dimensionalidade Calculadoras de interpretação genética Grupos étnicos Software R. Microbanchmark PCA Ethnicities Jews Dimensionality reduction Genetic Interpretation Calculators Ethnic groups R software. Microbankmark Ciência da Computação. |
topic |
Etnias Judeus DNA t-SNE UMAP Redução de dimensionalidade Calculadoras de interpretação genética Grupos étnicos Software R. Microbanchmark PCA Ethnicities Jews Dimensionality reduction Genetic Interpretation Calculators Ethnic groups R software. Microbankmark Ciência da Computação. |
description |
Aplicamos PCA, t-SNE e UMAP nos datasets de calculadoras de interpretação genética com dados de grupos étnicos judaicos, de vários vizinhos não-judeus e de etnias correlacionadas, utilizando o software R. Realizamos uma comparação visual entre os resultados gerados e utilizamos o microbenchmark para verificar o tempo de execução dos métodos. O t-SNE e o UMAP são eficientes para trabalharmos com âmbitos locais da visualização, enquanto o PCA é adequado quando o número de amostras é reduzido. t-SNE e UMAP são capazes de formar agrupamentos que não veríamos somente utilizando o PCA. Apesar disso, são mais lentos que o PCA, e as visualizações geradas por eles mudam ao executar o algoritmo novamente. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-06-28 2023-07-03T14:57:50Z 2023-07-03 2023-07-03T14:57:50Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521 RODRIGUES, Matheus Andrade. Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. 2023. 24f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521 |
url |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521 |
identifier_str_mv |
RODRIGUES, Matheus Andrade. Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. 2023. 24f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI UFCG |
publisher.none.fl_str_mv |
Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI UFCG |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFCG instname:Universidade Federal de Campina Grande (UFCG) instacron:UFCG |
instname_str |
Universidade Federal de Campina Grande (UFCG) |
instacron_str |
UFCG |
institution |
UFCG |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
collection |
Biblioteca Digital de Teses e Dissertações da UFCG |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG) |
repository.mail.fl_str_mv |
bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br |
_version_ |
1809744582976471040 |