Análise de dados de altas dimensões
Autor(a) principal: | |
---|---|
Data de Publicação: | 2010 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/24864 |
Resumo: | O avanço tecnológico vem permitindo que novas áreas da ciência se desenvolvam e, com isso, novas técnicas começam a surgir. Problemas antes considerados sem solução passam a ser resolvidos computacionalmente. E isto não é diferente na estatística. Bancos de dados cada vez maiores vem surgindo e, com isso, surgem dados com altas dimensões. Áreas como química, genética e biociências têm um crescente interesse em analisar este tipo de dado. As técnicas multivariadas utilizadas atualmente não se aplicam neste tipo de caso e, para isso, novos métodos devem ser desenvolvidos. Este trabalho tem como principal foco fazer uma revisão da literatura existente sobre o tema de dados com altas dimensões. São mostradas técnicas como análise de similaridade, redução de dimensões, análise de cluster e medidas de distância entre sequências de DNA. É apresentado o software ImageMaster™ 2D Platinum, que é uma alternativa viável para a realização da análise de similaridade entre imagens e o software PAST e, por fim, três exemplos práticos ilustram a utilização dos métodos abordados em dados com altas dimensões. |
id |
UFRGS-2_14973db5f60b9967c2c8369a06a135b5 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/24864 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Beuren, Gilberto MüllerFachel, Jandyra Maria Guimarães2010-07-28T04:18:36Z2010http://hdl.handle.net/10183/24864000749628O avanço tecnológico vem permitindo que novas áreas da ciência se desenvolvam e, com isso, novas técnicas começam a surgir. Problemas antes considerados sem solução passam a ser resolvidos computacionalmente. E isto não é diferente na estatística. Bancos de dados cada vez maiores vem surgindo e, com isso, surgem dados com altas dimensões. Áreas como química, genética e biociências têm um crescente interesse em analisar este tipo de dado. As técnicas multivariadas utilizadas atualmente não se aplicam neste tipo de caso e, para isso, novos métodos devem ser desenvolvidos. Este trabalho tem como principal foco fazer uma revisão da literatura existente sobre o tema de dados com altas dimensões. São mostradas técnicas como análise de similaridade, redução de dimensões, análise de cluster e medidas de distância entre sequências de DNA. É apresentado o software ImageMaster™ 2D Platinum, que é uma alternativa viável para a realização da análise de similaridade entre imagens e o software PAST e, por fim, três exemplos práticos ilustram a utilização dos métodos abordados em dados com altas dimensões.Technological progress is enabling new science areas to develop and, thus, new techniques are beginning to emerge. Problems previously considered unsolvable now have a computational solution. And this is not different in statistics. Increasing databases has emerged and, with this, high dimensional data arise. Areas such as chemistry, genetics and life sciences have an increasing interest in analyzing this kind of data. The current multivariate techniques do not apply in this case and, therefore, new methods must be developed. This monograph has as its main focus to review the existing literature on the topic of high dimensional data. It is shown techniques such as similarity analysis, dimensionality reduction, cluster analysis and measures of distance between DNA sequences. We present the software ImageMaster™ 2D Platinum, which is a viable alternative to the analysis of similarity between images and the software PAST and, finally, three examples illustrate the use of the methods with high dimensional data.application/pdfporEstatistica aplicada : MedicinaAnálise de similaridade genéticaHigh dimensional dataBidimensional electrophoresisDNA sequencesImage comparisonAnálise de dados de altas dimensõesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de MatemáticaPorto Alegre, BR-RS2010Estatística: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000749628.pdf000749628.pdfTexto completoapplication/pdf3335627http://www.lume.ufrgs.br/bitstream/10183/24864/1/000749628.pdf8ec8514c9122359c9590d1cacad378bfMD51TEXT000749628.pdf.txt000749628.pdf.txtExtracted Texttext/plain78444http://www.lume.ufrgs.br/bitstream/10183/24864/2/000749628.pdf.txte304d3fa63cafcf3bf60838f35374700MD52THUMBNAIL000749628.pdf.jpg000749628.pdf.jpgGenerated Thumbnailimage/jpeg1263http://www.lume.ufrgs.br/bitstream/10183/24864/3/000749628.pdf.jpga2a7aa4998bb00a06c87e0978ede50c2MD5310183/248642018-10-18 07:33:03.9oai:www.lume.ufrgs.br:10183/24864Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2018-10-18T10:33:03Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Análise de dados de altas dimensões |
title |
Análise de dados de altas dimensões |
spellingShingle |
Análise de dados de altas dimensões Beuren, Gilberto Müller Estatistica aplicada : Medicina Análise de similaridade genética High dimensional data Bidimensional electrophoresis DNA sequences Image comparison |
title_short |
Análise de dados de altas dimensões |
title_full |
Análise de dados de altas dimensões |
title_fullStr |
Análise de dados de altas dimensões |
title_full_unstemmed |
Análise de dados de altas dimensões |
title_sort |
Análise de dados de altas dimensões |
author |
Beuren, Gilberto Müller |
author_facet |
Beuren, Gilberto Müller |
author_role |
author |
dc.contributor.author.fl_str_mv |
Beuren, Gilberto Müller |
dc.contributor.advisor1.fl_str_mv |
Fachel, Jandyra Maria Guimarães |
contributor_str_mv |
Fachel, Jandyra Maria Guimarães |
dc.subject.por.fl_str_mv |
Estatistica aplicada : Medicina Análise de similaridade genética |
topic |
Estatistica aplicada : Medicina Análise de similaridade genética High dimensional data Bidimensional electrophoresis DNA sequences Image comparison |
dc.subject.eng.fl_str_mv |
High dimensional data Bidimensional electrophoresis DNA sequences Image comparison |
description |
O avanço tecnológico vem permitindo que novas áreas da ciência se desenvolvam e, com isso, novas técnicas começam a surgir. Problemas antes considerados sem solução passam a ser resolvidos computacionalmente. E isto não é diferente na estatística. Bancos de dados cada vez maiores vem surgindo e, com isso, surgem dados com altas dimensões. Áreas como química, genética e biociências têm um crescente interesse em analisar este tipo de dado. As técnicas multivariadas utilizadas atualmente não se aplicam neste tipo de caso e, para isso, novos métodos devem ser desenvolvidos. Este trabalho tem como principal foco fazer uma revisão da literatura existente sobre o tema de dados com altas dimensões. São mostradas técnicas como análise de similaridade, redução de dimensões, análise de cluster e medidas de distância entre sequências de DNA. É apresentado o software ImageMaster™ 2D Platinum, que é uma alternativa viável para a realização da análise de similaridade entre imagens e o software PAST e, por fim, três exemplos práticos ilustram a utilização dos métodos abordados em dados com altas dimensões. |
publishDate |
2010 |
dc.date.accessioned.fl_str_mv |
2010-07-28T04:18:36Z |
dc.date.issued.fl_str_mv |
2010 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/24864 |
dc.identifier.nrb.pt_BR.fl_str_mv |
000749628 |
url |
http://hdl.handle.net/10183/24864 |
identifier_str_mv |
000749628 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/24864/1/000749628.pdf http://www.lume.ufrgs.br/bitstream/10183/24864/2/000749628.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/24864/3/000749628.pdf.jpg |
bitstream.checksum.fl_str_mv |
8ec8514c9122359c9590d1cacad378bf e304d3fa63cafcf3bf60838f35374700 a2a7aa4998bb00a06c87e0978ede50c2 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1801224397363609600 |