Análise de dados de altas dimensões

Detalhes bibliográficos
Autor(a) principal: Beuren, Gilberto Müller
Data de Publicação: 2010
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/24864
Resumo: O avanço tecnológico vem permitindo que novas áreas da ciência se desenvolvam e, com isso, novas técnicas começam a surgir. Problemas antes considerados sem solução passam a ser resolvidos computacionalmente. E isto não é diferente na estatística. Bancos de dados cada vez maiores vem surgindo e, com isso, surgem dados com altas dimensões. Áreas como química, genética e biociências têm um crescente interesse em analisar este tipo de dado. As técnicas multivariadas utilizadas atualmente não se aplicam neste tipo de caso e, para isso, novos métodos devem ser desenvolvidos. Este trabalho tem como principal foco fazer uma revisão da literatura existente sobre o tema de dados com altas dimensões. São mostradas técnicas como análise de similaridade, redução de dimensões, análise de cluster e medidas de distância entre sequências de DNA. É apresentado o software ImageMaster™ 2D Platinum, que é uma alternativa viável para a realização da análise de similaridade entre imagens e o software PAST e, por fim, três exemplos práticos ilustram a utilização dos métodos abordados em dados com altas dimensões.
id UFRGS-2_14973db5f60b9967c2c8369a06a135b5
oai_identifier_str oai:www.lume.ufrgs.br:10183/24864
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Beuren, Gilberto MüllerFachel, Jandyra Maria Guimarães2010-07-28T04:18:36Z2010http://hdl.handle.net/10183/24864000749628O avanço tecnológico vem permitindo que novas áreas da ciência se desenvolvam e, com isso, novas técnicas começam a surgir. Problemas antes considerados sem solução passam a ser resolvidos computacionalmente. E isto não é diferente na estatística. Bancos de dados cada vez maiores vem surgindo e, com isso, surgem dados com altas dimensões. Áreas como química, genética e biociências têm um crescente interesse em analisar este tipo de dado. As técnicas multivariadas utilizadas atualmente não se aplicam neste tipo de caso e, para isso, novos métodos devem ser desenvolvidos. Este trabalho tem como principal foco fazer uma revisão da literatura existente sobre o tema de dados com altas dimensões. São mostradas técnicas como análise de similaridade, redução de dimensões, análise de cluster e medidas de distância entre sequências de DNA. É apresentado o software ImageMaster™ 2D Platinum, que é uma alternativa viável para a realização da análise de similaridade entre imagens e o software PAST e, por fim, três exemplos práticos ilustram a utilização dos métodos abordados em dados com altas dimensões.Technological progress is enabling new science areas to develop and, thus, new techniques are beginning to emerge. Problems previously considered unsolvable now have a computational solution. And this is not different in statistics. Increasing databases has emerged and, with this, high dimensional data arise. Areas such as chemistry, genetics and life sciences have an increasing interest in analyzing this kind of data. The current multivariate techniques do not apply in this case and, therefore, new methods must be developed. This monograph has as its main focus to review the existing literature on the topic of high dimensional data. It is shown techniques such as similarity analysis, dimensionality reduction, cluster analysis and measures of distance between DNA sequences. We present the software ImageMaster™ 2D Platinum, which is a viable alternative to the analysis of similarity between images and the software PAST and, finally, three examples illustrate the use of the methods with high dimensional data.application/pdfporEstatistica aplicada : MedicinaAnálise de similaridade genéticaHigh dimensional dataBidimensional electrophoresisDNA sequencesImage comparisonAnálise de dados de altas dimensõesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de MatemáticaPorto Alegre, BR-RS2010Estatística: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000749628.pdf000749628.pdfTexto completoapplication/pdf3335627http://www.lume.ufrgs.br/bitstream/10183/24864/1/000749628.pdf8ec8514c9122359c9590d1cacad378bfMD51TEXT000749628.pdf.txt000749628.pdf.txtExtracted Texttext/plain78444http://www.lume.ufrgs.br/bitstream/10183/24864/2/000749628.pdf.txte304d3fa63cafcf3bf60838f35374700MD52THUMBNAIL000749628.pdf.jpg000749628.pdf.jpgGenerated Thumbnailimage/jpeg1263http://www.lume.ufrgs.br/bitstream/10183/24864/3/000749628.pdf.jpga2a7aa4998bb00a06c87e0978ede50c2MD5310183/248642018-10-18 07:33:03.9oai:www.lume.ufrgs.br:10183/24864Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2018-10-18T10:33:03Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Análise de dados de altas dimensões
title Análise de dados de altas dimensões
spellingShingle Análise de dados de altas dimensões
Beuren, Gilberto Müller
Estatistica aplicada : Medicina
Análise de similaridade genética
High dimensional data
Bidimensional electrophoresis
DNA sequences
Image comparison
title_short Análise de dados de altas dimensões
title_full Análise de dados de altas dimensões
title_fullStr Análise de dados de altas dimensões
title_full_unstemmed Análise de dados de altas dimensões
title_sort Análise de dados de altas dimensões
author Beuren, Gilberto Müller
author_facet Beuren, Gilberto Müller
author_role author
dc.contributor.author.fl_str_mv Beuren, Gilberto Müller
dc.contributor.advisor1.fl_str_mv Fachel, Jandyra Maria Guimarães
contributor_str_mv Fachel, Jandyra Maria Guimarães
dc.subject.por.fl_str_mv Estatistica aplicada : Medicina
Análise de similaridade genética
topic Estatistica aplicada : Medicina
Análise de similaridade genética
High dimensional data
Bidimensional electrophoresis
DNA sequences
Image comparison
dc.subject.eng.fl_str_mv High dimensional data
Bidimensional electrophoresis
DNA sequences
Image comparison
description O avanço tecnológico vem permitindo que novas áreas da ciência se desenvolvam e, com isso, novas técnicas começam a surgir. Problemas antes considerados sem solução passam a ser resolvidos computacionalmente. E isto não é diferente na estatística. Bancos de dados cada vez maiores vem surgindo e, com isso, surgem dados com altas dimensões. Áreas como química, genética e biociências têm um crescente interesse em analisar este tipo de dado. As técnicas multivariadas utilizadas atualmente não se aplicam neste tipo de caso e, para isso, novos métodos devem ser desenvolvidos. Este trabalho tem como principal foco fazer uma revisão da literatura existente sobre o tema de dados com altas dimensões. São mostradas técnicas como análise de similaridade, redução de dimensões, análise de cluster e medidas de distância entre sequências de DNA. É apresentado o software ImageMaster™ 2D Platinum, que é uma alternativa viável para a realização da análise de similaridade entre imagens e o software PAST e, por fim, três exemplos práticos ilustram a utilização dos métodos abordados em dados com altas dimensões.
publishDate 2010
dc.date.accessioned.fl_str_mv 2010-07-28T04:18:36Z
dc.date.issued.fl_str_mv 2010
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/24864
dc.identifier.nrb.pt_BR.fl_str_mv 000749628
url http://hdl.handle.net/10183/24864
identifier_str_mv 000749628
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/24864/1/000749628.pdf
http://www.lume.ufrgs.br/bitstream/10183/24864/2/000749628.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/24864/3/000749628.pdf.jpg
bitstream.checksum.fl_str_mv 8ec8514c9122359c9590d1cacad378bf
e304d3fa63cafcf3bf60838f35374700
a2a7aa4998bb00a06c87e0978ede50c2
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801224397363609600