Métodos Biplot aplicados a dados de biologia molecular

Detalhes bibliográficos
Autor(a) principal: Ferreira, Elisabete dos Santos
Data de Publicação: 2010
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10773/9514
Resumo: Uma análise Estatística Multivariada (EM) surge sempre que os dados de uma determinada amostra incluem medições simultâneas de mais que uma variável. Nesta dissertação usamos EM no sentido da redução da dimensionalidade dos dados. Para isso usamos as técnicas ACP, AC e MDS. A ACP permite reduzir o conjunto original de variáveis num menor conjunto de variáveis independentes, explicando a máxima variabilidade das variáveis originais. A AC converte uma matriz de dados não negativos num tipo de representação grá ca em que as linhas e colunas da matriz são representadas por pontos no grá co. O MDS visa representar as distâncias entre pontos num sistema de dimensão reduzida, de modo a que a distância euclidiana entre eles reproduza aproximadamente as distâncias originais no conjunto de dados originais. Para a representação dos dados num espaço reduzido usamos os biplots. Um biplot é um grá co de dispersão (de dimensão 2 ou 3), que representa simultaneamente marcadores para as variáveis e marcadores para os objectos. O objectivo deste trabalho é estudar as técnicas ACP, AC, MDS e os biplots, e aplicá-las a duas bases de dados reais (dados sobre o cancro do cólon e sequências completas de DNA de 123 espécies repartidas em 5 reinos) usando o software R . Por m, são apresentados os resultados obtidos.
id RCAP_8c4293e9c4a01925c9d6a0bf3d098098
oai_identifier_str oai:ria.ua.pt:10773/9514
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Métodos Biplot aplicados a dados de biologia molecularMatemática aplicadaAnálise multivariadaBiologia molecularUma análise Estatística Multivariada (EM) surge sempre que os dados de uma determinada amostra incluem medições simultâneas de mais que uma variável. Nesta dissertação usamos EM no sentido da redução da dimensionalidade dos dados. Para isso usamos as técnicas ACP, AC e MDS. A ACP permite reduzir o conjunto original de variáveis num menor conjunto de variáveis independentes, explicando a máxima variabilidade das variáveis originais. A AC converte uma matriz de dados não negativos num tipo de representação grá ca em que as linhas e colunas da matriz são representadas por pontos no grá co. O MDS visa representar as distâncias entre pontos num sistema de dimensão reduzida, de modo a que a distância euclidiana entre eles reproduza aproximadamente as distâncias originais no conjunto de dados originais. Para a representação dos dados num espaço reduzido usamos os biplots. Um biplot é um grá co de dispersão (de dimensão 2 ou 3), que representa simultaneamente marcadores para as variáveis e marcadores para os objectos. O objectivo deste trabalho é estudar as técnicas ACP, AC, MDS e os biplots, e aplicá-las a duas bases de dados reais (dados sobre o cancro do cólon e sequências completas de DNA de 123 espécies repartidas em 5 reinos) usando o software R . Por m, são apresentados os resultados obtidos.Multivariate statistical analysis is used when the data of a given sample includes simultaneous measurements on many variables. With the purpose of reducing data dimensionality, multivariate statistical analysis is applied. Three methods are addressed: PCA, CA and MDS. PCA reduces the original set of variables into a smaller set of independent variables, explaining the maximum variability of the original variables. CA converts a matrix of nonnegative data into a particular type of graphical display in which the rows and columns of the matrix are depicted as points. The objective of MDS is to display graphically the distance between points in a low-dimensional system so that the euclidean distance between them approximately reproduces the original distances in the original data set. For the representation of data in a low-dimensional space we use biplots. A biplot is a scatter plot (of low-dimension, 2 or 3), which display shows column e ects of the variables and row e ects of the obervations. The objective of this paper is to study PCA, CA and MDS methods and biplots. We also apply these methods to two real data sets (colon cancer data set and complete sequences of DNA from 123 species divided into 5 kingdoms) using the software R . Finally, we present the results obtained.Universidade de Aveiro2013-01-18T11:41:54Z2010-01-01T00:00:00Z2010info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/9514porFerreira, Elisabete dos Santosinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-22T11:16:17Zoai:ria.ua.pt:10773/9514Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:46:20.052486Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Métodos Biplot aplicados a dados de biologia molecular
title Métodos Biplot aplicados a dados de biologia molecular
spellingShingle Métodos Biplot aplicados a dados de biologia molecular
Ferreira, Elisabete dos Santos
Matemática aplicada
Análise multivariada
Biologia molecular
title_short Métodos Biplot aplicados a dados de biologia molecular
title_full Métodos Biplot aplicados a dados de biologia molecular
title_fullStr Métodos Biplot aplicados a dados de biologia molecular
title_full_unstemmed Métodos Biplot aplicados a dados de biologia molecular
title_sort Métodos Biplot aplicados a dados de biologia molecular
author Ferreira, Elisabete dos Santos
author_facet Ferreira, Elisabete dos Santos
author_role author
dc.contributor.author.fl_str_mv Ferreira, Elisabete dos Santos
dc.subject.por.fl_str_mv Matemática aplicada
Análise multivariada
Biologia molecular
topic Matemática aplicada
Análise multivariada
Biologia molecular
description Uma análise Estatística Multivariada (EM) surge sempre que os dados de uma determinada amostra incluem medições simultâneas de mais que uma variável. Nesta dissertação usamos EM no sentido da redução da dimensionalidade dos dados. Para isso usamos as técnicas ACP, AC e MDS. A ACP permite reduzir o conjunto original de variáveis num menor conjunto de variáveis independentes, explicando a máxima variabilidade das variáveis originais. A AC converte uma matriz de dados não negativos num tipo de representação grá ca em que as linhas e colunas da matriz são representadas por pontos no grá co. O MDS visa representar as distâncias entre pontos num sistema de dimensão reduzida, de modo a que a distância euclidiana entre eles reproduza aproximadamente as distâncias originais no conjunto de dados originais. Para a representação dos dados num espaço reduzido usamos os biplots. Um biplot é um grá co de dispersão (de dimensão 2 ou 3), que representa simultaneamente marcadores para as variáveis e marcadores para os objectos. O objectivo deste trabalho é estudar as técnicas ACP, AC, MDS e os biplots, e aplicá-las a duas bases de dados reais (dados sobre o cancro do cólon e sequências completas de DNA de 123 espécies repartidas em 5 reinos) usando o software R . Por m, são apresentados os resultados obtidos.
publishDate 2010
dc.date.none.fl_str_mv 2010-01-01T00:00:00Z
2010
2013-01-18T11:41:54Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10773/9514
url http://hdl.handle.net/10773/9514
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade de Aveiro
publisher.none.fl_str_mv Universidade de Aveiro
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799137515289968640