Métodos Biplot aplicados a dados de biologia molecular
Autor(a) principal: | |
---|---|
Data de Publicação: | 2010 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10773/9514 |
Resumo: | Uma análise Estatística Multivariada (EM) surge sempre que os dados de uma determinada amostra incluem medições simultâneas de mais que uma variável. Nesta dissertação usamos EM no sentido da redução da dimensionalidade dos dados. Para isso usamos as técnicas ACP, AC e MDS. A ACP permite reduzir o conjunto original de variáveis num menor conjunto de variáveis independentes, explicando a máxima variabilidade das variáveis originais. A AC converte uma matriz de dados não negativos num tipo de representação grá ca em que as linhas e colunas da matriz são representadas por pontos no grá co. O MDS visa representar as distâncias entre pontos num sistema de dimensão reduzida, de modo a que a distância euclidiana entre eles reproduza aproximadamente as distâncias originais no conjunto de dados originais. Para a representação dos dados num espaço reduzido usamos os biplots. Um biplot é um grá co de dispersão (de dimensão 2 ou 3), que representa simultaneamente marcadores para as variáveis e marcadores para os objectos. O objectivo deste trabalho é estudar as técnicas ACP, AC, MDS e os biplots, e aplicá-las a duas bases de dados reais (dados sobre o cancro do cólon e sequências completas de DNA de 123 espécies repartidas em 5 reinos) usando o software R . Por m, são apresentados os resultados obtidos. |
id |
RCAP_8c4293e9c4a01925c9d6a0bf3d098098 |
---|---|
oai_identifier_str |
oai:ria.ua.pt:10773/9514 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Métodos Biplot aplicados a dados de biologia molecularMatemática aplicadaAnálise multivariadaBiologia molecularUma análise Estatística Multivariada (EM) surge sempre que os dados de uma determinada amostra incluem medições simultâneas de mais que uma variável. Nesta dissertação usamos EM no sentido da redução da dimensionalidade dos dados. Para isso usamos as técnicas ACP, AC e MDS. A ACP permite reduzir o conjunto original de variáveis num menor conjunto de variáveis independentes, explicando a máxima variabilidade das variáveis originais. A AC converte uma matriz de dados não negativos num tipo de representação grá ca em que as linhas e colunas da matriz são representadas por pontos no grá co. O MDS visa representar as distâncias entre pontos num sistema de dimensão reduzida, de modo a que a distância euclidiana entre eles reproduza aproximadamente as distâncias originais no conjunto de dados originais. Para a representação dos dados num espaço reduzido usamos os biplots. Um biplot é um grá co de dispersão (de dimensão 2 ou 3), que representa simultaneamente marcadores para as variáveis e marcadores para os objectos. O objectivo deste trabalho é estudar as técnicas ACP, AC, MDS e os biplots, e aplicá-las a duas bases de dados reais (dados sobre o cancro do cólon e sequências completas de DNA de 123 espécies repartidas em 5 reinos) usando o software R . Por m, são apresentados os resultados obtidos.Multivariate statistical analysis is used when the data of a given sample includes simultaneous measurements on many variables. With the purpose of reducing data dimensionality, multivariate statistical analysis is applied. Three methods are addressed: PCA, CA and MDS. PCA reduces the original set of variables into a smaller set of independent variables, explaining the maximum variability of the original variables. CA converts a matrix of nonnegative data into a particular type of graphical display in which the rows and columns of the matrix are depicted as points. The objective of MDS is to display graphically the distance between points in a low-dimensional system so that the euclidean distance between them approximately reproduces the original distances in the original data set. For the representation of data in a low-dimensional space we use biplots. A biplot is a scatter plot (of low-dimension, 2 or 3), which display shows column e ects of the variables and row e ects of the obervations. The objective of this paper is to study PCA, CA and MDS methods and biplots. We also apply these methods to two real data sets (colon cancer data set and complete sequences of DNA from 123 species divided into 5 kingdoms) using the software R . Finally, we present the results obtained.Universidade de Aveiro2013-01-18T11:41:54Z2010-01-01T00:00:00Z2010info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/9514porFerreira, Elisabete dos Santosinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-22T11:16:17Zoai:ria.ua.pt:10773/9514Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:46:20.052486Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Métodos Biplot aplicados a dados de biologia molecular |
title |
Métodos Biplot aplicados a dados de biologia molecular |
spellingShingle |
Métodos Biplot aplicados a dados de biologia molecular Ferreira, Elisabete dos Santos Matemática aplicada Análise multivariada Biologia molecular |
title_short |
Métodos Biplot aplicados a dados de biologia molecular |
title_full |
Métodos Biplot aplicados a dados de biologia molecular |
title_fullStr |
Métodos Biplot aplicados a dados de biologia molecular |
title_full_unstemmed |
Métodos Biplot aplicados a dados de biologia molecular |
title_sort |
Métodos Biplot aplicados a dados de biologia molecular |
author |
Ferreira, Elisabete dos Santos |
author_facet |
Ferreira, Elisabete dos Santos |
author_role |
author |
dc.contributor.author.fl_str_mv |
Ferreira, Elisabete dos Santos |
dc.subject.por.fl_str_mv |
Matemática aplicada Análise multivariada Biologia molecular |
topic |
Matemática aplicada Análise multivariada Biologia molecular |
description |
Uma análise Estatística Multivariada (EM) surge sempre que os dados de uma determinada amostra incluem medições simultâneas de mais que uma variável. Nesta dissertação usamos EM no sentido da redução da dimensionalidade dos dados. Para isso usamos as técnicas ACP, AC e MDS. A ACP permite reduzir o conjunto original de variáveis num menor conjunto de variáveis independentes, explicando a máxima variabilidade das variáveis originais. A AC converte uma matriz de dados não negativos num tipo de representação grá ca em que as linhas e colunas da matriz são representadas por pontos no grá co. O MDS visa representar as distâncias entre pontos num sistema de dimensão reduzida, de modo a que a distância euclidiana entre eles reproduza aproximadamente as distâncias originais no conjunto de dados originais. Para a representação dos dados num espaço reduzido usamos os biplots. Um biplot é um grá co de dispersão (de dimensão 2 ou 3), que representa simultaneamente marcadores para as variáveis e marcadores para os objectos. O objectivo deste trabalho é estudar as técnicas ACP, AC, MDS e os biplots, e aplicá-las a duas bases de dados reais (dados sobre o cancro do cólon e sequências completas de DNA de 123 espécies repartidas em 5 reinos) usando o software R . Por m, são apresentados os resultados obtidos. |
publishDate |
2010 |
dc.date.none.fl_str_mv |
2010-01-01T00:00:00Z 2010 2013-01-18T11:41:54Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10773/9514 |
url |
http://hdl.handle.net/10773/9514 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade de Aveiro |
publisher.none.fl_str_mv |
Universidade de Aveiro |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799137515289968640 |