Modelo computacional para comparação de táxons : filogenia global e mineração de dados na família Formicidae

Detalhes bibliográficos
Autor(a) principal: Schreiner, Monique, 1994-
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPR
Texto Completo: https://hdl.handle.net/1884/71413
Resumo: Orientador: Roberto Tadeu Raittz
id UFPR_961bb96c2b869d2556229c86953be187
oai_identifier_str oai:acervodigital.ufpr.br:1884/71413
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str 308
spelling Schreiner, Monique, 1994-Universidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em BioinformáticaRaittz, Roberto Tadeu, 1966-2022-05-09T19:49:40Z2022-05-09T19:49:40Z2021https://hdl.handle.net/1884/71413Orientador: Roberto Tadeu RaittzDissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa : Curitiba, 18/02/2021Inclui referências: p. 75-81Área de concentração: Inteligência ArtificialResumo: Formigas são consideradas "engenheiras do ecossistema" pois oferecem inúmeros serviços ecológicos e têm impacto na produção de sistemas agrícolas. A interação delas com o ambiente pode afetar desde a composição do solo até o controle de pragas. Estudos filogenéticos acerca do grupo são importantes pois contribuem para a compreensão do funcionamento do ecossistema em que esses animais estão inseridos, além de permitirem a predição de como mudanças nesse funcionamento se comportarão no futuro. Apesar da importância, ainda não há uma filogenia que contemple todas as espécies de formigas. A grande diversidade de espécies (mais de 15 mil espécies e subespécies), técnicas de montagem de árvore computacionalmente custosas, a heterogeneidade na distribuição dos táxons e falta de dados moleculares são fatores que contribuem para a ausência de uma filogenia que contemple todas as espécies. O objetivo desse trabalho é propor uma metodologia para a construção de filogenias de grupos taxonômicos grandes, tendo como resultado final uma filogenia completa de formigas. O método proposto explora o modelo SWeeP e aprendizado de máquina para a vetorização e diminuição da dimensionalidade das sequências, inferência de dados faltantes e integração com informações taxonômicas já existentes. Como resultado, criou-se uma matriz (MAM) que sumarizou a informação molecular disponível. Os testes realizados mostraram que, apesar de dados incompletos, desbalanceados e heterogêneos, a MAM conseguiu representar os padrões taxonômicos e fenotípicos. Em um segundo momento, com a integração da informação taxonômica já existente, foi possível construir uma filogenia com 2.981 espécies congruente com a literatura e, por fim, integrar as espécies sem informação molecular, alcançando a filogenia global com 13.812 espécies de formiga.Abstract: Ants are considered "ecosystem engineers" as they offer numerous ecological services and have impact on the production of agricultural systems. Their interaction with the environment can affect from soil composition to pest control. Phylogenetic studies about the group are important because they contribute to the understanding of the ecosystem functioning in which these animals are inserted, in addition to allowing the prediction of how changes in this functioning will behave in the future. Despite its importance, there is still no phylogeny that includes all species of ants. The great diversity of species (more than 15 thousand species and subspecies), computationally expensive tree assembly techniques, heterogeneity in the distribution of taxa and lack of molecular data are factors that contribute to the absence of a phylogeny that includes all species. The objective of this work is to propose a methodology for the construction of phylogenies of large taxonomic groups, resulting in a complete phylogeny of ants. The proposed method explores the SWeeP model and machine learning for the vectorization and reduction of the dimensionality of the sequences, inference of missing data and integration with existing taxonomic information. As a result, a matrix (MAM) that summarized the available molecular information was created. The tests performed showed that, despite incomplete, unbalanced and heterogeneous data, MAM was able to represent the taxonomic and phenotypic patterns. In a second step, with the integration of the existing taxonomic information, it was possible to build a phylogeny with 2,981 species congruent with the literature. Finally, species without molecular information were integrated and the global phylogeny with 13,812 ant species was reached.1 recurso online : PDF.application/pdfFormigaInteligência artificialBioinformáticaModelo computacional para comparação de táxons : filogenia global e mineração de dados na família Formicidaeinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - D - MONIQUE SCHREINER.pdfapplication/pdf5039876https://acervodigital.ufpr.br/bitstream/1884/71413/1/R%20-%20D%20-%20MONIQUE%20SCHREINER.pdf2650e30af8aa401aefd11adbaff789b1MD51open access1884/714132022-05-09 16:49:40.725open accessoai:acervodigital.ufpr.br:1884/71413Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082022-05-09T19:49:40Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Modelo computacional para comparação de táxons : filogenia global e mineração de dados na família Formicidae
title Modelo computacional para comparação de táxons : filogenia global e mineração de dados na família Formicidae
spellingShingle Modelo computacional para comparação de táxons : filogenia global e mineração de dados na família Formicidae
Schreiner, Monique, 1994-
Formiga
Inteligência artificial
Bioinformática
title_short Modelo computacional para comparação de táxons : filogenia global e mineração de dados na família Formicidae
title_full Modelo computacional para comparação de táxons : filogenia global e mineração de dados na família Formicidae
title_fullStr Modelo computacional para comparação de táxons : filogenia global e mineração de dados na família Formicidae
title_full_unstemmed Modelo computacional para comparação de táxons : filogenia global e mineração de dados na família Formicidae
title_sort Modelo computacional para comparação de táxons : filogenia global e mineração de dados na família Formicidae
author Schreiner, Monique, 1994-
author_facet Schreiner, Monique, 1994-
author_role author
dc.contributor.other.pt_BR.fl_str_mv Universidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática
dc.contributor.author.fl_str_mv Schreiner, Monique, 1994-
dc.contributor.advisor1.fl_str_mv Raittz, Roberto Tadeu, 1966-
contributor_str_mv Raittz, Roberto Tadeu, 1966-
dc.subject.por.fl_str_mv Formiga
Inteligência artificial
Bioinformática
topic Formiga
Inteligência artificial
Bioinformática
description Orientador: Roberto Tadeu Raittz
publishDate 2021
dc.date.issued.fl_str_mv 2021
dc.date.accessioned.fl_str_mv 2022-05-09T19:49:40Z
dc.date.available.fl_str_mv 2022-05-09T19:49:40Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/71413
url https://hdl.handle.net/1884/71413
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 1 recurso online : PDF.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/71413/1/R%20-%20D%20-%20MONIQUE%20SCHREINER.pdf
bitstream.checksum.fl_str_mv 2650e30af8aa401aefd11adbaff789b1
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv
_version_ 1801860346456047616