Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees

Detalhes bibliográficos
Autor(a) principal: Freire-Oliveira, Hiago
Data de Publicação: 2022
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/16064
Resumo: PIWI-interacting RNAs (PiRNAs) are a class of interfering RNAs whose actions range from regulating gene expression to fighting viral infections and silencing transposable elements, possessing unique characteristics such as being from 21 to 35 nucleotides long, displaying an uracil bias at the end 5' and 2'-O-methylation at the 3' end. Transposable elements (TEs) are genetic elements capable of moving between host genomes, being split into retrotransposons and DNA transposons. The replication of TEs can promote harmful recombination events by generating breaks in DNA double strands, in addition to interference in expression, considering that their promoters can lead to aberrant transcription of neighboring genes. Silencing of these elements by piRNAs occurs in the germ line in the majority of animals and is essential for the maintenance of genome integrity. The problem of in silico prediction of interaction between piRNAs and TEs was addressed by machine learning using a decision tree algorithm, namely Predictive Bi-Clustering Trees (PBCT). In order to improve the algorithm’s performance, the interaction matrix of piRNAs and TEs was reconstructed by means of an Beta-distribution-rescored Neighborhood Regularized Logistic Matrix Factorization (NRLMFβ) algorithm. PBCT was applied in 5-fold and 10-fold cross-validation configurations, both for the matrix without reconstruction (BICT) and for the matrix reconstructed by NRLMFβ (BICTR). In general, PBCT applied to this dataset was not able to predict positive interactions satisfactorily, behaving as a random classifier. Comparatively, in the BICT method, PBCT presented higher values of AUROC and AUPRC. However, in the BICTR method, PBCT was able to correctly predict more positive interactions, which are, in fact, the major interest in this study. Potential biological applications and ways to improve the algorithm’s performance were also considered.
id SCAR_e0f7cf77202cdf4ae2d33ffd9001201a
oai_identifier_str oai:repositorio.ufscar.br:ufscar/16064
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Freire-Oliveira, HiagoGabriel, Jane Eyrehttp://lattes.cnpq.br/6757487143317098Cerri, Ricardohttp://lattes.cnpq.br/6266519868438512http://lattes.cnpq.br/16481536201873079c700b81-6212-43a2-bc24-e310bfa516862022-05-06T21:53:52Z2022-05-06T21:53:52Z2022-04-26FREIRE-OLIVEIRA, Hiago. Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees. 2022. Trabalho de Conclusão de Curso (Graduação em Ciências Biológicas) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/16064.https://repositorio.ufscar.br/handle/ufscar/16064PIWI-interacting RNAs (PiRNAs) are a class of interfering RNAs whose actions range from regulating gene expression to fighting viral infections and silencing transposable elements, possessing unique characteristics such as being from 21 to 35 nucleotides long, displaying an uracil bias at the end 5' and 2'-O-methylation at the 3' end. Transposable elements (TEs) are genetic elements capable of moving between host genomes, being split into retrotransposons and DNA transposons. The replication of TEs can promote harmful recombination events by generating breaks in DNA double strands, in addition to interference in expression, considering that their promoters can lead to aberrant transcription of neighboring genes. Silencing of these elements by piRNAs occurs in the germ line in the majority of animals and is essential for the maintenance of genome integrity. The problem of in silico prediction of interaction between piRNAs and TEs was addressed by machine learning using a decision tree algorithm, namely Predictive Bi-Clustering Trees (PBCT). In order to improve the algorithm’s performance, the interaction matrix of piRNAs and TEs was reconstructed by means of an Beta-distribution-rescored Neighborhood Regularized Logistic Matrix Factorization (NRLMFβ) algorithm. PBCT was applied in 5-fold and 10-fold cross-validation configurations, both for the matrix without reconstruction (BICT) and for the matrix reconstructed by NRLMFβ (BICTR). In general, PBCT applied to this dataset was not able to predict positive interactions satisfactorily, behaving as a random classifier. Comparatively, in the BICT method, PBCT presented higher values of AUROC and AUPRC. However, in the BICTR method, PBCT was able to correctly predict more positive interactions, which are, in fact, the major interest in this study. Potential biological applications and ways to improve the algorithm’s performance were also considered.RNAs interagentes com PIWI (piRNAs) são uma classe de RNAs de interferência cujas ações variam de regulação da expressão gênica ao combate de infecções virais e silenciamento de elementos transponíveis, possuindo características únicas como tamanho de 21 a 35 nucleotídeos, viés de uracila na extremidade 5’ e 2’-O-metilação na extremidade 3’. Os elementos transponíveis (TEs) são elementos genéticos com capacidade de se moverem por entre os genomas hospedeiros, sendo divididos entre retrotransposons e transposons de DNA. A replicação dos TEs pode promover eventos recombinatórios danosos pela geração de quebras nas duplas-fitas de DNA, além de interferências na expressão, uma vez que seus promotores podem levar a uma transcrição aberrante dos genes vizinhos. O silenciamento desses elementos pelos piRNAs ocorre na linhagem germinativa da maioria dos animais e é essencial à manutenção da integridade do genoma. O problema de predição in silico de interação entre piRNAs e TEs foi abordado por aprendizado de máquina por meio de um algoritmo de árvores de decisões do tipo Predictive Bi-Clustering Trees (PBCT). A fim de melhorar o desempenho do algoritmo, a matriz de interações entre os piRNAs e TEs foi reconstruída por meio de um algoritmo do tipo Beta-distribution-rescored Neighborhood Regularized Logistic Matrix Factorization (NRLMFβ). O PBCT foi aplicado em configurações de validação cruzada de 5-folds e de 10-folds, tanto para a matriz sem reconstrução (BICT) quanto para a matriz reconstruída por NRLMFβ (BICTR). De forma geral, o PBCT aplicado a esse conjunto de dados não foi capaz de predizer as interações positivas satisfatoriamente, comportando-se como um classificador aleatório. Comparativamente, no método BICT, o PBCT apresentou maiores valores de AUROC e AUPRC. Entretanto, no método BICTR, o PBCT foi capaz de predizer corretamente mais interações positivas, que são, de fato, o maior interesse neste estudo. Possíveis aplicações biológicas e caminhos para melhorar o desempenho do algoritmo também foram consideradas.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosCiências Biológicas - CBUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccesspiRNAElemento transponívelPredição de interaçãoÁrvore de decisãoAprendizado de máquinaCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAOPredição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering treespiRNAs and transposable elements interaction prediction with predictive bi-clustering treesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis6006006bcea958-e130-44a9-984f-3d87215d3225reponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALTCC.pdfTCC.pdfArtigo principalapplication/pdf1377260https://repositorio.ufscar.br/bitstream/ufscar/16064/1/TCC.pdf1e7aec00850a3f54a1d9d58834677d56MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufscar.br/bitstream/ufscar/16064/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52TEXTTCC.pdf.txtTCC.pdf.txtExtracted texttext/plain78950https://repositorio.ufscar.br/bitstream/ufscar/16064/3/TCC.pdf.txt5985ac9d734a6d365bd972c777ea28b1MD53THUMBNAILTCC.pdf.jpgTCC.pdf.jpgIM Thumbnailimage/jpeg6230https://repositorio.ufscar.br/bitstream/ufscar/16064/4/TCC.pdf.jpg7afc37b379603308ebca1e8177fee025MD54ufscar/160642023-09-18 18:32:27.437oai:repositorio.ufscar.br:ufscar/16064Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:32:27Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees
dc.title.alternative.eng.fl_str_mv piRNAs and transposable elements interaction prediction with predictive bi-clustering trees
title Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees
spellingShingle Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees
Freire-Oliveira, Hiago
piRNA
Elemento transponível
Predição de interação
Árvore de decisão
Aprendizado de máquina
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAO
title_short Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees
title_full Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees
title_fullStr Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees
title_full_unstemmed Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees
title_sort Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees
author Freire-Oliveira, Hiago
author_facet Freire-Oliveira, Hiago
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/1648153620187307
dc.contributor.author.fl_str_mv Freire-Oliveira, Hiago
dc.contributor.advisor1.fl_str_mv Gabriel, Jane Eyre
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6757487143317098
dc.contributor.advisor-co1.fl_str_mv Cerri, Ricardo
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/6266519868438512
dc.contributor.authorID.fl_str_mv 9c700b81-6212-43a2-bc24-e310bfa51686
contributor_str_mv Gabriel, Jane Eyre
Cerri, Ricardo
dc.subject.por.fl_str_mv piRNA
Elemento transponível
Predição de interação
Árvore de decisão
Aprendizado de máquina
topic piRNA
Elemento transponível
Predição de interação
Árvore de decisão
Aprendizado de máquina
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAO
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAO
description PIWI-interacting RNAs (PiRNAs) are a class of interfering RNAs whose actions range from regulating gene expression to fighting viral infections and silencing transposable elements, possessing unique characteristics such as being from 21 to 35 nucleotides long, displaying an uracil bias at the end 5' and 2'-O-methylation at the 3' end. Transposable elements (TEs) are genetic elements capable of moving between host genomes, being split into retrotransposons and DNA transposons. The replication of TEs can promote harmful recombination events by generating breaks in DNA double strands, in addition to interference in expression, considering that their promoters can lead to aberrant transcription of neighboring genes. Silencing of these elements by piRNAs occurs in the germ line in the majority of animals and is essential for the maintenance of genome integrity. The problem of in silico prediction of interaction between piRNAs and TEs was addressed by machine learning using a decision tree algorithm, namely Predictive Bi-Clustering Trees (PBCT). In order to improve the algorithm’s performance, the interaction matrix of piRNAs and TEs was reconstructed by means of an Beta-distribution-rescored Neighborhood Regularized Logistic Matrix Factorization (NRLMFβ) algorithm. PBCT was applied in 5-fold and 10-fold cross-validation configurations, both for the matrix without reconstruction (BICT) and for the matrix reconstructed by NRLMFβ (BICTR). In general, PBCT applied to this dataset was not able to predict positive interactions satisfactorily, behaving as a random classifier. Comparatively, in the BICT method, PBCT presented higher values of AUROC and AUPRC. However, in the BICTR method, PBCT was able to correctly predict more positive interactions, which are, in fact, the major interest in this study. Potential biological applications and ways to improve the algorithm’s performance were also considered.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-05-06T21:53:52Z
dc.date.available.fl_str_mv 2022-05-06T21:53:52Z
dc.date.issued.fl_str_mv 2022-04-26
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv FREIRE-OLIVEIRA, Hiago. Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees. 2022. Trabalho de Conclusão de Curso (Graduação em Ciências Biológicas) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/16064.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/16064
identifier_str_mv FREIRE-OLIVEIRA, Hiago. Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees. 2022. Trabalho de Conclusão de Curso (Graduação em Ciências Biológicas) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/16064.
url https://repositorio.ufscar.br/handle/ufscar/16064
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv 600
600
dc.relation.authority.fl_str_mv 6bcea958-e130-44a9-984f-3d87215d3225
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
Ciências Biológicas - CB
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
Ciências Biológicas - CB
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/16064/1/TCC.pdf
https://repositorio.ufscar.br/bitstream/ufscar/16064/2/license_rdf
https://repositorio.ufscar.br/bitstream/ufscar/16064/3/TCC.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/16064/4/TCC.pdf.jpg
bitstream.checksum.fl_str_mv 1e7aec00850a3f54a1d9d58834677d56
e39d27027a6cc9cb039ad269a5db8e34
5985ac9d734a6d365bd972c777ea28b1
7afc37b379603308ebca1e8177fee025
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1802136406282207232