Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/16064 |
Resumo: | PIWI-interacting RNAs (PiRNAs) are a class of interfering RNAs whose actions range from regulating gene expression to fighting viral infections and silencing transposable elements, possessing unique characteristics such as being from 21 to 35 nucleotides long, displaying an uracil bias at the end 5' and 2'-O-methylation at the 3' end. Transposable elements (TEs) are genetic elements capable of moving between host genomes, being split into retrotransposons and DNA transposons. The replication of TEs can promote harmful recombination events by generating breaks in DNA double strands, in addition to interference in expression, considering that their promoters can lead to aberrant transcription of neighboring genes. Silencing of these elements by piRNAs occurs in the germ line in the majority of animals and is essential for the maintenance of genome integrity. The problem of in silico prediction of interaction between piRNAs and TEs was addressed by machine learning using a decision tree algorithm, namely Predictive Bi-Clustering Trees (PBCT). In order to improve the algorithm’s performance, the interaction matrix of piRNAs and TEs was reconstructed by means of an Beta-distribution-rescored Neighborhood Regularized Logistic Matrix Factorization (NRLMFβ) algorithm. PBCT was applied in 5-fold and 10-fold cross-validation configurations, both for the matrix without reconstruction (BICT) and for the matrix reconstructed by NRLMFβ (BICTR). In general, PBCT applied to this dataset was not able to predict positive interactions satisfactorily, behaving as a random classifier. Comparatively, in the BICT method, PBCT presented higher values of AUROC and AUPRC. However, in the BICTR method, PBCT was able to correctly predict more positive interactions, which are, in fact, the major interest in this study. Potential biological applications and ways to improve the algorithm’s performance were also considered. |
id |
SCAR_e0f7cf77202cdf4ae2d33ffd9001201a |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/16064 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Freire-Oliveira, HiagoGabriel, Jane Eyrehttp://lattes.cnpq.br/6757487143317098Cerri, Ricardohttp://lattes.cnpq.br/6266519868438512http://lattes.cnpq.br/16481536201873079c700b81-6212-43a2-bc24-e310bfa516862022-05-06T21:53:52Z2022-05-06T21:53:52Z2022-04-26FREIRE-OLIVEIRA, Hiago. Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees. 2022. Trabalho de Conclusão de Curso (Graduação em Ciências Biológicas) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/16064.https://repositorio.ufscar.br/handle/ufscar/16064PIWI-interacting RNAs (PiRNAs) are a class of interfering RNAs whose actions range from regulating gene expression to fighting viral infections and silencing transposable elements, possessing unique characteristics such as being from 21 to 35 nucleotides long, displaying an uracil bias at the end 5' and 2'-O-methylation at the 3' end. Transposable elements (TEs) are genetic elements capable of moving between host genomes, being split into retrotransposons and DNA transposons. The replication of TEs can promote harmful recombination events by generating breaks in DNA double strands, in addition to interference in expression, considering that their promoters can lead to aberrant transcription of neighboring genes. Silencing of these elements by piRNAs occurs in the germ line in the majority of animals and is essential for the maintenance of genome integrity. The problem of in silico prediction of interaction between piRNAs and TEs was addressed by machine learning using a decision tree algorithm, namely Predictive Bi-Clustering Trees (PBCT). In order to improve the algorithm’s performance, the interaction matrix of piRNAs and TEs was reconstructed by means of an Beta-distribution-rescored Neighborhood Regularized Logistic Matrix Factorization (NRLMFβ) algorithm. PBCT was applied in 5-fold and 10-fold cross-validation configurations, both for the matrix without reconstruction (BICT) and for the matrix reconstructed by NRLMFβ (BICTR). In general, PBCT applied to this dataset was not able to predict positive interactions satisfactorily, behaving as a random classifier. Comparatively, in the BICT method, PBCT presented higher values of AUROC and AUPRC. However, in the BICTR method, PBCT was able to correctly predict more positive interactions, which are, in fact, the major interest in this study. Potential biological applications and ways to improve the algorithm’s performance were also considered.RNAs interagentes com PIWI (piRNAs) são uma classe de RNAs de interferência cujas ações variam de regulação da expressão gênica ao combate de infecções virais e silenciamento de elementos transponíveis, possuindo características únicas como tamanho de 21 a 35 nucleotídeos, viés de uracila na extremidade 5’ e 2’-O-metilação na extremidade 3’. Os elementos transponíveis (TEs) são elementos genéticos com capacidade de se moverem por entre os genomas hospedeiros, sendo divididos entre retrotransposons e transposons de DNA. A replicação dos TEs pode promover eventos recombinatórios danosos pela geração de quebras nas duplas-fitas de DNA, além de interferências na expressão, uma vez que seus promotores podem levar a uma transcrição aberrante dos genes vizinhos. O silenciamento desses elementos pelos piRNAs ocorre na linhagem germinativa da maioria dos animais e é essencial à manutenção da integridade do genoma. O problema de predição in silico de interação entre piRNAs e TEs foi abordado por aprendizado de máquina por meio de um algoritmo de árvores de decisões do tipo Predictive Bi-Clustering Trees (PBCT). A fim de melhorar o desempenho do algoritmo, a matriz de interações entre os piRNAs e TEs foi reconstruída por meio de um algoritmo do tipo Beta-distribution-rescored Neighborhood Regularized Logistic Matrix Factorization (NRLMFβ). O PBCT foi aplicado em configurações de validação cruzada de 5-folds e de 10-folds, tanto para a matriz sem reconstrução (BICT) quanto para a matriz reconstruída por NRLMFβ (BICTR). De forma geral, o PBCT aplicado a esse conjunto de dados não foi capaz de predizer as interações positivas satisfatoriamente, comportando-se como um classificador aleatório. Comparativamente, no método BICT, o PBCT apresentou maiores valores de AUROC e AUPRC. Entretanto, no método BICTR, o PBCT foi capaz de predizer corretamente mais interações positivas, que são, de fato, o maior interesse neste estudo. Possíveis aplicações biológicas e caminhos para melhorar o desempenho do algoritmo também foram consideradas.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosCiências Biológicas - CBUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccesspiRNAElemento transponívelPredição de interaçãoÁrvore de decisãoAprendizado de máquinaCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAOPredição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering treespiRNAs and transposable elements interaction prediction with predictive bi-clustering treesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis6006006bcea958-e130-44a9-984f-3d87215d3225reponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALTCC.pdfTCC.pdfArtigo principalapplication/pdf1377260https://repositorio.ufscar.br/bitstream/ufscar/16064/1/TCC.pdf1e7aec00850a3f54a1d9d58834677d56MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufscar.br/bitstream/ufscar/16064/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52TEXTTCC.pdf.txtTCC.pdf.txtExtracted texttext/plain78950https://repositorio.ufscar.br/bitstream/ufscar/16064/3/TCC.pdf.txt5985ac9d734a6d365bd972c777ea28b1MD53THUMBNAILTCC.pdf.jpgTCC.pdf.jpgIM Thumbnailimage/jpeg6230https://repositorio.ufscar.br/bitstream/ufscar/16064/4/TCC.pdf.jpg7afc37b379603308ebca1e8177fee025MD54ufscar/160642023-09-18 18:32:27.437oai:repositorio.ufscar.br:ufscar/16064Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:32:27Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees |
dc.title.alternative.eng.fl_str_mv |
piRNAs and transposable elements interaction prediction with predictive bi-clustering trees |
title |
Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees |
spellingShingle |
Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees Freire-Oliveira, Hiago piRNA Elemento transponível Predição de interação Árvore de decisão Aprendizado de máquina CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAO |
title_short |
Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees |
title_full |
Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees |
title_fullStr |
Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees |
title_full_unstemmed |
Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees |
title_sort |
Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees |
author |
Freire-Oliveira, Hiago |
author_facet |
Freire-Oliveira, Hiago |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/1648153620187307 |
dc.contributor.author.fl_str_mv |
Freire-Oliveira, Hiago |
dc.contributor.advisor1.fl_str_mv |
Gabriel, Jane Eyre |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/6757487143317098 |
dc.contributor.advisor-co1.fl_str_mv |
Cerri, Ricardo |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/6266519868438512 |
dc.contributor.authorID.fl_str_mv |
9c700b81-6212-43a2-bc24-e310bfa51686 |
contributor_str_mv |
Gabriel, Jane Eyre Cerri, Ricardo |
dc.subject.por.fl_str_mv |
piRNA Elemento transponível Predição de interação Árvore de decisão Aprendizado de máquina |
topic |
piRNA Elemento transponível Predição de interação Árvore de decisão Aprendizado de máquina CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAO |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAO |
description |
PIWI-interacting RNAs (PiRNAs) are a class of interfering RNAs whose actions range from regulating gene expression to fighting viral infections and silencing transposable elements, possessing unique characteristics such as being from 21 to 35 nucleotides long, displaying an uracil bias at the end 5' and 2'-O-methylation at the 3' end. Transposable elements (TEs) are genetic elements capable of moving between host genomes, being split into retrotransposons and DNA transposons. The replication of TEs can promote harmful recombination events by generating breaks in DNA double strands, in addition to interference in expression, considering that their promoters can lead to aberrant transcription of neighboring genes. Silencing of these elements by piRNAs occurs in the germ line in the majority of animals and is essential for the maintenance of genome integrity. The problem of in silico prediction of interaction between piRNAs and TEs was addressed by machine learning using a decision tree algorithm, namely Predictive Bi-Clustering Trees (PBCT). In order to improve the algorithm’s performance, the interaction matrix of piRNAs and TEs was reconstructed by means of an Beta-distribution-rescored Neighborhood Regularized Logistic Matrix Factorization (NRLMFβ) algorithm. PBCT was applied in 5-fold and 10-fold cross-validation configurations, both for the matrix without reconstruction (BICT) and for the matrix reconstructed by NRLMFβ (BICTR). In general, PBCT applied to this dataset was not able to predict positive interactions satisfactorily, behaving as a random classifier. Comparatively, in the BICT method, PBCT presented higher values of AUROC and AUPRC. However, in the BICTR method, PBCT was able to correctly predict more positive interactions, which are, in fact, the major interest in this study. Potential biological applications and ways to improve the algorithm’s performance were also considered. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-05-06T21:53:52Z |
dc.date.available.fl_str_mv |
2022-05-06T21:53:52Z |
dc.date.issued.fl_str_mv |
2022-04-26 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
FREIRE-OLIVEIRA, Hiago. Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees. 2022. Trabalho de Conclusão de Curso (Graduação em Ciências Biológicas) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/16064. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/16064 |
identifier_str_mv |
FREIRE-OLIVEIRA, Hiago. Predição de interações entre piRNAs e elementos transponíveis por meio de predictive bi-clustering trees. 2022. Trabalho de Conclusão de Curso (Graduação em Ciências Biológicas) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/ufscar/16064. |
url |
https://repositorio.ufscar.br/handle/ufscar/16064 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
600 600 |
dc.relation.authority.fl_str_mv |
6bcea958-e130-44a9-984f-3d87215d3225 |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos Ciências Biológicas - CB |
dc.publisher.initials.fl_str_mv |
UFSCar |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos Ciências Biológicas - CB |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/16064/1/TCC.pdf https://repositorio.ufscar.br/bitstream/ufscar/16064/2/license_rdf https://repositorio.ufscar.br/bitstream/ufscar/16064/3/TCC.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/16064/4/TCC.pdf.jpg |
bitstream.checksum.fl_str_mv |
1e7aec00850a3f54a1d9d58834677d56 e39d27027a6cc9cb039ad269a5db8e34 5985ac9d734a6d365bd972c777ea28b1 7afc37b379603308ebca1e8177fee025 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1802136406282207232 |