Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Monografias da UnB |
Texto Completo: | http://bdm.unb.br/handle/10483/13908 |
Resumo: | Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2016. |
id |
UNB-2_c6cb6aae99e6e5ecf1ba04481b53770d |
---|---|
oai_identifier_str |
oai:bdm.unb.br:10483/13908 |
network_acronym_str |
UNB-2 |
network_name_str |
Biblioteca Digital de Monografias da UnB |
repository_id_str |
11571 |
spelling |
Vieira, Lucas MacielWalter, Maria Emilia Machado TellesVIEIRA, Lucas Maciel. Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte: um estudo de caso para a cana-de-açúcar. 2016. xii, 74 f., il. Monografia (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2016.http://bdm.unb.br/handle/10483/13908Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2016.Dentre os RNAs, temos os que expressam proteínas, e aqueles que, embora não participando da síntese proteica, realizam funções importantes nas células, sendo denominados de RNAs não-codificadores (ncRNAs). Dentre os ncRNAs, existem os RNAs nãocodificadores longos intergênicos (long intergenic ncRNAs - lincRNAs), que estão localizados em regiões intergênicas, e podem desempenhar importantes papéis na regulação gênica e em doenças. Embora existam vários projetos relacionados a lincRNAs, tanto na parte da biologia molecular quanto computacional, não há métodos amplamente usados para sua predição. Neste contexto, validando características obtidas na literatura, criamos um modelo baseado em máquinas de vetores de suporte (Support Vector Machine - SVM) para predizer lincRNAs. Desenvolvemos dois estudos de caso, um para calcular o desempenho do modelo usando Mus musculus (camundongo) e Homo sapiens (humano) e outro para predizer lincRNAs em Saccharum officinarum (cana-de-açúcar). Os experimentos mostraram que o modelo tem boa acurácia, em camundongos 90%, em humanos 99% e em ambos simultaneamente 91%, que são melhores resultados, quando comparados ao iSeeRNA. Para a cana-de-açúcar, o método predisse 67 lincRNAs, usando um pipeline construído especialmente para predizer lincRNAs, que inclui o modelo SVM treinado com características extraídas de plantas.Submitted by Nayara Silva (nayarasilva@bce.unb.br) on 2016-05-16T16:22:42Z No. of bitstreams: 1 2016_LucasMacielVieira.pdf: 4292656 bytes, checksum: 947b48770801cc5a8144b2c5ea3384ad (MD5)Approved for entry into archive by Ruthlea Nascimento(ruthlea.nascimento@gmail.com) on 2016-07-29T18:53:06Z (GMT) No. of bitstreams: 1 2016_LucasMacielVieira.pdf: 4292656 bytes, checksum: 947b48770801cc5a8144b2c5ea3384ad (MD5)Made available in DSpace on 2016-07-29T18:53:06Z (GMT). No. of bitstreams: 1 2016_LucasMacielVieira.pdf: 4292656 bytes, checksum: 947b48770801cc5a8144b2c5ea3384ad (MD5)Among RNAs, some are involved in protein expression, and some other, although not participating in protein synthesis, perform important functions in cells, called non-coding RNAs (ncRNAs). Some functions of ncRNAs are: to catalyze chemical reactions and act in regulation of other RNAs. Generically, we can classify ncRNAs into two classes: small (small ncRNAs), having sizes between 20 and 300 nucleotides and presenting known features; and longs (long ncRNAs - lncRNAs), which have sizes larger than 200 nucleotides and small protein synthesis capacity, today not entirely known. Among the lncRNAs, there are the so called long intergenic non-coding RNAs (lincRNAs), those located in intergenic regions, which play important roles in gene regulation and diseases. Although there are many projects related to lincRNAs, both in molecular biology and in computational systems, there are no methods broadly used to predict lincRNAs. In this context, validating features extracted from literature, we created a model based on Support Vector Machine (SVM) to predict lincRNAs. Two case studies were developed, the first one to verify the performance of the model, using Mus musculus (mouse) and Homo sapiens (human), and the other one to predict lincRNAs in Saccharum officinarum (sugarcane). The experiments showed that the model presented good accuracy, in mouse 90%, humans 99%, and in both simultaneously 91%, which were better when compared to iSeeRNA. For sugarcane, the method predicted 67 lincRNAs, using a specially designed pipeline to predict lincRNAs, including the SVM model trained with features extracted from plants.Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcarinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis2016-07-29T18:53:06Z2016-07-29T18:53:06Z2016-07-29T18:53:06Z2016RNAs não-codificadoresBiologia computacionalMáquinas de suporte vetorialBioinformáticainfo:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Monografias da UnBinstname:Universidade de Brasília (UnB)instacron:UNBORIGINAL2016_LucasMacielVieira.pdf2016_LucasMacielVieira.pdfapplication/pdf4292656http://bdm.unb.br/xmlui/bitstream/10483/13908/1/2016_LucasMacielVieira.pdf947b48770801cc5a8144b2c5ea3384adMD51CC-LICENSElicense_urllicense_urltext/plain46http://bdm.unb.br/xmlui/bitstream/10483/13908/2/license_url587cd8ffae15c8598ed3c46d248a3f38MD52license_textlicense_textapplication/octet-stream0http://bdm.unb.br/xmlui/bitstream/10483/13908/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/octet-stream21267http://bdm.unb.br/xmlui/bitstream/10483/13908/4/license_rdf73e23c2acaaf13389e092bd813e3223dMD54LICENSElicense.txtlicense.txttext/plain1847http://bdm.unb.br/xmlui/bitstream/10483/13908/5/license.txt5145371de34f430c839a41d2bbfee019MD5510483/139082016-07-29 15:54:11.117oai:bdm.unb.br:10483/13908TGljZW5zZSBncmFudGVkIGJ5IE5heWFyYSBTaWx2YSAobmF5YXJhc2lsdmFAYmNlLnVuYi5icikgb24gMjAxNi0wNS0xNlQxNjoyMjo0MlogKEdNVCk6CgrDiSBuZWNlc3PDoXJpbyBjb25jb3JkYXIgY29tIGEgbGljZW7Dp2EgZGUgZGlzdHJpYnVpw6fDo28gbsOjby1leGNsdXNpdmEsCmFudGVzIHF1ZSBvIGRvY3VtZW50byBwb3NzYSBhcGFyZWNlciBubyBSZXBvc2l0w7NyaW8uIFBvciBmYXZvciwgbGVpYSBhCmxpY2Vuw6dhIGF0ZW50YW1lbnRlLiBDYXNvIG5lY2Vzc2l0ZSBkZSBhbGd1bSBlc2NsYXJlY2ltZW50byBlbnRyZSBlbQpjb250YXRvIGF0cmF2w6lzIGRlOiBiZG1AYmNlLnVuYi5iciBvdSAzMTA3LTI2ODcuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQW8gYXNzaW5hciBlIGVudHJlZ2FyIGVzdGEgbGljZW7Dp2EsIG8vYSBTci4vU3JhLiAoYXV0b3Igb3UgZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yKToKCmEpIENvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUKcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291CmRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0KZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYQp0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kKcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MKZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcwpkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEgb3MgZGlyZWl0b3MKcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlCnRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91CmNvbnRlw7pkbyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbwpwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEsIGRlY2xhcmEgcXVlCmN1bXByaXUgcXVhaXNxdWVyIG9icmlnYcOnw7VlcyBleGlnaWRhcyBwZWxvIHJlc3BlY3Rpdm8gY29udHJhdG8gb3UKYWNvcmRvLgoKQSBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldSAocykgbm9tZSAocykKY29tbyBvIChzKSBhdXRvciAoZXMpIG91IGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50bwplbnRyZWd1ZSwgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvcgplc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Monografiahttps://bdm.unb.br/PUBhttp://bdm.unb.br/oai/requestbdm@bce.unb.br||patricia@bce.unb.bropendoar:115712016-07-29T18:54:11Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)false |
dc.title.en.fl_str_mv |
Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar |
title |
Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar |
spellingShingle |
Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar Vieira, Lucas Maciel RNAs não-codificadores Biologia computacional Máquinas de suporte vetorial Bioinformática |
title_short |
Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar |
title_full |
Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar |
title_fullStr |
Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar |
title_full_unstemmed |
Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar |
title_sort |
Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar |
author |
Vieira, Lucas Maciel |
author_facet |
Vieira, Lucas Maciel |
author_role |
author |
dc.contributor.author.fl_str_mv |
Vieira, Lucas Maciel |
dc.contributor.advisor1.fl_str_mv |
Walter, Maria Emilia Machado Telles |
contributor_str_mv |
Walter, Maria Emilia Machado Telles |
dc.subject.por.fl_str_mv |
RNAs não-codificadores Biologia computacional Máquinas de suporte vetorial Bioinformática |
topic |
RNAs não-codificadores Biologia computacional Máquinas de suporte vetorial Bioinformática |
description |
Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2016. |
publishDate |
2016 |
dc.date.submitted.none.fl_str_mv |
2016 |
dc.date.accessioned.fl_str_mv |
2016-07-29T18:53:06Z |
dc.date.available.fl_str_mv |
2016-07-29T18:53:06Z |
dc.date.issued.fl_str_mv |
2016-07-29T18:53:06Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
VIEIRA, Lucas Maciel. Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte: um estudo de caso para a cana-de-açúcar. 2016. xii, 74 f., il. Monografia (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2016. |
dc.identifier.uri.fl_str_mv |
http://bdm.unb.br/handle/10483/13908 |
identifier_str_mv |
VIEIRA, Lucas Maciel. Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte: um estudo de caso para a cana-de-açúcar. 2016. xii, 74 f., il. Monografia (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2016. |
url |
http://bdm.unb.br/handle/10483/13908 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Monografias da UnB instname:Universidade de Brasília (UnB) instacron:UNB |
instname_str |
Universidade de Brasília (UnB) |
instacron_str |
UNB |
institution |
UNB |
reponame_str |
Biblioteca Digital de Monografias da UnB |
collection |
Biblioteca Digital de Monografias da UnB |
bitstream.url.fl_str_mv |
http://bdm.unb.br/xmlui/bitstream/10483/13908/1/2016_LucasMacielVieira.pdf http://bdm.unb.br/xmlui/bitstream/10483/13908/2/license_url http://bdm.unb.br/xmlui/bitstream/10483/13908/3/license_text http://bdm.unb.br/xmlui/bitstream/10483/13908/4/license_rdf http://bdm.unb.br/xmlui/bitstream/10483/13908/5/license.txt |
bitstream.checksum.fl_str_mv |
947b48770801cc5a8144b2c5ea3384ad 587cd8ffae15c8598ed3c46d248a3f38 d41d8cd98f00b204e9800998ecf8427e 73e23c2acaaf13389e092bd813e3223d 5145371de34f430c839a41d2bbfee019 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB) |
repository.mail.fl_str_mv |
bdm@bce.unb.br||patricia@bce.unb.br |
_version_ |
1801492992565968896 |