Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar

Detalhes bibliográficos
Autor(a) principal: Vieira, Lucas Maciel
Data de Publicação: 2016
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Biblioteca Digital de Monografias da UnB
Texto Completo: http://bdm.unb.br/handle/10483/13908
Resumo: Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2016.
id UNB-2_c6cb6aae99e6e5ecf1ba04481b53770d
oai_identifier_str oai:bdm.unb.br:10483/13908
network_acronym_str UNB-2
network_name_str Biblioteca Digital de Monografias da UnB
repository_id_str 11571
spelling Vieira, Lucas MacielWalter, Maria Emilia Machado TellesVIEIRA, Lucas Maciel. Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte: um estudo de caso para a cana-de-açúcar. 2016. xii, 74 f., il. Monografia (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2016.http://bdm.unb.br/handle/10483/13908Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2016.Dentre os RNAs, temos os que expressam proteínas, e aqueles que, embora não participando da síntese proteica, realizam funções importantes nas células, sendo denominados de RNAs não-codificadores (ncRNAs). Dentre os ncRNAs, existem os RNAs nãocodificadores longos intergênicos (long intergenic ncRNAs - lincRNAs), que estão localizados em regiões intergênicas, e podem desempenhar importantes papéis na regulação gênica e em doenças. Embora existam vários projetos relacionados a lincRNAs, tanto na parte da biologia molecular quanto computacional, não há métodos amplamente usados para sua predição. Neste contexto, validando características obtidas na literatura, criamos um modelo baseado em máquinas de vetores de suporte (Support Vector Machine - SVM) para predizer lincRNAs. Desenvolvemos dois estudos de caso, um para calcular o desempenho do modelo usando Mus musculus (camundongo) e Homo sapiens (humano) e outro para predizer lincRNAs em Saccharum officinarum (cana-de-açúcar). Os experimentos mostraram que o modelo tem boa acurácia, em camundongos 90%, em humanos 99% e em ambos simultaneamente 91%, que são melhores resultados, quando comparados ao iSeeRNA. Para a cana-de-açúcar, o método predisse 67 lincRNAs, usando um pipeline construído especialmente para predizer lincRNAs, que inclui o modelo SVM treinado com características extraídas de plantas.Submitted by Nayara Silva (nayarasilva@bce.unb.br) on 2016-05-16T16:22:42Z No. of bitstreams: 1 2016_LucasMacielVieira.pdf: 4292656 bytes, checksum: 947b48770801cc5a8144b2c5ea3384ad (MD5)Approved for entry into archive by Ruthlea Nascimento(ruthlea.nascimento@gmail.com) on 2016-07-29T18:53:06Z (GMT) No. of bitstreams: 1 2016_LucasMacielVieira.pdf: 4292656 bytes, checksum: 947b48770801cc5a8144b2c5ea3384ad (MD5)Made available in DSpace on 2016-07-29T18:53:06Z (GMT). No. of bitstreams: 1 2016_LucasMacielVieira.pdf: 4292656 bytes, checksum: 947b48770801cc5a8144b2c5ea3384ad (MD5)Among RNAs, some are involved in protein expression, and some other, although not participating in protein synthesis, perform important functions in cells, called non-coding RNAs (ncRNAs). Some functions of ncRNAs are: to catalyze chemical reactions and act in regulation of other RNAs. Generically, we can classify ncRNAs into two classes: small (small ncRNAs), having sizes between 20 and 300 nucleotides and presenting known features; and longs (long ncRNAs - lncRNAs), which have sizes larger than 200 nucleotides and small protein synthesis capacity, today not entirely known. Among the lncRNAs, there are the so called long intergenic non-coding RNAs (lincRNAs), those located in intergenic regions, which play important roles in gene regulation and diseases. Although there are many projects related to lincRNAs, both in molecular biology and in computational systems, there are no methods broadly used to predict lincRNAs. In this context, validating features extracted from literature, we created a model based on Support Vector Machine (SVM) to predict lincRNAs. Two case studies were developed, the first one to verify the performance of the model, using Mus musculus (mouse) and Homo sapiens (human), and the other one to predict lincRNAs in Saccharum officinarum (sugarcane). The experiments showed that the model presented good accuracy, in mouse 90%, humans 99%, and in both simultaneously 91%, which were better when compared to iSeeRNA. For sugarcane, the method predicted 67 lincRNAs, using a specially designed pipeline to predict lincRNAs, including the SVM model trained with features extracted from plants.Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcarinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis2016-07-29T18:53:06Z2016-07-29T18:53:06Z2016-07-29T18:53:06Z2016RNAs não-codificadoresBiologia computacionalMáquinas de suporte vetorialBioinformáticainfo:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Monografias da UnBinstname:Universidade de Brasília (UnB)instacron:UNBORIGINAL2016_LucasMacielVieira.pdf2016_LucasMacielVieira.pdfapplication/pdf4292656http://bdm.unb.br/xmlui/bitstream/10483/13908/1/2016_LucasMacielVieira.pdf947b48770801cc5a8144b2c5ea3384adMD51CC-LICENSElicense_urllicense_urltext/plain46http://bdm.unb.br/xmlui/bitstream/10483/13908/2/license_url587cd8ffae15c8598ed3c46d248a3f38MD52license_textlicense_textapplication/octet-stream0http://bdm.unb.br/xmlui/bitstream/10483/13908/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/octet-stream21267http://bdm.unb.br/xmlui/bitstream/10483/13908/4/license_rdf73e23c2acaaf13389e092bd813e3223dMD54LICENSElicense.txtlicense.txttext/plain1847http://bdm.unb.br/xmlui/bitstream/10483/13908/5/license.txt5145371de34f430c839a41d2bbfee019MD5510483/139082016-07-29 15:54:11.117oai:bdm.unb.br:10483/13908TGljZW5zZSBncmFudGVkIGJ5IE5heWFyYSBTaWx2YSAobmF5YXJhc2lsdmFAYmNlLnVuYi5icikgb24gMjAxNi0wNS0xNlQxNjoyMjo0MlogKEdNVCk6CgrDiSBuZWNlc3PDoXJpbyBjb25jb3JkYXIgY29tIGEgbGljZW7Dp2EgZGUgZGlzdHJpYnVpw6fDo28gbsOjby1leGNsdXNpdmEsCmFudGVzIHF1ZSBvIGRvY3VtZW50byBwb3NzYSBhcGFyZWNlciBubyBSZXBvc2l0w7NyaW8uIFBvciBmYXZvciwgbGVpYSBhCmxpY2Vuw6dhIGF0ZW50YW1lbnRlLiBDYXNvIG5lY2Vzc2l0ZSBkZSBhbGd1bSBlc2NsYXJlY2ltZW50byBlbnRyZSBlbQpjb250YXRvIGF0cmF2w6lzIGRlOiBiZG1AYmNlLnVuYi5iciBvdSAzMTA3LTI2ODcuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQW8gYXNzaW5hciBlIGVudHJlZ2FyIGVzdGEgbGljZW7Dp2EsIG8vYSBTci4vU3JhLiAoYXV0b3Igb3UgZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yKToKCmEpIENvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUKcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291CmRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0KZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYQp0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kKcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MKZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcwpkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEgb3MgZGlyZWl0b3MKcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlCnRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91CmNvbnRlw7pkbyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbwpwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEsIGRlY2xhcmEgcXVlCmN1bXByaXUgcXVhaXNxdWVyIG9icmlnYcOnw7VlcyBleGlnaWRhcyBwZWxvIHJlc3BlY3Rpdm8gY29udHJhdG8gb3UKYWNvcmRvLgoKQSBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldSAocykgbm9tZSAocykKY29tbyBvIChzKSBhdXRvciAoZXMpIG91IGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50bwplbnRyZWd1ZSwgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvcgplc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Monografiahttps://bdm.unb.br/PUBhttp://bdm.unb.br/oai/requestbdm@bce.unb.br||patricia@bce.unb.bropendoar:115712016-07-29T18:54:11Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)false
dc.title.en.fl_str_mv Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar
title Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar
spellingShingle Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar
Vieira, Lucas Maciel
RNAs não-codificadores
Biologia computacional
Máquinas de suporte vetorial
Bioinformática
title_short Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar
title_full Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar
title_fullStr Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar
title_full_unstemmed Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar
title_sort Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte : um estudo de caso para a cana-de-açúcar
author Vieira, Lucas Maciel
author_facet Vieira, Lucas Maciel
author_role author
dc.contributor.author.fl_str_mv Vieira, Lucas Maciel
dc.contributor.advisor1.fl_str_mv Walter, Maria Emilia Machado Telles
contributor_str_mv Walter, Maria Emilia Machado Telles
dc.subject.por.fl_str_mv RNAs não-codificadores
Biologia computacional
Máquinas de suporte vetorial
Bioinformática
topic RNAs não-codificadores
Biologia computacional
Máquinas de suporte vetorial
Bioinformática
description Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2016.
publishDate 2016
dc.date.submitted.none.fl_str_mv 2016
dc.date.accessioned.fl_str_mv 2016-07-29T18:53:06Z
dc.date.available.fl_str_mv 2016-07-29T18:53:06Z
dc.date.issued.fl_str_mv 2016-07-29T18:53:06Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv VIEIRA, Lucas Maciel. Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte: um estudo de caso para a cana-de-açúcar. 2016. xii, 74 f., il. Monografia (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2016.
dc.identifier.uri.fl_str_mv http://bdm.unb.br/handle/10483/13908
identifier_str_mv VIEIRA, Lucas Maciel. Classificação de RNAs não-codificadores longos intergênicos usando máquina de vetores de suporte: um estudo de caso para a cana-de-açúcar. 2016. xii, 74 f., il. Monografia (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2016.
url http://bdm.unb.br/handle/10483/13908
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Monografias da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Biblioteca Digital de Monografias da UnB
collection Biblioteca Digital de Monografias da UnB
bitstream.url.fl_str_mv http://bdm.unb.br/xmlui/bitstream/10483/13908/1/2016_LucasMacielVieira.pdf
http://bdm.unb.br/xmlui/bitstream/10483/13908/2/license_url
http://bdm.unb.br/xmlui/bitstream/10483/13908/3/license_text
http://bdm.unb.br/xmlui/bitstream/10483/13908/4/license_rdf
http://bdm.unb.br/xmlui/bitstream/10483/13908/5/license.txt
bitstream.checksum.fl_str_mv 947b48770801cc5a8144b2c5ea3384ad
587cd8ffae15c8598ed3c46d248a3f38
d41d8cd98f00b204e9800998ecf8427e
73e23c2acaaf13389e092bd813e3223d
5145371de34f430c839a41d2bbfee019
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv bdm@bce.unb.br||patricia@bce.unb.br
_version_ 1801492992565968896