Deep learning aplicado à classificação de vídeos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Outros Autores: | |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Monografias da UnB |
Texto Completo: | https://bdm.unb.br/handle/10483/28398 |
Resumo: | Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2018. |
id |
UNB-2_9b6939e0df848e5f2216a11ad4d6fb06 |
---|---|
oai_identifier_str |
oai:bdm.unb.br:10483/28398 |
network_acronym_str |
UNB-2 |
network_name_str |
Biblioteca Digital de Monografias da UnB |
repository_id_str |
11571 |
spelling |
Carvalho, Gustavo Henrique Takahashi de AquinoMarques, Pedro CaiafaRomariz, Alexandre Ricardo SoaresCARVALHO, Gustavo Henrique Takahashi de Aquino; MARQUES, Pedro Caiafa. Deep learning aplicado à classificação de vídeos. 2018. 74 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2018.https://bdm.unb.br/handle/10483/28398Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2018.A identificação automática de ações em vídeos é uma área extensamente explorada em inteligência artificial, impulsionada pela enorme quantidade de dados e tempo necessário para realização manual desta tarefa. Neste cenário, realiza-se estudo a respeito de redes capazes de classificar vídeos de acordo com as ações tomadas utilizando o data set UCF101, composto por 13320 vídeos divididos em 101 categorias. Comparam-se metodologias ingênuas, que realizam classificação da ação por apenas uma imagem estática, com técnicas que incorporam as informações temporais por meio de diversas arquiteturas, aferindo impactos da relação temporal na classificação. Com este fim, são utilizadas redes convolucionais, implementadas em python com auxílio da biblioteca Keras utilizando o Tensorflow como backend. É explorada a possibilidade de realizar o presente estudo com limitações de recursos expressivas quando comparadas às tecnologias disponíveis em trabalhos estado da arte. Ao final, comprova-se a viabilidade deste tipo de pesquisa com a capacidade de obter redes que, ainda que não alcancem 98, 0% de acurácia do melhor resultado já reportado, apresentem resultados bastante expressivos, atingindo a marca de 92, 6% de acurácia.Submitted by Patricia Nunes (patricia@bce.unb.br) on 2021-08-28T02:04:53Z No. of bitstreams: 1 2018_GustavoHenriqueCarvalho_PedroMarques_tcc.pdf: 4181882 bytes, checksum: 22c5a73089cd51f3facdaedb67147958 (MD5)Approved for entry into archive by Patricia Nunes (patricia@bce.unb.br) on 2021-08-28T02:05:18Z (GMT) No. of bitstreams: 1 2018_GustavoHenriqueCarvalho_PedroMarques_tcc.pdf: 4181882 bytes, checksum: 22c5a73089cd51f3facdaedb67147958 (MD5)Made available in DSpace on 2021-08-28T02:05:18Z (GMT). No. of bitstreams: 1 2018_GustavoHenriqueCarvalho_PedroMarques_tcc.pdf: 4181882 bytes, checksum: 22c5a73089cd51f3facdaedb67147958 (MD5)Automatically identifying actions in videos is extensively explored by the usage of artificial intelligence given the vast video data there is and the time it takes to manually perform this task. With this in perspective, we set out to study networks capable of classifying videos in respect to the actions taken within them, to that end the data set UCF101, comprised of 133320 video clips divided among 101 classes, is explored. We compare trivial methodologies, which try to classify the video using only a single static image, with networks that incorporate the temporal information, hoping to asses the influence of temporal relation in the classification process. To do so convolutional networks are implemented in python with the support of the Keras library running on top of Tensorflow. We also address the viability of studying these problems with severe resource limitation compared to the technology available in most state of the art researches. We manage to confirm the possibility of researches with these limitations by training a neural network that, even though it falls short from state of the art accuracy of 98,0%, has an expressive accuracy of 92,6%.A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.info:eu-repo/semantics/openAccessAprendizado de máquinaRedes neurais (Computação)Vídeo - classificaçãoDeep learning aplicado à classificação de vídeosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis2021-08-28T02:05:18Z2021-08-28T02:05:18Z2018-12-10porreponame:Biblioteca Digital de Monografias da UnBinstname:Universidade de Brasília (UnB)instacron:UNBLICENSElicense.txtlicense.txttext/plain1817http://bdm.unb.br/xmlui/bitstream/10483/28398/2/license.txt21554873e56ad8ddc69c092699b98f95MD52ORIGINAL2018_GustavoHenriqueCarvalho_PedroMarques_tcc.pdf2018_GustavoHenriqueCarvalho_PedroMarques_tcc.pdfapplication/pdf4181882http://bdm.unb.br/xmlui/bitstream/10483/28398/1/2018_GustavoHenriqueCarvalho_PedroMarques_tcc.pdf22c5a73089cd51f3facdaedb67147958MD5110483/283982021-08-31 23:41:18.597oai:bdm.unb.br:10483/28398w4kgbmVjZXNzw6FyaW8gY29uY29yZGFyIGNvbSBhIGxpY2Vuw6dhIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhLAphbnRlcyBxdWUgbyBkb2N1bWVudG8gcG9zc2EgYXBhcmVjZXIgbmEgQmlibGlvdGVjYSBEaWdpdGFsIGRhIFByb2R1w6fDo28gCkRpc2NlbnRlIGRhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEuIFBvciBmYXZvciwgbGVpYSBhCmxpY2Vuw6dhIGF0ZW50YW1lbnRlLiBDYXNvIG5lY2Vzc2l0ZSBkZSBhbGd1bSBlc2NsYXJlY2ltZW50byBlbnRyZSBlbQpjb250YXRvIGF0cmF2w6lzIGRlOiBiZG1AYmNlLnVuYi5iciBvdSAzMTA3LTI2ODcuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQW8gYXNzaW5hciBlIGVudHJlZ2FyIGVzdGEgbGljZW7Dp2EsIG8vYSBTci4vU3JhLiAoYXV0b3Igb3UgZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yKToKCmEpIENvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUKcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291CmRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0KZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYQp0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kKcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MKZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcwpkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEgb3MgZGlyZWl0b3MKcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlCnRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91CmNvbnRlw7pkbyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbwpwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEsIGRlY2xhcmEgcXVlCmN1bXByaXUgcXVhaXNxdWVyIG9icmlnYcOnw7VlcyBleGlnaWRhcyBwZWxvIHJlc3BlY3Rpdm8gY29udHJhdG8gb3UKYWNvcmRvLgoKQSBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldSAocykgbm9tZSAocykKY29tbyBvIChzKSBhdXRvciAoZXMpIG91IGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50bwplbnRyZWd1ZSwgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvcgplc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Monografiahttps://bdm.unb.br/PUBhttp://bdm.unb.br/oai/requestbdm@bce.unb.br||patricia@bce.unb.bropendoar:115712021-09-01T02:41:18Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)false |
dc.title.pt_BR.fl_str_mv |
Deep learning aplicado à classificação de vídeos |
title |
Deep learning aplicado à classificação de vídeos |
spellingShingle |
Deep learning aplicado à classificação de vídeos Carvalho, Gustavo Henrique Takahashi de Aquino Aprendizado de máquina Redes neurais (Computação) Vídeo - classificação |
title_short |
Deep learning aplicado à classificação de vídeos |
title_full |
Deep learning aplicado à classificação de vídeos |
title_fullStr |
Deep learning aplicado à classificação de vídeos |
title_full_unstemmed |
Deep learning aplicado à classificação de vídeos |
title_sort |
Deep learning aplicado à classificação de vídeos |
author |
Carvalho, Gustavo Henrique Takahashi de Aquino |
author_facet |
Carvalho, Gustavo Henrique Takahashi de Aquino Marques, Pedro Caiafa |
author_role |
author |
author2 |
Marques, Pedro Caiafa |
author2_role |
author |
dc.contributor.author.fl_str_mv |
Carvalho, Gustavo Henrique Takahashi de Aquino Marques, Pedro Caiafa |
dc.contributor.advisor1.fl_str_mv |
Romariz, Alexandre Ricardo Soares |
contributor_str_mv |
Romariz, Alexandre Ricardo Soares |
dc.subject.keyword.pt_BR.fl_str_mv |
Aprendizado de máquina Redes neurais (Computação) Vídeo - classificação |
topic |
Aprendizado de máquina Redes neurais (Computação) Vídeo - classificação |
description |
Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2018. |
publishDate |
2018 |
dc.date.submitted.none.fl_str_mv |
2018-12-10 |
dc.date.accessioned.fl_str_mv |
2021-08-28T02:05:18Z |
dc.date.available.fl_str_mv |
2021-08-28T02:05:18Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
CARVALHO, Gustavo Henrique Takahashi de Aquino; MARQUES, Pedro Caiafa. Deep learning aplicado à classificação de vídeos. 2018. 74 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2018. |
dc.identifier.uri.fl_str_mv |
https://bdm.unb.br/handle/10483/28398 |
identifier_str_mv |
CARVALHO, Gustavo Henrique Takahashi de Aquino; MARQUES, Pedro Caiafa. Deep learning aplicado à classificação de vídeos. 2018. 74 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2018. |
url |
https://bdm.unb.br/handle/10483/28398 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Monografias da UnB instname:Universidade de Brasília (UnB) instacron:UNB |
instname_str |
Universidade de Brasília (UnB) |
instacron_str |
UNB |
institution |
UNB |
reponame_str |
Biblioteca Digital de Monografias da UnB |
collection |
Biblioteca Digital de Monografias da UnB |
bitstream.url.fl_str_mv |
http://bdm.unb.br/xmlui/bitstream/10483/28398/2/license.txt http://bdm.unb.br/xmlui/bitstream/10483/28398/1/2018_GustavoHenriqueCarvalho_PedroMarques_tcc.pdf |
bitstream.checksum.fl_str_mv |
21554873e56ad8ddc69c092699b98f95 22c5a73089cd51f3facdaedb67147958 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB) |
repository.mail.fl_str_mv |
bdm@bce.unb.br||patricia@bce.unb.br |
_version_ |
1813908051222069248 |