Segmentação de imagens de pessoas em tempo real para videoconferências
Autor(a) principal: | |
---|---|
Data de Publicação: | 2011 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UNISINOS (RBDU Repositório Digital da Biblioteca da Unisinos) |
Texto Completo: | http://www.repositorio.jesuita.org.br/handle/UNISINOS/3005 |
Resumo: | Segmentação de objetos em imagens e vídeos é uma área relativamente antiga na área de processamento de imagens e visão computacional. De fato, recentemente, devido à grande evolução dos sistemas computacionais em termos de hardware e à popularização da internet, uma aplicação de segmentação de imagens de pessoas que vem ganhando grande destaque na área acadêmica e comercial são as videoconferências. Esse tipo de aplicação traz benefícios a diferentes áreas, como telemedicina, educação à distância, e principalmente empresarial. Diversas empresas utilizam esse tipo de recurso para realizar reuniões/conferências a nível global economizando quantias consideráveis de recursos. No entanto, videoconferências ainda não proporcionam a mesma experiência que as pessoas têm quando estão num mesmo ambiente. Portanto, esse trabalho propõe o desenvolvimento de um sistema de segmentação da imagem do locutor, específico para videoconferências, a fim de permitir futuros processamentos que aumentem a sensação de imersão dos participantes, como por exemplo, a substituição do fundo da imagem por um fundo padrão em todos ambientes. O sistema proposto utiliza basicamente um algoritmo de programação dinâmica guiado por energias extraídas da imagem, envolvendo informações de borda, movimento e probabilidade. Através de diversos testes realizados, observou-se que o sistema apresenta resultados equiparáveis aos do estado da arte do tema, sendo capaz de ser executado em tempo real a uma taxa de 8 FPS, mesmo com um código não otimizado. O grande diferencial do sistema proposto é que nenhum tipo de treinamento prévio é necessário para efetuar a segmentação |
id |
USIN_390a89d81b969a4b686ba5b3994f6e8c |
---|---|
oai_identifier_str |
oai:www.repositorio.jesuita.org.br:UNISINOS/3005 |
network_acronym_str |
USIN |
network_name_str |
Repositório Institucional da UNISINOS (RBDU Repositório Digital da Biblioteca da Unisinos) |
repository_id_str |
|
spelling |
2015-03-16T14:26:47Z2015-03-16T14:26:47Z2011-03-22Submitted by Mariana Dornelles Vargas (marianadv) on 2015-03-16T14:26:47Z No. of bitstreams: 1 segmentacao_imagens.pdf: 6472132 bytes, checksum: b5a25706eff2375403bc63c7d6a89f0d (MD5)Made available in DSpace on 2015-03-16T14:26:47Z (GMT). No. of bitstreams: 1 segmentacao_imagens.pdf: 6472132 bytes, checksum: b5a25706eff2375403bc63c7d6a89f0d (MD5) Previous issue date: 2011Segmentação de objetos em imagens e vídeos é uma área relativamente antiga na área de processamento de imagens e visão computacional. De fato, recentemente, devido à grande evolução dos sistemas computacionais em termos de hardware e à popularização da internet, uma aplicação de segmentação de imagens de pessoas que vem ganhando grande destaque na área acadêmica e comercial são as videoconferências. Esse tipo de aplicação traz benefícios a diferentes áreas, como telemedicina, educação à distância, e principalmente empresarial. Diversas empresas utilizam esse tipo de recurso para realizar reuniões/conferências a nível global economizando quantias consideráveis de recursos. No entanto, videoconferências ainda não proporcionam a mesma experiência que as pessoas têm quando estão num mesmo ambiente. Portanto, esse trabalho propõe o desenvolvimento de um sistema de segmentação da imagem do locutor, específico para videoconferências, a fim de permitir futuros processamentos que aumentem a sensação de imersão dos participantes, como por exemplo, a substituição do fundo da imagem por um fundo padrão em todos ambientes. O sistema proposto utiliza basicamente um algoritmo de programação dinâmica guiado por energias extraídas da imagem, envolvendo informações de borda, movimento e probabilidade. Através de diversos testes realizados, observou-se que o sistema apresenta resultados equiparáveis aos do estado da arte do tema, sendo capaz de ser executado em tempo real a uma taxa de 8 FPS, mesmo com um código não otimizado. O grande diferencial do sistema proposto é que nenhum tipo de treinamento prévio é necessário para efetuar a segmentaçãoObject segmentation has been discussed on Computer Vision and Image processing fields for quite some time. Recently, given the hardware evolution and popularization of the World Wide Web, videoconferences have been the main discussion in this area. This technique brings advantages to many fields, such as telemedicine, education (distance learning), and mainly to the business world. Many companies use videoconferences for worldwide meetings, in order to save a substantial amount o f resources. However, videoconferences still do not provide the same experience a s people have when they are in the same room. Therefore, in this paper we propose the development of a system to segment the image of a person who is attending the videoconference, in order to allow future processing that may increase the experience of being in the same room. For instance, the background of the scene could be replaced by a standard one for all participants. The proposed system uses a dynamic programming algorithm guided by energies, such as image edges, motion and probabilistic information. After extensive tests, we could conclude that the results obtained are comparable to other state of the art works and the system is able to execute in real time at 8 FPS. The advantage of the proposed system when compared to others is that no previous training is required in order to perform the segmentationHP - Hewlett-Packard Brasil LtdaMilton ValenteParolin, Alessandrohttp://lattes.cnpq.br/6931013337647100http://lattes.cnpq.br/0625922822611048Oliveira, Luiz Paulo Luna deUniversidade do Vale do Rio dos SinosPrograma de Pós-Graduação em Computação AplicadaUnisinosBrasilEscola PolitécnicaSegmentação de imagens de pessoas em tempo real para videoconferênciasACCNPQ::Ciências Exatas e da Terra::Ciência da ComputaçãoVideoconferênciasProcessamento de imagensDetecção de facesSegmentação de objetosVisão computacionalInteração homem-máquinaHuman segmentationImage processingComputer visionFace detectioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://www.repositorio.jesuita.org.br/handle/UNISINOS/3005info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UNISINOS (RBDU Repositório Digital da Biblioteca da Unisinos)instname:Universidade do Vale do Rio dos Sinos (UNISINOS)instacron:UNISINOSORIGINALsegmentacao_imagens.pdfsegmentacao_imagens.pdfapplication/pdf6472132http://repositorio.jesuita.org.br/bitstream/UNISINOS/3005/1/segmentacao_imagens.pdfb5a25706eff2375403bc63c7d6a89f0dMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82097http://repositorio.jesuita.org.br/bitstream/UNISINOS/3005/2/license.txt30aee977a52392c99464e4663dd115a2MD52UNISINOS/30052015-03-31 08:34:59.934oai:www.repositorio.jesuita.org.br:UNISINOS/3005Tk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSP1BSSUEgTElDRU4/QQpFc3RhIGxpY2VuP2EgZGUgZXhlbXBsbyA/IGZvcm5lY2lkYSBhcGVuYXMgcGFyYSBmaW5zIGluZm9ybWF0aXZvcy4KCkxJQ0VOP0EgREUgRElTVFJJQlVJPz9PIE4/Ty1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YT8/byBkZXN0YSBsaWNlbj9hLCB2b2M/IChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSA/IApVbml2ZXJzaWRhZGUgZG8gVmFsZSBkbyBSaW8gZG9zIFNpbm9zIChVTklTSU5PUykgbyBkaXJlaXRvIG4/by1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGE/P28gKGluY2x1aW5kbyBvIHJlc3VtbykgcG9yIHRvZG8gbyBtdW5kbyBubyBmb3JtYXRvIGltcHJlc3NvIGUgZWxldHI/bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3MgP3VkaW8gb3Ugdj9kZW8uCgpWb2M/IGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlP2RvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhPz9vIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmE/P28uCgpWb2M/IHRhbWI/bSBjb25jb3JkYSBxdWUgYSBTaWdsYSBkZSBVbml2ZXJzaWRhZGUgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgYz9waWEgYSBzdWEgdGVzZSBvdSAKZGlzc2VydGE/P28gcGFyYSBmaW5zIGRlIHNlZ3VyYW4/YSwgYmFjay11cCBlIHByZXNlcnZhPz9vLgoKVm9jPyBkZWNsYXJhIHF1ZSBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhPz9vID8gb3JpZ2luYWwgZSBxdWUgdm9jPyB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW4/YS4gVm9jPyB0YW1iP20gZGVjbGFyYSBxdWUgbyBkZXA/c2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YT8/byBuP28sIHF1ZSBzZWphIGRlIHNldSAKY29uaGVjaW1lbnRvLCBpbmZyaW5nZSBkaXJlaXRvcyBhdXRvcmFpcyBkZSBuaW5ndT9tLgoKQ2FzbyBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhPz9vIGNvbnRlbmhhIG1hdGVyaWFsIHF1ZSB2b2M/IG4/byBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2M/IApkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzP28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciA/IFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2VuP2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdD8gY2xhcmFtZW50ZSAKaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGU/ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YT8/byBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBPz9PIE9SQSBERVBPU0lUQURBIFRFTkhBIFNJRE8gUkVTVUxUQURPIERFIFVNIFBBVFJPQz9OSU8gT1UgCkFQT0lPIERFIFVNQSBBRz9OQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOP08gU0VKQSBBIFNJR0xBIERFIApVTklWRVJTSURBREUsIFZPQz8gREVDTEFSQSBRVUUgUkVTUEVJVE9VIFRPRE9TIEUgUVVBSVNRVUVSIERJUkVJVE9TIERFIFJFVklTP08gQ09NTyAKVEFNQj9NIEFTIERFTUFJUyBPQlJJR0E/P0VTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YT8/bywgZSBuP28gZmFyPyBxdWFscXVlciBhbHRlcmE/P28sIGFsP20gZGFxdWVsYXMgCmNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW4/YS4KBiblioteca Digital de Teses e Dissertaçõeshttp://www.repositorio.jesuita.org.br/oai/requestopendoar:2015-03-31T11:34:59Repositório Institucional da UNISINOS (RBDU Repositório Digital da Biblioteca da Unisinos) - Universidade do Vale do Rio dos Sinos (UNISINOS)false |
dc.title.pt_BR.fl_str_mv |
Segmentação de imagens de pessoas em tempo real para videoconferências |
title |
Segmentação de imagens de pessoas em tempo real para videoconferências |
spellingShingle |
Segmentação de imagens de pessoas em tempo real para videoconferências Parolin, Alessandro ACCNPQ::Ciências Exatas e da Terra::Ciência da Computação Videoconferências Processamento de imagens Detecção de faces Segmentação de objetos Visão computacional Interação homem-máquina Human segmentation Image processing Computer vision Face detection |
title_short |
Segmentação de imagens de pessoas em tempo real para videoconferências |
title_full |
Segmentação de imagens de pessoas em tempo real para videoconferências |
title_fullStr |
Segmentação de imagens de pessoas em tempo real para videoconferências |
title_full_unstemmed |
Segmentação de imagens de pessoas em tempo real para videoconferências |
title_sort |
Segmentação de imagens de pessoas em tempo real para videoconferências |
author |
Parolin, Alessandro |
author_facet |
Parolin, Alessandro |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/6931013337647100 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/0625922822611048 |
dc.contributor.author.fl_str_mv |
Parolin, Alessandro |
dc.contributor.advisor1.fl_str_mv |
Oliveira, Luiz Paulo Luna de |
contributor_str_mv |
Oliveira, Luiz Paulo Luna de |
dc.subject.cnpq.fl_str_mv |
ACCNPQ::Ciências Exatas e da Terra::Ciência da Computação |
topic |
ACCNPQ::Ciências Exatas e da Terra::Ciência da Computação Videoconferências Processamento de imagens Detecção de faces Segmentação de objetos Visão computacional Interação homem-máquina Human segmentation Image processing Computer vision Face detection |
dc.subject.por.fl_str_mv |
Videoconferências Processamento de imagens Detecção de faces Segmentação de objetos Visão computacional Interação homem-máquina |
dc.subject.eng.fl_str_mv |
Human segmentation Image processing Computer vision Face detection |
description |
Segmentação de objetos em imagens e vídeos é uma área relativamente antiga na área de processamento de imagens e visão computacional. De fato, recentemente, devido à grande evolução dos sistemas computacionais em termos de hardware e à popularização da internet, uma aplicação de segmentação de imagens de pessoas que vem ganhando grande destaque na área acadêmica e comercial são as videoconferências. Esse tipo de aplicação traz benefícios a diferentes áreas, como telemedicina, educação à distância, e principalmente empresarial. Diversas empresas utilizam esse tipo de recurso para realizar reuniões/conferências a nível global economizando quantias consideráveis de recursos. No entanto, videoconferências ainda não proporcionam a mesma experiência que as pessoas têm quando estão num mesmo ambiente. Portanto, esse trabalho propõe o desenvolvimento de um sistema de segmentação da imagem do locutor, específico para videoconferências, a fim de permitir futuros processamentos que aumentem a sensação de imersão dos participantes, como por exemplo, a substituição do fundo da imagem por um fundo padrão em todos ambientes. O sistema proposto utiliza basicamente um algoritmo de programação dinâmica guiado por energias extraídas da imagem, envolvendo informações de borda, movimento e probabilidade. Através de diversos testes realizados, observou-se que o sistema apresenta resultados equiparáveis aos do estado da arte do tema, sendo capaz de ser executado em tempo real a uma taxa de 8 FPS, mesmo com um código não otimizado. O grande diferencial do sistema proposto é que nenhum tipo de treinamento prévio é necessário para efetuar a segmentação |
publishDate |
2011 |
dc.date.issued.fl_str_mv |
2011-03-22 |
dc.date.accessioned.fl_str_mv |
2015-03-16T14:26:47Z |
dc.date.available.fl_str_mv |
2015-03-16T14:26:47Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://www.repositorio.jesuita.org.br/handle/UNISINOS/3005 |
url |
http://www.repositorio.jesuita.org.br/handle/UNISINOS/3005 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade do Vale do Rio dos Sinos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Computação Aplicada |
dc.publisher.initials.fl_str_mv |
Unisinos |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Escola Politécnica |
publisher.none.fl_str_mv |
Universidade do Vale do Rio dos Sinos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNISINOS (RBDU Repositório Digital da Biblioteca da Unisinos) instname:Universidade do Vale do Rio dos Sinos (UNISINOS) instacron:UNISINOS |
instname_str |
Universidade do Vale do Rio dos Sinos (UNISINOS) |
instacron_str |
UNISINOS |
institution |
UNISINOS |
reponame_str |
Repositório Institucional da UNISINOS (RBDU Repositório Digital da Biblioteca da Unisinos) |
collection |
Repositório Institucional da UNISINOS (RBDU Repositório Digital da Biblioteca da Unisinos) |
bitstream.url.fl_str_mv |
http://repositorio.jesuita.org.br/bitstream/UNISINOS/3005/1/segmentacao_imagens.pdf http://repositorio.jesuita.org.br/bitstream/UNISINOS/3005/2/license.txt |
bitstream.checksum.fl_str_mv |
b5a25706eff2375403bc63c7d6a89f0d 30aee977a52392c99464e4663dd115a2 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UNISINOS (RBDU Repositório Digital da Biblioteca da Unisinos) - Universidade do Vale do Rio dos Sinos (UNISINOS) |
repository.mail.fl_str_mv |
|
_version_ |
1801844950007021568 |