Correlação probabilística implementada em spark para big data em saúde
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFBA |
Texto Completo: | http://repositorio.ufba.br/ri/handle/ri/19308 |
Resumo: | A aplicação de técnicas de correlação probabilística em registros de saúde ou socioeconômicos de uma população tem sido uma prática comum entre epidemiologistas como base para suas pesquisa não-experimentais. Entretanto, o crescimento do volume dos dados comum ao cenário imposto pelo Big Data provocou uma carˆencia por ferramentas computacionais capazes de lidar com esses imensos reposit´orios. Neste trabalho é descrita uma solução implementada no framework de processamento em cluster Spark para a correlação probabilística de registros de grandes bases de dados do Sistema Público de Saúde brasileiro. Este trabalho está vinculado a um projeto que visa analisar a relação entre o Programam Bolsa Família e a incidência de doen¸cas associadas á pobreza, tais como hanseníase e tuberculose. Os resultados obtidos demonstram que esta implementação provê qualidade competitiva em relação a outras ferramentas e abordagens existentes, comprovada pela superioridade das métricas de tempo de execução. |
id |
UFBA-2_943cae3a5261122433dd778e02821ae1 |
---|---|
oai_identifier_str |
oai:repositorio.ufba.br:ri/19308 |
network_acronym_str |
UFBA-2 |
network_name_str |
Repositório Institucional da UFBA |
repository_id_str |
1932 |
spelling |
Pita, Robespierre Dantas da RochaBarreto, Marcos EnnesBoratto, Murilo do CarmoSantos, Carlos Antonio de Souza TelesRios, Ricardo Araujo2016-05-30T16:15:43Z2016-05-30T16:15:43Z2016-05-302015-03-05http://repositorio.ufba.br/ri/handle/ri/19308A aplicação de técnicas de correlação probabilística em registros de saúde ou socioeconômicos de uma população tem sido uma prática comum entre epidemiologistas como base para suas pesquisa não-experimentais. Entretanto, o crescimento do volume dos dados comum ao cenário imposto pelo Big Data provocou uma carˆencia por ferramentas computacionais capazes de lidar com esses imensos reposit´orios. Neste trabalho é descrita uma solução implementada no framework de processamento em cluster Spark para a correlação probabilística de registros de grandes bases de dados do Sistema Público de Saúde brasileiro. Este trabalho está vinculado a um projeto que visa analisar a relação entre o Programam Bolsa Família e a incidência de doen¸cas associadas á pobreza, tais como hanseníase e tuberculose. Os resultados obtidos demonstram que esta implementação provê qualidade competitiva em relação a outras ferramentas e abordagens existentes, comprovada pela superioridade das métricas de tempo de execução.Submitted by Santos Davilene (davilenes@ufba.br) on 2016-05-30T16:15:43Z No. of bitstreams: 1 Dissertação_Mestrado_Clicia(1).pdf: 2228201 bytes, checksum: d990a114eac5a988c57ba6d1e22e8f99 (MD5)Made available in DSpace on 2016-05-30T16:15:43Z (GMT). No. of bitstreams: 1 Dissertação_Mestrado_Clicia(1).pdf: 2228201 bytes, checksum: d990a114eac5a988c57ba6d1e22e8f99 (MD5)Ciência da ComputaçãoCorrelação probabilísticaComputação intensiva de dadosSistemas de saúde públicaApache SparkCorrelação probabilística implementada em spark para big data em saúdeinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisInstituto de Matemática. Departamento de Ciência da ComputaçãoMestrado Multiinstitucional em Ciência da ComputaçãoUFBAbrasilinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFBAinstname:Universidade Federal da Bahia (UFBA)instacron:UFBAORIGINALDissertação final - Robespierre.pdfDissertação final - Robespierre.pdfapplication/pdf2025980https://repositorio.ufba.br/bitstream/ri/19308/3/Disserta%c3%a7%c3%a3o%20final%20-%20Robespierre.pdf4bad146cfdc17b12f67055d79bca96c3MD53LICENSElicense.txtlicense.txttext/plain1345https://repositorio.ufba.br/bitstream/ri/19308/2/license.txt0d4b811ef71182510d2015daa7c8a900MD52TEXTDissertação final - Robespierre.pdf.txtDissertação final - Robespierre.pdf.txtExtracted texttext/plain190332https://repositorio.ufba.br/bitstream/ri/19308/4/Disserta%c3%a7%c3%a3o%20final%20-%20Robespierre.pdf.txt1e9ebdc6bf05907bbde3488be8f93be4MD54ri/193082022-02-20 21:42:06.322oai:repositorio.ufba.br:ri/19308VGVybW8gZGUgTGljZW4/YSwgbj9vIGV4Y2x1c2l2bywgcGFyYSBvIGRlcD9zaXRvIG5vIFJlcG9zaXQ/cmlvIEluc3RpdHVjaW9uYWwgZGEgVUZCQS4KCiBQZWxvIHByb2Nlc3NvIGRlIHN1Ym1pc3M/byBkZSBkb2N1bWVudG9zLCBvIGF1dG9yIG91IHNldSByZXByZXNlbnRhbnRlIGxlZ2FsLCBhbyBhY2VpdGFyIAplc3NlIHRlcm1vIGRlIGxpY2VuP2EsIGNvbmNlZGUgYW8gUmVwb3NpdD9yaW8gSW5zdGl0dWNpb25hbCBkYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkYSBCYWhpYSAKbyBkaXJlaXRvIGRlIG1hbnRlciB1bWEgYz9waWEgZW0gc2V1IHJlcG9zaXQ/cmlvIGNvbSBhIGZpbmFsaWRhZGUsIHByaW1laXJhLCBkZSBwcmVzZXJ2YT8/by4gCkVzc2VzIHRlcm1vcywgbj9vIGV4Y2x1c2l2b3MsIG1hbnQ/bSBvcyBkaXJlaXRvcyBkZSBhdXRvci9jb3B5cmlnaHQsIG1hcyBlbnRlbmRlIG8gZG9jdW1lbnRvIApjb21vIHBhcnRlIGRvIGFjZXJ2byBpbnRlbGVjdHVhbCBkZXNzYSBVbml2ZXJzaWRhZGUuCgogUGFyYSBvcyBkb2N1bWVudG9zIHB1YmxpY2Fkb3MgY29tIHJlcGFzc2UgZGUgZGlyZWl0b3MgZGUgZGlzdHJpYnVpPz9vLCBlc3NlIHRlcm1vIGRlIGxpY2VuP2EgCmVudGVuZGUgcXVlOgoKIE1hbnRlbmRvIG9zIGRpcmVpdG9zIGF1dG9yYWlzLCByZXBhc3NhZG9zIGEgdGVyY2Vpcm9zLCBlbSBjYXNvIGRlIHB1YmxpY2E/P2VzLCBvIHJlcG9zaXQ/cmlvCnBvZGUgcmVzdHJpbmdpciBvIGFjZXNzbyBhbyB0ZXh0byBpbnRlZ3JhbCwgbWFzIGxpYmVyYSBhcyBpbmZvcm1hPz9lcyBzb2JyZSBvIGRvY3VtZW50bwooTWV0YWRhZG9zIGVzY3JpdGl2b3MpLgoKIERlc3RhIGZvcm1hLCBhdGVuZGVuZG8gYW9zIGFuc2Vpb3MgZGVzc2EgdW5pdmVyc2lkYWRlIGVtIG1hbnRlciBzdWEgcHJvZHU/P28gY2llbnQ/ZmljYSBjb20gCmFzIHJlc3RyaT8/ZXMgaW1wb3N0YXMgcGVsb3MgZWRpdG9yZXMgZGUgcGVyaT9kaWNvcy4KCiBQYXJhIGFzIHB1YmxpY2E/P2VzIHNlbSBpbmljaWF0aXZhcyBxdWUgc2VndWVtIGEgcG9sP3RpY2EgZGUgQWNlc3NvIEFiZXJ0bywgb3MgZGVwP3NpdG9zIApjb21wdWxzP3Jpb3MgbmVzc2UgcmVwb3NpdD9yaW8gbWFudD9tIG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBtYXMgbWFudD9tIGFjZXNzbyBpcnJlc3RyaXRvIAphbyBtZXRhZGFkb3MgZSB0ZXh0byBjb21wbGV0by4gQXNzaW0sIGEgYWNlaXRhPz9vIGRlc3NlIHRlcm1vIG4/byBuZWNlc3NpdGEgZGUgY29uc2VudGltZW50bwogcG9yIHBhcnRlIGRlIGF1dG9yZXMvZGV0ZW50b3JlcyBkb3MgZGlyZWl0b3MsIHBvciBlc3RhcmVtIGVtIGluaWNpYXRpdmFzIGRlIGFjZXNzbyBhYmVydG8uCg==Repositório InstitucionalPUBhttp://192.188.11.11:8080/oai/requestopendoar:19322022-02-21T00:42:06Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)false |
dc.title.pt_BR.fl_str_mv |
Correlação probabilística implementada em spark para big data em saúde |
title |
Correlação probabilística implementada em spark para big data em saúde |
spellingShingle |
Correlação probabilística implementada em spark para big data em saúde Pita, Robespierre Dantas da Rocha Ciência da Computação Correlação probabilística Computação intensiva de dados Sistemas de saúde pública Apache Spark |
title_short |
Correlação probabilística implementada em spark para big data em saúde |
title_full |
Correlação probabilística implementada em spark para big data em saúde |
title_fullStr |
Correlação probabilística implementada em spark para big data em saúde |
title_full_unstemmed |
Correlação probabilística implementada em spark para big data em saúde |
title_sort |
Correlação probabilística implementada em spark para big data em saúde |
author |
Pita, Robespierre Dantas da Rocha |
author_facet |
Pita, Robespierre Dantas da Rocha |
author_role |
author |
dc.contributor.author.fl_str_mv |
Pita, Robespierre Dantas da Rocha |
dc.contributor.advisor1.fl_str_mv |
Barreto, Marcos Ennes |
dc.contributor.referee1.fl_str_mv |
Boratto, Murilo do Carmo Santos, Carlos Antonio de Souza Teles Rios, Ricardo Araujo |
contributor_str_mv |
Barreto, Marcos Ennes Boratto, Murilo do Carmo Santos, Carlos Antonio de Souza Teles Rios, Ricardo Araujo |
dc.subject.cnpq.fl_str_mv |
Ciência da Computação |
topic |
Ciência da Computação Correlação probabilística Computação intensiva de dados Sistemas de saúde pública Apache Spark |
dc.subject.por.fl_str_mv |
Correlação probabilística Computação intensiva de dados Sistemas de saúde pública Apache Spark |
description |
A aplicação de técnicas de correlação probabilística em registros de saúde ou socioeconômicos de uma população tem sido uma prática comum entre epidemiologistas como base para suas pesquisa não-experimentais. Entretanto, o crescimento do volume dos dados comum ao cenário imposto pelo Big Data provocou uma carˆencia por ferramentas computacionais capazes de lidar com esses imensos reposit´orios. Neste trabalho é descrita uma solução implementada no framework de processamento em cluster Spark para a correlação probabilística de registros de grandes bases de dados do Sistema Público de Saúde brasileiro. Este trabalho está vinculado a um projeto que visa analisar a relação entre o Programam Bolsa Família e a incidência de doen¸cas associadas á pobreza, tais como hanseníase e tuberculose. Os resultados obtidos demonstram que esta implementação provê qualidade competitiva em relação a outras ferramentas e abordagens existentes, comprovada pela superioridade das métricas de tempo de execução. |
publishDate |
2015 |
dc.date.submitted.none.fl_str_mv |
2015-03-05 |
dc.date.accessioned.fl_str_mv |
2016-05-30T16:15:43Z |
dc.date.available.fl_str_mv |
2016-05-30T16:15:43Z |
dc.date.issued.fl_str_mv |
2016-05-30 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://repositorio.ufba.br/ri/handle/ri/19308 |
url |
http://repositorio.ufba.br/ri/handle/ri/19308 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Instituto de Matemática. Departamento de Ciência da Computação |
dc.publisher.program.fl_str_mv |
Mestrado Multiinstitucional em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UFBA |
dc.publisher.country.fl_str_mv |
brasil |
publisher.none.fl_str_mv |
Instituto de Matemática. Departamento de Ciência da Computação |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFBA instname:Universidade Federal da Bahia (UFBA) instacron:UFBA |
instname_str |
Universidade Federal da Bahia (UFBA) |
instacron_str |
UFBA |
institution |
UFBA |
reponame_str |
Repositório Institucional da UFBA |
collection |
Repositório Institucional da UFBA |
bitstream.url.fl_str_mv |
https://repositorio.ufba.br/bitstream/ri/19308/3/Disserta%c3%a7%c3%a3o%20final%20-%20Robespierre.pdf https://repositorio.ufba.br/bitstream/ri/19308/2/license.txt https://repositorio.ufba.br/bitstream/ri/19308/4/Disserta%c3%a7%c3%a3o%20final%20-%20Robespierre.pdf.txt |
bitstream.checksum.fl_str_mv |
4bad146cfdc17b12f67055d79bca96c3 0d4b811ef71182510d2015daa7c8a900 1e9ebdc6bf05907bbde3488be8f93be4 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA) |
repository.mail.fl_str_mv |
|
_version_ |
1808459514539671552 |