Correlação probabilística implementada em spark para big data em saúde

Detalhes bibliográficos
Autor(a) principal: Pita, Robespierre Dantas da Rocha
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFBA
Texto Completo: http://repositorio.ufba.br/ri/handle/ri/19308
Resumo: A aplicação de técnicas de correlação probabilística em registros de saúde ou socioeconômicos de uma população tem sido uma prática comum entre epidemiologistas como base para suas pesquisa não-experimentais. Entretanto, o crescimento do volume dos dados comum ao cenário imposto pelo Big Data provocou uma carˆencia por ferramentas computacionais capazes de lidar com esses imensos reposit´orios. Neste trabalho é descrita uma solução implementada no framework de processamento em cluster Spark para a correlação probabilística de registros de grandes bases de dados do Sistema Público de Saúde brasileiro. Este trabalho está vinculado a um projeto que visa analisar a relação entre o Programam Bolsa Família e a incidência de doen¸cas associadas á pobreza, tais como hanseníase e tuberculose. Os resultados obtidos demonstram que esta implementação provê qualidade competitiva em relação a outras ferramentas e abordagens existentes, comprovada pela superioridade das métricas de tempo de execução.
id UFBA-2_943cae3a5261122433dd778e02821ae1
oai_identifier_str oai:repositorio.ufba.br:ri/19308
network_acronym_str UFBA-2
network_name_str Repositório Institucional da UFBA
repository_id_str 1932
spelling Pita, Robespierre Dantas da RochaBarreto, Marcos EnnesBoratto, Murilo do CarmoSantos, Carlos Antonio de Souza TelesRios, Ricardo Araujo2016-05-30T16:15:43Z2016-05-30T16:15:43Z2016-05-302015-03-05http://repositorio.ufba.br/ri/handle/ri/19308A aplicação de técnicas de correlação probabilística em registros de saúde ou socioeconômicos de uma população tem sido uma prática comum entre epidemiologistas como base para suas pesquisa não-experimentais. Entretanto, o crescimento do volume dos dados comum ao cenário imposto pelo Big Data provocou uma carˆencia por ferramentas computacionais capazes de lidar com esses imensos reposit´orios. Neste trabalho é descrita uma solução implementada no framework de processamento em cluster Spark para a correlação probabilística de registros de grandes bases de dados do Sistema Público de Saúde brasileiro. Este trabalho está vinculado a um projeto que visa analisar a relação entre o Programam Bolsa Família e a incidência de doen¸cas associadas á pobreza, tais como hanseníase e tuberculose. Os resultados obtidos demonstram que esta implementação provê qualidade competitiva em relação a outras ferramentas e abordagens existentes, comprovada pela superioridade das métricas de tempo de execução.Submitted by Santos Davilene (davilenes@ufba.br) on 2016-05-30T16:15:43Z No. of bitstreams: 1 Dissertação_Mestrado_Clicia(1).pdf: 2228201 bytes, checksum: d990a114eac5a988c57ba6d1e22e8f99 (MD5)Made available in DSpace on 2016-05-30T16:15:43Z (GMT). No. of bitstreams: 1 Dissertação_Mestrado_Clicia(1).pdf: 2228201 bytes, checksum: d990a114eac5a988c57ba6d1e22e8f99 (MD5)Ciência da ComputaçãoCorrelação probabilísticaComputação intensiva de dadosSistemas de saúde públicaApache SparkCorrelação probabilística implementada em spark para big data em saúdeinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisInstituto de Matemática. Departamento de Ciência da ComputaçãoMestrado Multiinstitucional em Ciência da ComputaçãoUFBAbrasilinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFBAinstname:Universidade Federal da Bahia (UFBA)instacron:UFBAORIGINALDissertação final - Robespierre.pdfDissertação final - Robespierre.pdfapplication/pdf2025980https://repositorio.ufba.br/bitstream/ri/19308/3/Disserta%c3%a7%c3%a3o%20final%20-%20Robespierre.pdf4bad146cfdc17b12f67055d79bca96c3MD53LICENSElicense.txtlicense.txttext/plain1345https://repositorio.ufba.br/bitstream/ri/19308/2/license.txt0d4b811ef71182510d2015daa7c8a900MD52TEXTDissertação final - Robespierre.pdf.txtDissertação final - Robespierre.pdf.txtExtracted texttext/plain190332https://repositorio.ufba.br/bitstream/ri/19308/4/Disserta%c3%a7%c3%a3o%20final%20-%20Robespierre.pdf.txt1e9ebdc6bf05907bbde3488be8f93be4MD54ri/193082022-02-20 21:42:06.322oai:repositorio.ufba.br:ri/19308VGVybW8gZGUgTGljZW4/YSwgbj9vIGV4Y2x1c2l2bywgcGFyYSBvIGRlcD9zaXRvIG5vIFJlcG9zaXQ/cmlvIEluc3RpdHVjaW9uYWwgZGEgVUZCQS4KCiBQZWxvIHByb2Nlc3NvIGRlIHN1Ym1pc3M/byBkZSBkb2N1bWVudG9zLCBvIGF1dG9yIG91IHNldSByZXByZXNlbnRhbnRlIGxlZ2FsLCBhbyBhY2VpdGFyIAplc3NlIHRlcm1vIGRlIGxpY2VuP2EsIGNvbmNlZGUgYW8gUmVwb3NpdD9yaW8gSW5zdGl0dWNpb25hbCBkYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkYSBCYWhpYSAKbyBkaXJlaXRvIGRlIG1hbnRlciB1bWEgYz9waWEgZW0gc2V1IHJlcG9zaXQ/cmlvIGNvbSBhIGZpbmFsaWRhZGUsIHByaW1laXJhLCBkZSBwcmVzZXJ2YT8/by4gCkVzc2VzIHRlcm1vcywgbj9vIGV4Y2x1c2l2b3MsIG1hbnQ/bSBvcyBkaXJlaXRvcyBkZSBhdXRvci9jb3B5cmlnaHQsIG1hcyBlbnRlbmRlIG8gZG9jdW1lbnRvIApjb21vIHBhcnRlIGRvIGFjZXJ2byBpbnRlbGVjdHVhbCBkZXNzYSBVbml2ZXJzaWRhZGUuCgogUGFyYSBvcyBkb2N1bWVudG9zIHB1YmxpY2Fkb3MgY29tIHJlcGFzc2UgZGUgZGlyZWl0b3MgZGUgZGlzdHJpYnVpPz9vLCBlc3NlIHRlcm1vIGRlIGxpY2VuP2EgCmVudGVuZGUgcXVlOgoKIE1hbnRlbmRvIG9zIGRpcmVpdG9zIGF1dG9yYWlzLCByZXBhc3NhZG9zIGEgdGVyY2Vpcm9zLCBlbSBjYXNvIGRlIHB1YmxpY2E/P2VzLCBvIHJlcG9zaXQ/cmlvCnBvZGUgcmVzdHJpbmdpciBvIGFjZXNzbyBhbyB0ZXh0byBpbnRlZ3JhbCwgbWFzIGxpYmVyYSBhcyBpbmZvcm1hPz9lcyBzb2JyZSBvIGRvY3VtZW50bwooTWV0YWRhZG9zIGVzY3JpdGl2b3MpLgoKIERlc3RhIGZvcm1hLCBhdGVuZGVuZG8gYW9zIGFuc2Vpb3MgZGVzc2EgdW5pdmVyc2lkYWRlIGVtIG1hbnRlciBzdWEgcHJvZHU/P28gY2llbnQ/ZmljYSBjb20gCmFzIHJlc3RyaT8/ZXMgaW1wb3N0YXMgcGVsb3MgZWRpdG9yZXMgZGUgcGVyaT9kaWNvcy4KCiBQYXJhIGFzIHB1YmxpY2E/P2VzIHNlbSBpbmljaWF0aXZhcyBxdWUgc2VndWVtIGEgcG9sP3RpY2EgZGUgQWNlc3NvIEFiZXJ0bywgb3MgZGVwP3NpdG9zIApjb21wdWxzP3Jpb3MgbmVzc2UgcmVwb3NpdD9yaW8gbWFudD9tIG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBtYXMgbWFudD9tIGFjZXNzbyBpcnJlc3RyaXRvIAphbyBtZXRhZGFkb3MgZSB0ZXh0byBjb21wbGV0by4gQXNzaW0sIGEgYWNlaXRhPz9vIGRlc3NlIHRlcm1vIG4/byBuZWNlc3NpdGEgZGUgY29uc2VudGltZW50bwogcG9yIHBhcnRlIGRlIGF1dG9yZXMvZGV0ZW50b3JlcyBkb3MgZGlyZWl0b3MsIHBvciBlc3RhcmVtIGVtIGluaWNpYXRpdmFzIGRlIGFjZXNzbyBhYmVydG8uCg==Repositório InstitucionalPUBhttp://192.188.11.11:8080/oai/requestopendoar:19322022-02-21T00:42:06Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)false
dc.title.pt_BR.fl_str_mv Correlação probabilística implementada em spark para big data em saúde
title Correlação probabilística implementada em spark para big data em saúde
spellingShingle Correlação probabilística implementada em spark para big data em saúde
Pita, Robespierre Dantas da Rocha
Ciência da Computação
Correlação probabilística
Computação intensiva de dados
Sistemas de saúde pública
Apache Spark
title_short Correlação probabilística implementada em spark para big data em saúde
title_full Correlação probabilística implementada em spark para big data em saúde
title_fullStr Correlação probabilística implementada em spark para big data em saúde
title_full_unstemmed Correlação probabilística implementada em spark para big data em saúde
title_sort Correlação probabilística implementada em spark para big data em saúde
author Pita, Robespierre Dantas da Rocha
author_facet Pita, Robespierre Dantas da Rocha
author_role author
dc.contributor.author.fl_str_mv Pita, Robespierre Dantas da Rocha
dc.contributor.advisor1.fl_str_mv Barreto, Marcos Ennes
dc.contributor.referee1.fl_str_mv Boratto, Murilo do Carmo
Santos, Carlos Antonio de Souza Teles
Rios, Ricardo Araujo
contributor_str_mv Barreto, Marcos Ennes
Boratto, Murilo do Carmo
Santos, Carlos Antonio de Souza Teles
Rios, Ricardo Araujo
dc.subject.cnpq.fl_str_mv Ciência da Computação
topic Ciência da Computação
Correlação probabilística
Computação intensiva de dados
Sistemas de saúde pública
Apache Spark
dc.subject.por.fl_str_mv Correlação probabilística
Computação intensiva de dados
Sistemas de saúde pública
Apache Spark
description A aplicação de técnicas de correlação probabilística em registros de saúde ou socioeconômicos de uma população tem sido uma prática comum entre epidemiologistas como base para suas pesquisa não-experimentais. Entretanto, o crescimento do volume dos dados comum ao cenário imposto pelo Big Data provocou uma carˆencia por ferramentas computacionais capazes de lidar com esses imensos reposit´orios. Neste trabalho é descrita uma solução implementada no framework de processamento em cluster Spark para a correlação probabilística de registros de grandes bases de dados do Sistema Público de Saúde brasileiro. Este trabalho está vinculado a um projeto que visa analisar a relação entre o Programam Bolsa Família e a incidência de doen¸cas associadas á pobreza, tais como hanseníase e tuberculose. Os resultados obtidos demonstram que esta implementação provê qualidade competitiva em relação a outras ferramentas e abordagens existentes, comprovada pela superioridade das métricas de tempo de execução.
publishDate 2015
dc.date.submitted.none.fl_str_mv 2015-03-05
dc.date.accessioned.fl_str_mv 2016-05-30T16:15:43Z
dc.date.available.fl_str_mv 2016-05-30T16:15:43Z
dc.date.issued.fl_str_mv 2016-05-30
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.ufba.br/ri/handle/ri/19308
url http://repositorio.ufba.br/ri/handle/ri/19308
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Instituto de Matemática. Departamento de Ciência da Computação
dc.publisher.program.fl_str_mv Mestrado Multiinstitucional em Ciência da Computação
dc.publisher.initials.fl_str_mv UFBA
dc.publisher.country.fl_str_mv brasil
publisher.none.fl_str_mv Instituto de Matemática. Departamento de Ciência da Computação
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFBA
instname:Universidade Federal da Bahia (UFBA)
instacron:UFBA
instname_str Universidade Federal da Bahia (UFBA)
instacron_str UFBA
institution UFBA
reponame_str Repositório Institucional da UFBA
collection Repositório Institucional da UFBA
bitstream.url.fl_str_mv https://repositorio.ufba.br/bitstream/ri/19308/3/Disserta%c3%a7%c3%a3o%20final%20-%20Robespierre.pdf
https://repositorio.ufba.br/bitstream/ri/19308/2/license.txt
https://repositorio.ufba.br/bitstream/ri/19308/4/Disserta%c3%a7%c3%a3o%20final%20-%20Robespierre.pdf.txt
bitstream.checksum.fl_str_mv 4bad146cfdc17b12f67055d79bca96c3
0d4b811ef71182510d2015daa7c8a900
1e9ebdc6bf05907bbde3488be8f93be4
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)
repository.mail.fl_str_mv
_version_ 1808459514539671552