Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico

Detalhes bibliográficos
Autor(a) principal: Brustulin, Rafael
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFT
Texto Completo: http://hdl.handle.net/11612/911
Resumo: O objetivo do presente estudo foi demonstrar a aplicação de uma etapa de pós-processamento determinístico, baseada em medidas de similaridade, para aumentar a performance do relacionamento probabilístico com e sem a etapa de revisão manual. As bases de dados utilizadas no estudo foram o Sistema de Informações de Agravos de Notificação e o Sistema de Informação Sobre Mortalidade no período de 2007 a 2015 do município de Palmas, Tocantins. O software probabilístico utilizado foi o OpenRecLink; foi desenvolvida e aplicada uma etapa de pós-processamento determinístico aos dados obtidos por três diferentes estratégias de pareamento probabilístico. As três estratégias foram comparadas entre si e acrescidas da etapa de pós-processamento determinístico. A sensibilidade das estratégias probabilísticas sem revisão manual variou entre 69,1% e 77,8%, enquanto que as mesmas estratégias, acrescidas da etapa de pós-processamento determinístico, tiveram uma variação entre 92,9% e 96,3%. A sensibilidade de duas estratégias probabilísticas com revisão manual foi semelhante aos obtidos pela etapa de pós-processamento determinístico, no entanto o número de pares destinados a revisão manual pelas duas estratégias probabilísticas variou entre 1.177 e 1.132 registros, contra 149 e 145 após a etapa de pós-processamento determinístico. Nossos resultados sugerem que a etapa de pós-processamento determinístico é uma opção promissora, tanto para aumentar a sensibilidade quanto para reduzir o número de pares que precisam ser revisados manualmente, ou mesmo para eliminar sua necessidade.
id UFT_add7805d84fab4c7babaf15f4c6baa37
oai_identifier_str oai:repositorio.uft.edu.br:11612/911
network_acronym_str UFT
network_name_str Repositório Institucional da UFT
repository_id_str
spelling Brustulin, RafaelMarson, Poliana Guerino2018-04-24T17:29:06Z2018-04-24T17:29:06Z2018-03-06BRUSTULIN, Rafael. Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico. 2018.75f. Dissertação (Mestrado em Ciências da Saúde) – Universidade Federal do Tocantins, Programa de Pós-Graduação em Ciências da Saúde, Palmas, 2018.http://hdl.handle.net/11612/911O objetivo do presente estudo foi demonstrar a aplicação de uma etapa de pós-processamento determinístico, baseada em medidas de similaridade, para aumentar a performance do relacionamento probabilístico com e sem a etapa de revisão manual. As bases de dados utilizadas no estudo foram o Sistema de Informações de Agravos de Notificação e o Sistema de Informação Sobre Mortalidade no período de 2007 a 2015 do município de Palmas, Tocantins. O software probabilístico utilizado foi o OpenRecLink; foi desenvolvida e aplicada uma etapa de pós-processamento determinístico aos dados obtidos por três diferentes estratégias de pareamento probabilístico. As três estratégias foram comparadas entre si e acrescidas da etapa de pós-processamento determinístico. A sensibilidade das estratégias probabilísticas sem revisão manual variou entre 69,1% e 77,8%, enquanto que as mesmas estratégias, acrescidas da etapa de pós-processamento determinístico, tiveram uma variação entre 92,9% e 96,3%. A sensibilidade de duas estratégias probabilísticas com revisão manual foi semelhante aos obtidos pela etapa de pós-processamento determinístico, no entanto o número de pares destinados a revisão manual pelas duas estratégias probabilísticas variou entre 1.177 e 1.132 registros, contra 149 e 145 após a etapa de pós-processamento determinístico. Nossos resultados sugerem que a etapa de pós-processamento determinístico é uma opção promissora, tanto para aumentar a sensibilidade quanto para reduzir o número de pares que precisam ser revisados manualmente, ou mesmo para eliminar sua necessidade.The objective of the present study was to demonstrate the application of a deterministic post-processing step, based on similarity measures, to increase the performance of the probabilistic relationship with and without the clerical review. The databases used in the study were the Information System of Notifiable Diseases and the Mortality Information System in the period from 2007 to 2015 of the municipality of Palmas, Tocantins, Brazil. The probabilistic software used was OpenRecLink; a deterministic post-processing step was developed and applied to the data obtained by three different probabilistic matching strategies. The three strategies were compared to each other and added to the deterministic post-processing step. The sensitivity of the probabilistic strategies without manual revision varied between 69.1% and 77.8%, while the same strategies, added to the deterministic post-processing step, ranged from 92.9% to 96.3%. The sensitivity of two probabilistic strategies with manual revision was similar to those obtained by the deterministic post-processing step. However, the number of pairs destined for manual revision by the two probabilistic strategies varied between 1,177 and 1,132 registers, against 149 and 145 after the post-processing step. Our results suggest that the deterministic postprocessing step is a promising option both to increase sensitivity and to reduce the number of pairs that need to be revised manually or even to eliminate their need.application/pdfUniversidade Federal do TocantinsPalmasPrograma de Pós-Graduação em Ciências da Saúde - PPGCSBRCNPQ::CIENCIAS DA SAUDEBase de DadosSoftwareSistemas de InformaçãoSoftwareInformation SystemsInclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilísticoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFTinstname:Universidade Federal do Tocantins (UFT)instacron:UFTTEXTRafael Brustulin - Elementos pré-textuais.pdf.txtRafael Brustulin - Elementos pré-textuais.pdf.txtExtracted texttext/plain7087http://repositorio.uft.edu.br/bitstream/11612/911/3/Rafael%20Brustulin%20-%20Elementos%20pr%c3%a9-textuais.pdf.txt914d8088c2391ff0d4b3cf832dc6695cMD53THUMBNAILRafael Brustulin - Elementos pré-textuais.pdf.jpgRafael Brustulin - Elementos pré-textuais.pdf.jpgGenerated Thumbnailimage/jpeg1267http://repositorio.uft.edu.br/bitstream/11612/911/4/Rafael%20Brustulin%20-%20Elementos%20pr%c3%a9-textuais.pdf.jpge3d11ea28fe63344e7f69120204e1072MD54ORIGINALRafael Brustulin - Elementos pré-textuais.pdfRafael Brustulin - Elementos pré-textuais.pdfapplication/pdf1058772http://repositorio.uft.edu.br/bitstream/11612/911/1/Rafael%20Brustulin%20-%20Elementos%20pr%c3%a9-textuais.pdf927139394326f62bf12bed7b86fb2cd3MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-8508http://repositorio.uft.edu.br/bitstream/11612/911/2/license.txt0a9e77404315487775b2e0c2b887ae47MD5211612/9112019-05-25 03:19:41.616oai:repositorio.uft.edu.br:11612/911TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRvIHRyYWJhbGhvIHN1cHJhY2l0YWRvLCBkZSBhY29yZG8gY29tIGEgTGVpIG7CsCA5LjYxMC85OCwgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBUb2NhbnRpbnMsIGEgZGlzcG9uaWJpbGl6YXIgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBjb25mb3JtZSBwZXJtaXNzw7VlcyBhc3NpbmFsYWRhcyBhY2ltYSwgbyBkb2N1bWVudG8gZW0gbWVpbyBlbGV0csO0bmljbywgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZSBuYSBCaWJsaW90ZWNhIERpZ2l0YWwgZGUgVGVzZXMgZSBEaXNzZXJ0YcOnw7VlcywgZW0gZm9ybWF0byBkaWdpdGFsIFBERiwgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gb3UgZG93bmxvYWQsIGEgcGFydGlyIGRlc3RhIGRhdGEsIGVtIGNvbmZvcm1pZGFkZSBjb20gYSBSZXNvbHXDp8OjbyBDT05TRVBFIG7CuiAwNS8yMDExLg==Repositório InstitucionalPUBhttp://repositorio.uft.edu.br/oai/requestbiblioarraias@uft.edu.br || bibliogpi@uft.edu.br || bibliomira@uft.edu.br || bibliopalmas@uft.edu.br || biblioporto@uft.edu.br || biblioarag@uft.edu.br || dirbib@ufnt.edu.br || bibliocca@uft.edu.br || bibliotoc@uft.edu.bropendoar:2019-05-25T06:19:41Repositório Institucional da UFT - Universidade Federal do Tocantins (UFT)false
dc.title.pt_BR.fl_str_mv Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico
title Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico
spellingShingle Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico
Brustulin, Rafael
CNPQ::CIENCIAS DA SAUDE
Base de Dados
Software
Sistemas de Informação
Software
Information Systems
title_short Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico
title_full Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico
title_fullStr Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico
title_full_unstemmed Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico
title_sort Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico
author Brustulin, Rafael
author_facet Brustulin, Rafael
author_role author
dc.contributor.author.fl_str_mv Brustulin, Rafael
dc.contributor.advisor1.fl_str_mv Marson, Poliana Guerino
contributor_str_mv Marson, Poliana Guerino
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS DA SAUDE
topic CNPQ::CIENCIAS DA SAUDE
Base de Dados
Software
Sistemas de Informação
Software
Information Systems
dc.subject.por.fl_str_mv Base de Dados
Software
Sistemas de Informação
Software
Information Systems
description O objetivo do presente estudo foi demonstrar a aplicação de uma etapa de pós-processamento determinístico, baseada em medidas de similaridade, para aumentar a performance do relacionamento probabilístico com e sem a etapa de revisão manual. As bases de dados utilizadas no estudo foram o Sistema de Informações de Agravos de Notificação e o Sistema de Informação Sobre Mortalidade no período de 2007 a 2015 do município de Palmas, Tocantins. O software probabilístico utilizado foi o OpenRecLink; foi desenvolvida e aplicada uma etapa de pós-processamento determinístico aos dados obtidos por três diferentes estratégias de pareamento probabilístico. As três estratégias foram comparadas entre si e acrescidas da etapa de pós-processamento determinístico. A sensibilidade das estratégias probabilísticas sem revisão manual variou entre 69,1% e 77,8%, enquanto que as mesmas estratégias, acrescidas da etapa de pós-processamento determinístico, tiveram uma variação entre 92,9% e 96,3%. A sensibilidade de duas estratégias probabilísticas com revisão manual foi semelhante aos obtidos pela etapa de pós-processamento determinístico, no entanto o número de pares destinados a revisão manual pelas duas estratégias probabilísticas variou entre 1.177 e 1.132 registros, contra 149 e 145 após a etapa de pós-processamento determinístico. Nossos resultados sugerem que a etapa de pós-processamento determinístico é uma opção promissora, tanto para aumentar a sensibilidade quanto para reduzir o número de pares que precisam ser revisados manualmente, ou mesmo para eliminar sua necessidade.
publishDate 2018
dc.date.accessioned.fl_str_mv 2018-04-24T17:29:06Z
dc.date.available.fl_str_mv 2018-04-24T17:29:06Z
dc.date.issued.fl_str_mv 2018-03-06
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv BRUSTULIN, Rafael. Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico. 2018.75f. Dissertação (Mestrado em Ciências da Saúde) – Universidade Federal do Tocantins, Programa de Pós-Graduação em Ciências da Saúde, Palmas, 2018.
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11612/911
identifier_str_mv BRUSTULIN, Rafael. Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico. 2018.75f. Dissertação (Mestrado em Ciências da Saúde) – Universidade Federal do Tocantins, Programa de Pós-Graduação em Ciências da Saúde, Palmas, 2018.
url http://hdl.handle.net/11612/911
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Tocantins
Palmas
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciências da Saúde - PPGCS
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal do Tocantins
Palmas
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFT
instname:Universidade Federal do Tocantins (UFT)
instacron:UFT
instname_str Universidade Federal do Tocantins (UFT)
instacron_str UFT
institution UFT
reponame_str Repositório Institucional da UFT
collection Repositório Institucional da UFT
bitstream.url.fl_str_mv http://repositorio.uft.edu.br/bitstream/11612/911/3/Rafael%20Brustulin%20-%20Elementos%20pr%c3%a9-textuais.pdf.txt
http://repositorio.uft.edu.br/bitstream/11612/911/4/Rafael%20Brustulin%20-%20Elementos%20pr%c3%a9-textuais.pdf.jpg
http://repositorio.uft.edu.br/bitstream/11612/911/1/Rafael%20Brustulin%20-%20Elementos%20pr%c3%a9-textuais.pdf
http://repositorio.uft.edu.br/bitstream/11612/911/2/license.txt
bitstream.checksum.fl_str_mv 914d8088c2391ff0d4b3cf832dc6695c
e3d11ea28fe63344e7f69120204e1072
927139394326f62bf12bed7b86fb2cd3
0a9e77404315487775b2e0c2b887ae47
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFT - Universidade Federal do Tocantins (UFT)
repository.mail.fl_str_mv biblioarraias@uft.edu.br || bibliogpi@uft.edu.br || bibliomira@uft.edu.br || bibliopalmas@uft.edu.br || biblioporto@uft.edu.br || biblioarag@uft.edu.br || dirbib@ufnt.edu.br || bibliocca@uft.edu.br || bibliotoc@uft.edu.br
_version_ 1797427472147415040