Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFT |
Texto Completo: | http://hdl.handle.net/11612/911 |
Resumo: | O objetivo do presente estudo foi demonstrar a aplicação de uma etapa de pós-processamento determinístico, baseada em medidas de similaridade, para aumentar a performance do relacionamento probabilístico com e sem a etapa de revisão manual. As bases de dados utilizadas no estudo foram o Sistema de Informações de Agravos de Notificação e o Sistema de Informação Sobre Mortalidade no período de 2007 a 2015 do município de Palmas, Tocantins. O software probabilístico utilizado foi o OpenRecLink; foi desenvolvida e aplicada uma etapa de pós-processamento determinístico aos dados obtidos por três diferentes estratégias de pareamento probabilístico. As três estratégias foram comparadas entre si e acrescidas da etapa de pós-processamento determinístico. A sensibilidade das estratégias probabilísticas sem revisão manual variou entre 69,1% e 77,8%, enquanto que as mesmas estratégias, acrescidas da etapa de pós-processamento determinístico, tiveram uma variação entre 92,9% e 96,3%. A sensibilidade de duas estratégias probabilísticas com revisão manual foi semelhante aos obtidos pela etapa de pós-processamento determinístico, no entanto o número de pares destinados a revisão manual pelas duas estratégias probabilísticas variou entre 1.177 e 1.132 registros, contra 149 e 145 após a etapa de pós-processamento determinístico. Nossos resultados sugerem que a etapa de pós-processamento determinístico é uma opção promissora, tanto para aumentar a sensibilidade quanto para reduzir o número de pares que precisam ser revisados manualmente, ou mesmo para eliminar sua necessidade. |
id |
UFT_add7805d84fab4c7babaf15f4c6baa37 |
---|---|
oai_identifier_str |
oai:repositorio.uft.edu.br:11612/911 |
network_acronym_str |
UFT |
network_name_str |
Repositório Institucional da UFT |
repository_id_str |
|
spelling |
Brustulin, RafaelMarson, Poliana Guerino2018-04-24T17:29:06Z2018-04-24T17:29:06Z2018-03-06BRUSTULIN, Rafael. Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico. 2018.75f. Dissertação (Mestrado em Ciências da Saúde) – Universidade Federal do Tocantins, Programa de Pós-Graduação em Ciências da Saúde, Palmas, 2018.http://hdl.handle.net/11612/911O objetivo do presente estudo foi demonstrar a aplicação de uma etapa de pós-processamento determinístico, baseada em medidas de similaridade, para aumentar a performance do relacionamento probabilístico com e sem a etapa de revisão manual. As bases de dados utilizadas no estudo foram o Sistema de Informações de Agravos de Notificação e o Sistema de Informação Sobre Mortalidade no período de 2007 a 2015 do município de Palmas, Tocantins. O software probabilístico utilizado foi o OpenRecLink; foi desenvolvida e aplicada uma etapa de pós-processamento determinístico aos dados obtidos por três diferentes estratégias de pareamento probabilístico. As três estratégias foram comparadas entre si e acrescidas da etapa de pós-processamento determinístico. A sensibilidade das estratégias probabilísticas sem revisão manual variou entre 69,1% e 77,8%, enquanto que as mesmas estratégias, acrescidas da etapa de pós-processamento determinístico, tiveram uma variação entre 92,9% e 96,3%. A sensibilidade de duas estratégias probabilísticas com revisão manual foi semelhante aos obtidos pela etapa de pós-processamento determinístico, no entanto o número de pares destinados a revisão manual pelas duas estratégias probabilísticas variou entre 1.177 e 1.132 registros, contra 149 e 145 após a etapa de pós-processamento determinístico. Nossos resultados sugerem que a etapa de pós-processamento determinístico é uma opção promissora, tanto para aumentar a sensibilidade quanto para reduzir o número de pares que precisam ser revisados manualmente, ou mesmo para eliminar sua necessidade.The objective of the present study was to demonstrate the application of a deterministic post-processing step, based on similarity measures, to increase the performance of the probabilistic relationship with and without the clerical review. The databases used in the study were the Information System of Notifiable Diseases and the Mortality Information System in the period from 2007 to 2015 of the municipality of Palmas, Tocantins, Brazil. The probabilistic software used was OpenRecLink; a deterministic post-processing step was developed and applied to the data obtained by three different probabilistic matching strategies. The three strategies were compared to each other and added to the deterministic post-processing step. The sensitivity of the probabilistic strategies without manual revision varied between 69.1% and 77.8%, while the same strategies, added to the deterministic post-processing step, ranged from 92.9% to 96.3%. The sensitivity of two probabilistic strategies with manual revision was similar to those obtained by the deterministic post-processing step. However, the number of pairs destined for manual revision by the two probabilistic strategies varied between 1,177 and 1,132 registers, against 149 and 145 after the post-processing step. Our results suggest that the deterministic postprocessing step is a promising option both to increase sensitivity and to reduce the number of pairs that need to be revised manually or even to eliminate their need.application/pdfUniversidade Federal do TocantinsPalmasPrograma de Pós-Graduação em Ciências da Saúde - PPGCSBRCNPQ::CIENCIAS DA SAUDEBase de DadosSoftwareSistemas de InformaçãoSoftwareInformation SystemsInclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilísticoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFTinstname:Universidade Federal do Tocantins (UFT)instacron:UFTTEXTRafael Brustulin - Elementos pré-textuais.pdf.txtRafael Brustulin - Elementos pré-textuais.pdf.txtExtracted texttext/plain7087http://repositorio.uft.edu.br/bitstream/11612/911/3/Rafael%20Brustulin%20-%20Elementos%20pr%c3%a9-textuais.pdf.txt914d8088c2391ff0d4b3cf832dc6695cMD53THUMBNAILRafael Brustulin - Elementos pré-textuais.pdf.jpgRafael Brustulin - Elementos pré-textuais.pdf.jpgGenerated Thumbnailimage/jpeg1267http://repositorio.uft.edu.br/bitstream/11612/911/4/Rafael%20Brustulin%20-%20Elementos%20pr%c3%a9-textuais.pdf.jpge3d11ea28fe63344e7f69120204e1072MD54ORIGINALRafael Brustulin - Elementos pré-textuais.pdfRafael Brustulin - Elementos pré-textuais.pdfapplication/pdf1058772http://repositorio.uft.edu.br/bitstream/11612/911/1/Rafael%20Brustulin%20-%20Elementos%20pr%c3%a9-textuais.pdf927139394326f62bf12bed7b86fb2cd3MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-8508http://repositorio.uft.edu.br/bitstream/11612/911/2/license.txt0a9e77404315487775b2e0c2b887ae47MD5211612/9112019-05-25 03:19:41.616oai:repositorio.uft.edu.br:11612/911TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRvIHRyYWJhbGhvIHN1cHJhY2l0YWRvLCBkZSBhY29yZG8gY29tIGEgTGVpIG7CsCA5LjYxMC85OCwgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBUb2NhbnRpbnMsIGEgZGlzcG9uaWJpbGl6YXIgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBjb25mb3JtZSBwZXJtaXNzw7VlcyBhc3NpbmFsYWRhcyBhY2ltYSwgbyBkb2N1bWVudG8gZW0gbWVpbyBlbGV0csO0bmljbywgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZSBuYSBCaWJsaW90ZWNhIERpZ2l0YWwgZGUgVGVzZXMgZSBEaXNzZXJ0YcOnw7VlcywgZW0gZm9ybWF0byBkaWdpdGFsIFBERiwgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gb3UgZG93bmxvYWQsIGEgcGFydGlyIGRlc3RhIGRhdGEsIGVtIGNvbmZvcm1pZGFkZSBjb20gYSBSZXNvbHXDp8OjbyBDT05TRVBFIG7CuiAwNS8yMDExLg==Repositório InstitucionalPUBhttp://repositorio.uft.edu.br/oai/requestbiblioarraias@uft.edu.br || bibliogpi@uft.edu.br || bibliomira@uft.edu.br || bibliopalmas@uft.edu.br || biblioporto@uft.edu.br || biblioarag@uft.edu.br || dirbib@ufnt.edu.br || bibliocca@uft.edu.br || bibliotoc@uft.edu.bropendoar:2019-05-25T06:19:41Repositório Institucional da UFT - Universidade Federal do Tocantins (UFT)false |
dc.title.pt_BR.fl_str_mv |
Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico |
title |
Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico |
spellingShingle |
Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico Brustulin, Rafael CNPQ::CIENCIAS DA SAUDE Base de Dados Software Sistemas de Informação Software Information Systems |
title_short |
Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico |
title_full |
Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico |
title_fullStr |
Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico |
title_full_unstemmed |
Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico |
title_sort |
Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico |
author |
Brustulin, Rafael |
author_facet |
Brustulin, Rafael |
author_role |
author |
dc.contributor.author.fl_str_mv |
Brustulin, Rafael |
dc.contributor.advisor1.fl_str_mv |
Marson, Poliana Guerino |
contributor_str_mv |
Marson, Poliana Guerino |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS DA SAUDE |
topic |
CNPQ::CIENCIAS DA SAUDE Base de Dados Software Sistemas de Informação Software Information Systems |
dc.subject.por.fl_str_mv |
Base de Dados Software Sistemas de Informação Software Information Systems |
description |
O objetivo do presente estudo foi demonstrar a aplicação de uma etapa de pós-processamento determinístico, baseada em medidas de similaridade, para aumentar a performance do relacionamento probabilístico com e sem a etapa de revisão manual. As bases de dados utilizadas no estudo foram o Sistema de Informações de Agravos de Notificação e o Sistema de Informação Sobre Mortalidade no período de 2007 a 2015 do município de Palmas, Tocantins. O software probabilístico utilizado foi o OpenRecLink; foi desenvolvida e aplicada uma etapa de pós-processamento determinístico aos dados obtidos por três diferentes estratégias de pareamento probabilístico. As três estratégias foram comparadas entre si e acrescidas da etapa de pós-processamento determinístico. A sensibilidade das estratégias probabilísticas sem revisão manual variou entre 69,1% e 77,8%, enquanto que as mesmas estratégias, acrescidas da etapa de pós-processamento determinístico, tiveram uma variação entre 92,9% e 96,3%. A sensibilidade de duas estratégias probabilísticas com revisão manual foi semelhante aos obtidos pela etapa de pós-processamento determinístico, no entanto o número de pares destinados a revisão manual pelas duas estratégias probabilísticas variou entre 1.177 e 1.132 registros, contra 149 e 145 após a etapa de pós-processamento determinístico. Nossos resultados sugerem que a etapa de pós-processamento determinístico é uma opção promissora, tanto para aumentar a sensibilidade quanto para reduzir o número de pares que precisam ser revisados manualmente, ou mesmo para eliminar sua necessidade. |
publishDate |
2018 |
dc.date.accessioned.fl_str_mv |
2018-04-24T17:29:06Z |
dc.date.available.fl_str_mv |
2018-04-24T17:29:06Z |
dc.date.issued.fl_str_mv |
2018-03-06 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
BRUSTULIN, Rafael. Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico. 2018.75f. Dissertação (Mestrado em Ciências da Saúde) – Universidade Federal do Tocantins, Programa de Pós-Graduação em Ciências da Saúde, Palmas, 2018. |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11612/911 |
identifier_str_mv |
BRUSTULIN, Rafael. Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico. 2018.75f. Dissertação (Mestrado em Ciências da Saúde) – Universidade Federal do Tocantins, Programa de Pós-Graduação em Ciências da Saúde, Palmas, 2018. |
url |
http://hdl.handle.net/11612/911 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal do Tocantins Palmas |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciências da Saúde - PPGCS |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
Universidade Federal do Tocantins Palmas |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFT instname:Universidade Federal do Tocantins (UFT) instacron:UFT |
instname_str |
Universidade Federal do Tocantins (UFT) |
instacron_str |
UFT |
institution |
UFT |
reponame_str |
Repositório Institucional da UFT |
collection |
Repositório Institucional da UFT |
bitstream.url.fl_str_mv |
http://repositorio.uft.edu.br/bitstream/11612/911/3/Rafael%20Brustulin%20-%20Elementos%20pr%c3%a9-textuais.pdf.txt http://repositorio.uft.edu.br/bitstream/11612/911/4/Rafael%20Brustulin%20-%20Elementos%20pr%c3%a9-textuais.pdf.jpg http://repositorio.uft.edu.br/bitstream/11612/911/1/Rafael%20Brustulin%20-%20Elementos%20pr%c3%a9-textuais.pdf http://repositorio.uft.edu.br/bitstream/11612/911/2/license.txt |
bitstream.checksum.fl_str_mv |
914d8088c2391ff0d4b3cf832dc6695c e3d11ea28fe63344e7f69120204e1072 927139394326f62bf12bed7b86fb2cd3 0a9e77404315487775b2e0c2b887ae47 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFT - Universidade Federal do Tocantins (UFT) |
repository.mail.fl_str_mv |
biblioarraias@uft.edu.br || bibliogpi@uft.edu.br || bibliomira@uft.edu.br || bibliopalmas@uft.edu.br || biblioporto@uft.edu.br || biblioarag@uft.edu.br || dirbib@ufnt.edu.br || bibliocca@uft.edu.br || bibliotoc@uft.edu.br |
_version_ |
1813912808354480128 |