Inclusão de etapa de pós-processamento determinístico para o aumento de performance do relacionamento (linkage) probabilístico
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Outros Autores: | |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Cadernos de Saúde Pública |
Texto Completo: | http://old.scielo.br/scielo.php?script=sci_arttext&pid=S0102-311X2018000604001 |
Resumo: | O objetivo do presente estudo foi demonstrar a aplicação de uma etapa de pós-processamento determinístico, baseada em medidas de similaridade, para aumentar a performance do relacionamento probabilístico com e sem a etapa de revisão manual. As bases de dados utilizadas no estudo foram o Sistema de Informação de Agravos de Notificação e o Sistema de Informações sobre Mortalidade, no período de 2007 a 2015, do Município de Palmas, Tocantins, Brasil. O software probabilístico utilizado foi o OpenRecLink; foi desenvolvida e aplicada uma etapa de pós-processamento determinístico aos dados obtidos por três diferentes estratégias de pareamento probabilístico. As três estratégias foram comparadas entre si e acrescidas da etapa de pós-processamento determinístico. A sensibilidade das estratégias probabilísticas sem revisão manual variou entre 69,1% e 77,8%, já as mesmas estratégias, acrescidas da etapa de pós-processamento determinístico, apresentaram uma variação entre 92,9% e 96,3%. A sensibilidade de duas estratégias probabilísticas com revisão manual foi semelhante à obtida pela etapa de pós-processamento determinístico, no entanto, o número de pares destinados à revisão manual pelas duas estratégias probabilísticas variou entre 1.177 e 1.132 registros, contra 149 e 145 após a etapa de pós-processamento determinístico. Nossos resultados sugerem que a etapa de pós-processamento determinístico é uma opção promissora, tanto para aumentar a sensibilidade quanto para reduzir o número de pares que precisam ser revisados manualmente, ou mesmo para eliminar sua necessidade. |
id |
FIOCRUZ-5_e0c3d364666e0ab527733067a91880cd |
---|---|
oai_identifier_str |
oai:scielo:S0102-311X2018000604001 |
network_acronym_str |
FIOCRUZ-5 |
network_name_str |
Cadernos de Saúde Pública |
repository_id_str |
|
spelling |
Inclusão de etapa de pós-processamento determinístico para o aumento de performance do relacionamento (linkage) probabilísticoBase de DadosSoftwareProcessamento Automatizado de DadosSistemas de InformaçãoO objetivo do presente estudo foi demonstrar a aplicação de uma etapa de pós-processamento determinístico, baseada em medidas de similaridade, para aumentar a performance do relacionamento probabilístico com e sem a etapa de revisão manual. As bases de dados utilizadas no estudo foram o Sistema de Informação de Agravos de Notificação e o Sistema de Informações sobre Mortalidade, no período de 2007 a 2015, do Município de Palmas, Tocantins, Brasil. O software probabilístico utilizado foi o OpenRecLink; foi desenvolvida e aplicada uma etapa de pós-processamento determinístico aos dados obtidos por três diferentes estratégias de pareamento probabilístico. As três estratégias foram comparadas entre si e acrescidas da etapa de pós-processamento determinístico. A sensibilidade das estratégias probabilísticas sem revisão manual variou entre 69,1% e 77,8%, já as mesmas estratégias, acrescidas da etapa de pós-processamento determinístico, apresentaram uma variação entre 92,9% e 96,3%. A sensibilidade de duas estratégias probabilísticas com revisão manual foi semelhante à obtida pela etapa de pós-processamento determinístico, no entanto, o número de pares destinados à revisão manual pelas duas estratégias probabilísticas variou entre 1.177 e 1.132 registros, contra 149 e 145 após a etapa de pós-processamento determinístico. Nossos resultados sugerem que a etapa de pós-processamento determinístico é uma opção promissora, tanto para aumentar a sensibilidade quanto para reduzir o número de pares que precisam ser revisados manualmente, ou mesmo para eliminar sua necessidade.Escola Nacional de Saúde Pública Sergio Arouca, Fundação Oswaldo Cruz2018-01-01info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersiontext/htmlhttp://old.scielo.br/scielo.php?script=sci_arttext&pid=S0102-311X2018000604001Cadernos de Saúde Pública v.34 n.6 2018reponame:Cadernos de Saúde Públicainstname:Fundação Oswaldo Cruz (FIOCRUZ)instacron:FIOCRUZ10.1590/0102-311x00088117info:eu-repo/semantics/openAccessBrustulin,RafaelMarson,Poliana Guerinopor2018-06-15T00:00:00Zoai:scielo:S0102-311X2018000604001Revistahttp://cadernos.ensp.fiocruz.br/csp/https://old.scielo.br/oai/scielo-oai.phpcadernos@ensp.fiocruz.br||cadernos@ensp.fiocruz.br1678-44640102-311Xopendoar:2018-06-15T00:00Cadernos de Saúde Pública - Fundação Oswaldo Cruz (FIOCRUZ)false |
dc.title.none.fl_str_mv |
Inclusão de etapa de pós-processamento determinístico para o aumento de performance do relacionamento (linkage) probabilístico |
title |
Inclusão de etapa de pós-processamento determinístico para o aumento de performance do relacionamento (linkage) probabilístico |
spellingShingle |
Inclusão de etapa de pós-processamento determinístico para o aumento de performance do relacionamento (linkage) probabilístico Brustulin,Rafael Base de Dados Software Processamento Automatizado de Dados Sistemas de Informação |
title_short |
Inclusão de etapa de pós-processamento determinístico para o aumento de performance do relacionamento (linkage) probabilístico |
title_full |
Inclusão de etapa de pós-processamento determinístico para o aumento de performance do relacionamento (linkage) probabilístico |
title_fullStr |
Inclusão de etapa de pós-processamento determinístico para o aumento de performance do relacionamento (linkage) probabilístico |
title_full_unstemmed |
Inclusão de etapa de pós-processamento determinístico para o aumento de performance do relacionamento (linkage) probabilístico |
title_sort |
Inclusão de etapa de pós-processamento determinístico para o aumento de performance do relacionamento (linkage) probabilístico |
author |
Brustulin,Rafael |
author_facet |
Brustulin,Rafael Marson,Poliana Guerino |
author_role |
author |
author2 |
Marson,Poliana Guerino |
author2_role |
author |
dc.contributor.author.fl_str_mv |
Brustulin,Rafael Marson,Poliana Guerino |
dc.subject.por.fl_str_mv |
Base de Dados Software Processamento Automatizado de Dados Sistemas de Informação |
topic |
Base de Dados Software Processamento Automatizado de Dados Sistemas de Informação |
description |
O objetivo do presente estudo foi demonstrar a aplicação de uma etapa de pós-processamento determinístico, baseada em medidas de similaridade, para aumentar a performance do relacionamento probabilístico com e sem a etapa de revisão manual. As bases de dados utilizadas no estudo foram o Sistema de Informação de Agravos de Notificação e o Sistema de Informações sobre Mortalidade, no período de 2007 a 2015, do Município de Palmas, Tocantins, Brasil. O software probabilístico utilizado foi o OpenRecLink; foi desenvolvida e aplicada uma etapa de pós-processamento determinístico aos dados obtidos por três diferentes estratégias de pareamento probabilístico. As três estratégias foram comparadas entre si e acrescidas da etapa de pós-processamento determinístico. A sensibilidade das estratégias probabilísticas sem revisão manual variou entre 69,1% e 77,8%, já as mesmas estratégias, acrescidas da etapa de pós-processamento determinístico, apresentaram uma variação entre 92,9% e 96,3%. A sensibilidade de duas estratégias probabilísticas com revisão manual foi semelhante à obtida pela etapa de pós-processamento determinístico, no entanto, o número de pares destinados à revisão manual pelas duas estratégias probabilísticas variou entre 1.177 e 1.132 registros, contra 149 e 145 após a etapa de pós-processamento determinístico. Nossos resultados sugerem que a etapa de pós-processamento determinístico é uma opção promissora, tanto para aumentar a sensibilidade quanto para reduzir o número de pares que precisam ser revisados manualmente, ou mesmo para eliminar sua necessidade. |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-01-01 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://old.scielo.br/scielo.php?script=sci_arttext&pid=S0102-311X2018000604001 |
url |
http://old.scielo.br/scielo.php?script=sci_arttext&pid=S0102-311X2018000604001 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
10.1590/0102-311x00088117 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
text/html |
dc.publisher.none.fl_str_mv |
Escola Nacional de Saúde Pública Sergio Arouca, Fundação Oswaldo Cruz |
publisher.none.fl_str_mv |
Escola Nacional de Saúde Pública Sergio Arouca, Fundação Oswaldo Cruz |
dc.source.none.fl_str_mv |
Cadernos de Saúde Pública v.34 n.6 2018 reponame:Cadernos de Saúde Pública instname:Fundação Oswaldo Cruz (FIOCRUZ) instacron:FIOCRUZ |
instname_str |
Fundação Oswaldo Cruz (FIOCRUZ) |
instacron_str |
FIOCRUZ |
institution |
FIOCRUZ |
reponame_str |
Cadernos de Saúde Pública |
collection |
Cadernos de Saúde Pública |
repository.name.fl_str_mv |
Cadernos de Saúde Pública - Fundação Oswaldo Cruz (FIOCRUZ) |
repository.mail.fl_str_mv |
cadernos@ensp.fiocruz.br||cadernos@ensp.fiocruz.br |
_version_ |
1754115738872840192 |