Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2

Detalhes bibliográficos
Autor(a) principal: Bessel, Marina
Data de Publicação: 2010
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/29100
Resumo: Em muitas investigações, principalmente na área da saúde, é necessário reunir informações sobre indivíduos armazenadas em bases de bancos diferentes, muitas vezes registradas por instituições diferentes. Um aspecto peculiar é que a chave de identificação dos registros nos arquivos de dados, quando existe, não permite fazer uma correspondência entre eles. Para superar estas dificuldades foram desenvolvidas técnicas especiais de relacionamento de registros utilizando campos como nome do indivíduo, nome da mãe, data de nascimento, endereço, etc., para identificar os pares correspondentes. Este método é usualmente chamado de linkagem de registros, podendo utilizar algoritmos determinísticos ou probabilísticos. O objetivo deste trabalho é apresentar os conceitos fundamentais e aplicação da linkagem de registros. Rotinas computacionais em linguagem SAS® foram desenvolvidas para a padronização dos campos e criação de um banco final, usado nas análises. A linkagem foi realizada utilizando o programa Link King. Dois conjuntos de dados hipotéticos foram usados para ilustrar passo a passo os procedimentos de padronização e linkagem. De um total de 4995 registros em cada banco de dados, foram criados corretamente 4746 (95%) pares.
id UFRGS-2_4609ab3e8642b78b4d3699f9747550d2
oai_identifier_str oai:www.lume.ufrgs.br:10183/29100
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Bessel, MarinaVigo, Álvaro2011-05-21T05:59:48Z2010http://hdl.handle.net/10183/29100000775473Em muitas investigações, principalmente na área da saúde, é necessário reunir informações sobre indivíduos armazenadas em bases de bancos diferentes, muitas vezes registradas por instituições diferentes. Um aspecto peculiar é que a chave de identificação dos registros nos arquivos de dados, quando existe, não permite fazer uma correspondência entre eles. Para superar estas dificuldades foram desenvolvidas técnicas especiais de relacionamento de registros utilizando campos como nome do indivíduo, nome da mãe, data de nascimento, endereço, etc., para identificar os pares correspondentes. Este método é usualmente chamado de linkagem de registros, podendo utilizar algoritmos determinísticos ou probabilísticos. O objetivo deste trabalho é apresentar os conceitos fundamentais e aplicação da linkagem de registros. Rotinas computacionais em linguagem SAS® foram desenvolvidas para a padronização dos campos e criação de um banco final, usado nas análises. A linkagem foi realizada utilizando o programa Link King. Dois conjuntos de dados hipotéticos foram usados para ilustrar passo a passo os procedimentos de padronização e linkagem. De um total de 4995 registros em cada banco de dados, foram criados corretamente 4746 (95%) pares.In many investigations, especially in health, it is necessary to join individual’s information stored in different databases, often recorded by distinct institutions. A peculiar aspect is that the key to identifying the records in the data files, if any, do not allow a match between them. To overcome these difficulties some special techniques have been developed to identify the corresponding pairs using fields such as individual's name, mother's name, birth date or address. This method is usually called record linkage and may use deterministic or probabilistic algorithms. The aim of this work is to present the fundamental concepts of record linkage and of its application. SAS® routines were developed to standardize the fields and also to create the final database used in the analysis. The record linkage was performed using the program Link King. Two hypothetical datasets were used to illustrate step by step procedures of standardization and linkage. From a total of 4995 records in each database, 4746 (95%) of the pairs were correctly created. The main objective of this work is to present the concepts and application of record linkage method. This method can be deterministic or probabilistic, once in the first there is a univocal identifier field which is inexistent on the second. It has been developed computational routines in SAS® language for the fields’ standardization and creation of a final database that can be adapted to any other database. In the application phase, the software used was the Link King together with the developed routines. From a total of 4995 records in each database used in the linkage 4746 (95%) pairs were created correctly.application/pdfporLink KingMetodos probabilisticosLinkageProbabilistic linkageLink kingLinkagem de Dados Utilizando os Programas Link King e SAS® 9.2info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de Matemática. Departamento de EstatísticaPorto Alegre, BR-RS2010Estatística: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT000775473.pdf.txt000775473.pdf.txtExtracted Texttext/plain77612http://www.lume.ufrgs.br/bitstream/10183/29100/2/000775473.pdf.txt58defe5b92d7da538015e43c1aaf70adMD52ORIGINAL000775473.pdf000775473.pdfTexto completoapplication/pdf3529104http://www.lume.ufrgs.br/bitstream/10183/29100/1/000775473.pdf3d07c6ffd12f1f471c4fcebcae440fa2MD51THUMBNAIL000775473.pdf.jpg000775473.pdf.jpgGenerated Thumbnailimage/jpeg1281http://www.lume.ufrgs.br/bitstream/10183/29100/3/000775473.pdf.jpgaa16b5a524e6edd5aea13df06602c76bMD5310183/291002018-10-09 09:16:50.61oai:www.lume.ufrgs.br:10183/29100Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2018-10-09T12:16:50Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2
title Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2
spellingShingle Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2
Bessel, Marina
Link King
Metodos probabilisticos
Linkage
Probabilistic linkage
Link king
title_short Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2
title_full Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2
title_fullStr Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2
title_full_unstemmed Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2
title_sort Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2
author Bessel, Marina
author_facet Bessel, Marina
author_role author
dc.contributor.author.fl_str_mv Bessel, Marina
dc.contributor.advisor1.fl_str_mv Vigo, Álvaro
contributor_str_mv Vigo, Álvaro
dc.subject.por.fl_str_mv Link King
Metodos probabilisticos
topic Link King
Metodos probabilisticos
Linkage
Probabilistic linkage
Link king
dc.subject.eng.fl_str_mv Linkage
Probabilistic linkage
Link king
description Em muitas investigações, principalmente na área da saúde, é necessário reunir informações sobre indivíduos armazenadas em bases de bancos diferentes, muitas vezes registradas por instituições diferentes. Um aspecto peculiar é que a chave de identificação dos registros nos arquivos de dados, quando existe, não permite fazer uma correspondência entre eles. Para superar estas dificuldades foram desenvolvidas técnicas especiais de relacionamento de registros utilizando campos como nome do indivíduo, nome da mãe, data de nascimento, endereço, etc., para identificar os pares correspondentes. Este método é usualmente chamado de linkagem de registros, podendo utilizar algoritmos determinísticos ou probabilísticos. O objetivo deste trabalho é apresentar os conceitos fundamentais e aplicação da linkagem de registros. Rotinas computacionais em linguagem SAS® foram desenvolvidas para a padronização dos campos e criação de um banco final, usado nas análises. A linkagem foi realizada utilizando o programa Link King. Dois conjuntos de dados hipotéticos foram usados para ilustrar passo a passo os procedimentos de padronização e linkagem. De um total de 4995 registros em cada banco de dados, foram criados corretamente 4746 (95%) pares.
publishDate 2010
dc.date.issued.fl_str_mv 2010
dc.date.accessioned.fl_str_mv 2011-05-21T05:59:48Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/29100
dc.identifier.nrb.pt_BR.fl_str_mv 000775473
url http://hdl.handle.net/10183/29100
identifier_str_mv 000775473
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/29100/2/000775473.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/29100/1/000775473.pdf
http://www.lume.ufrgs.br/bitstream/10183/29100/3/000775473.pdf.jpg
bitstream.checksum.fl_str_mv 58defe5b92d7da538015e43c1aaf70ad
3d07c6ffd12f1f471c4fcebcae440fa2
aa16b5a524e6edd5aea13df06602c76b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801224408577081344