Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2
Autor(a) principal: | |
---|---|
Data de Publicação: | 2010 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/29100 |
Resumo: | Em muitas investigações, principalmente na área da saúde, é necessário reunir informações sobre indivíduos armazenadas em bases de bancos diferentes, muitas vezes registradas por instituições diferentes. Um aspecto peculiar é que a chave de identificação dos registros nos arquivos de dados, quando existe, não permite fazer uma correspondência entre eles. Para superar estas dificuldades foram desenvolvidas técnicas especiais de relacionamento de registros utilizando campos como nome do indivíduo, nome da mãe, data de nascimento, endereço, etc., para identificar os pares correspondentes. Este método é usualmente chamado de linkagem de registros, podendo utilizar algoritmos determinísticos ou probabilísticos. O objetivo deste trabalho é apresentar os conceitos fundamentais e aplicação da linkagem de registros. Rotinas computacionais em linguagem SAS® foram desenvolvidas para a padronização dos campos e criação de um banco final, usado nas análises. A linkagem foi realizada utilizando o programa Link King. Dois conjuntos de dados hipotéticos foram usados para ilustrar passo a passo os procedimentos de padronização e linkagem. De um total de 4995 registros em cada banco de dados, foram criados corretamente 4746 (95%) pares. |
id |
UFRGS-2_4609ab3e8642b78b4d3699f9747550d2 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/29100 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Bessel, MarinaVigo, Álvaro2011-05-21T05:59:48Z2010http://hdl.handle.net/10183/29100000775473Em muitas investigações, principalmente na área da saúde, é necessário reunir informações sobre indivíduos armazenadas em bases de bancos diferentes, muitas vezes registradas por instituições diferentes. Um aspecto peculiar é que a chave de identificação dos registros nos arquivos de dados, quando existe, não permite fazer uma correspondência entre eles. Para superar estas dificuldades foram desenvolvidas técnicas especiais de relacionamento de registros utilizando campos como nome do indivíduo, nome da mãe, data de nascimento, endereço, etc., para identificar os pares correspondentes. Este método é usualmente chamado de linkagem de registros, podendo utilizar algoritmos determinísticos ou probabilísticos. O objetivo deste trabalho é apresentar os conceitos fundamentais e aplicação da linkagem de registros. Rotinas computacionais em linguagem SAS® foram desenvolvidas para a padronização dos campos e criação de um banco final, usado nas análises. A linkagem foi realizada utilizando o programa Link King. Dois conjuntos de dados hipotéticos foram usados para ilustrar passo a passo os procedimentos de padronização e linkagem. De um total de 4995 registros em cada banco de dados, foram criados corretamente 4746 (95%) pares.In many investigations, especially in health, it is necessary to join individual’s information stored in different databases, often recorded by distinct institutions. A peculiar aspect is that the key to identifying the records in the data files, if any, do not allow a match between them. To overcome these difficulties some special techniques have been developed to identify the corresponding pairs using fields such as individual's name, mother's name, birth date or address. This method is usually called record linkage and may use deterministic or probabilistic algorithms. The aim of this work is to present the fundamental concepts of record linkage and of its application. SAS® routines were developed to standardize the fields and also to create the final database used in the analysis. The record linkage was performed using the program Link King. Two hypothetical datasets were used to illustrate step by step procedures of standardization and linkage. From a total of 4995 records in each database, 4746 (95%) of the pairs were correctly created. The main objective of this work is to present the concepts and application of record linkage method. This method can be deterministic or probabilistic, once in the first there is a univocal identifier field which is inexistent on the second. It has been developed computational routines in SAS® language for the fields’ standardization and creation of a final database that can be adapted to any other database. In the application phase, the software used was the Link King together with the developed routines. From a total of 4995 records in each database used in the linkage 4746 (95%) pairs were created correctly.application/pdfporLink KingMetodos probabilisticosLinkageProbabilistic linkageLink kingLinkagem de Dados Utilizando os Programas Link King e SAS® 9.2info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de Matemática. Departamento de EstatísticaPorto Alegre, BR-RS2010Estatística: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT000775473.pdf.txt000775473.pdf.txtExtracted Texttext/plain77612http://www.lume.ufrgs.br/bitstream/10183/29100/2/000775473.pdf.txt58defe5b92d7da538015e43c1aaf70adMD52ORIGINAL000775473.pdf000775473.pdfTexto completoapplication/pdf3529104http://www.lume.ufrgs.br/bitstream/10183/29100/1/000775473.pdf3d07c6ffd12f1f471c4fcebcae440fa2MD51THUMBNAIL000775473.pdf.jpg000775473.pdf.jpgGenerated Thumbnailimage/jpeg1281http://www.lume.ufrgs.br/bitstream/10183/29100/3/000775473.pdf.jpgaa16b5a524e6edd5aea13df06602c76bMD5310183/291002018-10-09 09:16:50.61oai:www.lume.ufrgs.br:10183/29100Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2018-10-09T12:16:50Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2 |
title |
Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2 |
spellingShingle |
Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2 Bessel, Marina Link King Metodos probabilisticos Linkage Probabilistic linkage Link king |
title_short |
Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2 |
title_full |
Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2 |
title_fullStr |
Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2 |
title_full_unstemmed |
Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2 |
title_sort |
Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2 |
author |
Bessel, Marina |
author_facet |
Bessel, Marina |
author_role |
author |
dc.contributor.author.fl_str_mv |
Bessel, Marina |
dc.contributor.advisor1.fl_str_mv |
Vigo, Álvaro |
contributor_str_mv |
Vigo, Álvaro |
dc.subject.por.fl_str_mv |
Link King Metodos probabilisticos |
topic |
Link King Metodos probabilisticos Linkage Probabilistic linkage Link king |
dc.subject.eng.fl_str_mv |
Linkage Probabilistic linkage Link king |
description |
Em muitas investigações, principalmente na área da saúde, é necessário reunir informações sobre indivíduos armazenadas em bases de bancos diferentes, muitas vezes registradas por instituições diferentes. Um aspecto peculiar é que a chave de identificação dos registros nos arquivos de dados, quando existe, não permite fazer uma correspondência entre eles. Para superar estas dificuldades foram desenvolvidas técnicas especiais de relacionamento de registros utilizando campos como nome do indivíduo, nome da mãe, data de nascimento, endereço, etc., para identificar os pares correspondentes. Este método é usualmente chamado de linkagem de registros, podendo utilizar algoritmos determinísticos ou probabilísticos. O objetivo deste trabalho é apresentar os conceitos fundamentais e aplicação da linkagem de registros. Rotinas computacionais em linguagem SAS® foram desenvolvidas para a padronização dos campos e criação de um banco final, usado nas análises. A linkagem foi realizada utilizando o programa Link King. Dois conjuntos de dados hipotéticos foram usados para ilustrar passo a passo os procedimentos de padronização e linkagem. De um total de 4995 registros em cada banco de dados, foram criados corretamente 4746 (95%) pares. |
publishDate |
2010 |
dc.date.issued.fl_str_mv |
2010 |
dc.date.accessioned.fl_str_mv |
2011-05-21T05:59:48Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/29100 |
dc.identifier.nrb.pt_BR.fl_str_mv |
000775473 |
url |
http://hdl.handle.net/10183/29100 |
identifier_str_mv |
000775473 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/29100/2/000775473.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/29100/1/000775473.pdf http://www.lume.ufrgs.br/bitstream/10183/29100/3/000775473.pdf.jpg |
bitstream.checksum.fl_str_mv |
58defe5b92d7da538015e43c1aaf70ad 3d07c6ffd12f1f471c4fcebcae440fa2 aa16b5a524e6edd5aea13df06602c76b |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1801224408577081344 |