Simulação e comparação de técnicas de correção de dados incompletos de idade para o cálculo de taxas de incidência

Detalhes bibliográficos
Autor(a) principal: Max Moura de Oliveira
Data de Publicação: 2018
Outros Autores: Maria do Rosário Dias de Oliveira Latorre, Luana Fiengo Tanaka, Maria Paula Curado
Tipo de documento: Artigo
Idioma: por
Título da fonte: Cadernos de Saúde Pública
Texto Completo: https://cadernos.ensp.fiocruz.br/ojs/index.php/csp/article/view/6617
Resumo: The objective was to compare two techniques to estimate age in databases with incomplete records and analyze their application to the calculation of cancer incidence. The study used the database of the Population-Based Cancer Registry from the city of São Paulo, Brazil, containing cases of urinary tract cancer diagnosed from 1997 to 2013. Two techniques were applied to estimate age: correction factor and multiple imputation. Using binomial distribution, six databases were simulated with different proportions of incomplete data on patient’s age (from 5% to 50%). The ratio between the incidence rates was calculated, using the complete database as reference, whose standardized incidence was 11.83/100,000; the other incidence rates in the databases, with at least 5% incomplete data for age, were underestimated. By applying the correction factors, the corrected rates did not differ from the standardized rates, but this technique does not allow correcting specific rates. Multiple imputation was useful for correcting the standardized and specific rates in databases with up to 30% of incomplete data, but the specific rates for individuals under 50 years of age were underestimated. Databases with 5% incomplete data or more require correction. Although the implementation of multiple imputation is complex, it proved to be superior to the correction factor. However, it should be used sparingly, since age-specific rates may remain underestimated.
id FIOCRUZ-5_3fff552948d33b62c05ca6a28d125998
oai_identifier_str oai:ojs.teste-cadernos.ensp.fiocruz.br:article/6617
network_acronym_str FIOCRUZ-5
network_name_str Cadernos de Saúde Pública
repository_id_str
spelling Simulação e comparação de técnicas de correção de dados incompletos de idade para o cálculo de taxas de incidênciaIncidênciaIndicadores Básicos de SaúdeBase de DadosNeoplasiasThe objective was to compare two techniques to estimate age in databases with incomplete records and analyze their application to the calculation of cancer incidence. The study used the database of the Population-Based Cancer Registry from the city of São Paulo, Brazil, containing cases of urinary tract cancer diagnosed from 1997 to 2013. Two techniques were applied to estimate age: correction factor and multiple imputation. Using binomial distribution, six databases were simulated with different proportions of incomplete data on patient’s age (from 5% to 50%). The ratio between the incidence rates was calculated, using the complete database as reference, whose standardized incidence was 11.83/100,000; the other incidence rates in the databases, with at least 5% incomplete data for age, were underestimated. By applying the correction factors, the corrected rates did not differ from the standardized rates, but this technique does not allow correcting specific rates. Multiple imputation was useful for correcting the standardized and specific rates in databases with up to 30% of incomplete data, but the specific rates for individuals under 50 years of age were underestimated. Databases with 5% incomplete data or more require correction. Although the implementation of multiple imputation is complex, it proved to be superior to the correction factor. However, it should be used sparingly, since age-specific rates may remain underestimated.El objetivo fue comparar dos técnicas para estimar edad en bancos de datos con registros incompletos y analizar su aplicación en el cálculo de la incidencia de cáncer. Se utilizó la base de datos del Registro de Cáncer de Base Poblacional del municipio de São Paulo, Brasil, conteniendo casos diagnosticados de cáncer del tracto urinario, entre 1997 y 2013. Se aplicaron dos técnicas para la estimativa de edad: factor de corrección e imputación múltiple. Fueron simuladas, usando una distribución binomial, seis bases de datos con diferentes proporciones de datos incompletos para edad desde un 5% hasta el 50%. La razón entre las incidencias se calculó teniendo, como referencia, la base completa, cuya incidencia padronizada fue de 11,83/100.000; las demás incidencias en las bases con un 5% o más de datos incompletos en la edad se presentaron subestimadas. Al aplicar el factor de corrección, las tasas corregidas no presentaron diferencias, en comparación con las estandarizadas, sin embargo, esta técnica no permite corregir tasas específicas. La imputación múltiple fue útil en la corrección de las tasas estandarizadas y específicas en bancos con hasta un 30% de datos incompletos, no obstante, las tasas específicas para individuos con menos de 50 años se presentaron subestimadas. Bases con un 5% o más de datos incompletos necesitan una aplicación de corrección. La imputación múltiple, a pesar de ser compleja en su ejecución, se mostró superior al factor de corrección. Sin embargo, debe ser utilizada con prudencia, puesto que las tasas específicas por edad pueden seguir manteniéndose subestimadas.O objetivo foi comparar duas técnicas para estimar idade em bancos de dados com registros incompletos e analisar sua aplicação no cálculo da incidência de câncer. Utilizou-se a base de dados do Registro de Câncer de Base Populacional do Município de São Paulo, Brasil, contendo casos diagnosticados por câncer do trato urinário, entre 1997 e 2013. Foram aplicadas duas técnicas para estimativa de idade: fator de correção e imputação múltipla. Foram simuladas, usando a distribuição binomial, seis bases de dados com diferentes proporções de dados incompletos para idade de 5% até 50%. A razão entre as incidências foi calculada tendo, como referência, a base completa, cuja incidência padronizada foi de 11,83/100 mil; as demais incidências nas bases com 5% ou mais de dados incompletos para idade apresentaram-se subestimadas. Ao aplicar o fator de correção, as taxas corrigidas não apresentaram diferenças em comparação com as padronizadas, entretanto, essa técnica não permite corrigir taxas específicas. A imputação múltipla foi útil na correção das taxas padronizadas e específicas em bancos com até 30% de dados incompletos, entretanto, as taxas específicas para indivíduos com menos de 50 anos apresentaram-se subestimadas. Bases com 5% ou mais de dados incompletos necessitam de aplicação de correção. A imputação múltipla, apesar de complexa em sua execução, mostrou-se superior ao fator de correção. Todavia, deve ser utilizada com parcimônia, pois taxas específicas por idade podem manter-se subestimadas.Reports in Public HealthCadernos de Saúde Pública2018-09-03info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersiontext/htmlapplication/pdfhttps://cadernos.ensp.fiocruz.br/ojs/index.php/csp/article/view/6617Reports in Public Health; Vol. 34 No. 6 (2018): JuneCadernos de Saúde Pública; v. 34 n. 6 (2018): Junho1678-44640102-311Xreponame:Cadernos de Saúde Públicainstname:Fundação Oswaldo Cruz (FIOCRUZ)instacron:FIOCRUZporhttps://cadernos.ensp.fiocruz.br/ojs/index.php/csp/article/view/6617/14238https://cadernos.ensp.fiocruz.br/ojs/index.php/csp/article/view/6617/14239Max Moura de OliveiraMaria do Rosário Dias de Oliveira LatorreLuana Fiengo TanakaMaria Paula Curadoinfo:eu-repo/semantics/openAccess2024-03-06T15:29:26Zoai:ojs.teste-cadernos.ensp.fiocruz.br:article/6617Revistahttps://cadernos.ensp.fiocruz.br/ojs/index.php/csphttps://cadernos.ensp.fiocruz.br/ojs/index.php/csp/oaicadernos@ensp.fiocruz.br||cadernos@ensp.fiocruz.br1678-44640102-311Xopendoar:2024-03-06T13:07:34.781865Cadernos de Saúde Pública - Fundação Oswaldo Cruz (FIOCRUZ)true
dc.title.none.fl_str_mv Simulação e comparação de técnicas de correção de dados incompletos de idade para o cálculo de taxas de incidência
title Simulação e comparação de técnicas de correção de dados incompletos de idade para o cálculo de taxas de incidência
spellingShingle Simulação e comparação de técnicas de correção de dados incompletos de idade para o cálculo de taxas de incidência
Max Moura de Oliveira
Incidência
Indicadores Básicos de Saúde
Base de Dados
Neoplasias
title_short Simulação e comparação de técnicas de correção de dados incompletos de idade para o cálculo de taxas de incidência
title_full Simulação e comparação de técnicas de correção de dados incompletos de idade para o cálculo de taxas de incidência
title_fullStr Simulação e comparação de técnicas de correção de dados incompletos de idade para o cálculo de taxas de incidência
title_full_unstemmed Simulação e comparação de técnicas de correção de dados incompletos de idade para o cálculo de taxas de incidência
title_sort Simulação e comparação de técnicas de correção de dados incompletos de idade para o cálculo de taxas de incidência
author Max Moura de Oliveira
author_facet Max Moura de Oliveira
Maria do Rosário Dias de Oliveira Latorre
Luana Fiengo Tanaka
Maria Paula Curado
author_role author
author2 Maria do Rosário Dias de Oliveira Latorre
Luana Fiengo Tanaka
Maria Paula Curado
author2_role author
author
author
dc.contributor.author.fl_str_mv Max Moura de Oliveira
Maria do Rosário Dias de Oliveira Latorre
Luana Fiengo Tanaka
Maria Paula Curado
dc.subject.por.fl_str_mv Incidência
Indicadores Básicos de Saúde
Base de Dados
Neoplasias
topic Incidência
Indicadores Básicos de Saúde
Base de Dados
Neoplasias
description The objective was to compare two techniques to estimate age in databases with incomplete records and analyze their application to the calculation of cancer incidence. The study used the database of the Population-Based Cancer Registry from the city of São Paulo, Brazil, containing cases of urinary tract cancer diagnosed from 1997 to 2013. Two techniques were applied to estimate age: correction factor and multiple imputation. Using binomial distribution, six databases were simulated with different proportions of incomplete data on patient’s age (from 5% to 50%). The ratio between the incidence rates was calculated, using the complete database as reference, whose standardized incidence was 11.83/100,000; the other incidence rates in the databases, with at least 5% incomplete data for age, were underestimated. By applying the correction factors, the corrected rates did not differ from the standardized rates, but this technique does not allow correcting specific rates. Multiple imputation was useful for correcting the standardized and specific rates in databases with up to 30% of incomplete data, but the specific rates for individuals under 50 years of age were underestimated. Databases with 5% incomplete data or more require correction. Although the implementation of multiple imputation is complex, it proved to be superior to the correction factor. However, it should be used sparingly, since age-specific rates may remain underestimated.
publishDate 2018
dc.date.none.fl_str_mv 2018-09-03
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://cadernos.ensp.fiocruz.br/ojs/index.php/csp/article/view/6617
url https://cadernos.ensp.fiocruz.br/ojs/index.php/csp/article/view/6617
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://cadernos.ensp.fiocruz.br/ojs/index.php/csp/article/view/6617/14238
https://cadernos.ensp.fiocruz.br/ojs/index.php/csp/article/view/6617/14239
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv text/html
application/pdf
dc.publisher.none.fl_str_mv Reports in Public Health
Cadernos de Saúde Pública
publisher.none.fl_str_mv Reports in Public Health
Cadernos de Saúde Pública
dc.source.none.fl_str_mv Reports in Public Health; Vol. 34 No. 6 (2018): June
Cadernos de Saúde Pública; v. 34 n. 6 (2018): Junho
1678-4464
0102-311X
reponame:Cadernos de Saúde Pública
instname:Fundação Oswaldo Cruz (FIOCRUZ)
instacron:FIOCRUZ
instname_str Fundação Oswaldo Cruz (FIOCRUZ)
instacron_str FIOCRUZ
institution FIOCRUZ
reponame_str Cadernos de Saúde Pública
collection Cadernos de Saúde Pública
repository.name.fl_str_mv Cadernos de Saúde Pública - Fundação Oswaldo Cruz (FIOCRUZ)
repository.mail.fl_str_mv cadernos@ensp.fiocruz.br||cadernos@ensp.fiocruz.br
_version_ 1798943385728319488