Machine learning em saúde e segurança do trabalhador: perspectivas, desafios e aplicações 

Detalhes bibliográficos
Autor(a) principal: Fernandes, Fernando Timoteo
Data de Publicação: 2021
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/6/6143/tde-27012022-140548/
Resumo: Algoritmos de machine learning têm impactado a área da saúde nos últimos anos. Muita dessa popularidade deve-se aos ganhos de performance preditiva em comparação aos modelos estatísticos tradicionais, já que estes algoritmos conseguem capturar relações não-lineares e complexas, além de permitirem o uso de diferentes tipos de dados. Esta pesquisa objetiva descrever as diferentes técnicas recentes de machine learning e como elas podem ser aplicadas na saúde e segurança do trabalhador (SST). Os resultados da tese estão organizados em três artigos científicos. No primeiro artigo, foi realizada uma revisão bibliográfica para entender o panorama de uso de machine learning na saúde pública e em SST. Foram identificadas e categorizadas aplicações de aprendizagem supervisionada e não-supervisionada, e os principais problemas de pesquisa correspondentes. No segundo artigo, foram aplicados algoritmos de aprendizagem supervisionada para predição de absenteísmo por doença e doença relacionada ao trabalho em professores da rede pública municipal do Estado de São Paulo entre 2014 a 2018 (n=174.294), usando como fonte de dados a Relação Anual de Informações Sociais (RAIS). Cinco algoritmos foram comparados de acordo com o valor da área abaixo da curva (AUC). Todos os algoritmos obtiveram AUROC superior a 0,76. O melhor algoritmo (redes neurais artificiais) obteve AUROC de 0,79, com acurácia de 71,52%, sensibilidade de 72,86% e especificidade de 70,52%. Foi possível realizar predições que forneceram estimativas de risco no ensino infantil, para subsidiar a prevenção de afastamento por morbidades em professores, utilizando dados públicos e anônimos. No terceiro e último artigo, foram desenvolvidos modelos preditivos para identificar, antecipadamente, trabalhadores com risco de diagnóstico positivo para doença pulmonar obstrutiva crônica (DPOC). O estudo utilizou dados da coorte prospectiva do UK Biobank, de indivíduos acompanhados desde 2006, filtrando aqueles que preencheram o questionário de histórico ocupacional (n=120.289). Desses, 1731 (1,4%) foram diagnosticados com DPOC. Ao todo, foram selecionadas 26 variáveis, entre dados demográficos, exames laboratoriais, hábitos e sintomas, para a construção de modelos generalistas para predição de DPOC. Além disso, foi selecionado um subconjunto de participantes (n=7.628) com histórico ocupacional na indústria da construção civil e na mineração com possível exposição a poeira de sílica, para desenvolver modelos especialistas. Desses, 237 (3,11%) tiveram diagnóstico de DPOC. O modelo generalista obteve AUROC de 0.845, e o modelo especialista obteve AUROC de 0.841. As cinco principais variáveis preditoras foram idade, tosse crônica, tabagismo, histórico de asma e expectoração. Os resultados mostram que é possível predizer risco individual de diagnóstico de DPOC na população geral e nos trabalhadores expostos a poeiras minerais utilizando variáveis comumente coletadas na atenção primária. Nesta tese, mostramos a viabilidade de uso de modelos preditivos na saúde do trabalhador tanto para prognóstico quanto para diagnóstico, com boa performance preditiva. Espera-se que este estudo possa contribuir para uma maior adoção de modelos preditivos por pesquisadores em SST, permitindo identificar antecipadamente trabalhadores expostos a riscos ambientais de forma a auxiliar o início de medidas preventivas que inibam ou minimizem os riscos.
id USP_07fa7681a8db9461cbf7caf4d038b40a
oai_identifier_str oai:teses.usp.br:tde-27012022-140548
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Machine learning em saúde e segurança do trabalhador: perspectivas, desafios e aplicações Machine learning in public health and occupational safety and health: perspectives, techniques and applicationsAprendizado de MáquinaDiagnosticDiagnósticoMachine learningOccupational HealthPrognosisPrognósticoSaúde do TrabalhadorAlgoritmos de machine learning têm impactado a área da saúde nos últimos anos. Muita dessa popularidade deve-se aos ganhos de performance preditiva em comparação aos modelos estatísticos tradicionais, já que estes algoritmos conseguem capturar relações não-lineares e complexas, além de permitirem o uso de diferentes tipos de dados. Esta pesquisa objetiva descrever as diferentes técnicas recentes de machine learning e como elas podem ser aplicadas na saúde e segurança do trabalhador (SST). Os resultados da tese estão organizados em três artigos científicos. No primeiro artigo, foi realizada uma revisão bibliográfica para entender o panorama de uso de machine learning na saúde pública e em SST. Foram identificadas e categorizadas aplicações de aprendizagem supervisionada e não-supervisionada, e os principais problemas de pesquisa correspondentes. No segundo artigo, foram aplicados algoritmos de aprendizagem supervisionada para predição de absenteísmo por doença e doença relacionada ao trabalho em professores da rede pública municipal do Estado de São Paulo entre 2014 a 2018 (n=174.294), usando como fonte de dados a Relação Anual de Informações Sociais (RAIS). Cinco algoritmos foram comparados de acordo com o valor da área abaixo da curva (AUC). Todos os algoritmos obtiveram AUROC superior a 0,76. O melhor algoritmo (redes neurais artificiais) obteve AUROC de 0,79, com acurácia de 71,52%, sensibilidade de 72,86% e especificidade de 70,52%. Foi possível realizar predições que forneceram estimativas de risco no ensino infantil, para subsidiar a prevenção de afastamento por morbidades em professores, utilizando dados públicos e anônimos. No terceiro e último artigo, foram desenvolvidos modelos preditivos para identificar, antecipadamente, trabalhadores com risco de diagnóstico positivo para doença pulmonar obstrutiva crônica (DPOC). O estudo utilizou dados da coorte prospectiva do UK Biobank, de indivíduos acompanhados desde 2006, filtrando aqueles que preencheram o questionário de histórico ocupacional (n=120.289). Desses, 1731 (1,4%) foram diagnosticados com DPOC. Ao todo, foram selecionadas 26 variáveis, entre dados demográficos, exames laboratoriais, hábitos e sintomas, para a construção de modelos generalistas para predição de DPOC. Além disso, foi selecionado um subconjunto de participantes (n=7.628) com histórico ocupacional na indústria da construção civil e na mineração com possível exposição a poeira de sílica, para desenvolver modelos especialistas. Desses, 237 (3,11%) tiveram diagnóstico de DPOC. O modelo generalista obteve AUROC de 0.845, e o modelo especialista obteve AUROC de 0.841. As cinco principais variáveis preditoras foram idade, tosse crônica, tabagismo, histórico de asma e expectoração. Os resultados mostram que é possível predizer risco individual de diagnóstico de DPOC na população geral e nos trabalhadores expostos a poeiras minerais utilizando variáveis comumente coletadas na atenção primária. Nesta tese, mostramos a viabilidade de uso de modelos preditivos na saúde do trabalhador tanto para prognóstico quanto para diagnóstico, com boa performance preditiva. Espera-se que este estudo possa contribuir para uma maior adoção de modelos preditivos por pesquisadores em SST, permitindo identificar antecipadamente trabalhadores expostos a riscos ambientais de forma a auxiliar o início de medidas preventivas que inibam ou minimizem os riscos.Machine learning algorithms have gained prominence in the health area in recent years. Much of this popularity is due to predictive performance gains when compared to traditional statistical models, as these algorithms are able to capture non-linear relationships and to handle different types of data. This research aims to describe the different machine learning techniques and how these techniques can be applied in occupational safety and health (OSH). The results are organized into three scientific articles. In the first manuscript, a literature review was carried out to understand the panorama of machine learning use in public health and OSH. Supervised and unsupervised learning algorithms were identified and categorized, and main research problems were listed. In the second article, supervised learning algorithms were developed to predict absenteeism due to illness and work related illness in teachers from all public municipal schools in the State of São Paulo between 2014 and 2018 (n=174.294) available from the Relação Anual de Informações Sociais (RAIS). Five algorithms were compared according to the value of the area under the receiver operating characteristic curve (AUROC). All algorithms obtained AUROC greater than 0.76. The best algorithm (artificial neural networks) obtained an AUROC of 0.79, with an accuracy of 71.52%, sensitivity of 72.86% and specificity of 70.52%. It was possible to make assertive predictions, which provide estimates of risk, providing subsidies for preventing sick leave in teachers using public and anonymous data. In the third and last article, predictive models were developed to identify workers at risk of a positive diagnosis for chronic obstructive pulmonary disease (COPD). The study used data from the UK Biobank prospective cohort from individuals followed since 2006, filtering those who completed the occupational history questionnaire (n=120.294). Of these, 1731 (1.4%) had a positive diagnosis of COPD. In all, 26 variables were selected, including demographic data, laboratory tests, habits and symptoms, for the development of generalist models for the prediction of COPD. In addition, a subset of individuals (n=7628) with an occupational background in the construction and mining industry, with possible exposure to mineral dusts was selected to develop specialized models. Of these, 237 (3.11%) were diagnosed with COPD. The generalist model obtained AUROC of 0.845, and the specialist model, an AUC of 0.841. The five main predictive variables were age, chronic cough, smoking, earlier diagnosis of asthma and chronic sputum. The results show that it is possible to predict individual risk of COPD diagnosis in the general population and in workers exposed to silica dust using variables commonly collected in primary care. In this research, we showed the feasibility of using predictive models in worker health for both prognosis and diagnosis, with good predictive performance. We believe that this study can contribute to a greater adoption of predictive models by OSH researchers, allowing the early identification of workers exposed to risks and the adoption of preventive measures that inhibit or minimize risks.Biblioteca Digitais de Teses e Dissertações da USPChiavegatto Filho, Alexandre Dias PortoFernandes, Fernando Timoteo2021-10-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/6/6143/tde-27012022-140548/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-01-31T19:43:02Zoai:teses.usp.br:tde-27012022-140548Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-01-31T19:43:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Machine learning em saúde e segurança do trabalhador: perspectivas, desafios e aplicações 
Machine learning in public health and occupational safety and health: perspectives, techniques and applications
title Machine learning em saúde e segurança do trabalhador: perspectivas, desafios e aplicações 
spellingShingle Machine learning em saúde e segurança do trabalhador: perspectivas, desafios e aplicações 
Fernandes, Fernando Timoteo
Aprendizado de Máquina
Diagnostic
Diagnóstico
Machine learning
Occupational Health
Prognosis
Prognóstico
Saúde do Trabalhador
title_short Machine learning em saúde e segurança do trabalhador: perspectivas, desafios e aplicações 
title_full Machine learning em saúde e segurança do trabalhador: perspectivas, desafios e aplicações 
title_fullStr Machine learning em saúde e segurança do trabalhador: perspectivas, desafios e aplicações 
title_full_unstemmed Machine learning em saúde e segurança do trabalhador: perspectivas, desafios e aplicações 
title_sort Machine learning em saúde e segurança do trabalhador: perspectivas, desafios e aplicações 
author Fernandes, Fernando Timoteo
author_facet Fernandes, Fernando Timoteo
author_role author
dc.contributor.none.fl_str_mv Chiavegatto Filho, Alexandre Dias Porto
dc.contributor.author.fl_str_mv Fernandes, Fernando Timoteo
dc.subject.por.fl_str_mv Aprendizado de Máquina
Diagnostic
Diagnóstico
Machine learning
Occupational Health
Prognosis
Prognóstico
Saúde do Trabalhador
topic Aprendizado de Máquina
Diagnostic
Diagnóstico
Machine learning
Occupational Health
Prognosis
Prognóstico
Saúde do Trabalhador
description Algoritmos de machine learning têm impactado a área da saúde nos últimos anos. Muita dessa popularidade deve-se aos ganhos de performance preditiva em comparação aos modelos estatísticos tradicionais, já que estes algoritmos conseguem capturar relações não-lineares e complexas, além de permitirem o uso de diferentes tipos de dados. Esta pesquisa objetiva descrever as diferentes técnicas recentes de machine learning e como elas podem ser aplicadas na saúde e segurança do trabalhador (SST). Os resultados da tese estão organizados em três artigos científicos. No primeiro artigo, foi realizada uma revisão bibliográfica para entender o panorama de uso de machine learning na saúde pública e em SST. Foram identificadas e categorizadas aplicações de aprendizagem supervisionada e não-supervisionada, e os principais problemas de pesquisa correspondentes. No segundo artigo, foram aplicados algoritmos de aprendizagem supervisionada para predição de absenteísmo por doença e doença relacionada ao trabalho em professores da rede pública municipal do Estado de São Paulo entre 2014 a 2018 (n=174.294), usando como fonte de dados a Relação Anual de Informações Sociais (RAIS). Cinco algoritmos foram comparados de acordo com o valor da área abaixo da curva (AUC). Todos os algoritmos obtiveram AUROC superior a 0,76. O melhor algoritmo (redes neurais artificiais) obteve AUROC de 0,79, com acurácia de 71,52%, sensibilidade de 72,86% e especificidade de 70,52%. Foi possível realizar predições que forneceram estimativas de risco no ensino infantil, para subsidiar a prevenção de afastamento por morbidades em professores, utilizando dados públicos e anônimos. No terceiro e último artigo, foram desenvolvidos modelos preditivos para identificar, antecipadamente, trabalhadores com risco de diagnóstico positivo para doença pulmonar obstrutiva crônica (DPOC). O estudo utilizou dados da coorte prospectiva do UK Biobank, de indivíduos acompanhados desde 2006, filtrando aqueles que preencheram o questionário de histórico ocupacional (n=120.289). Desses, 1731 (1,4%) foram diagnosticados com DPOC. Ao todo, foram selecionadas 26 variáveis, entre dados demográficos, exames laboratoriais, hábitos e sintomas, para a construção de modelos generalistas para predição de DPOC. Além disso, foi selecionado um subconjunto de participantes (n=7.628) com histórico ocupacional na indústria da construção civil e na mineração com possível exposição a poeira de sílica, para desenvolver modelos especialistas. Desses, 237 (3,11%) tiveram diagnóstico de DPOC. O modelo generalista obteve AUROC de 0.845, e o modelo especialista obteve AUROC de 0.841. As cinco principais variáveis preditoras foram idade, tosse crônica, tabagismo, histórico de asma e expectoração. Os resultados mostram que é possível predizer risco individual de diagnóstico de DPOC na população geral e nos trabalhadores expostos a poeiras minerais utilizando variáveis comumente coletadas na atenção primária. Nesta tese, mostramos a viabilidade de uso de modelos preditivos na saúde do trabalhador tanto para prognóstico quanto para diagnóstico, com boa performance preditiva. Espera-se que este estudo possa contribuir para uma maior adoção de modelos preditivos por pesquisadores em SST, permitindo identificar antecipadamente trabalhadores expostos a riscos ambientais de forma a auxiliar o início de medidas preventivas que inibam ou minimizem os riscos.
publishDate 2021
dc.date.none.fl_str_mv 2021-10-22
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/6/6143/tde-27012022-140548/
url https://www.teses.usp.br/teses/disponiveis/6/6143/tde-27012022-140548/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809091115169611776