Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial

Detalhes bibliográficos
Autor(a) principal: Nakayama, Luis Filipe [UNIFESP]
Data de Publicação: 2024
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UNIFESP
Texto Completo: https://hdl.handle.net/11600/71152
Resumo: Objetivo: Este projeto teve como objetivo compreender o panorama da inteligência artificial (IA) com foco em suas aplicações na área da saúde, especialmente em oftalmologia e retina. Os objetivos incluíram identificar oportunidades e desafios para o desenvolvimento de sistemas de IA na saúde, com ênfase em abordar vieses e melhorar a representatividade de bancos de dados e conduzir experimentos para validar e estabelecer resultados basais em classificar retinopatia diabética e determinar o sexo dos pacientes através da análise de retinografias. Métodos: A criação do BRSET envolveu a compilação de um banco de dados com 16.255 imagens de 8.524 pacientes brasileiros, com multiplas classificações. Foram realizados experimentos para validar a utilidade do BRSET, incluindo a detecção de retinopatia diabética, identificação de gênero dos pacientes e manipulação de imagens para aprimoramento da privacidade. Utilizamos a rede neural ConvNext V2, ResNet200D e Inception-V3, com mapas de saliência gerados para identificar áreas de foco para classificação de retinopatia diabética e gênero do paciente. Resultados: O BRSET reuniu um conjunto de 16.255 imagens de 8.524 pacientes brasileiros, com várias classificações. Ele é composto por 61,8% de pacientes do sexo feminino, com idade média de 57,6 (±18,26) anos e retinopatia diabética em 15,8% das imagens. Na classificação de retinopatia, o ConvNext V2 destacou-se com uma AUC de 97% e macro F1 de 89%, enquanto a conversão de imagens em vetores resultou em AUCs entre 75-77% e F1s entre 62-67%. Na identificação do sexo, o ResNet-200D alcançou acurácias de até 82.6%, e o ConvNext V2 obteve AUC de 91% e macro F1 de 83%, com resultados inferiores ao converter imagens em vetores (AUCs de 66-68% e F1s de 65-68%). As técnicas de manipulação de imagem demonstraram a viabilidade de aprimorar a privacidade mantendo a utilidade diagnóstica na classificação de retinopatia diabética. Os mapas de saliência forneceram insights sobre áreas de foco localizadas para classificação de doenças e áreas globais para previsão de gênero. O algoritmo desenvolvido com pacientes brasileiros apresentou resultado de AUC de 97%, sensibilidade de 96,02% e especificidade de 79,93% para detectar casos referenciáveis de retinopatia diabética. Conclusões: Os experimentos apresentaram performance comparável à literatura para classificar casos de retinopatia diabética, identificar o sexo dos pacientes e demonstraram que a manipulação de pixels é uma forma viável de aumentar privacidade de imagens e manter a utilidade em classificação de retinopatia diabética e que a implantação de sistemas automatizados representa uma alternativa para melhorar o fluxo do rastreio da RD no Brasil. O projeto estabeleceu resultados basais, orientar a comunidade científica a como utilizar o banco de dados e validar o BRSET como um banco de dados útil para projetos em ciência de dados e IA. O BRSET foi proposto como um projeto que possibilita desenvolver projetos de ciência de dados, porém também atividades de ensino, com o objetivo de aumentar a representatividade de dados do Brasil e reduzir vieses em sistemas de inteligência artificial.
id UFSP_d628644009b9c79adb6f9adff592b202
oai_identifier_str oai:repositorio.unifesp.br/:11600/71152
network_acronym_str UFSP
network_name_str Repositório Institucional da UNIFESP
repository_id_str 3465
spelling Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificialThe creation of a brazilian retinography database with the aim of reducing biases in artificial intelligence applicationsInteligência ArtificialRetinaBancos de dadosViesesObjetivo: Este projeto teve como objetivo compreender o panorama da inteligência artificial (IA) com foco em suas aplicações na área da saúde, especialmente em oftalmologia e retina. Os objetivos incluíram identificar oportunidades e desafios para o desenvolvimento de sistemas de IA na saúde, com ênfase em abordar vieses e melhorar a representatividade de bancos de dados e conduzir experimentos para validar e estabelecer resultados basais em classificar retinopatia diabética e determinar o sexo dos pacientes através da análise de retinografias. Métodos: A criação do BRSET envolveu a compilação de um banco de dados com 16.255 imagens de 8.524 pacientes brasileiros, com multiplas classificações. Foram realizados experimentos para validar a utilidade do BRSET, incluindo a detecção de retinopatia diabética, identificação de gênero dos pacientes e manipulação de imagens para aprimoramento da privacidade. Utilizamos a rede neural ConvNext V2, ResNet200D e Inception-V3, com mapas de saliência gerados para identificar áreas de foco para classificação de retinopatia diabética e gênero do paciente. Resultados: O BRSET reuniu um conjunto de 16.255 imagens de 8.524 pacientes brasileiros, com várias classificações. Ele é composto por 61,8% de pacientes do sexo feminino, com idade média de 57,6 (±18,26) anos e retinopatia diabética em 15,8% das imagens. Na classificação de retinopatia, o ConvNext V2 destacou-se com uma AUC de 97% e macro F1 de 89%, enquanto a conversão de imagens em vetores resultou em AUCs entre 75-77% e F1s entre 62-67%. Na identificação do sexo, o ResNet-200D alcançou acurácias de até 82.6%, e o ConvNext V2 obteve AUC de 91% e macro F1 de 83%, com resultados inferiores ao converter imagens em vetores (AUCs de 66-68% e F1s de 65-68%). As técnicas de manipulação de imagem demonstraram a viabilidade de aprimorar a privacidade mantendo a utilidade diagnóstica na classificação de retinopatia diabética. Os mapas de saliência forneceram insights sobre áreas de foco localizadas para classificação de doenças e áreas globais para previsão de gênero. O algoritmo desenvolvido com pacientes brasileiros apresentou resultado de AUC de 97%, sensibilidade de 96,02% e especificidade de 79,93% para detectar casos referenciáveis de retinopatia diabética. Conclusões: Os experimentos apresentaram performance comparável à literatura para classificar casos de retinopatia diabética, identificar o sexo dos pacientes e demonstraram que a manipulação de pixels é uma forma viável de aumentar privacidade de imagens e manter a utilidade em classificação de retinopatia diabética e que a implantação de sistemas automatizados representa uma alternativa para melhorar o fluxo do rastreio da RD no Brasil. O projeto estabeleceu resultados basais, orientar a comunidade científica a como utilizar o banco de dados e validar o BRSET como um banco de dados útil para projetos em ciência de dados e IA. O BRSET foi proposto como um projeto que possibilita desenvolver projetos de ciência de dados, porém também atividades de ensino, com o objetivo de aumentar a representatividade de dados do Brasil e reduzir vieses em sistemas de inteligência artificial. Objective: This project aimed to comprehend the landscape of artificial intelligence (AI) with a focus on its applications in the healthcare sector, particularly in ophthalmology and retina analysis. The objectives included identifying opportunities and challenges for the development of AI systems in healthcare, with an emphasis on addressing biases and improving database representativeness. We conducted experiments to validate and establish baseline results in classifying diabetic retinopathy and determining the gender of patients through retinography analysis. Methods: The creation of BRSET involved compiling a database with 16,255 images from 8,524 Brazilian patients, with multiple classifications. Experiments were conducted to validate the utility of BRSET, including diabetic retinopathy detection, patient gender identification, and image manipulation for privacy enhancement. We utilized the ConvNext V2, ResNet200D, and Inception-V3 neural networks, with saliency maps generated to identify focus areas for diabetic retinopathy classification and patient gender. Results: BRSET gathered a set of 16,255 images from 8,524 Brazilian patients, with various classifications. It comprises 61.8% female patients, with an average age of 57.6 (±18.26) years, and diabetic retinopathy is present in 15.8% of images. In the retinopathy classification task, ConvNext V2 stood out with an AUC of 97% and macro F1 of 89%, while converting images into vectors resulted in AUCs between 75-77% and F1s between 62-67%. In the gender identification task, ResNet-200D achieved accuracies of up to 82.6%, and ConvNext V2 obtained an AUC of 91% and macro F1 of 83%, with lower results when converting images into vectors (AUCs of 66-68% and F1s of 65-68%). Image manipulation techniques demonstrated the feasibility of enhancing privacy while maintaining diagnostic utility in diabetic retinopathy classification. Saliency maps provided insights into localized focus areas for disease classification and global areas for gender prediction. The algorithm developed with Brazilian patients yielded an AUC of 97%, sensitivity of 96.02%, and specificity of 79.93% for detecting referable cases of diabetic retinopathy. Conclusions: The experiments showed performance comparable to the literature for classifying cases of diabetic retinopathy, identifying patient gender, and demonstrated that pixel manipulation is a viable way to enhance image privacy while maintaining utility in diabetic retinopathy classification, and indicate that the implementation of automated systems represents an alternative to improve the screening flow of diabetic retinopathy in Brazil. The project established baseline results, guide the scientific community on how to utilize the database and validate BRSET as a useful database for projects in data science and AI. BRSET was proposed as a project enabling the development of data science projects, as well as teaching activities, with the aim of increasing data representativeness from Brazil and reducing biases in AI system implementations.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Universidade Federal de São PauloRegatieri, Caio Vinicius Saito [UNIFESP]Malerbi, Fernando Korn [UNIFESP]http://lattes.cnpq.br/8724599579159084http://lattes.cnpq.br/3274977342997227http://lattes.cnpq.br/3985859159795854Nakayama, Luis Filipe [UNIFESP]2024-05-27T18:55:08Z2024-05-27T18:55:08Z2024-04-25info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersion113 f.application/pdfNAKAYAMA, Luis Filipe. Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial. 2024. 113 f. Tese (Doutorado em Oftalmologia e Ciências Visuais) – Escola Paulista de Medicina, Universidade Federal de São Paulo (UNIFESP), São Paulo, 2024.https://hdl.handle.net/11600/71152porSão Pauloinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIFESPinstname:Universidade Federal de São Paulo (UNIFESP)instacron:UNIFESP2024-08-14T00:21:43Zoai:repositorio.unifesp.br/:11600/71152Repositório InstitucionalPUBhttp://www.repositorio.unifesp.br/oai/requestbiblioteca.csp@unifesp.bropendoar:34652024-08-14T00:21:43Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)false
dc.title.none.fl_str_mv Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial
The creation of a brazilian retinography database with the aim of reducing biases in artificial intelligence applications
title Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial
spellingShingle Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial
Nakayama, Luis Filipe [UNIFESP]
Inteligência Artificial
Retina
Bancos de dados
Vieses
title_short Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial
title_full Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial
title_fullStr Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial
title_full_unstemmed Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial
title_sort Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial
author Nakayama, Luis Filipe [UNIFESP]
author_facet Nakayama, Luis Filipe [UNIFESP]
author_role author
dc.contributor.none.fl_str_mv Regatieri, Caio Vinicius Saito [UNIFESP]
Malerbi, Fernando Korn [UNIFESP]
http://lattes.cnpq.br/8724599579159084
http://lattes.cnpq.br/3274977342997227
http://lattes.cnpq.br/3985859159795854
dc.contributor.author.fl_str_mv Nakayama, Luis Filipe [UNIFESP]
dc.subject.por.fl_str_mv Inteligência Artificial
Retina
Bancos de dados
Vieses
topic Inteligência Artificial
Retina
Bancos de dados
Vieses
description Objetivo: Este projeto teve como objetivo compreender o panorama da inteligência artificial (IA) com foco em suas aplicações na área da saúde, especialmente em oftalmologia e retina. Os objetivos incluíram identificar oportunidades e desafios para o desenvolvimento de sistemas de IA na saúde, com ênfase em abordar vieses e melhorar a representatividade de bancos de dados e conduzir experimentos para validar e estabelecer resultados basais em classificar retinopatia diabética e determinar o sexo dos pacientes através da análise de retinografias. Métodos: A criação do BRSET envolveu a compilação de um banco de dados com 16.255 imagens de 8.524 pacientes brasileiros, com multiplas classificações. Foram realizados experimentos para validar a utilidade do BRSET, incluindo a detecção de retinopatia diabética, identificação de gênero dos pacientes e manipulação de imagens para aprimoramento da privacidade. Utilizamos a rede neural ConvNext V2, ResNet200D e Inception-V3, com mapas de saliência gerados para identificar áreas de foco para classificação de retinopatia diabética e gênero do paciente. Resultados: O BRSET reuniu um conjunto de 16.255 imagens de 8.524 pacientes brasileiros, com várias classificações. Ele é composto por 61,8% de pacientes do sexo feminino, com idade média de 57,6 (±18,26) anos e retinopatia diabética em 15,8% das imagens. Na classificação de retinopatia, o ConvNext V2 destacou-se com uma AUC de 97% e macro F1 de 89%, enquanto a conversão de imagens em vetores resultou em AUCs entre 75-77% e F1s entre 62-67%. Na identificação do sexo, o ResNet-200D alcançou acurácias de até 82.6%, e o ConvNext V2 obteve AUC de 91% e macro F1 de 83%, com resultados inferiores ao converter imagens em vetores (AUCs de 66-68% e F1s de 65-68%). As técnicas de manipulação de imagem demonstraram a viabilidade de aprimorar a privacidade mantendo a utilidade diagnóstica na classificação de retinopatia diabética. Os mapas de saliência forneceram insights sobre áreas de foco localizadas para classificação de doenças e áreas globais para previsão de gênero. O algoritmo desenvolvido com pacientes brasileiros apresentou resultado de AUC de 97%, sensibilidade de 96,02% e especificidade de 79,93% para detectar casos referenciáveis de retinopatia diabética. Conclusões: Os experimentos apresentaram performance comparável à literatura para classificar casos de retinopatia diabética, identificar o sexo dos pacientes e demonstraram que a manipulação de pixels é uma forma viável de aumentar privacidade de imagens e manter a utilidade em classificação de retinopatia diabética e que a implantação de sistemas automatizados representa uma alternativa para melhorar o fluxo do rastreio da RD no Brasil. O projeto estabeleceu resultados basais, orientar a comunidade científica a como utilizar o banco de dados e validar o BRSET como um banco de dados útil para projetos em ciência de dados e IA. O BRSET foi proposto como um projeto que possibilita desenvolver projetos de ciência de dados, porém também atividades de ensino, com o objetivo de aumentar a representatividade de dados do Brasil e reduzir vieses em sistemas de inteligência artificial.
publishDate 2024
dc.date.none.fl_str_mv 2024-05-27T18:55:08Z
2024-05-27T18:55:08Z
2024-04-25
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv NAKAYAMA, Luis Filipe. Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial. 2024. 113 f. Tese (Doutorado em Oftalmologia e Ciências Visuais) – Escola Paulista de Medicina, Universidade Federal de São Paulo (UNIFESP), São Paulo, 2024.
https://hdl.handle.net/11600/71152
identifier_str_mv NAKAYAMA, Luis Filipe. Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial. 2024. 113 f. Tese (Doutorado em Oftalmologia e Ciências Visuais) – Escola Paulista de Medicina, Universidade Federal de São Paulo (UNIFESP), São Paulo, 2024.
url https://hdl.handle.net/11600/71152
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 113 f.
application/pdf
dc.coverage.none.fl_str_mv São Paulo
dc.publisher.none.fl_str_mv Universidade Federal de São Paulo
publisher.none.fl_str_mv Universidade Federal de São Paulo
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNIFESP
instname:Universidade Federal de São Paulo (UNIFESP)
instacron:UNIFESP
instname_str Universidade Federal de São Paulo (UNIFESP)
instacron_str UNIFESP
institution UNIFESP
reponame_str Repositório Institucional da UNIFESP
collection Repositório Institucional da UNIFESP
repository.name.fl_str_mv Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)
repository.mail.fl_str_mv biblioteca.csp@unifesp.br
_version_ 1814268297778036736