Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial
Autor(a) principal: | |
---|---|
Data de Publicação: | 2024 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UNIFESP |
Texto Completo: | https://hdl.handle.net/11600/71152 |
Resumo: | Objetivo: Este projeto teve como objetivo compreender o panorama da inteligência artificial (IA) com foco em suas aplicações na área da saúde, especialmente em oftalmologia e retina. Os objetivos incluíram identificar oportunidades e desafios para o desenvolvimento de sistemas de IA na saúde, com ênfase em abordar vieses e melhorar a representatividade de bancos de dados e conduzir experimentos para validar e estabelecer resultados basais em classificar retinopatia diabética e determinar o sexo dos pacientes através da análise de retinografias. Métodos: A criação do BRSET envolveu a compilação de um banco de dados com 16.255 imagens de 8.524 pacientes brasileiros, com multiplas classificações. Foram realizados experimentos para validar a utilidade do BRSET, incluindo a detecção de retinopatia diabética, identificação de gênero dos pacientes e manipulação de imagens para aprimoramento da privacidade. Utilizamos a rede neural ConvNext V2, ResNet200D e Inception-V3, com mapas de saliência gerados para identificar áreas de foco para classificação de retinopatia diabética e gênero do paciente. Resultados: O BRSET reuniu um conjunto de 16.255 imagens de 8.524 pacientes brasileiros, com várias classificações. Ele é composto por 61,8% de pacientes do sexo feminino, com idade média de 57,6 (±18,26) anos e retinopatia diabética em 15,8% das imagens. Na classificação de retinopatia, o ConvNext V2 destacou-se com uma AUC de 97% e macro F1 de 89%, enquanto a conversão de imagens em vetores resultou em AUCs entre 75-77% e F1s entre 62-67%. Na identificação do sexo, o ResNet-200D alcançou acurácias de até 82.6%, e o ConvNext V2 obteve AUC de 91% e macro F1 de 83%, com resultados inferiores ao converter imagens em vetores (AUCs de 66-68% e F1s de 65-68%). As técnicas de manipulação de imagem demonstraram a viabilidade de aprimorar a privacidade mantendo a utilidade diagnóstica na classificação de retinopatia diabética. Os mapas de saliência forneceram insights sobre áreas de foco localizadas para classificação de doenças e áreas globais para previsão de gênero. O algoritmo desenvolvido com pacientes brasileiros apresentou resultado de AUC de 97%, sensibilidade de 96,02% e especificidade de 79,93% para detectar casos referenciáveis de retinopatia diabética. Conclusões: Os experimentos apresentaram performance comparável à literatura para classificar casos de retinopatia diabética, identificar o sexo dos pacientes e demonstraram que a manipulação de pixels é uma forma viável de aumentar privacidade de imagens e manter a utilidade em classificação de retinopatia diabética e que a implantação de sistemas automatizados representa uma alternativa para melhorar o fluxo do rastreio da RD no Brasil. O projeto estabeleceu resultados basais, orientar a comunidade científica a como utilizar o banco de dados e validar o BRSET como um banco de dados útil para projetos em ciência de dados e IA. O BRSET foi proposto como um projeto que possibilita desenvolver projetos de ciência de dados, porém também atividades de ensino, com o objetivo de aumentar a representatividade de dados do Brasil e reduzir vieses em sistemas de inteligência artificial. |
id |
UFSP_d628644009b9c79adb6f9adff592b202 |
---|---|
oai_identifier_str |
oai:repositorio.unifesp.br/:11600/71152 |
network_acronym_str |
UFSP |
network_name_str |
Repositório Institucional da UNIFESP |
repository_id_str |
3465 |
spelling |
Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificialThe creation of a brazilian retinography database with the aim of reducing biases in artificial intelligence applicationsInteligência ArtificialRetinaBancos de dadosViesesObjetivo: Este projeto teve como objetivo compreender o panorama da inteligência artificial (IA) com foco em suas aplicações na área da saúde, especialmente em oftalmologia e retina. Os objetivos incluíram identificar oportunidades e desafios para o desenvolvimento de sistemas de IA na saúde, com ênfase em abordar vieses e melhorar a representatividade de bancos de dados e conduzir experimentos para validar e estabelecer resultados basais em classificar retinopatia diabética e determinar o sexo dos pacientes através da análise de retinografias. Métodos: A criação do BRSET envolveu a compilação de um banco de dados com 16.255 imagens de 8.524 pacientes brasileiros, com multiplas classificações. Foram realizados experimentos para validar a utilidade do BRSET, incluindo a detecção de retinopatia diabética, identificação de gênero dos pacientes e manipulação de imagens para aprimoramento da privacidade. Utilizamos a rede neural ConvNext V2, ResNet200D e Inception-V3, com mapas de saliência gerados para identificar áreas de foco para classificação de retinopatia diabética e gênero do paciente. Resultados: O BRSET reuniu um conjunto de 16.255 imagens de 8.524 pacientes brasileiros, com várias classificações. Ele é composto por 61,8% de pacientes do sexo feminino, com idade média de 57,6 (±18,26) anos e retinopatia diabética em 15,8% das imagens. Na classificação de retinopatia, o ConvNext V2 destacou-se com uma AUC de 97% e macro F1 de 89%, enquanto a conversão de imagens em vetores resultou em AUCs entre 75-77% e F1s entre 62-67%. Na identificação do sexo, o ResNet-200D alcançou acurácias de até 82.6%, e o ConvNext V2 obteve AUC de 91% e macro F1 de 83%, com resultados inferiores ao converter imagens em vetores (AUCs de 66-68% e F1s de 65-68%). As técnicas de manipulação de imagem demonstraram a viabilidade de aprimorar a privacidade mantendo a utilidade diagnóstica na classificação de retinopatia diabética. Os mapas de saliência forneceram insights sobre áreas de foco localizadas para classificação de doenças e áreas globais para previsão de gênero. O algoritmo desenvolvido com pacientes brasileiros apresentou resultado de AUC de 97%, sensibilidade de 96,02% e especificidade de 79,93% para detectar casos referenciáveis de retinopatia diabética. Conclusões: Os experimentos apresentaram performance comparável à literatura para classificar casos de retinopatia diabética, identificar o sexo dos pacientes e demonstraram que a manipulação de pixels é uma forma viável de aumentar privacidade de imagens e manter a utilidade em classificação de retinopatia diabética e que a implantação de sistemas automatizados representa uma alternativa para melhorar o fluxo do rastreio da RD no Brasil. O projeto estabeleceu resultados basais, orientar a comunidade científica a como utilizar o banco de dados e validar o BRSET como um banco de dados útil para projetos em ciência de dados e IA. O BRSET foi proposto como um projeto que possibilita desenvolver projetos de ciência de dados, porém também atividades de ensino, com o objetivo de aumentar a representatividade de dados do Brasil e reduzir vieses em sistemas de inteligência artificial. Objective: This project aimed to comprehend the landscape of artificial intelligence (AI) with a focus on its applications in the healthcare sector, particularly in ophthalmology and retina analysis. The objectives included identifying opportunities and challenges for the development of AI systems in healthcare, with an emphasis on addressing biases and improving database representativeness. We conducted experiments to validate and establish baseline results in classifying diabetic retinopathy and determining the gender of patients through retinography analysis. Methods: The creation of BRSET involved compiling a database with 16,255 images from 8,524 Brazilian patients, with multiple classifications. Experiments were conducted to validate the utility of BRSET, including diabetic retinopathy detection, patient gender identification, and image manipulation for privacy enhancement. We utilized the ConvNext V2, ResNet200D, and Inception-V3 neural networks, with saliency maps generated to identify focus areas for diabetic retinopathy classification and patient gender. Results: BRSET gathered a set of 16,255 images from 8,524 Brazilian patients, with various classifications. It comprises 61.8% female patients, with an average age of 57.6 (±18.26) years, and diabetic retinopathy is present in 15.8% of images. In the retinopathy classification task, ConvNext V2 stood out with an AUC of 97% and macro F1 of 89%, while converting images into vectors resulted in AUCs between 75-77% and F1s between 62-67%. In the gender identification task, ResNet-200D achieved accuracies of up to 82.6%, and ConvNext V2 obtained an AUC of 91% and macro F1 of 83%, with lower results when converting images into vectors (AUCs of 66-68% and F1s of 65-68%). Image manipulation techniques demonstrated the feasibility of enhancing privacy while maintaining diagnostic utility in diabetic retinopathy classification. Saliency maps provided insights into localized focus areas for disease classification and global areas for gender prediction. The algorithm developed with Brazilian patients yielded an AUC of 97%, sensitivity of 96.02%, and specificity of 79.93% for detecting referable cases of diabetic retinopathy. Conclusions: The experiments showed performance comparable to the literature for classifying cases of diabetic retinopathy, identifying patient gender, and demonstrated that pixel manipulation is a viable way to enhance image privacy while maintaining utility in diabetic retinopathy classification, and indicate that the implementation of automated systems represents an alternative to improve the screening flow of diabetic retinopathy in Brazil. The project established baseline results, guide the scientific community on how to utilize the database and validate BRSET as a useful database for projects in data science and AI. BRSET was proposed as a project enabling the development of data science projects, as well as teaching activities, with the aim of increasing data representativeness from Brazil and reducing biases in AI system implementations.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Universidade Federal de São PauloRegatieri, Caio Vinicius Saito [UNIFESP]Malerbi, Fernando Korn [UNIFESP]http://lattes.cnpq.br/8724599579159084http://lattes.cnpq.br/3274977342997227http://lattes.cnpq.br/3985859159795854Nakayama, Luis Filipe [UNIFESP]2024-05-27T18:55:08Z2024-05-27T18:55:08Z2024-04-25info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersion113 f.application/pdfNAKAYAMA, Luis Filipe. Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial. 2024. 113 f. Tese (Doutorado em Oftalmologia e Ciências Visuais) – Escola Paulista de Medicina, Universidade Federal de São Paulo (UNIFESP), São Paulo, 2024.https://hdl.handle.net/11600/71152porSão Pauloinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIFESPinstname:Universidade Federal de São Paulo (UNIFESP)instacron:UNIFESP2024-08-14T00:21:43Zoai:repositorio.unifesp.br/:11600/71152Repositório InstitucionalPUBhttp://www.repositorio.unifesp.br/oai/requestbiblioteca.csp@unifesp.bropendoar:34652024-08-14T00:21:43Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)false |
dc.title.none.fl_str_mv |
Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial The creation of a brazilian retinography database with the aim of reducing biases in artificial intelligence applications |
title |
Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial |
spellingShingle |
Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial Nakayama, Luis Filipe [UNIFESP] Inteligência Artificial Retina Bancos de dados Vieses |
title_short |
Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial |
title_full |
Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial |
title_fullStr |
Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial |
title_full_unstemmed |
Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial |
title_sort |
Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial |
author |
Nakayama, Luis Filipe [UNIFESP] |
author_facet |
Nakayama, Luis Filipe [UNIFESP] |
author_role |
author |
dc.contributor.none.fl_str_mv |
Regatieri, Caio Vinicius Saito [UNIFESP] Malerbi, Fernando Korn [UNIFESP] http://lattes.cnpq.br/8724599579159084 http://lattes.cnpq.br/3274977342997227 http://lattes.cnpq.br/3985859159795854 |
dc.contributor.author.fl_str_mv |
Nakayama, Luis Filipe [UNIFESP] |
dc.subject.por.fl_str_mv |
Inteligência Artificial Retina Bancos de dados Vieses |
topic |
Inteligência Artificial Retina Bancos de dados Vieses |
description |
Objetivo: Este projeto teve como objetivo compreender o panorama da inteligência artificial (IA) com foco em suas aplicações na área da saúde, especialmente em oftalmologia e retina. Os objetivos incluíram identificar oportunidades e desafios para o desenvolvimento de sistemas de IA na saúde, com ênfase em abordar vieses e melhorar a representatividade de bancos de dados e conduzir experimentos para validar e estabelecer resultados basais em classificar retinopatia diabética e determinar o sexo dos pacientes através da análise de retinografias. Métodos: A criação do BRSET envolveu a compilação de um banco de dados com 16.255 imagens de 8.524 pacientes brasileiros, com multiplas classificações. Foram realizados experimentos para validar a utilidade do BRSET, incluindo a detecção de retinopatia diabética, identificação de gênero dos pacientes e manipulação de imagens para aprimoramento da privacidade. Utilizamos a rede neural ConvNext V2, ResNet200D e Inception-V3, com mapas de saliência gerados para identificar áreas de foco para classificação de retinopatia diabética e gênero do paciente. Resultados: O BRSET reuniu um conjunto de 16.255 imagens de 8.524 pacientes brasileiros, com várias classificações. Ele é composto por 61,8% de pacientes do sexo feminino, com idade média de 57,6 (±18,26) anos e retinopatia diabética em 15,8% das imagens. Na classificação de retinopatia, o ConvNext V2 destacou-se com uma AUC de 97% e macro F1 de 89%, enquanto a conversão de imagens em vetores resultou em AUCs entre 75-77% e F1s entre 62-67%. Na identificação do sexo, o ResNet-200D alcançou acurácias de até 82.6%, e o ConvNext V2 obteve AUC de 91% e macro F1 de 83%, com resultados inferiores ao converter imagens em vetores (AUCs de 66-68% e F1s de 65-68%). As técnicas de manipulação de imagem demonstraram a viabilidade de aprimorar a privacidade mantendo a utilidade diagnóstica na classificação de retinopatia diabética. Os mapas de saliência forneceram insights sobre áreas de foco localizadas para classificação de doenças e áreas globais para previsão de gênero. O algoritmo desenvolvido com pacientes brasileiros apresentou resultado de AUC de 97%, sensibilidade de 96,02% e especificidade de 79,93% para detectar casos referenciáveis de retinopatia diabética. Conclusões: Os experimentos apresentaram performance comparável à literatura para classificar casos de retinopatia diabética, identificar o sexo dos pacientes e demonstraram que a manipulação de pixels é uma forma viável de aumentar privacidade de imagens e manter a utilidade em classificação de retinopatia diabética e que a implantação de sistemas automatizados representa uma alternativa para melhorar o fluxo do rastreio da RD no Brasil. O projeto estabeleceu resultados basais, orientar a comunidade científica a como utilizar o banco de dados e validar o BRSET como um banco de dados útil para projetos em ciência de dados e IA. O BRSET foi proposto como um projeto que possibilita desenvolver projetos de ciência de dados, porém também atividades de ensino, com o objetivo de aumentar a representatividade de dados do Brasil e reduzir vieses em sistemas de inteligência artificial. |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024-05-27T18:55:08Z 2024-05-27T18:55:08Z 2024-04-25 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
NAKAYAMA, Luis Filipe. Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial. 2024. 113 f. Tese (Doutorado em Oftalmologia e Ciências Visuais) – Escola Paulista de Medicina, Universidade Federal de São Paulo (UNIFESP), São Paulo, 2024. https://hdl.handle.net/11600/71152 |
identifier_str_mv |
NAKAYAMA, Luis Filipe. Criação de um banco de dados brasileiro de retinografia com objetivo de reduzir vieses em aplicações de inteligência artificial. 2024. 113 f. Tese (Doutorado em Oftalmologia e Ciências Visuais) – Escola Paulista de Medicina, Universidade Federal de São Paulo (UNIFESP), São Paulo, 2024. |
url |
https://hdl.handle.net/11600/71152 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
113 f. application/pdf |
dc.coverage.none.fl_str_mv |
São Paulo |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Paulo |
publisher.none.fl_str_mv |
Universidade Federal de São Paulo |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNIFESP instname:Universidade Federal de São Paulo (UNIFESP) instacron:UNIFESP |
instname_str |
Universidade Federal de São Paulo (UNIFESP) |
instacron_str |
UNIFESP |
institution |
UNIFESP |
reponame_str |
Repositório Institucional da UNIFESP |
collection |
Repositório Institucional da UNIFESP |
repository.name.fl_str_mv |
Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP) |
repository.mail.fl_str_mv |
biblioteca.csp@unifesp.br |
_version_ |
1814268297778036736 |