Exploring the radiomics approach for covid-19 identification in lung computed tomography

Detalhes bibliográficos
Autor(a) principal: Oliveira, Christian Mattjie de
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da PUC_RS
Texto Completo: https://tede2.pucrs.br/tede2/handle/tede/10223
Resumo: O surto de pneumonia de COVID-19 causou transtornos globais e foi declarado uma pandemia pela Organização Mundial da Saúde em 13 de março de 2020. Os exames radiológicos do tórax, como radiografias do tórax ou tomografias computadorizadas, têm um papel vital no diagnóstico da COVID-19. Vários estudos propuseram o uso de modelos de classificação utilizando características radiômicas extraídas dos pulmões em imagens radiológicas, principalmente para o diagnóstico e avaliação da gravidade da COVID-19. Entretanto, poucos desses estudos exploram como os parâmetros de extração de características, como a discretização, impactam as características extraídas. Portanto, este estudo visa implementar modelos para identificar a COVID-19 através da assinatura radiômica enquanto investiga diferentes parâmetros de pré-processamento e discretização. O conjunto de dados utilizado foi de 180 (128 COVID e 52 não COVID) tomografias de tórax realizadas no Hospital São Lucas da PUCRS que foram divididas em conjuntos de treinamento (50\%), validação (25\%) e teste (25\%). Realizamos segmentação dos pulmões, aplicamos diversos filtros e discretizamos a imagem com 6 tamanhos diferentes de bin: 1, 5, 10, 25, 50, e 75. As características foram extraídas de todos os filtros aplicados e tamanhos de bin. Os atributos Wavelet e não-wavelet foram fundidos em 36 combinações de tamanhos de bin com 1774 atributos para cada pulmão. Um modelo de classificação foi treinado com cada combinação de características e os três melhores modelos foram escolhidos para a otimização. Identificamos algumas de nossas limitações e utilizamos quatro estratégias alternativas para tentar superá-las: SMOTE, subamostragem, seleção de atributos e somente utilizar atributos da imagem original. O melhor desempenho foi alcançado pelo modelo SMOTE NW25-1 com um AUC de 0,800. Os três melhores modelos para cada uma destas estratégias alternativas também foram otimizados. Dos 15 modelos otimizados, os seis melhores foram selecionados para análise da importância dos atributos. Os filtros laplaciano da gaussiana e wavelet foram os que geraram os atributos mais relevantes. Nossos resultados indicam que os tamanhos menores de bin, em uma faixa de 1 a 25, podem ser mais investigados para extração de características na imagem original e na maior parte dos filtros. Os filtros laplaciano da gaussiana e wavelet podem ter melhor desempenho com bins ainda menores, em uma faixa de 1 a 10.
id P_RS_031f72a9828b5bcf212a56f1b2fbaafb
oai_identifier_str oai:tede2.pucrs.br:tede/10223
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Silva, Ana Maria Marques dahttp://lattes.cnpq.br/5375482124482980Oliveira, Christian Mattjie de2022-05-17T13:48:10Z2022-03-25https://tede2.pucrs.br/tede2/handle/tede/10223O surto de pneumonia de COVID-19 causou transtornos globais e foi declarado uma pandemia pela Organização Mundial da Saúde em 13 de março de 2020. Os exames radiológicos do tórax, como radiografias do tórax ou tomografias computadorizadas, têm um papel vital no diagnóstico da COVID-19. Vários estudos propuseram o uso de modelos de classificação utilizando características radiômicas extraídas dos pulmões em imagens radiológicas, principalmente para o diagnóstico e avaliação da gravidade da COVID-19. Entretanto, poucos desses estudos exploram como os parâmetros de extração de características, como a discretização, impactam as características extraídas. Portanto, este estudo visa implementar modelos para identificar a COVID-19 através da assinatura radiômica enquanto investiga diferentes parâmetros de pré-processamento e discretização. O conjunto de dados utilizado foi de 180 (128 COVID e 52 não COVID) tomografias de tórax realizadas no Hospital São Lucas da PUCRS que foram divididas em conjuntos de treinamento (50\%), validação (25\%) e teste (25\%). Realizamos segmentação dos pulmões, aplicamos diversos filtros e discretizamos a imagem com 6 tamanhos diferentes de bin: 1, 5, 10, 25, 50, e 75. As características foram extraídas de todos os filtros aplicados e tamanhos de bin. Os atributos Wavelet e não-wavelet foram fundidos em 36 combinações de tamanhos de bin com 1774 atributos para cada pulmão. Um modelo de classificação foi treinado com cada combinação de características e os três melhores modelos foram escolhidos para a otimização. Identificamos algumas de nossas limitações e utilizamos quatro estratégias alternativas para tentar superá-las: SMOTE, subamostragem, seleção de atributos e somente utilizar atributos da imagem original. O melhor desempenho foi alcançado pelo modelo SMOTE NW25-1 com um AUC de 0,800. Os três melhores modelos para cada uma destas estratégias alternativas também foram otimizados. Dos 15 modelos otimizados, os seis melhores foram selecionados para análise da importância dos atributos. Os filtros laplaciano da gaussiana e wavelet foram os que geraram os atributos mais relevantes. Nossos resultados indicam que os tamanhos menores de bin, em uma faixa de 1 a 25, podem ser mais investigados para extração de características na imagem original e na maior parte dos filtros. Os filtros laplaciano da gaussiana e wavelet podem ter melhor desempenho com bins ainda menores, em uma faixa de 1 a 10.The COVID-19 pneumonia outbreak has caused global turmoil and was declared a pandemic by the World Health Organization on March 13, 2020. Chest radiological examinations, such as chest X-rays or CT scans, play a vital role in the diagnosis of COVID-19. Several studies have proposed the use of classification models using radiomic features extracted from the lungs in radiological images, mainly for COVID-19 diagnosis and severity assessment. However, few of these studies explore how feature extraction parameters, such as discretization, impact the extracted features. Therefore, this study aims to implement models for identifying COVID-19 through the radiomic signature while investigating different preprocessing and discretization parameters. Our dataset was composed by 180 (128 COVID and 52 non-COVID) chest CT scans performed at Hospital São Lucas da PUCRS which were divided into training (50\%), validation (25\%), and test (25\%) sets. We performed lung segmentation, applied several filters, and discretized the image with 6 different bin sizes: 1, 5, 10, 25, 50, and 75. Features were extracted from all applied filters and bin sizes. Wavelet and non-wavelet features were merged into 36 combinations of bin sizes with 1774 features for each lung. A classification model was trained with each combination of features and the best three models were chosen for the optimization. We identified some of our limitations and used four alternative strategies to try to overcome them: SMOTE, undersampling, feature selection, and only using features from the original image. The best performance was achieved by SMOTE NW25-1 model with an AUC of 0.800. The best three models for each of these alternative strategies were also optimized. Of the 15 optimized models, the six best were selected for feature importance analysis. The laplacian of gaussian and wavelet filters were the ones that generated the most relevant features. Our results indicate that smaller bin sizes, in a range from 1 to 25 may be further investigated for feature extraction in the original image and most filters. Laplacian of gaussian and wavelet filters may perform better with even smaller bin sizes, with a range from 1 to 10.Submitted by PPG Gerontologia Biomédica (geronbio@pucrs.br) on 2022-05-16T11:51:24Z No. of bitstreams: 1 OLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdf: 14323879 bytes, checksum: da52519e05d5a41aa7438e2d765a6d77 (MD5)Approved for entry into archive by Sheila Dias (sheila.dias@pucrs.br) on 2022-05-17T13:21:35Z (GMT) No. of bitstreams: 1 OLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdf: 14323879 bytes, checksum: da52519e05d5a41aa7438e2d765a6d77 (MD5)Made available in DSpace on 2022-05-17T13:48:10Z (GMT). No. of bitstreams: 1 OLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdf: 14323879 bytes, checksum: da52519e05d5a41aa7438e2d765a6d77 (MD5) Previous issue date: 2022-03-25Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESapplication/pdfhttps://tede2.pucrs.br/tede2/retrieve/184059/OLIVEIRA_CHRISTIAN%20MATTJIE_DE_DIS%20.pdf.jpgengPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Gerontologia BiomédicaPUCRSBrasilEscola de MedicinaTomografia ComputadorizadaCOVID-19RadiômicaDiscretizaçãoImportância de AtributosCIENCIAS DA SAUDE::MEDICINAExploring the radiomics approach for covid-19 identification in lung computed tomographyinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisTrabalho não apresenta restrição para publicação8969645070886364160500600500600-224747486637135387-9693694523087866273590462550136975366info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAILOLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdf.jpgOLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdf.jpgimage/jpeg5658https://tede2.pucrs.br/tede2/bitstream/tede/10223/3/OLIVEIRA_CHRISTIAN+MATTJIE_DE_DIS+.pdf.jpgd0c7922bf75dcb2c268b80716a3e0131MD53TEXTOLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdf.txtOLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdf.txttext/plain209946https://tede2.pucrs.br/tede2/bitstream/tede/10223/4/OLIVEIRA_CHRISTIAN+MATTJIE_DE_DIS+.pdf.txt346402f7cef8fa8b436356a04fa34b09MD54ORIGINALOLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdfOLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdfapplication/pdf14323879https://tede2.pucrs.br/tede2/bitstream/tede/10223/2/OLIVEIRA_CHRISTIAN+MATTJIE_DE_DIS+.pdfda52519e05d5a41aa7438e2d765a6d77MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8590https://tede2.pucrs.br/tede2/bitstream/tede/10223/1/license.txt220e11f2d3ba5354f917c7035aadef24MD51tede/102232022-05-17 20:00:14.464oai:tede2.pucrs.br:tede/10223QXV0b3JpemE/P28gcGFyYSBQdWJsaWNhPz9vIEVsZXRyP25pY2E6IENvbSBiYXNlIG5vIGRpc3Bvc3RvIG5hIExlaSBGZWRlcmFsIG4/OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYT8/byBlbGV0cj9uaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWY/Y2lhIFVuaXZlcnNpZGFkZSBDYXQ/bGljYSBkbyBSaW8gR3JhbmRlIGRvIFN1bCwgc2VkaWFkYSBhIEF2LiBJcGlyYW5nYSA2NjgxLCBQb3J0byBBbGVncmUsIFJpbyBHcmFuZGUgZG8gU3VsLCBjb20gcmVnaXN0cm8gZGUgQ05QSiA4ODYzMDQxMzAwMDItODEgYmVtIGNvbW8gZW0gb3V0cmFzIGJpYmxpb3RlY2FzIGRpZ2l0YWlzLCBuYWNpb25haXMgZSBpbnRlcm5hY2lvbmFpcywgY29ucz9yY2lvcyBlIHJlZGVzID9zIHF1YWlzIGEgYmlibGlvdGVjYSBkYSBQVUNSUyBwb3NzYSBhIHZpciBwYXJ0aWNpcGFyLCBzZW0gP251cyBhbHVzaXZvIGFvcyBkaXJlaXRvcyBhdXRvcmFpcywgYSB0P3R1bG8gZGUgZGl2dWxnYT8/byBkYSBwcm9kdT8/byBjaWVudD9maWNhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2022-05-17T23:00:14Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv Exploring the radiomics approach for covid-19 identification in lung computed tomography
title Exploring the radiomics approach for covid-19 identification in lung computed tomography
spellingShingle Exploring the radiomics approach for covid-19 identification in lung computed tomography
Oliveira, Christian Mattjie de
Tomografia Computadorizada
COVID-19
Radiômica
Discretização
Importância de Atributos
CIENCIAS DA SAUDE::MEDICINA
title_short Exploring the radiomics approach for covid-19 identification in lung computed tomography
title_full Exploring the radiomics approach for covid-19 identification in lung computed tomography
title_fullStr Exploring the radiomics approach for covid-19 identification in lung computed tomography
title_full_unstemmed Exploring the radiomics approach for covid-19 identification in lung computed tomography
title_sort Exploring the radiomics approach for covid-19 identification in lung computed tomography
author Oliveira, Christian Mattjie de
author_facet Oliveira, Christian Mattjie de
author_role author
dc.contributor.advisor1.fl_str_mv Silva, Ana Maria Marques da
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/5375482124482980
dc.contributor.author.fl_str_mv Oliveira, Christian Mattjie de
contributor_str_mv Silva, Ana Maria Marques da
dc.subject.por.fl_str_mv Tomografia Computadorizada
COVID-19
Radiômica
Discretização
Importância de Atributos
topic Tomografia Computadorizada
COVID-19
Radiômica
Discretização
Importância de Atributos
CIENCIAS DA SAUDE::MEDICINA
dc.subject.cnpq.fl_str_mv CIENCIAS DA SAUDE::MEDICINA
description O surto de pneumonia de COVID-19 causou transtornos globais e foi declarado uma pandemia pela Organização Mundial da Saúde em 13 de março de 2020. Os exames radiológicos do tórax, como radiografias do tórax ou tomografias computadorizadas, têm um papel vital no diagnóstico da COVID-19. Vários estudos propuseram o uso de modelos de classificação utilizando características radiômicas extraídas dos pulmões em imagens radiológicas, principalmente para o diagnóstico e avaliação da gravidade da COVID-19. Entretanto, poucos desses estudos exploram como os parâmetros de extração de características, como a discretização, impactam as características extraídas. Portanto, este estudo visa implementar modelos para identificar a COVID-19 através da assinatura radiômica enquanto investiga diferentes parâmetros de pré-processamento e discretização. O conjunto de dados utilizado foi de 180 (128 COVID e 52 não COVID) tomografias de tórax realizadas no Hospital São Lucas da PUCRS que foram divididas em conjuntos de treinamento (50\%), validação (25\%) e teste (25\%). Realizamos segmentação dos pulmões, aplicamos diversos filtros e discretizamos a imagem com 6 tamanhos diferentes de bin: 1, 5, 10, 25, 50, e 75. As características foram extraídas de todos os filtros aplicados e tamanhos de bin. Os atributos Wavelet e não-wavelet foram fundidos em 36 combinações de tamanhos de bin com 1774 atributos para cada pulmão. Um modelo de classificação foi treinado com cada combinação de características e os três melhores modelos foram escolhidos para a otimização. Identificamos algumas de nossas limitações e utilizamos quatro estratégias alternativas para tentar superá-las: SMOTE, subamostragem, seleção de atributos e somente utilizar atributos da imagem original. O melhor desempenho foi alcançado pelo modelo SMOTE NW25-1 com um AUC de 0,800. Os três melhores modelos para cada uma destas estratégias alternativas também foram otimizados. Dos 15 modelos otimizados, os seis melhores foram selecionados para análise da importância dos atributos. Os filtros laplaciano da gaussiana e wavelet foram os que geraram os atributos mais relevantes. Nossos resultados indicam que os tamanhos menores de bin, em uma faixa de 1 a 25, podem ser mais investigados para extração de características na imagem original e na maior parte dos filtros. Os filtros laplaciano da gaussiana e wavelet podem ter melhor desempenho com bins ainda menores, em uma faixa de 1 a 10.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-05-17T13:48:10Z
dc.date.issued.fl_str_mv 2022-03-25
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://tede2.pucrs.br/tede2/handle/tede/10223
url https://tede2.pucrs.br/tede2/handle/tede/10223
dc.language.iso.fl_str_mv eng
language eng
dc.relation.program.fl_str_mv 8969645070886364160
dc.relation.confidence.fl_str_mv 500
600
500
600
dc.relation.department.fl_str_mv -224747486637135387
dc.relation.cnpq.fl_str_mv -969369452308786627
dc.relation.sponsorship.fl_str_mv 3590462550136975366
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Gerontologia Biomédica
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Escola de Medicina
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv https://tede2.pucrs.br/tede2/bitstream/tede/10223/3/OLIVEIRA_CHRISTIAN+MATTJIE_DE_DIS+.pdf.jpg
https://tede2.pucrs.br/tede2/bitstream/tede/10223/4/OLIVEIRA_CHRISTIAN+MATTJIE_DE_DIS+.pdf.txt
https://tede2.pucrs.br/tede2/bitstream/tede/10223/2/OLIVEIRA_CHRISTIAN+MATTJIE_DE_DIS+.pdf
https://tede2.pucrs.br/tede2/bitstream/tede/10223/1/license.txt
bitstream.checksum.fl_str_mv d0c7922bf75dcb2c268b80716a3e0131
346402f7cef8fa8b436356a04fa34b09
da52519e05d5a41aa7438e2d765a6d77
220e11f2d3ba5354f917c7035aadef24
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1799765355553357824