Exploring the radiomics approach for covid-19 identification in lung computed tomography
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da PUC_RS |
Texto Completo: | https://tede2.pucrs.br/tede2/handle/tede/10223 |
Resumo: | O surto de pneumonia de COVID-19 causou transtornos globais e foi declarado uma pandemia pela Organização Mundial da Saúde em 13 de março de 2020. Os exames radiológicos do tórax, como radiografias do tórax ou tomografias computadorizadas, têm um papel vital no diagnóstico da COVID-19. Vários estudos propuseram o uso de modelos de classificação utilizando características radiômicas extraídas dos pulmões em imagens radiológicas, principalmente para o diagnóstico e avaliação da gravidade da COVID-19. Entretanto, poucos desses estudos exploram como os parâmetros de extração de características, como a discretização, impactam as características extraídas. Portanto, este estudo visa implementar modelos para identificar a COVID-19 através da assinatura radiômica enquanto investiga diferentes parâmetros de pré-processamento e discretização. O conjunto de dados utilizado foi de 180 (128 COVID e 52 não COVID) tomografias de tórax realizadas no Hospital São Lucas da PUCRS que foram divididas em conjuntos de treinamento (50\%), validação (25\%) e teste (25\%). Realizamos segmentação dos pulmões, aplicamos diversos filtros e discretizamos a imagem com 6 tamanhos diferentes de bin: 1, 5, 10, 25, 50, e 75. As características foram extraídas de todos os filtros aplicados e tamanhos de bin. Os atributos Wavelet e não-wavelet foram fundidos em 36 combinações de tamanhos de bin com 1774 atributos para cada pulmão. Um modelo de classificação foi treinado com cada combinação de características e os três melhores modelos foram escolhidos para a otimização. Identificamos algumas de nossas limitações e utilizamos quatro estratégias alternativas para tentar superá-las: SMOTE, subamostragem, seleção de atributos e somente utilizar atributos da imagem original. O melhor desempenho foi alcançado pelo modelo SMOTE NW25-1 com um AUC de 0,800. Os três melhores modelos para cada uma destas estratégias alternativas também foram otimizados. Dos 15 modelos otimizados, os seis melhores foram selecionados para análise da importância dos atributos. Os filtros laplaciano da gaussiana e wavelet foram os que geraram os atributos mais relevantes. Nossos resultados indicam que os tamanhos menores de bin, em uma faixa de 1 a 25, podem ser mais investigados para extração de características na imagem original e na maior parte dos filtros. Os filtros laplaciano da gaussiana e wavelet podem ter melhor desempenho com bins ainda menores, em uma faixa de 1 a 10. |
id |
P_RS_031f72a9828b5bcf212a56f1b2fbaafb |
---|---|
oai_identifier_str |
oai:tede2.pucrs.br:tede/10223 |
network_acronym_str |
P_RS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
repository_id_str |
|
spelling |
Silva, Ana Maria Marques dahttp://lattes.cnpq.br/5375482124482980Oliveira, Christian Mattjie de2022-05-17T13:48:10Z2022-03-25https://tede2.pucrs.br/tede2/handle/tede/10223O surto de pneumonia de COVID-19 causou transtornos globais e foi declarado uma pandemia pela Organização Mundial da Saúde em 13 de março de 2020. Os exames radiológicos do tórax, como radiografias do tórax ou tomografias computadorizadas, têm um papel vital no diagnóstico da COVID-19. Vários estudos propuseram o uso de modelos de classificação utilizando características radiômicas extraídas dos pulmões em imagens radiológicas, principalmente para o diagnóstico e avaliação da gravidade da COVID-19. Entretanto, poucos desses estudos exploram como os parâmetros de extração de características, como a discretização, impactam as características extraídas. Portanto, este estudo visa implementar modelos para identificar a COVID-19 através da assinatura radiômica enquanto investiga diferentes parâmetros de pré-processamento e discretização. O conjunto de dados utilizado foi de 180 (128 COVID e 52 não COVID) tomografias de tórax realizadas no Hospital São Lucas da PUCRS que foram divididas em conjuntos de treinamento (50\%), validação (25\%) e teste (25\%). Realizamos segmentação dos pulmões, aplicamos diversos filtros e discretizamos a imagem com 6 tamanhos diferentes de bin: 1, 5, 10, 25, 50, e 75. As características foram extraídas de todos os filtros aplicados e tamanhos de bin. Os atributos Wavelet e não-wavelet foram fundidos em 36 combinações de tamanhos de bin com 1774 atributos para cada pulmão. Um modelo de classificação foi treinado com cada combinação de características e os três melhores modelos foram escolhidos para a otimização. Identificamos algumas de nossas limitações e utilizamos quatro estratégias alternativas para tentar superá-las: SMOTE, subamostragem, seleção de atributos e somente utilizar atributos da imagem original. O melhor desempenho foi alcançado pelo modelo SMOTE NW25-1 com um AUC de 0,800. Os três melhores modelos para cada uma destas estratégias alternativas também foram otimizados. Dos 15 modelos otimizados, os seis melhores foram selecionados para análise da importância dos atributos. Os filtros laplaciano da gaussiana e wavelet foram os que geraram os atributos mais relevantes. Nossos resultados indicam que os tamanhos menores de bin, em uma faixa de 1 a 25, podem ser mais investigados para extração de características na imagem original e na maior parte dos filtros. Os filtros laplaciano da gaussiana e wavelet podem ter melhor desempenho com bins ainda menores, em uma faixa de 1 a 10.The COVID-19 pneumonia outbreak has caused global turmoil and was declared a pandemic by the World Health Organization on March 13, 2020. Chest radiological examinations, such as chest X-rays or CT scans, play a vital role in the diagnosis of COVID-19. Several studies have proposed the use of classification models using radiomic features extracted from the lungs in radiological images, mainly for COVID-19 diagnosis and severity assessment. However, few of these studies explore how feature extraction parameters, such as discretization, impact the extracted features. Therefore, this study aims to implement models for identifying COVID-19 through the radiomic signature while investigating different preprocessing and discretization parameters. Our dataset was composed by 180 (128 COVID and 52 non-COVID) chest CT scans performed at Hospital São Lucas da PUCRS which were divided into training (50\%), validation (25\%), and test (25\%) sets. We performed lung segmentation, applied several filters, and discretized the image with 6 different bin sizes: 1, 5, 10, 25, 50, and 75. Features were extracted from all applied filters and bin sizes. Wavelet and non-wavelet features were merged into 36 combinations of bin sizes with 1774 features for each lung. A classification model was trained with each combination of features and the best three models were chosen for the optimization. We identified some of our limitations and used four alternative strategies to try to overcome them: SMOTE, undersampling, feature selection, and only using features from the original image. The best performance was achieved by SMOTE NW25-1 model with an AUC of 0.800. The best three models for each of these alternative strategies were also optimized. Of the 15 optimized models, the six best were selected for feature importance analysis. The laplacian of gaussian and wavelet filters were the ones that generated the most relevant features. Our results indicate that smaller bin sizes, in a range from 1 to 25 may be further investigated for feature extraction in the original image and most filters. Laplacian of gaussian and wavelet filters may perform better with even smaller bin sizes, with a range from 1 to 10.Submitted by PPG Gerontologia Biomédica (geronbio@pucrs.br) on 2022-05-16T11:51:24Z No. of bitstreams: 1 OLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdf: 14323879 bytes, checksum: da52519e05d5a41aa7438e2d765a6d77 (MD5)Approved for entry into archive by Sheila Dias (sheila.dias@pucrs.br) on 2022-05-17T13:21:35Z (GMT) No. of bitstreams: 1 OLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdf: 14323879 bytes, checksum: da52519e05d5a41aa7438e2d765a6d77 (MD5)Made available in DSpace on 2022-05-17T13:48:10Z (GMT). No. of bitstreams: 1 OLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdf: 14323879 bytes, checksum: da52519e05d5a41aa7438e2d765a6d77 (MD5) Previous issue date: 2022-03-25Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESapplication/pdfhttps://tede2.pucrs.br/tede2/retrieve/184059/OLIVEIRA_CHRISTIAN%20MATTJIE_DE_DIS%20.pdf.jpgengPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Gerontologia BiomédicaPUCRSBrasilEscola de MedicinaTomografia ComputadorizadaCOVID-19RadiômicaDiscretizaçãoImportância de AtributosCIENCIAS DA SAUDE::MEDICINAExploring the radiomics approach for covid-19 identification in lung computed tomographyinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisTrabalho não apresenta restrição para publicação8969645070886364160500600500600-224747486637135387-9693694523087866273590462550136975366info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAILOLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdf.jpgOLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdf.jpgimage/jpeg5658https://tede2.pucrs.br/tede2/bitstream/tede/10223/3/OLIVEIRA_CHRISTIAN+MATTJIE_DE_DIS+.pdf.jpgd0c7922bf75dcb2c268b80716a3e0131MD53TEXTOLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdf.txtOLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdf.txttext/plain209946https://tede2.pucrs.br/tede2/bitstream/tede/10223/4/OLIVEIRA_CHRISTIAN+MATTJIE_DE_DIS+.pdf.txt346402f7cef8fa8b436356a04fa34b09MD54ORIGINALOLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdfOLIVEIRA_CHRISTIAN MATTJIE_DE_DIS .pdfapplication/pdf14323879https://tede2.pucrs.br/tede2/bitstream/tede/10223/2/OLIVEIRA_CHRISTIAN+MATTJIE_DE_DIS+.pdfda52519e05d5a41aa7438e2d765a6d77MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8590https://tede2.pucrs.br/tede2/bitstream/tede/10223/1/license.txt220e11f2d3ba5354f917c7035aadef24MD51tede/102232022-05-17 20:00:14.464oai:tede2.pucrs.br:tede/10223QXV0b3JpemE/P28gcGFyYSBQdWJsaWNhPz9vIEVsZXRyP25pY2E6IENvbSBiYXNlIG5vIGRpc3Bvc3RvIG5hIExlaSBGZWRlcmFsIG4/OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYT8/byBlbGV0cj9uaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWY/Y2lhIFVuaXZlcnNpZGFkZSBDYXQ/bGljYSBkbyBSaW8gR3JhbmRlIGRvIFN1bCwgc2VkaWFkYSBhIEF2LiBJcGlyYW5nYSA2NjgxLCBQb3J0byBBbGVncmUsIFJpbyBHcmFuZGUgZG8gU3VsLCBjb20gcmVnaXN0cm8gZGUgQ05QSiA4ODYzMDQxMzAwMDItODEgYmVtIGNvbW8gZW0gb3V0cmFzIGJpYmxpb3RlY2FzIGRpZ2l0YWlzLCBuYWNpb25haXMgZSBpbnRlcm5hY2lvbmFpcywgY29ucz9yY2lvcyBlIHJlZGVzID9zIHF1YWlzIGEgYmlibGlvdGVjYSBkYSBQVUNSUyBwb3NzYSBhIHZpciBwYXJ0aWNpcGFyLCBzZW0gP251cyBhbHVzaXZvIGFvcyBkaXJlaXRvcyBhdXRvcmFpcywgYSB0P3R1bG8gZGUgZGl2dWxnYT8/byBkYSBwcm9kdT8/byBjaWVudD9maWNhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2022-05-17T23:00:14Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
dc.title.por.fl_str_mv |
Exploring the radiomics approach for covid-19 identification in lung computed tomography |
title |
Exploring the radiomics approach for covid-19 identification in lung computed tomography |
spellingShingle |
Exploring the radiomics approach for covid-19 identification in lung computed tomography Oliveira, Christian Mattjie de Tomografia Computadorizada COVID-19 Radiômica Discretização Importância de Atributos CIENCIAS DA SAUDE::MEDICINA |
title_short |
Exploring the radiomics approach for covid-19 identification in lung computed tomography |
title_full |
Exploring the radiomics approach for covid-19 identification in lung computed tomography |
title_fullStr |
Exploring the radiomics approach for covid-19 identification in lung computed tomography |
title_full_unstemmed |
Exploring the radiomics approach for covid-19 identification in lung computed tomography |
title_sort |
Exploring the radiomics approach for covid-19 identification in lung computed tomography |
author |
Oliveira, Christian Mattjie de |
author_facet |
Oliveira, Christian Mattjie de |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Silva, Ana Maria Marques da |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/5375482124482980 |
dc.contributor.author.fl_str_mv |
Oliveira, Christian Mattjie de |
contributor_str_mv |
Silva, Ana Maria Marques da |
dc.subject.por.fl_str_mv |
Tomografia Computadorizada COVID-19 Radiômica Discretização Importância de Atributos |
topic |
Tomografia Computadorizada COVID-19 Radiômica Discretização Importância de Atributos CIENCIAS DA SAUDE::MEDICINA |
dc.subject.cnpq.fl_str_mv |
CIENCIAS DA SAUDE::MEDICINA |
description |
O surto de pneumonia de COVID-19 causou transtornos globais e foi declarado uma pandemia pela Organização Mundial da Saúde em 13 de março de 2020. Os exames radiológicos do tórax, como radiografias do tórax ou tomografias computadorizadas, têm um papel vital no diagnóstico da COVID-19. Vários estudos propuseram o uso de modelos de classificação utilizando características radiômicas extraídas dos pulmões em imagens radiológicas, principalmente para o diagnóstico e avaliação da gravidade da COVID-19. Entretanto, poucos desses estudos exploram como os parâmetros de extração de características, como a discretização, impactam as características extraídas. Portanto, este estudo visa implementar modelos para identificar a COVID-19 através da assinatura radiômica enquanto investiga diferentes parâmetros de pré-processamento e discretização. O conjunto de dados utilizado foi de 180 (128 COVID e 52 não COVID) tomografias de tórax realizadas no Hospital São Lucas da PUCRS que foram divididas em conjuntos de treinamento (50\%), validação (25\%) e teste (25\%). Realizamos segmentação dos pulmões, aplicamos diversos filtros e discretizamos a imagem com 6 tamanhos diferentes de bin: 1, 5, 10, 25, 50, e 75. As características foram extraídas de todos os filtros aplicados e tamanhos de bin. Os atributos Wavelet e não-wavelet foram fundidos em 36 combinações de tamanhos de bin com 1774 atributos para cada pulmão. Um modelo de classificação foi treinado com cada combinação de características e os três melhores modelos foram escolhidos para a otimização. Identificamos algumas de nossas limitações e utilizamos quatro estratégias alternativas para tentar superá-las: SMOTE, subamostragem, seleção de atributos e somente utilizar atributos da imagem original. O melhor desempenho foi alcançado pelo modelo SMOTE NW25-1 com um AUC de 0,800. Os três melhores modelos para cada uma destas estratégias alternativas também foram otimizados. Dos 15 modelos otimizados, os seis melhores foram selecionados para análise da importância dos atributos. Os filtros laplaciano da gaussiana e wavelet foram os que geraram os atributos mais relevantes. Nossos resultados indicam que os tamanhos menores de bin, em uma faixa de 1 a 25, podem ser mais investigados para extração de características na imagem original e na maior parte dos filtros. Os filtros laplaciano da gaussiana e wavelet podem ter melhor desempenho com bins ainda menores, em uma faixa de 1 a 10. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-05-17T13:48:10Z |
dc.date.issued.fl_str_mv |
2022-03-25 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://tede2.pucrs.br/tede2/handle/tede/10223 |
url |
https://tede2.pucrs.br/tede2/handle/tede/10223 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.program.fl_str_mv |
8969645070886364160 |
dc.relation.confidence.fl_str_mv |
500 600 500 600 |
dc.relation.department.fl_str_mv |
-224747486637135387 |
dc.relation.cnpq.fl_str_mv |
-969369452308786627 |
dc.relation.sponsorship.fl_str_mv |
3590462550136975366 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Gerontologia Biomédica |
dc.publisher.initials.fl_str_mv |
PUCRS |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Escola de Medicina |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
instacron_str |
PUC_RS |
institution |
PUC_RS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
collection |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
bitstream.url.fl_str_mv |
https://tede2.pucrs.br/tede2/bitstream/tede/10223/3/OLIVEIRA_CHRISTIAN+MATTJIE_DE_DIS+.pdf.jpg https://tede2.pucrs.br/tede2/bitstream/tede/10223/4/OLIVEIRA_CHRISTIAN+MATTJIE_DE_DIS+.pdf.txt https://tede2.pucrs.br/tede2/bitstream/tede/10223/2/OLIVEIRA_CHRISTIAN+MATTJIE_DE_DIS+.pdf https://tede2.pucrs.br/tede2/bitstream/tede/10223/1/license.txt |
bitstream.checksum.fl_str_mv |
d0c7922bf75dcb2c268b80716a3e0131 346402f7cef8fa8b436356a04fa34b09 da52519e05d5a41aa7438e2d765a6d77 220e11f2d3ba5354f917c7035aadef24 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
repository.mail.fl_str_mv |
biblioteca.central@pucrs.br|| |
_version_ |
1799765355553357824 |