O uso de redes neurais artificiais na análise de dados de câncer de pulmão

Detalhes bibliográficos
Autor(a) principal: Lima, Débora Virgínia da Costa e
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/48470
Resumo: O câncer de pulmão representa a principal causa de morte com câncer no mundo, e possui altos níveis de incidência. Assim como outros tipos de câncer, pode ocorrer por diversas causas, de genéticas à ambientais, por isso estudos realizados a partir de diferentes tipos de dados podem ser relevantes para o controle dessa neoplasia, especialmente quando considerados fatores que têm impacto na sobrevivência dos pacientes. No contexto do câncer de pulmão, esse estudo foi desenvolvido para utilizar deep learning a fim de prever a sobrevivência de pacientes. Para tanto foram obtidos dados clínicos e moleculares presentes em bancos de dados do TCGA (The Cancer Genome Atlas) referentes às coortes LUSC (Carcinoma de Células Escamosas do Pulmão) e LUAD (Adenocarcinoma do pulmão), seguido da análise das alterações genômicas, e aplicação de redes neurais usando como entrada os genes frequentemente mutados para cada coorte, seleção de genes chave e validação com outro banco de dados. As coortes apresentaram diferenças na sobrevida entre si quando submetidas ao método de Kaplan-Meier e ao teste Log-Rank. Na análise genômica, foram selecionados todos os genes com frequência de mutação superior a 15%, sendo encontrados 34 genes para LUAD e 32 para LUSC. A utilização desses genes como entrada nas redes construídas possibilitou a geração das redes LUSC e LUAD com 100% de acurácia, identificando, de acordo com as mutações, o status vital do paciente. Além disso, foi obtida também uma rede LUSC usando como validação um outro banco de dados o LUSC-KR que alcançou 99% de acurácia. Desta forma, este trabalho mostrou que a utilização de genes com mutações frequentes associadas ao uso de deep learning é uma ferramenta robusta e permite predizer a sobrevida de pacientes com câncer de pulmão.
id UFRN_86d96e2251920b613e3b7dd32428f0c3
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/48470
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Lima, Débora Virgínia da Costa ehttp://lattes.cnpq.br/4705169857699631https://orcid.org/0000-0002-5445-7327http://lattes.cnpq.br/1987295209521433Ferreira, Beatriz Stranskyhttps://orcid.org/0000-0003-4506-393Xhttp://lattes.cnpq.br/3142264445097872Torres, Taffarel MeloSakamoto, TetsuDoria Neto, Adrião Duarte2022-07-12T22:53:24Z2022-07-12T22:53:24Z2022-05-12LIMA, Débora Virgínia da Costa e. O uso de redes neurais artificiais na análise de dados de câncer de pulmão. 2022. 76f. Dissertação (Mestrado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022.https://repositorio.ufrn.br/handle/123456789/48470O câncer de pulmão representa a principal causa de morte com câncer no mundo, e possui altos níveis de incidência. Assim como outros tipos de câncer, pode ocorrer por diversas causas, de genéticas à ambientais, por isso estudos realizados a partir de diferentes tipos de dados podem ser relevantes para o controle dessa neoplasia, especialmente quando considerados fatores que têm impacto na sobrevivência dos pacientes. No contexto do câncer de pulmão, esse estudo foi desenvolvido para utilizar deep learning a fim de prever a sobrevivência de pacientes. Para tanto foram obtidos dados clínicos e moleculares presentes em bancos de dados do TCGA (The Cancer Genome Atlas) referentes às coortes LUSC (Carcinoma de Células Escamosas do Pulmão) e LUAD (Adenocarcinoma do pulmão), seguido da análise das alterações genômicas, e aplicação de redes neurais usando como entrada os genes frequentemente mutados para cada coorte, seleção de genes chave e validação com outro banco de dados. As coortes apresentaram diferenças na sobrevida entre si quando submetidas ao método de Kaplan-Meier e ao teste Log-Rank. Na análise genômica, foram selecionados todos os genes com frequência de mutação superior a 15%, sendo encontrados 34 genes para LUAD e 32 para LUSC. A utilização desses genes como entrada nas redes construídas possibilitou a geração das redes LUSC e LUAD com 100% de acurácia, identificando, de acordo com as mutações, o status vital do paciente. Além disso, foi obtida também uma rede LUSC usando como validação um outro banco de dados o LUSC-KR que alcançou 99% de acurácia. Desta forma, este trabalho mostrou que a utilização de genes com mutações frequentes associadas ao uso de deep learning é uma ferramenta robusta e permite predizer a sobrevida de pacientes com câncer de pulmão.Lung cancer represents the leading cause of cancer death worldwide and has a high incidence. Like other types of cancer, it can occur due to different causes, from genetics to environmental ones, so studies carried out using different types of data may be relevant for the control of this neoplasm, especially when considering factors that have an impact on patient survival. In the context of lung cancer, this study uses deep learning to predict patient survival. Clinical and molecular data from TCGA (The Cancer Genome Atlas) databases were obtained for the LUSC (Lung Squamous Cell Carcinoma) and LUAD (Lung Adenocarcinoma) cohorts, followed by the analysis of the genomic alterations, and application of neural networks using as input the frequently mutated genes for each cohort, selection of key genes and validation with another database. The cohorts showed differences in survival among themselves when subjected to the Kaplan-Meier method and the Log-Rank test. In the genomic analysis, all genes with a mutation frequency above 15% were selected, and 34 genes were found for LUAD and 32 for LUSC. The use of these genes as input in the constructed networks made it possible to generate the LUSC and LUAD networks with 100% accuracy, identifying, according to the mutations, the vital status of the patient. In addition, a LUSC network was also obtained using another LUSC-KR database as validation, which reached 99% accuracy. In this way, this work showed that the use of genes with frequent mutations associated with deep learning is a robust tool and allows predicting the survival of patients with lung cancer.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESUniversidade Federal do Rio Grande do NortePROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICAUFRNBrasilCâncer de pulmãoAprendizado profundoDados genômicosAssinatura gênicaSobrevidaO uso de redes neurais artificiais na análise de dados de câncer de pulmãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALUsoredesneurais_Lima_2022.pdfapplication/pdf2369086https://repositorio.ufrn.br/bitstream/123456789/48470/1/Usoredesneurais_Lima_2022.pdf1136bbaf78dc1c93ba2eaf5e1f80055fMD51123456789/484702022-07-12 19:54:01.22oai:https://repositorio.ufrn.br:123456789/48470Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2022-07-12T22:54:01Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv O uso de redes neurais artificiais na análise de dados de câncer de pulmão
title O uso de redes neurais artificiais na análise de dados de câncer de pulmão
spellingShingle O uso de redes neurais artificiais na análise de dados de câncer de pulmão
Lima, Débora Virgínia da Costa e
Câncer de pulmão
Aprendizado profundo
Dados genômicos
Assinatura gênica
Sobrevida
title_short O uso de redes neurais artificiais na análise de dados de câncer de pulmão
title_full O uso de redes neurais artificiais na análise de dados de câncer de pulmão
title_fullStr O uso de redes neurais artificiais na análise de dados de câncer de pulmão
title_full_unstemmed O uso de redes neurais artificiais na análise de dados de câncer de pulmão
title_sort O uso de redes neurais artificiais na análise de dados de câncer de pulmão
author Lima, Débora Virgínia da Costa e
author_facet Lima, Débora Virgínia da Costa e
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/4705169857699631
dc.contributor.advisorID.pt_BR.fl_str_mv https://orcid.org/0000-0002-5445-7327
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/1987295209521433
dc.contributor.referees1.none.fl_str_mv Torres, Taffarel Melo
dc.contributor.referees2.none.fl_str_mv Sakamoto, Tetsu
dc.contributor.author.fl_str_mv Lima, Débora Virgínia da Costa e
dc.contributor.advisor-co1.fl_str_mv Ferreira, Beatriz Stransky
dc.contributor.advisor-co1ID.fl_str_mv https://orcid.org/0000-0003-4506-393X
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/3142264445097872
dc.contributor.advisor1.fl_str_mv Doria Neto, Adrião Duarte
contributor_str_mv Ferreira, Beatriz Stransky
Doria Neto, Adrião Duarte
dc.subject.por.fl_str_mv Câncer de pulmão
Aprendizado profundo
Dados genômicos
Assinatura gênica
Sobrevida
topic Câncer de pulmão
Aprendizado profundo
Dados genômicos
Assinatura gênica
Sobrevida
description O câncer de pulmão representa a principal causa de morte com câncer no mundo, e possui altos níveis de incidência. Assim como outros tipos de câncer, pode ocorrer por diversas causas, de genéticas à ambientais, por isso estudos realizados a partir de diferentes tipos de dados podem ser relevantes para o controle dessa neoplasia, especialmente quando considerados fatores que têm impacto na sobrevivência dos pacientes. No contexto do câncer de pulmão, esse estudo foi desenvolvido para utilizar deep learning a fim de prever a sobrevivência de pacientes. Para tanto foram obtidos dados clínicos e moleculares presentes em bancos de dados do TCGA (The Cancer Genome Atlas) referentes às coortes LUSC (Carcinoma de Células Escamosas do Pulmão) e LUAD (Adenocarcinoma do pulmão), seguido da análise das alterações genômicas, e aplicação de redes neurais usando como entrada os genes frequentemente mutados para cada coorte, seleção de genes chave e validação com outro banco de dados. As coortes apresentaram diferenças na sobrevida entre si quando submetidas ao método de Kaplan-Meier e ao teste Log-Rank. Na análise genômica, foram selecionados todos os genes com frequência de mutação superior a 15%, sendo encontrados 34 genes para LUAD e 32 para LUSC. A utilização desses genes como entrada nas redes construídas possibilitou a geração das redes LUSC e LUAD com 100% de acurácia, identificando, de acordo com as mutações, o status vital do paciente. Além disso, foi obtida também uma rede LUSC usando como validação um outro banco de dados o LUSC-KR que alcançou 99% de acurácia. Desta forma, este trabalho mostrou que a utilização de genes com mutações frequentes associadas ao uso de deep learning é uma ferramenta robusta e permite predizer a sobrevida de pacientes com câncer de pulmão.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-07-12T22:53:24Z
dc.date.available.fl_str_mv 2022-07-12T22:53:24Z
dc.date.issued.fl_str_mv 2022-05-12
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv LIMA, Débora Virgínia da Costa e. O uso de redes neurais artificiais na análise de dados de câncer de pulmão. 2022. 76f. Dissertação (Mestrado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/48470
identifier_str_mv LIMA, Débora Virgínia da Costa e. O uso de redes neurais artificiais na análise de dados de câncer de pulmão. 2022. 76f. Dissertação (Mestrado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022.
url https://repositorio.ufrn.br/handle/123456789/48470
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICA
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/48470/1/Usoredesneurais_Lima_2022.pdf
bitstream.checksum.fl_str_mv 1136bbaf78dc1c93ba2eaf5e1f80055f
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1814832914194497536