O uso de redes neurais artificiais na análise de dados de câncer de pulmão
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/handle/123456789/48470 |
Resumo: | O câncer de pulmão representa a principal causa de morte com câncer no mundo, e possui altos níveis de incidência. Assim como outros tipos de câncer, pode ocorrer por diversas causas, de genéticas à ambientais, por isso estudos realizados a partir de diferentes tipos de dados podem ser relevantes para o controle dessa neoplasia, especialmente quando considerados fatores que têm impacto na sobrevivência dos pacientes. No contexto do câncer de pulmão, esse estudo foi desenvolvido para utilizar deep learning a fim de prever a sobrevivência de pacientes. Para tanto foram obtidos dados clínicos e moleculares presentes em bancos de dados do TCGA (The Cancer Genome Atlas) referentes às coortes LUSC (Carcinoma de Células Escamosas do Pulmão) e LUAD (Adenocarcinoma do pulmão), seguido da análise das alterações genômicas, e aplicação de redes neurais usando como entrada os genes frequentemente mutados para cada coorte, seleção de genes chave e validação com outro banco de dados. As coortes apresentaram diferenças na sobrevida entre si quando submetidas ao método de Kaplan-Meier e ao teste Log-Rank. Na análise genômica, foram selecionados todos os genes com frequência de mutação superior a 15%, sendo encontrados 34 genes para LUAD e 32 para LUSC. A utilização desses genes como entrada nas redes construídas possibilitou a geração das redes LUSC e LUAD com 100% de acurácia, identificando, de acordo com as mutações, o status vital do paciente. Além disso, foi obtida também uma rede LUSC usando como validação um outro banco de dados o LUSC-KR que alcançou 99% de acurácia. Desta forma, este trabalho mostrou que a utilização de genes com mutações frequentes associadas ao uso de deep learning é uma ferramenta robusta e permite predizer a sobrevida de pacientes com câncer de pulmão. |
id |
UFRN_86d96e2251920b613e3b7dd32428f0c3 |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/48470 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Lima, Débora Virgínia da Costa ehttp://lattes.cnpq.br/4705169857699631https://orcid.org/0000-0002-5445-7327http://lattes.cnpq.br/1987295209521433Ferreira, Beatriz Stranskyhttps://orcid.org/0000-0003-4506-393Xhttp://lattes.cnpq.br/3142264445097872Torres, Taffarel MeloSakamoto, TetsuDoria Neto, Adrião Duarte2022-07-12T22:53:24Z2022-07-12T22:53:24Z2022-05-12LIMA, Débora Virgínia da Costa e. O uso de redes neurais artificiais na análise de dados de câncer de pulmão. 2022. 76f. Dissertação (Mestrado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022.https://repositorio.ufrn.br/handle/123456789/48470O câncer de pulmão representa a principal causa de morte com câncer no mundo, e possui altos níveis de incidência. Assim como outros tipos de câncer, pode ocorrer por diversas causas, de genéticas à ambientais, por isso estudos realizados a partir de diferentes tipos de dados podem ser relevantes para o controle dessa neoplasia, especialmente quando considerados fatores que têm impacto na sobrevivência dos pacientes. No contexto do câncer de pulmão, esse estudo foi desenvolvido para utilizar deep learning a fim de prever a sobrevivência de pacientes. Para tanto foram obtidos dados clínicos e moleculares presentes em bancos de dados do TCGA (The Cancer Genome Atlas) referentes às coortes LUSC (Carcinoma de Células Escamosas do Pulmão) e LUAD (Adenocarcinoma do pulmão), seguido da análise das alterações genômicas, e aplicação de redes neurais usando como entrada os genes frequentemente mutados para cada coorte, seleção de genes chave e validação com outro banco de dados. As coortes apresentaram diferenças na sobrevida entre si quando submetidas ao método de Kaplan-Meier e ao teste Log-Rank. Na análise genômica, foram selecionados todos os genes com frequência de mutação superior a 15%, sendo encontrados 34 genes para LUAD e 32 para LUSC. A utilização desses genes como entrada nas redes construídas possibilitou a geração das redes LUSC e LUAD com 100% de acurácia, identificando, de acordo com as mutações, o status vital do paciente. Além disso, foi obtida também uma rede LUSC usando como validação um outro banco de dados o LUSC-KR que alcançou 99% de acurácia. Desta forma, este trabalho mostrou que a utilização de genes com mutações frequentes associadas ao uso de deep learning é uma ferramenta robusta e permite predizer a sobrevida de pacientes com câncer de pulmão.Lung cancer represents the leading cause of cancer death worldwide and has a high incidence. Like other types of cancer, it can occur due to different causes, from genetics to environmental ones, so studies carried out using different types of data may be relevant for the control of this neoplasm, especially when considering factors that have an impact on patient survival. In the context of lung cancer, this study uses deep learning to predict patient survival. Clinical and molecular data from TCGA (The Cancer Genome Atlas) databases were obtained for the LUSC (Lung Squamous Cell Carcinoma) and LUAD (Lung Adenocarcinoma) cohorts, followed by the analysis of the genomic alterations, and application of neural networks using as input the frequently mutated genes for each cohort, selection of key genes and validation with another database. The cohorts showed differences in survival among themselves when subjected to the Kaplan-Meier method and the Log-Rank test. In the genomic analysis, all genes with a mutation frequency above 15% were selected, and 34 genes were found for LUAD and 32 for LUSC. The use of these genes as input in the constructed networks made it possible to generate the LUSC and LUAD networks with 100% accuracy, identifying, according to the mutations, the vital status of the patient. In addition, a LUSC network was also obtained using another LUSC-KR database as validation, which reached 99% accuracy. In this way, this work showed that the use of genes with frequent mutations associated with deep learning is a robust tool and allows predicting the survival of patients with lung cancer.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESUniversidade Federal do Rio Grande do NortePROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICAUFRNBrasilCâncer de pulmãoAprendizado profundoDados genômicosAssinatura gênicaSobrevidaO uso de redes neurais artificiais na análise de dados de câncer de pulmãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALUsoredesneurais_Lima_2022.pdfapplication/pdf2369086https://repositorio.ufrn.br/bitstream/123456789/48470/1/Usoredesneurais_Lima_2022.pdf1136bbaf78dc1c93ba2eaf5e1f80055fMD51123456789/484702022-07-12 19:54:01.22oai:https://repositorio.ufrn.br:123456789/48470Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2022-07-12T22:54:01Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
O uso de redes neurais artificiais na análise de dados de câncer de pulmão |
title |
O uso de redes neurais artificiais na análise de dados de câncer de pulmão |
spellingShingle |
O uso de redes neurais artificiais na análise de dados de câncer de pulmão Lima, Débora Virgínia da Costa e Câncer de pulmão Aprendizado profundo Dados genômicos Assinatura gênica Sobrevida |
title_short |
O uso de redes neurais artificiais na análise de dados de câncer de pulmão |
title_full |
O uso de redes neurais artificiais na análise de dados de câncer de pulmão |
title_fullStr |
O uso de redes neurais artificiais na análise de dados de câncer de pulmão |
title_full_unstemmed |
O uso de redes neurais artificiais na análise de dados de câncer de pulmão |
title_sort |
O uso de redes neurais artificiais na análise de dados de câncer de pulmão |
author |
Lima, Débora Virgínia da Costa e |
author_facet |
Lima, Débora Virgínia da Costa e |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/4705169857699631 |
dc.contributor.advisorID.pt_BR.fl_str_mv |
https://orcid.org/0000-0002-5445-7327 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/1987295209521433 |
dc.contributor.referees1.none.fl_str_mv |
Torres, Taffarel Melo |
dc.contributor.referees2.none.fl_str_mv |
Sakamoto, Tetsu |
dc.contributor.author.fl_str_mv |
Lima, Débora Virgínia da Costa e |
dc.contributor.advisor-co1.fl_str_mv |
Ferreira, Beatriz Stransky |
dc.contributor.advisor-co1ID.fl_str_mv |
https://orcid.org/0000-0003-4506-393X |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/3142264445097872 |
dc.contributor.advisor1.fl_str_mv |
Doria Neto, Adrião Duarte |
contributor_str_mv |
Ferreira, Beatriz Stransky Doria Neto, Adrião Duarte |
dc.subject.por.fl_str_mv |
Câncer de pulmão Aprendizado profundo Dados genômicos Assinatura gênica Sobrevida |
topic |
Câncer de pulmão Aprendizado profundo Dados genômicos Assinatura gênica Sobrevida |
description |
O câncer de pulmão representa a principal causa de morte com câncer no mundo, e possui altos níveis de incidência. Assim como outros tipos de câncer, pode ocorrer por diversas causas, de genéticas à ambientais, por isso estudos realizados a partir de diferentes tipos de dados podem ser relevantes para o controle dessa neoplasia, especialmente quando considerados fatores que têm impacto na sobrevivência dos pacientes. No contexto do câncer de pulmão, esse estudo foi desenvolvido para utilizar deep learning a fim de prever a sobrevivência de pacientes. Para tanto foram obtidos dados clínicos e moleculares presentes em bancos de dados do TCGA (The Cancer Genome Atlas) referentes às coortes LUSC (Carcinoma de Células Escamosas do Pulmão) e LUAD (Adenocarcinoma do pulmão), seguido da análise das alterações genômicas, e aplicação de redes neurais usando como entrada os genes frequentemente mutados para cada coorte, seleção de genes chave e validação com outro banco de dados. As coortes apresentaram diferenças na sobrevida entre si quando submetidas ao método de Kaplan-Meier e ao teste Log-Rank. Na análise genômica, foram selecionados todos os genes com frequência de mutação superior a 15%, sendo encontrados 34 genes para LUAD e 32 para LUSC. A utilização desses genes como entrada nas redes construídas possibilitou a geração das redes LUSC e LUAD com 100% de acurácia, identificando, de acordo com as mutações, o status vital do paciente. Além disso, foi obtida também uma rede LUSC usando como validação um outro banco de dados o LUSC-KR que alcançou 99% de acurácia. Desta forma, este trabalho mostrou que a utilização de genes com mutações frequentes associadas ao uso de deep learning é uma ferramenta robusta e permite predizer a sobrevida de pacientes com câncer de pulmão. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-07-12T22:53:24Z |
dc.date.available.fl_str_mv |
2022-07-12T22:53:24Z |
dc.date.issued.fl_str_mv |
2022-05-12 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
LIMA, Débora Virgínia da Costa e. O uso de redes neurais artificiais na análise de dados de câncer de pulmão. 2022. 76f. Dissertação (Mestrado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/handle/123456789/48470 |
identifier_str_mv |
LIMA, Débora Virgínia da Costa e. O uso de redes neurais artificiais na análise de dados de câncer de pulmão. 2022. 76f. Dissertação (Mestrado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022. |
url |
https://repositorio.ufrn.br/handle/123456789/48470 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.publisher.program.fl_str_mv |
PROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICA |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/48470/1/Usoredesneurais_Lima_2022.pdf |
bitstream.checksum.fl_str_mv |
1136bbaf78dc1c93ba2eaf5e1f80055f |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1814832914194497536 |