Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama

Detalhes bibliográficos
Autor(a) principal: Vaz, Fernando Emílio da Cruz Ribeiro
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.2/10470
Resumo: Uma pesquisa realizada pela Agência Internacional de Pesquisa em Câncer (IARC) indica que o câncer de mama é um dos três tipos de maior incidência, e é o que mais atinge as mulheres a nível mundial, representando um sério problema de saúde pública com predomínio de diagnóstico em fase avançada da doença em países em desenvolvimento como Cabo Verde. Neste trabalho, foi feito um estudo quantitativo do câncer de mama com o objetivo de elaborar um modelo que possa auxiliar no diagnóstico de câncer de mama. Foi feito um apanhado das metodologias com ênfase nos estudos caso-controlo e nos modelos lineares generalizados (GLM), destacando o modelo de regressão logística e apresentando procedimentos computacionais, no âmbito de pesquisas relacionadas ao câncer de mama. O modelo de regressão logística é amplamente utilizado em estudos na área médica dada a sua flexibilidade e tipo de resultados, que podem ser interpretados de forma bastante prática, uma vez que, possibilita identificar fatores de risco para um desfecho da variável de interesse, desde que o modelo esteja bem ajustado. Para ilustrar o uso da regressão logística foi utilizado um banco de dados real com 116 pacientes do sexo feminino no âmbito de um estudo sobre o câncer de mama usando diversos biomarcadores antropométricos, obtidos por meio de análise ao sangue. Com isso, recorreu-se a técnicas de seleção de variáveis implementadas no R-Studio e no SPSS, seleção stepwise, para construir modelos que permitiram selecionar as variáveis que influenciam o sucesso no diagnóstico de câncer de mama. Para avaliar o desempenho do modelo construído recorreu-se à Curva ROC analisando a respetiva área. Este trabalho permitiu identificar que a Idade, o índice de massa corporal, o nível de glicose no sangue e a resistina são fatores de risco na previsão do câncer de mama. Os resultados indicaram que a presença do câncer de mama nas mulheres pode ser predito com uma chance de acerto de 77,6% e uma sensibilidade e especificidade de 75 e 79,7%, respetivamente.
id RCAP_a92ef51eaee20c8e208faed2bd9c410c
oai_identifier_str oai:repositorioaberto.uab.pt:10400.2/10470
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mamaCancro da mamaModelos lineares generalizadosRegressão logísticaBiomarcadoresPrevisãoBreast cancerGeneralized linear modelsLogistic regressionBiomarkersPredictionDomínio/Área Científica::Ciências Naturais::MatemáticasODS::04:Educação de QualidadeODS::05:Igualdade de GéneroODS::09:Indústria, Inovação e InfraestruturasUma pesquisa realizada pela Agência Internacional de Pesquisa em Câncer (IARC) indica que o câncer de mama é um dos três tipos de maior incidência, e é o que mais atinge as mulheres a nível mundial, representando um sério problema de saúde pública com predomínio de diagnóstico em fase avançada da doença em países em desenvolvimento como Cabo Verde. Neste trabalho, foi feito um estudo quantitativo do câncer de mama com o objetivo de elaborar um modelo que possa auxiliar no diagnóstico de câncer de mama. Foi feito um apanhado das metodologias com ênfase nos estudos caso-controlo e nos modelos lineares generalizados (GLM), destacando o modelo de regressão logística e apresentando procedimentos computacionais, no âmbito de pesquisas relacionadas ao câncer de mama. O modelo de regressão logística é amplamente utilizado em estudos na área médica dada a sua flexibilidade e tipo de resultados, que podem ser interpretados de forma bastante prática, uma vez que, possibilita identificar fatores de risco para um desfecho da variável de interesse, desde que o modelo esteja bem ajustado. Para ilustrar o uso da regressão logística foi utilizado um banco de dados real com 116 pacientes do sexo feminino no âmbito de um estudo sobre o câncer de mama usando diversos biomarcadores antropométricos, obtidos por meio de análise ao sangue. Com isso, recorreu-se a técnicas de seleção de variáveis implementadas no R-Studio e no SPSS, seleção stepwise, para construir modelos que permitiram selecionar as variáveis que influenciam o sucesso no diagnóstico de câncer de mama. Para avaliar o desempenho do modelo construído recorreu-se à Curva ROC analisando a respetiva área. Este trabalho permitiu identificar que a Idade, o índice de massa corporal, o nível de glicose no sangue e a resistina são fatores de risco na previsão do câncer de mama. Os resultados indicaram que a presença do câncer de mama nas mulheres pode ser predito com uma chance de acerto de 77,6% e uma sensibilidade e especificidade de 75 e 79,7%, respetivamente.Research carried out by the International Agency for Research on Cancer (IARC) indicates that breast cancer is one of the three types with the highest incidence, and is the one that most affects women worldwide, representing a serious public health problem with a prevalence of diagnosed at an advanced stage of disease in developing countries like Cabo Verde. In this work, was performed a quantitative study of breast cancer in order to elaborate a model that may help in the diagnosis of breast cancer. An overview of the methodologies was made with an emphasis on case-control studies and generalized linear models (GLM), highlighting logistic regression presenting computational procedures, in the scope of research related to breast cancer. Logistic regression is growingly linked to the medical field, as it aims to predict risk factors for an outcome of the variable of interest, as long as the model is well adjusted. To illustrate the use of logistic regression, a real database with 116 female patients was used as part of a study on breast cancer using several anthropometric biomarkers, obtained through blood analysis. Stepwise technique for variable selection were implemented in R-Studio and SPSS, in order to build significant prediction models. To assess the performance of the built model, the ROC Curve was used to analyze the respective area. This work allows us to find that Age, BMI, blood Glucose level and Resistin are risk factors in predicting breast cancer. It was concluded that the presence of breast cancer in women can be predicted with a chance of success of 77.6% and a sensitivity and specificity of 75 and 79.7%, respectively.Ramos, Maria do RosárioRepositório AbertoVaz, Fernando Emílio da Cruz Ribeiro2021-02-09T15:25:32Z2020-12-222021-02-092020-12-22T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.2/10470TID:202652661porVaz, Fernando Emílio da Cruz Ribeiro - Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama [Em linha]. [S.l.]: [s.n.], 2020. 147 p.info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-16T15:35:36Zoai:repositorioaberto.uab.pt:10400.2/10470Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:50:03.119233Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama
title Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama
spellingShingle Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama
Vaz, Fernando Emílio da Cruz Ribeiro
Cancro da mama
Modelos lineares generalizados
Regressão logística
Biomarcadores
Previsão
Breast cancer
Generalized linear models
Logistic regression
Biomarkers
Prediction
Domínio/Área Científica::Ciências Naturais::Matemáticas
ODS::04:Educação de Qualidade
ODS::05:Igualdade de Género
ODS::09:Indústria, Inovação e Infraestruturas
title_short Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama
title_full Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama
title_fullStr Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama
title_full_unstemmed Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama
title_sort Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama
author Vaz, Fernando Emílio da Cruz Ribeiro
author_facet Vaz, Fernando Emílio da Cruz Ribeiro
author_role author
dc.contributor.none.fl_str_mv Ramos, Maria do Rosário
Repositório Aberto
dc.contributor.author.fl_str_mv Vaz, Fernando Emílio da Cruz Ribeiro
dc.subject.por.fl_str_mv Cancro da mama
Modelos lineares generalizados
Regressão logística
Biomarcadores
Previsão
Breast cancer
Generalized linear models
Logistic regression
Biomarkers
Prediction
Domínio/Área Científica::Ciências Naturais::Matemáticas
ODS::04:Educação de Qualidade
ODS::05:Igualdade de Género
ODS::09:Indústria, Inovação e Infraestruturas
topic Cancro da mama
Modelos lineares generalizados
Regressão logística
Biomarcadores
Previsão
Breast cancer
Generalized linear models
Logistic regression
Biomarkers
Prediction
Domínio/Área Científica::Ciências Naturais::Matemáticas
ODS::04:Educação de Qualidade
ODS::05:Igualdade de Género
ODS::09:Indústria, Inovação e Infraestruturas
description Uma pesquisa realizada pela Agência Internacional de Pesquisa em Câncer (IARC) indica que o câncer de mama é um dos três tipos de maior incidência, e é o que mais atinge as mulheres a nível mundial, representando um sério problema de saúde pública com predomínio de diagnóstico em fase avançada da doença em países em desenvolvimento como Cabo Verde. Neste trabalho, foi feito um estudo quantitativo do câncer de mama com o objetivo de elaborar um modelo que possa auxiliar no diagnóstico de câncer de mama. Foi feito um apanhado das metodologias com ênfase nos estudos caso-controlo e nos modelos lineares generalizados (GLM), destacando o modelo de regressão logística e apresentando procedimentos computacionais, no âmbito de pesquisas relacionadas ao câncer de mama. O modelo de regressão logística é amplamente utilizado em estudos na área médica dada a sua flexibilidade e tipo de resultados, que podem ser interpretados de forma bastante prática, uma vez que, possibilita identificar fatores de risco para um desfecho da variável de interesse, desde que o modelo esteja bem ajustado. Para ilustrar o uso da regressão logística foi utilizado um banco de dados real com 116 pacientes do sexo feminino no âmbito de um estudo sobre o câncer de mama usando diversos biomarcadores antropométricos, obtidos por meio de análise ao sangue. Com isso, recorreu-se a técnicas de seleção de variáveis implementadas no R-Studio e no SPSS, seleção stepwise, para construir modelos que permitiram selecionar as variáveis que influenciam o sucesso no diagnóstico de câncer de mama. Para avaliar o desempenho do modelo construído recorreu-se à Curva ROC analisando a respetiva área. Este trabalho permitiu identificar que a Idade, o índice de massa corporal, o nível de glicose no sangue e a resistina são fatores de risco na previsão do câncer de mama. Os resultados indicaram que a presença do câncer de mama nas mulheres pode ser predito com uma chance de acerto de 77,6% e uma sensibilidade e especificidade de 75 e 79,7%, respetivamente.
publishDate 2020
dc.date.none.fl_str_mv 2020-12-22
2020-12-22T00:00:00Z
2021-02-09T15:25:32Z
2021-02-09
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.2/10470
TID:202652661
url http://hdl.handle.net/10400.2/10470
identifier_str_mv TID:202652661
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv Vaz, Fernando Emílio da Cruz Ribeiro - Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama [Em linha]. [S.l.]: [s.n.], 2020. 147 p.
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799135086964113408