Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.2/10470 |
Resumo: | Uma pesquisa realizada pela Agência Internacional de Pesquisa em Câncer (IARC) indica que o câncer de mama é um dos três tipos de maior incidência, e é o que mais atinge as mulheres a nível mundial, representando um sério problema de saúde pública com predomínio de diagnóstico em fase avançada da doença em países em desenvolvimento como Cabo Verde. Neste trabalho, foi feito um estudo quantitativo do câncer de mama com o objetivo de elaborar um modelo que possa auxiliar no diagnóstico de câncer de mama. Foi feito um apanhado das metodologias com ênfase nos estudos caso-controlo e nos modelos lineares generalizados (GLM), destacando o modelo de regressão logística e apresentando procedimentos computacionais, no âmbito de pesquisas relacionadas ao câncer de mama. O modelo de regressão logística é amplamente utilizado em estudos na área médica dada a sua flexibilidade e tipo de resultados, que podem ser interpretados de forma bastante prática, uma vez que, possibilita identificar fatores de risco para um desfecho da variável de interesse, desde que o modelo esteja bem ajustado. Para ilustrar o uso da regressão logística foi utilizado um banco de dados real com 116 pacientes do sexo feminino no âmbito de um estudo sobre o câncer de mama usando diversos biomarcadores antropométricos, obtidos por meio de análise ao sangue. Com isso, recorreu-se a técnicas de seleção de variáveis implementadas no R-Studio e no SPSS, seleção stepwise, para construir modelos que permitiram selecionar as variáveis que influenciam o sucesso no diagnóstico de câncer de mama. Para avaliar o desempenho do modelo construído recorreu-se à Curva ROC analisando a respetiva área. Este trabalho permitiu identificar que a Idade, o índice de massa corporal, o nível de glicose no sangue e a resistina são fatores de risco na previsão do câncer de mama. Os resultados indicaram que a presença do câncer de mama nas mulheres pode ser predito com uma chance de acerto de 77,6% e uma sensibilidade e especificidade de 75 e 79,7%, respetivamente. |
id |
RCAP_a92ef51eaee20c8e208faed2bd9c410c |
---|---|
oai_identifier_str |
oai:repositorioaberto.uab.pt:10400.2/10470 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mamaCancro da mamaModelos lineares generalizadosRegressão logísticaBiomarcadoresPrevisãoBreast cancerGeneralized linear modelsLogistic regressionBiomarkersPredictionDomínio/Área Científica::Ciências Naturais::MatemáticasODS::04:Educação de QualidadeODS::05:Igualdade de GéneroODS::09:Indústria, Inovação e InfraestruturasUma pesquisa realizada pela Agência Internacional de Pesquisa em Câncer (IARC) indica que o câncer de mama é um dos três tipos de maior incidência, e é o que mais atinge as mulheres a nível mundial, representando um sério problema de saúde pública com predomínio de diagnóstico em fase avançada da doença em países em desenvolvimento como Cabo Verde. Neste trabalho, foi feito um estudo quantitativo do câncer de mama com o objetivo de elaborar um modelo que possa auxiliar no diagnóstico de câncer de mama. Foi feito um apanhado das metodologias com ênfase nos estudos caso-controlo e nos modelos lineares generalizados (GLM), destacando o modelo de regressão logística e apresentando procedimentos computacionais, no âmbito de pesquisas relacionadas ao câncer de mama. O modelo de regressão logística é amplamente utilizado em estudos na área médica dada a sua flexibilidade e tipo de resultados, que podem ser interpretados de forma bastante prática, uma vez que, possibilita identificar fatores de risco para um desfecho da variável de interesse, desde que o modelo esteja bem ajustado. Para ilustrar o uso da regressão logística foi utilizado um banco de dados real com 116 pacientes do sexo feminino no âmbito de um estudo sobre o câncer de mama usando diversos biomarcadores antropométricos, obtidos por meio de análise ao sangue. Com isso, recorreu-se a técnicas de seleção de variáveis implementadas no R-Studio e no SPSS, seleção stepwise, para construir modelos que permitiram selecionar as variáveis que influenciam o sucesso no diagnóstico de câncer de mama. Para avaliar o desempenho do modelo construído recorreu-se à Curva ROC analisando a respetiva área. Este trabalho permitiu identificar que a Idade, o índice de massa corporal, o nível de glicose no sangue e a resistina são fatores de risco na previsão do câncer de mama. Os resultados indicaram que a presença do câncer de mama nas mulheres pode ser predito com uma chance de acerto de 77,6% e uma sensibilidade e especificidade de 75 e 79,7%, respetivamente.Research carried out by the International Agency for Research on Cancer (IARC) indicates that breast cancer is one of the three types with the highest incidence, and is the one that most affects women worldwide, representing a serious public health problem with a prevalence of diagnosed at an advanced stage of disease in developing countries like Cabo Verde. In this work, was performed a quantitative study of breast cancer in order to elaborate a model that may help in the diagnosis of breast cancer. An overview of the methodologies was made with an emphasis on case-control studies and generalized linear models (GLM), highlighting logistic regression presenting computational procedures, in the scope of research related to breast cancer. Logistic regression is growingly linked to the medical field, as it aims to predict risk factors for an outcome of the variable of interest, as long as the model is well adjusted. To illustrate the use of logistic regression, a real database with 116 female patients was used as part of a study on breast cancer using several anthropometric biomarkers, obtained through blood analysis. Stepwise technique for variable selection were implemented in R-Studio and SPSS, in order to build significant prediction models. To assess the performance of the built model, the ROC Curve was used to analyze the respective area. This work allows us to find that Age, BMI, blood Glucose level and Resistin are risk factors in predicting breast cancer. It was concluded that the presence of breast cancer in women can be predicted with a chance of success of 77.6% and a sensitivity and specificity of 75 and 79.7%, respectively.Ramos, Maria do RosárioRepositório AbertoVaz, Fernando Emílio da Cruz Ribeiro2021-02-09T15:25:32Z2020-12-222021-02-092020-12-22T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.2/10470TID:202652661porVaz, Fernando Emílio da Cruz Ribeiro - Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama [Em linha]. [S.l.]: [s.n.], 2020. 147 p.info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-16T15:35:36Zoai:repositorioaberto.uab.pt:10400.2/10470Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:50:03.119233Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama |
title |
Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama |
spellingShingle |
Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama Vaz, Fernando Emílio da Cruz Ribeiro Cancro da mama Modelos lineares generalizados Regressão logística Biomarcadores Previsão Breast cancer Generalized linear models Logistic regression Biomarkers Prediction Domínio/Área Científica::Ciências Naturais::Matemáticas ODS::04:Educação de Qualidade ODS::05:Igualdade de Género ODS::09:Indústria, Inovação e Infraestruturas |
title_short |
Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama |
title_full |
Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama |
title_fullStr |
Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama |
title_full_unstemmed |
Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama |
title_sort |
Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama |
author |
Vaz, Fernando Emílio da Cruz Ribeiro |
author_facet |
Vaz, Fernando Emílio da Cruz Ribeiro |
author_role |
author |
dc.contributor.none.fl_str_mv |
Ramos, Maria do Rosário Repositório Aberto |
dc.contributor.author.fl_str_mv |
Vaz, Fernando Emílio da Cruz Ribeiro |
dc.subject.por.fl_str_mv |
Cancro da mama Modelos lineares generalizados Regressão logística Biomarcadores Previsão Breast cancer Generalized linear models Logistic regression Biomarkers Prediction Domínio/Área Científica::Ciências Naturais::Matemáticas ODS::04:Educação de Qualidade ODS::05:Igualdade de Género ODS::09:Indústria, Inovação e Infraestruturas |
topic |
Cancro da mama Modelos lineares generalizados Regressão logística Biomarcadores Previsão Breast cancer Generalized linear models Logistic regression Biomarkers Prediction Domínio/Área Científica::Ciências Naturais::Matemáticas ODS::04:Educação de Qualidade ODS::05:Igualdade de Género ODS::09:Indústria, Inovação e Infraestruturas |
description |
Uma pesquisa realizada pela Agência Internacional de Pesquisa em Câncer (IARC) indica que o câncer de mama é um dos três tipos de maior incidência, e é o que mais atinge as mulheres a nível mundial, representando um sério problema de saúde pública com predomínio de diagnóstico em fase avançada da doença em países em desenvolvimento como Cabo Verde. Neste trabalho, foi feito um estudo quantitativo do câncer de mama com o objetivo de elaborar um modelo que possa auxiliar no diagnóstico de câncer de mama. Foi feito um apanhado das metodologias com ênfase nos estudos caso-controlo e nos modelos lineares generalizados (GLM), destacando o modelo de regressão logística e apresentando procedimentos computacionais, no âmbito de pesquisas relacionadas ao câncer de mama. O modelo de regressão logística é amplamente utilizado em estudos na área médica dada a sua flexibilidade e tipo de resultados, que podem ser interpretados de forma bastante prática, uma vez que, possibilita identificar fatores de risco para um desfecho da variável de interesse, desde que o modelo esteja bem ajustado. Para ilustrar o uso da regressão logística foi utilizado um banco de dados real com 116 pacientes do sexo feminino no âmbito de um estudo sobre o câncer de mama usando diversos biomarcadores antropométricos, obtidos por meio de análise ao sangue. Com isso, recorreu-se a técnicas de seleção de variáveis implementadas no R-Studio e no SPSS, seleção stepwise, para construir modelos que permitiram selecionar as variáveis que influenciam o sucesso no diagnóstico de câncer de mama. Para avaliar o desempenho do modelo construído recorreu-se à Curva ROC analisando a respetiva área. Este trabalho permitiu identificar que a Idade, o índice de massa corporal, o nível de glicose no sangue e a resistina são fatores de risco na previsão do câncer de mama. Os resultados indicaram que a presença do câncer de mama nas mulheres pode ser predito com uma chance de acerto de 77,6% e uma sensibilidade e especificidade de 75 e 79,7%, respetivamente. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-12-22 2020-12-22T00:00:00Z 2021-02-09T15:25:32Z 2021-02-09 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.2/10470 TID:202652661 |
url |
http://hdl.handle.net/10400.2/10470 |
identifier_str_mv |
TID:202652661 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
Vaz, Fernando Emílio da Cruz Ribeiro - Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mama [Em linha]. [S.l.]: [s.n.], 2020. 147 p. |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799135086964113408 |