DAC Stacking : Comitê de redes profundas para classificação de ansiedade, depressão e comorbidade

Detalhes bibliográficos
Autor(a) principal: Souza, Vanessa Borba de
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/217568
Resumo: A depressão tornou-se um problema de saúde pública mundial, que atinge cerca de 322 milhões de pessoas no mundo, a um custo aproximado de $2,5 trilhões de dólares. A taxa de comorbidade de depressão com ansiedade também é alta, acentuando o quadro clínico de indivíduos deprimidos. A identificação precoce desses distúrbios é um fator crítico para a triagem correta e a decisão apropriada sobre as linhas de tratamento adequadas. O uso das redes sociais como forma de os indivíduos exporem suas dificuldades anonimamente permitiu a ampliação de estudos em saúde mental com o apoio da área computacional. Trabalhos relacionados abordam a identificação automática de condições mentais específicas, com foco na depressão. O presente trabalho expande essas contribuições, propondo um classificador ensemble para a identificação automática de depressão, ansiedade e a comorbidade dessas desordens, utilizando um conjunto de dados de autodiagnóstico extraído da rede social Reddit. O uso do método ensemble visa superar as dificuldades de lidar com o problema de classificação multirrótulo envolvidas no cenário de comorbidade, onde os padrões distintos podem ser mais difíceis de identificar. O nível mais baixo ensemble é composto de classificadores fracos que geram previsões binárias de rótulo único em condições de treinamento específicas e que seguem uma arquitetura de aprendizado profundo. Para o nível meta-learning, uma rede neural densa explora esses classificadores fracos como um contexto para se chegar a uma decisão com vários rótulos. Um extenso conjunto de experimentos usando as arquiteturas de aprendizado profundo LSTM, CNN e sua combinação, word embeddings e topologias ensemble foi desenvolvido. Todos os classificadores fracos e o modelo ensemble superaram as linhas de base. Os classificadores binários baseados na CNN obtiveram o melhor desempenho, com medidas F de 0,79 para depressão, 0,78 para ansiedade e 0,78 para comorbidade. A topologia do conjunto que obteve o melhor desempenho (perda de Hamming de 0,27 e taxa de correspondência exata de 0,47) combina classificadores fracos de acordo com três arquiteturas e não inclui classificadores de comorbidade. Também realizamos uma análise qualitativa usando SHAP, e confirmamos que as características influentes estão relacionadas aos sintomas desses distúrbios.
id URGS_e5305407cb1a9bc480bbe104a7acfef5
oai_identifier_str oai:www.lume.ufrgs.br:10183/217568
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Souza, Vanessa Borba deBecker, Karin2021-01-28T04:01:49Z2020http://hdl.handle.net/10183/217568001121922A depressão tornou-se um problema de saúde pública mundial, que atinge cerca de 322 milhões de pessoas no mundo, a um custo aproximado de $2,5 trilhões de dólares. A taxa de comorbidade de depressão com ansiedade também é alta, acentuando o quadro clínico de indivíduos deprimidos. A identificação precoce desses distúrbios é um fator crítico para a triagem correta e a decisão apropriada sobre as linhas de tratamento adequadas. O uso das redes sociais como forma de os indivíduos exporem suas dificuldades anonimamente permitiu a ampliação de estudos em saúde mental com o apoio da área computacional. Trabalhos relacionados abordam a identificação automática de condições mentais específicas, com foco na depressão. O presente trabalho expande essas contribuições, propondo um classificador ensemble para a identificação automática de depressão, ansiedade e a comorbidade dessas desordens, utilizando um conjunto de dados de autodiagnóstico extraído da rede social Reddit. O uso do método ensemble visa superar as dificuldades de lidar com o problema de classificação multirrótulo envolvidas no cenário de comorbidade, onde os padrões distintos podem ser mais difíceis de identificar. O nível mais baixo ensemble é composto de classificadores fracos que geram previsões binárias de rótulo único em condições de treinamento específicas e que seguem uma arquitetura de aprendizado profundo. Para o nível meta-learning, uma rede neural densa explora esses classificadores fracos como um contexto para se chegar a uma decisão com vários rótulos. Um extenso conjunto de experimentos usando as arquiteturas de aprendizado profundo LSTM, CNN e sua combinação, word embeddings e topologias ensemble foi desenvolvido. Todos os classificadores fracos e o modelo ensemble superaram as linhas de base. Os classificadores binários baseados na CNN obtiveram o melhor desempenho, com medidas F de 0,79 para depressão, 0,78 para ansiedade e 0,78 para comorbidade. A topologia do conjunto que obteve o melhor desempenho (perda de Hamming de 0,27 e taxa de correspondência exata de 0,47) combina classificadores fracos de acordo com três arquiteturas e não inclui classificadores de comorbidade. Também realizamos uma análise qualitativa usando SHAP, e confirmamos que as características influentes estão relacionadas aos sintomas desses distúrbios.Depression has become a worldwide public health problem, affecting approximately 322 million people worldwide. The comorbidity rate of depression with anxiety is also high, accentuating the clinical picture of depressed individuals. The early identification of these disorders is a critical factor for the correct screening and appropriate decision on the proper lines of treatment. The use of social networks as a means for individuals to expose their difficulties anonymously allowed the expansion of studies in mental health with the support of the computational area. Related works address the automatic identification of specific mental conditions, with a focus on depression. The present work expands these contributions by proposing an ensemble classifier for the automatic identification of depression, anxiety, as well as the comorbidity, using a self-diagnosed dataset extracted from Reddit. The use of a stacking ensemble aims to overcome the difficulties of dealing with the multi-class, multi-label classification problem involved in the scenario of comorbidity, where the distinctive patterns may be harder to identify. The stacking is composed of specialized single label binary classifiers that distinguish between specific disorders and control users. A meta-learner explores these weak classifiers as a context for reaching a multi-label, multi-class decision. We developed extensive experiments using alternative architectures (LSTM, CNN, and their combination), word embeddings, and ensemble topologies. All weak classifiers and ensembles outperformed the baselines. The CNN-based binary classifiers achieved the best performance, with f-measures of 0.79 for depression, 0.78 for anxiety, and 0.78 for comorbidity. The ensemble topology that achieved the best performance (Hamming Loss of 0.27 and Exact Match Ratio of 0.47) combines weak classifiers according to three architectures, and do not include comorbidity classifiers. We also performed a qualitative analysis using SHAP, and confirmed the influential features are related to symptoms of these disorders.application/pdfengAprendizado profundoRedes sociaisSaúde mentalProcessamento de linguagem naturalAnsiedadeDepressãoComorbidadeEnsembleWord embeddingsDAC Stacking : Comitê de redes profundas para classificação de ansiedade, depressão e comorbidadeA deep learning ensemble to classify anxiety, depression, and their comorbidity from texts of social networks info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2020mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001121922.pdf.txt001121922.pdf.txtExtracted Texttext/plain337177http://www.lume.ufrgs.br/bitstream/10183/217568/2/001121922.pdf.txtdec5d6e3a409a0a10a6b1d896a52ba9aMD52ORIGINAL001121922.pdfTexto completoapplication/pdf2225322http://www.lume.ufrgs.br/bitstream/10183/217568/1/001121922.pdfda95ed30ab04bcb23cf90a7cb0352e5eMD5110183/2175682024-06-16 06:45:18.13439oai:www.lume.ufrgs.br:10183/217568Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532024-06-16T09:45:18Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv DAC Stacking : Comitê de redes profundas para classificação de ansiedade, depressão e comorbidade
dc.title.alternative.en.fl_str_mv A deep learning ensemble to classify anxiety, depression, and their comorbidity from texts of social networks
title DAC Stacking : Comitê de redes profundas para classificação de ansiedade, depressão e comorbidade
spellingShingle DAC Stacking : Comitê de redes profundas para classificação de ansiedade, depressão e comorbidade
Souza, Vanessa Borba de
Aprendizado profundo
Redes sociais
Saúde mental
Processamento de linguagem natural
Ansiedade
Depressão
Comorbidade
Ensemble
Word embeddings
title_short DAC Stacking : Comitê de redes profundas para classificação de ansiedade, depressão e comorbidade
title_full DAC Stacking : Comitê de redes profundas para classificação de ansiedade, depressão e comorbidade
title_fullStr DAC Stacking : Comitê de redes profundas para classificação de ansiedade, depressão e comorbidade
title_full_unstemmed DAC Stacking : Comitê de redes profundas para classificação de ansiedade, depressão e comorbidade
title_sort DAC Stacking : Comitê de redes profundas para classificação de ansiedade, depressão e comorbidade
author Souza, Vanessa Borba de
author_facet Souza, Vanessa Borba de
author_role author
dc.contributor.author.fl_str_mv Souza, Vanessa Borba de
dc.contributor.advisor1.fl_str_mv Becker, Karin
contributor_str_mv Becker, Karin
dc.subject.por.fl_str_mv Aprendizado profundo
Redes sociais
Saúde mental
Processamento de linguagem natural
Ansiedade
Depressão
Comorbidade
topic Aprendizado profundo
Redes sociais
Saúde mental
Processamento de linguagem natural
Ansiedade
Depressão
Comorbidade
Ensemble
Word embeddings
dc.subject.eng.fl_str_mv Ensemble
Word embeddings
description A depressão tornou-se um problema de saúde pública mundial, que atinge cerca de 322 milhões de pessoas no mundo, a um custo aproximado de $2,5 trilhões de dólares. A taxa de comorbidade de depressão com ansiedade também é alta, acentuando o quadro clínico de indivíduos deprimidos. A identificação precoce desses distúrbios é um fator crítico para a triagem correta e a decisão apropriada sobre as linhas de tratamento adequadas. O uso das redes sociais como forma de os indivíduos exporem suas dificuldades anonimamente permitiu a ampliação de estudos em saúde mental com o apoio da área computacional. Trabalhos relacionados abordam a identificação automática de condições mentais específicas, com foco na depressão. O presente trabalho expande essas contribuições, propondo um classificador ensemble para a identificação automática de depressão, ansiedade e a comorbidade dessas desordens, utilizando um conjunto de dados de autodiagnóstico extraído da rede social Reddit. O uso do método ensemble visa superar as dificuldades de lidar com o problema de classificação multirrótulo envolvidas no cenário de comorbidade, onde os padrões distintos podem ser mais difíceis de identificar. O nível mais baixo ensemble é composto de classificadores fracos que geram previsões binárias de rótulo único em condições de treinamento específicas e que seguem uma arquitetura de aprendizado profundo. Para o nível meta-learning, uma rede neural densa explora esses classificadores fracos como um contexto para se chegar a uma decisão com vários rótulos. Um extenso conjunto de experimentos usando as arquiteturas de aprendizado profundo LSTM, CNN e sua combinação, word embeddings e topologias ensemble foi desenvolvido. Todos os classificadores fracos e o modelo ensemble superaram as linhas de base. Os classificadores binários baseados na CNN obtiveram o melhor desempenho, com medidas F de 0,79 para depressão, 0,78 para ansiedade e 0,78 para comorbidade. A topologia do conjunto que obteve o melhor desempenho (perda de Hamming de 0,27 e taxa de correspondência exata de 0,47) combina classificadores fracos de acordo com três arquiteturas e não inclui classificadores de comorbidade. Também realizamos uma análise qualitativa usando SHAP, e confirmamos que as características influentes estão relacionadas aos sintomas desses distúrbios.
publishDate 2020
dc.date.issued.fl_str_mv 2020
dc.date.accessioned.fl_str_mv 2021-01-28T04:01:49Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/217568
dc.identifier.nrb.pt_BR.fl_str_mv 001121922
url http://hdl.handle.net/10183/217568
identifier_str_mv 001121922
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/217568/2/001121922.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/217568/1/001121922.pdf
bitstream.checksum.fl_str_mv dec5d6e3a409a0a10a6b1d896a52ba9a
da95ed30ab04bcb23cf90a7cb0352e5e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085542145032192