Análise de padrões em casos de risco de suicídio utilizando aprendizado de máquina

Detalhes bibliográficos
Autor(a) principal: Godoy, Lucas Verdade
Data de Publicação: 2022
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/237977
Resumo: TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação.
id UFSC_511842b64254b72d64a513f85d57def9
oai_identifier_str oai:repositorio.ufsc.br:123456789/237977
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Análise de padrões em casos de risco de suicídio utilizando aprendizado de máquinaaprendizado de máquinaanálise de dadosclusteringsuicídioTCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação.Mortes por suicídio são um fenômeno global que tira a vida de cerca de 800 mil pessoas por ano. Atualmente, a avaliação do risco de suicídio é feita clinicamente e existem múltiplos fatores, externos e internos, que resultam em um risco alto. A literatura aponta um crescimento no uso de técnicas de Inteligência Artificial (IA) para apoiar profissionais da saúde que atuam na área. Levando-se isso em consideração, este trabalho propõe uma solução com mineração de dados, algoritmos de aprendizado de máquina para agrupamento de dados e algoritmo de árvore de decisão para encontrar padrões em perfis de indivíduos que cometeram suicídio. O processo de mineração de dados envolve etapas de agregação de dados de diferentes fontes, como do Sistema de Informação sobre Mortalidade (SIM) do DATASUS, da Classificação Brasileira de Ocupações (CBO-2002), da Classificação Internacional de Doenças (CID10) e de metadados dos municípios. Em seguida, o processo passa pela etapa de limpeza, transformação e de engenharia de atributos. Então, os dados são utilizados nos algoritmos de aprendizado de máquina, como o \textit{K-Prototypes}, com o propósito de criar grupos similares de indivíduos. Os resultados dos agrupamentos são analisados visualmente por meio de técnicas de visualização de dados e de um modelo de árvore de decisão gerado a partir dos agrupamentos. O resultado das análises feitas levou a uma melhor compreensão dos perfis dos indivíduos. Para fins de validação, os resultados dos agrupamentos são comparados com a literatura. Com isso, chegou-se a dois principais perfis: o agrupamento de indivíduos do sexo feminino e o agrupamento dos indivíduos com ocupações relacionadas à agricultura. Isso indica que os padrões obtidos pelos agrupamentos estão alinhados com aqueles encontrados na literatura. Espera-se que este trabalho contribua com os estudos na área da saúde que utilizam de técnicas de mineração de dados e aprendizado de máquina para se obter mais informações do fenômeno de suicídio no Brasil visando a criar políticas públicas de prevenção e visibilidade para esse problema.Deaths by suicide are a global phenomenon that takes the lives of nearly 800,000 people a year. Nowadays, suicide risk assessment is done clinically, and there are multiple factors, external and internal, that result in a high risk. The literature in the area shows an increasing use of Artificial Intelligence (AI) techniques to support health professionals working in the area. Taking that into consideration, this work proposes a solution using data mining, machine learning algorithms for data clustering and decision tree algorithm to find patterns in profiles of individuals who committed suicide. The data mining process involves data aggregation steps from different sources, such as the DATASUS Mortality Information System (SIM), the Brazilian Classification of Occupations (CBO-2002), the International Classification of Diseases (ICD10) and municipal metadata. After that, the process goes through the stage of cleaning, transformation and attribute engineering. Then the data is used in machine learning algorithms such as K-Prototypes for creating similar groups of individuals. The cluster results are visually analyzed using data visualization techniques and a decision tree model generated from the clusters. The result of the analysis carried out led to a better understanding of the profiles of individuals. For validation purposes, the clustering results are compared with the literature in the area. With that, two main profiles were found: the grouping of female individuals and the grouping of individuals with occupations related to agriculture. This indicates that the patterns obtained by the clusters are in line with those found in the literature. It is expected that this work contributes to studies in the health area that use data mining and machine learning techniques to obtain more information on the phenomenon of suicide in Brazil, in order to create public policies to prevent and give visibility to this problem.Florianópolis, SC.Silva, Mateus Grellert daCarvalho, Jônata TyskaUniversidade Federal de Santa CatarinaGodoy, Lucas Verdade2022-08-05T23:14:37Z2022-08-05T23:14:37Z2022-07-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis112application/pdfhttps://repositorio.ufsc.br/handle/123456789/237977info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSC2022-08-05T23:14:38Zoai:repositorio.ufsc.br:123456789/237977Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732022-08-05T23:14:38Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Análise de padrões em casos de risco de suicídio utilizando aprendizado de máquina
title Análise de padrões em casos de risco de suicídio utilizando aprendizado de máquina
spellingShingle Análise de padrões em casos de risco de suicídio utilizando aprendizado de máquina
Godoy, Lucas Verdade
aprendizado de máquina
análise de dados
clustering
suicídio
title_short Análise de padrões em casos de risco de suicídio utilizando aprendizado de máquina
title_full Análise de padrões em casos de risco de suicídio utilizando aprendizado de máquina
title_fullStr Análise de padrões em casos de risco de suicídio utilizando aprendizado de máquina
title_full_unstemmed Análise de padrões em casos de risco de suicídio utilizando aprendizado de máquina
title_sort Análise de padrões em casos de risco de suicídio utilizando aprendizado de máquina
author Godoy, Lucas Verdade
author_facet Godoy, Lucas Verdade
author_role author
dc.contributor.none.fl_str_mv Silva, Mateus Grellert da
Carvalho, Jônata Tyska
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Godoy, Lucas Verdade
dc.subject.por.fl_str_mv aprendizado de máquina
análise de dados
clustering
suicídio
topic aprendizado de máquina
análise de dados
clustering
suicídio
description TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação.
publishDate 2022
dc.date.none.fl_str_mv 2022-08-05T23:14:37Z
2022-08-05T23:14:37Z
2022-07-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/237977
url https://repositorio.ufsc.br/handle/123456789/237977
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 112
application/pdf
dc.publisher.none.fl_str_mv Florianópolis, SC.
publisher.none.fl_str_mv Florianópolis, SC.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808652386059681792