Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida

Detalhes bibliográficos
Autor(a) principal: Kacuta, Stephanie Luri
Data de Publicação: 2021
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/27606
Resumo: A ideação suicida é uma questão de extrema importância que afeta todas as raças e países. Atualmente, há lacunas de estudos de aplicação da metodologia KDD relacionando à influência da toxicodependência na ideação suicida. O seguinte trabalho tem como objetivo a descoberta de conhecimento em dados utilizando técnicas para a predição de ideação suicida. Para o aprendizado de máquina aplicaram-se as técnicas de classificação Árvore de Decisão e Floresta Aleatória, e para partição de dados, o método de kfold com 10 subconjuntos. A base de dados utilizada é uma base americana pertencente à Pesquisa Nacional sobre Uso de Drogas e Saúde (National Survey on Drug Use and Health NSDUH), foram exploradas 5.055 instâncias e 19 atributos pertencentes às dimensões demográficas, saúde mental e toxicodependência, dados do ano de 2019 e 2020. Três experimentos foram realizados, todos aplicando as duas técnicas de classificação a fim de analisar os diferentes comportamentos do modelo, alternando as dimensões dos atributos. O melhor desempenho foi encontrado no experimento 1 com o conjunto de dados contendo todas as dimensões, aplicando-se a técnica de Árvore de decisão, a qual apresentou 63,7% de acurácia, 55,2% de precisão e 49,1% de recall. Não foi possível observar uma influência considerável relacionada à toxicodependência no conjunto de dados. Em maior parte dos resultados dos experimentos, a técnica que teve melhor desempenho foi a Árvore de decisão. Porém, constatou-se que a porcentagem de predição correta ainda foi baixa, abrindo oportunidades para futuros trabalhos na área com a análise de novos parâmetros, técnicas e pré-processamento das informações que possam melhorar a predição.
id UTFPR-12_c08be6febdcd9aed74b60339d53413ec
oai_identifier_str oai:repositorio.utfpr.edu.br:1/27606
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2022-03-12T22:49:14Z2022-03-12T22:49:14Z2021-12-02KACUTA, Stephanie Luri. Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Produção) - Universidade Tecnológica Federal do Paraná, Londrina, 2021.http://repositorio.utfpr.edu.br/jspui/handle/1/27606A ideação suicida é uma questão de extrema importância que afeta todas as raças e países. Atualmente, há lacunas de estudos de aplicação da metodologia KDD relacionando à influência da toxicodependência na ideação suicida. O seguinte trabalho tem como objetivo a descoberta de conhecimento em dados utilizando técnicas para a predição de ideação suicida. Para o aprendizado de máquina aplicaram-se as técnicas de classificação Árvore de Decisão e Floresta Aleatória, e para partição de dados, o método de kfold com 10 subconjuntos. A base de dados utilizada é uma base americana pertencente à Pesquisa Nacional sobre Uso de Drogas e Saúde (National Survey on Drug Use and Health NSDUH), foram exploradas 5.055 instâncias e 19 atributos pertencentes às dimensões demográficas, saúde mental e toxicodependência, dados do ano de 2019 e 2020. Três experimentos foram realizados, todos aplicando as duas técnicas de classificação a fim de analisar os diferentes comportamentos do modelo, alternando as dimensões dos atributos. O melhor desempenho foi encontrado no experimento 1 com o conjunto de dados contendo todas as dimensões, aplicando-se a técnica de Árvore de decisão, a qual apresentou 63,7% de acurácia, 55,2% de precisão e 49,1% de recall. Não foi possível observar uma influência considerável relacionada à toxicodependência no conjunto de dados. Em maior parte dos resultados dos experimentos, a técnica que teve melhor desempenho foi a Árvore de decisão. Porém, constatou-se que a porcentagem de predição correta ainda foi baixa, abrindo oportunidades para futuros trabalhos na área com a análise de novos parâmetros, técnicas e pré-processamento das informações que possam melhorar a predição.Suicidal ideation is an extremely important issue that affects all races and countries. Currently, there are gaps in studies on the application of the KDD methodology relating to the influence of drug addiction on suicidal ideation. The following work aims to discover knowledge in data using techniques for the prediction of suicidal ideation. For machine learning, the Decision Tree and Random Forest classification techniques were applied, and for data partition, the kfold method with 10 subsets. The database used is an American database belonging to the National Survey on Drug Use and Health (NSDUH), 5,055 instances and 19 attributes belonging to the demographic dimensions, mental health and drug addiction were explored, data from the year 2019 and 2020. Three experiments were carried out, all applying the two classification techniques in order to analyze the different behaviors of the model, alternating the dimensions of the attributes. The best performance was found in experiment 1 with the dataset containing all dimensions, applying the Decision Tree technique, which showed 63.7% accuracy, 55.2% precision and 49.1% recall. It was not possible to observe a considerable influence related to drug addiction in the dataset. In the majority of the experiments results, the technique that performed best was the Decision Tree. However, it was found that the percentage of correct prediction was still low, opening up opportunities for future work in the area with the analysis of new parameters, techniques and preprocessing of information that can improve prediction.porUniversidade Tecnológica Federal do ParanáLondrinaEngenharia de ProduçãoUTFPRBrasilCNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAOMineração de dados (Computação)Vício em drogasComportamento suicidaData miningDrug addictionSuicidal behaviorUtilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicidaThe use of KDD methodology to discover knowledge in data related to drug dependence andsuicide ideationinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisLondrinaSantos, Bruno Samways dosSantos, Bruno Samways dosLima, Rafael Henrique PalmaAndrade, Pedro Rochavetz de LaraKacuta, Stephanie Luriinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRLICENSElicense.txtlicense.txttext/plain; charset=utf-81290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27606/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52ORIGINALkddtoxicodependenciaideacaosuicida.pdfkddtoxicodependenciaideacaosuicida.pdfapplication/pdf341753http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27606/1/kddtoxicodependenciaideacaosuicida.pdfd7600511f2f081f16ae64f2b28bf8fa0MD51TEXTkddtoxicodependenciaideacaosuicida.pdf.txtkddtoxicodependenciaideacaosuicida.pdf.txtExtracted texttext/plain84725http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27606/3/kddtoxicodependenciaideacaosuicida.pdf.txt3b588f8cb6963f53ac075d811f61a4acMD53THUMBNAILkddtoxicodependenciaideacaosuicida.pdf.jpgkddtoxicodependenciaideacaosuicida.pdf.jpgGenerated Thumbnailimage/jpeg1236http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27606/4/kddtoxicodependenciaideacaosuicida.pdf.jpg84785b6599b1f68a6f77d8cdf3df291aMD541/276062022-03-13 03:06:16.391oai:repositorio.utfpr.edu.br:1/27606TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2022-03-13T06:06:16Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida
dc.title.alternative.pt_BR.fl_str_mv The use of KDD methodology to discover knowledge in data related to drug dependence andsuicide ideation
title Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida
spellingShingle Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida
Kacuta, Stephanie Luri
CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO
Mineração de dados (Computação)
Vício em drogas
Comportamento suicida
Data mining
Drug addiction
Suicidal behavior
title_short Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida
title_full Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida
title_fullStr Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida
title_full_unstemmed Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida
title_sort Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida
author Kacuta, Stephanie Luri
author_facet Kacuta, Stephanie Luri
author_role author
dc.contributor.advisor1.fl_str_mv Santos, Bruno Samways dos
dc.contributor.referee1.fl_str_mv Santos, Bruno Samways dos
dc.contributor.referee2.fl_str_mv Lima, Rafael Henrique Palma
dc.contributor.referee3.fl_str_mv Andrade, Pedro Rochavetz de Lara
dc.contributor.author.fl_str_mv Kacuta, Stephanie Luri
contributor_str_mv Santos, Bruno Samways dos
Santos, Bruno Samways dos
Lima, Rafael Henrique Palma
Andrade, Pedro Rochavetz de Lara
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO
topic CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO
Mineração de dados (Computação)
Vício em drogas
Comportamento suicida
Data mining
Drug addiction
Suicidal behavior
dc.subject.por.fl_str_mv Mineração de dados (Computação)
Vício em drogas
Comportamento suicida
Data mining
Drug addiction
Suicidal behavior
description A ideação suicida é uma questão de extrema importância que afeta todas as raças e países. Atualmente, há lacunas de estudos de aplicação da metodologia KDD relacionando à influência da toxicodependência na ideação suicida. O seguinte trabalho tem como objetivo a descoberta de conhecimento em dados utilizando técnicas para a predição de ideação suicida. Para o aprendizado de máquina aplicaram-se as técnicas de classificação Árvore de Decisão e Floresta Aleatória, e para partição de dados, o método de kfold com 10 subconjuntos. A base de dados utilizada é uma base americana pertencente à Pesquisa Nacional sobre Uso de Drogas e Saúde (National Survey on Drug Use and Health NSDUH), foram exploradas 5.055 instâncias e 19 atributos pertencentes às dimensões demográficas, saúde mental e toxicodependência, dados do ano de 2019 e 2020. Três experimentos foram realizados, todos aplicando as duas técnicas de classificação a fim de analisar os diferentes comportamentos do modelo, alternando as dimensões dos atributos. O melhor desempenho foi encontrado no experimento 1 com o conjunto de dados contendo todas as dimensões, aplicando-se a técnica de Árvore de decisão, a qual apresentou 63,7% de acurácia, 55,2% de precisão e 49,1% de recall. Não foi possível observar uma influência considerável relacionada à toxicodependência no conjunto de dados. Em maior parte dos resultados dos experimentos, a técnica que teve melhor desempenho foi a Árvore de decisão. Porém, constatou-se que a porcentagem de predição correta ainda foi baixa, abrindo oportunidades para futuros trabalhos na área com a análise de novos parâmetros, técnicas e pré-processamento das informações que possam melhorar a predição.
publishDate 2021
dc.date.issued.fl_str_mv 2021-12-02
dc.date.accessioned.fl_str_mv 2022-03-12T22:49:14Z
dc.date.available.fl_str_mv 2022-03-12T22:49:14Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv KACUTA, Stephanie Luri. Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Produção) - Universidade Tecnológica Federal do Paraná, Londrina, 2021.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/27606
identifier_str_mv KACUTA, Stephanie Luri. Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Produção) - Universidade Tecnológica Federal do Paraná, Londrina, 2021.
url http://repositorio.utfpr.edu.br/jspui/handle/1/27606
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Londrina
dc.publisher.program.fl_str_mv Engenharia de Produção
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Londrina
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27606/2/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27606/1/kddtoxicodependenciaideacaosuicida.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27606/3/kddtoxicodependenciaideacaosuicida.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27606/4/kddtoxicodependenciaideacaosuicida.pdf.jpg
bitstream.checksum.fl_str_mv b9d82215ab23456fa2d8b49c5df1b95b
d7600511f2f081f16ae64f2b28bf8fa0
3b588f8cb6963f53ac075d811f61a4ac
84785b6599b1f68a6f77d8cdf3df291a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805923075730964480