Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/27606 |
Resumo: | A ideação suicida é uma questão de extrema importância que afeta todas as raças e países. Atualmente, há lacunas de estudos de aplicação da metodologia KDD relacionando à influência da toxicodependência na ideação suicida. O seguinte trabalho tem como objetivo a descoberta de conhecimento em dados utilizando técnicas para a predição de ideação suicida. Para o aprendizado de máquina aplicaram-se as técnicas de classificação Árvore de Decisão e Floresta Aleatória, e para partição de dados, o método de kfold com 10 subconjuntos. A base de dados utilizada é uma base americana pertencente à Pesquisa Nacional sobre Uso de Drogas e Saúde (National Survey on Drug Use and Health NSDUH), foram exploradas 5.055 instâncias e 19 atributos pertencentes às dimensões demográficas, saúde mental e toxicodependência, dados do ano de 2019 e 2020. Três experimentos foram realizados, todos aplicando as duas técnicas de classificação a fim de analisar os diferentes comportamentos do modelo, alternando as dimensões dos atributos. O melhor desempenho foi encontrado no experimento 1 com o conjunto de dados contendo todas as dimensões, aplicando-se a técnica de Árvore de decisão, a qual apresentou 63,7% de acurácia, 55,2% de precisão e 49,1% de recall. Não foi possível observar uma influência considerável relacionada à toxicodependência no conjunto de dados. Em maior parte dos resultados dos experimentos, a técnica que teve melhor desempenho foi a Árvore de decisão. Porém, constatou-se que a porcentagem de predição correta ainda foi baixa, abrindo oportunidades para futuros trabalhos na área com a análise de novos parâmetros, técnicas e pré-processamento das informações que possam melhorar a predição. |
id |
UTFPR-12_c08be6febdcd9aed74b60339d53413ec |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/27606 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2022-03-12T22:49:14Z2022-03-12T22:49:14Z2021-12-02KACUTA, Stephanie Luri. Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Produção) - Universidade Tecnológica Federal do Paraná, Londrina, 2021.http://repositorio.utfpr.edu.br/jspui/handle/1/27606A ideação suicida é uma questão de extrema importância que afeta todas as raças e países. Atualmente, há lacunas de estudos de aplicação da metodologia KDD relacionando à influência da toxicodependência na ideação suicida. O seguinte trabalho tem como objetivo a descoberta de conhecimento em dados utilizando técnicas para a predição de ideação suicida. Para o aprendizado de máquina aplicaram-se as técnicas de classificação Árvore de Decisão e Floresta Aleatória, e para partição de dados, o método de kfold com 10 subconjuntos. A base de dados utilizada é uma base americana pertencente à Pesquisa Nacional sobre Uso de Drogas e Saúde (National Survey on Drug Use and Health NSDUH), foram exploradas 5.055 instâncias e 19 atributos pertencentes às dimensões demográficas, saúde mental e toxicodependência, dados do ano de 2019 e 2020. Três experimentos foram realizados, todos aplicando as duas técnicas de classificação a fim de analisar os diferentes comportamentos do modelo, alternando as dimensões dos atributos. O melhor desempenho foi encontrado no experimento 1 com o conjunto de dados contendo todas as dimensões, aplicando-se a técnica de Árvore de decisão, a qual apresentou 63,7% de acurácia, 55,2% de precisão e 49,1% de recall. Não foi possível observar uma influência considerável relacionada à toxicodependência no conjunto de dados. Em maior parte dos resultados dos experimentos, a técnica que teve melhor desempenho foi a Árvore de decisão. Porém, constatou-se que a porcentagem de predição correta ainda foi baixa, abrindo oportunidades para futuros trabalhos na área com a análise de novos parâmetros, técnicas e pré-processamento das informações que possam melhorar a predição.Suicidal ideation is an extremely important issue that affects all races and countries. Currently, there are gaps in studies on the application of the KDD methodology relating to the influence of drug addiction on suicidal ideation. The following work aims to discover knowledge in data using techniques for the prediction of suicidal ideation. For machine learning, the Decision Tree and Random Forest classification techniques were applied, and for data partition, the kfold method with 10 subsets. The database used is an American database belonging to the National Survey on Drug Use and Health (NSDUH), 5,055 instances and 19 attributes belonging to the demographic dimensions, mental health and drug addiction were explored, data from the year 2019 and 2020. Three experiments were carried out, all applying the two classification techniques in order to analyze the different behaviors of the model, alternating the dimensions of the attributes. The best performance was found in experiment 1 with the dataset containing all dimensions, applying the Decision Tree technique, which showed 63.7% accuracy, 55.2% precision and 49.1% recall. It was not possible to observe a considerable influence related to drug addiction in the dataset. In the majority of the experiments results, the technique that performed best was the Decision Tree. However, it was found that the percentage of correct prediction was still low, opening up opportunities for future work in the area with the analysis of new parameters, techniques and preprocessing of information that can improve prediction.porUniversidade Tecnológica Federal do ParanáLondrinaEngenharia de ProduçãoUTFPRBrasilCNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAOMineração de dados (Computação)Vício em drogasComportamento suicidaData miningDrug addictionSuicidal behaviorUtilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicidaThe use of KDD methodology to discover knowledge in data related to drug dependence andsuicide ideationinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisLondrinaSantos, Bruno Samways dosSantos, Bruno Samways dosLima, Rafael Henrique PalmaAndrade, Pedro Rochavetz de LaraKacuta, Stephanie Luriinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRLICENSElicense.txtlicense.txttext/plain; charset=utf-81290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27606/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52ORIGINALkddtoxicodependenciaideacaosuicida.pdfkddtoxicodependenciaideacaosuicida.pdfapplication/pdf341753http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27606/1/kddtoxicodependenciaideacaosuicida.pdfd7600511f2f081f16ae64f2b28bf8fa0MD51TEXTkddtoxicodependenciaideacaosuicida.pdf.txtkddtoxicodependenciaideacaosuicida.pdf.txtExtracted texttext/plain84725http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27606/3/kddtoxicodependenciaideacaosuicida.pdf.txt3b588f8cb6963f53ac075d811f61a4acMD53THUMBNAILkddtoxicodependenciaideacaosuicida.pdf.jpgkddtoxicodependenciaideacaosuicida.pdf.jpgGenerated Thumbnailimage/jpeg1236http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27606/4/kddtoxicodependenciaideacaosuicida.pdf.jpg84785b6599b1f68a6f77d8cdf3df291aMD541/276062022-03-13 03:06:16.391oai:repositorio.utfpr.edu.br:1/27606TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2022-03-13T06:06:16Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida |
dc.title.alternative.pt_BR.fl_str_mv |
The use of KDD methodology to discover knowledge in data related to drug dependence andsuicide ideation |
title |
Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida |
spellingShingle |
Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida Kacuta, Stephanie Luri CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO Mineração de dados (Computação) Vício em drogas Comportamento suicida Data mining Drug addiction Suicidal behavior |
title_short |
Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida |
title_full |
Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida |
title_fullStr |
Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida |
title_full_unstemmed |
Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida |
title_sort |
Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida |
author |
Kacuta, Stephanie Luri |
author_facet |
Kacuta, Stephanie Luri |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Santos, Bruno Samways dos |
dc.contributor.referee1.fl_str_mv |
Santos, Bruno Samways dos |
dc.contributor.referee2.fl_str_mv |
Lima, Rafael Henrique Palma |
dc.contributor.referee3.fl_str_mv |
Andrade, Pedro Rochavetz de Lara |
dc.contributor.author.fl_str_mv |
Kacuta, Stephanie Luri |
contributor_str_mv |
Santos, Bruno Samways dos Santos, Bruno Samways dos Lima, Rafael Henrique Palma Andrade, Pedro Rochavetz de Lara |
dc.subject.cnpq.fl_str_mv |
CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO |
topic |
CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO Mineração de dados (Computação) Vício em drogas Comportamento suicida Data mining Drug addiction Suicidal behavior |
dc.subject.por.fl_str_mv |
Mineração de dados (Computação) Vício em drogas Comportamento suicida Data mining Drug addiction Suicidal behavior |
description |
A ideação suicida é uma questão de extrema importância que afeta todas as raças e países. Atualmente, há lacunas de estudos de aplicação da metodologia KDD relacionando à influência da toxicodependência na ideação suicida. O seguinte trabalho tem como objetivo a descoberta de conhecimento em dados utilizando técnicas para a predição de ideação suicida. Para o aprendizado de máquina aplicaram-se as técnicas de classificação Árvore de Decisão e Floresta Aleatória, e para partição de dados, o método de kfold com 10 subconjuntos. A base de dados utilizada é uma base americana pertencente à Pesquisa Nacional sobre Uso de Drogas e Saúde (National Survey on Drug Use and Health NSDUH), foram exploradas 5.055 instâncias e 19 atributos pertencentes às dimensões demográficas, saúde mental e toxicodependência, dados do ano de 2019 e 2020. Três experimentos foram realizados, todos aplicando as duas técnicas de classificação a fim de analisar os diferentes comportamentos do modelo, alternando as dimensões dos atributos. O melhor desempenho foi encontrado no experimento 1 com o conjunto de dados contendo todas as dimensões, aplicando-se a técnica de Árvore de decisão, a qual apresentou 63,7% de acurácia, 55,2% de precisão e 49,1% de recall. Não foi possível observar uma influência considerável relacionada à toxicodependência no conjunto de dados. Em maior parte dos resultados dos experimentos, a técnica que teve melhor desempenho foi a Árvore de decisão. Porém, constatou-se que a porcentagem de predição correta ainda foi baixa, abrindo oportunidades para futuros trabalhos na área com a análise de novos parâmetros, técnicas e pré-processamento das informações que possam melhorar a predição. |
publishDate |
2021 |
dc.date.issued.fl_str_mv |
2021-12-02 |
dc.date.accessioned.fl_str_mv |
2022-03-12T22:49:14Z |
dc.date.available.fl_str_mv |
2022-03-12T22:49:14Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
KACUTA, Stephanie Luri. Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Produção) - Universidade Tecnológica Federal do Paraná, Londrina, 2021. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/27606 |
identifier_str_mv |
KACUTA, Stephanie Luri. Utilização da metodologia KDD para descoberta de conhecimento em dados relacionados a toxicodependência e ideação suicida. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Produção) - Universidade Tecnológica Federal do Paraná, Londrina, 2021. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/27606 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Londrina |
dc.publisher.program.fl_str_mv |
Engenharia de Produção |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Londrina |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27606/2/license.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27606/1/kddtoxicodependenciaideacaosuicida.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27606/3/kddtoxicodependenciaideacaosuicida.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27606/4/kddtoxicodependenciaideacaosuicida.pdf.jpg |
bitstream.checksum.fl_str_mv |
b9d82215ab23456fa2d8b49c5df1b95b d7600511f2f081f16ae64f2b28bf8fa0 3b588f8cb6963f53ac075d811f61a4ac 84785b6599b1f68a6f77d8cdf3df291a |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1805923075730964480 |