Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais

Detalhes bibliográficos
Autor(a) principal: Martins, Victor Hugo Penhalves
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/191893
Resumo: A quantidade de dados tem crescido significativamente nos últimos anos, principalmente em formatos de textos e não estruturados, com a colaboração efetiva das mídias sociais. Tais plataformas podem ser definidas como aplicativos de internet que podem ser web ou mobile e permitem a criação, acesso e a troca de conteúdos criados por usuários. Com isso, o conjunto de dados produzidos por essas mídias podem ser chamados de Big Data e são especialmente importantes para pesquisas computacionais de extração de conhecimento. O termo Big Data pode ser definido como um grande volume de dados complexos provenientes de múltiplas fontes que desafiam a capacidade de armazenamento e processamento dos computadores com as tecnologias atuais. Com isso, as técnicas de programação distribuída e paralela têm sido amplamente utilizadas a fim de retornar em tempo hábil os resultados dos algoritmos de extração de conhecimento em dados de mídias sociais. Tendo em vista as características dos dados criados nas mídias sociais e o aumento de pessoas no mundo com problemas relacionados a transtornos de saúde, ferramentas que analisam esses dados para encontrar correlações podem contribuir para o cenário atual. Dessa forma, a contribuição científica deste trabalho está no desenvolvimento de algoritmos paralelos para prospecção de conhecimento em dados textuais, com foco em mídias sociais, que permita a classificação dos indivíduos em classes comuns e que considera o contexto inserido. Os resultados de desempenho indicam que a ferramenta com abordagem paralela desenvolvida foi capaz de reduzir em cerca de 11 vezes o tempo de préprocessamento, extração de características e classificação.
id UNSP_6edd94f2cea397f9b581760477cd7f7e
oai_identifier_str oai:repositorio.unesp.br:11449/191893
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentaisParallel algorithm for behavioral analysis of social media users in detecting mental disordersCiência da computaçãoProcessamento de textos (Computação)Processamento paralelo (Computadores)Big dataComputer scienceText miningParallel processingA quantidade de dados tem crescido significativamente nos últimos anos, principalmente em formatos de textos e não estruturados, com a colaboração efetiva das mídias sociais. Tais plataformas podem ser definidas como aplicativos de internet que podem ser web ou mobile e permitem a criação, acesso e a troca de conteúdos criados por usuários. Com isso, o conjunto de dados produzidos por essas mídias podem ser chamados de Big Data e são especialmente importantes para pesquisas computacionais de extração de conhecimento. O termo Big Data pode ser definido como um grande volume de dados complexos provenientes de múltiplas fontes que desafiam a capacidade de armazenamento e processamento dos computadores com as tecnologias atuais. Com isso, as técnicas de programação distribuída e paralela têm sido amplamente utilizadas a fim de retornar em tempo hábil os resultados dos algoritmos de extração de conhecimento em dados de mídias sociais. Tendo em vista as características dos dados criados nas mídias sociais e o aumento de pessoas no mundo com problemas relacionados a transtornos de saúde, ferramentas que analisam esses dados para encontrar correlações podem contribuir para o cenário atual. Dessa forma, a contribuição científica deste trabalho está no desenvolvimento de algoritmos paralelos para prospecção de conhecimento em dados textuais, com foco em mídias sociais, que permita a classificação dos indivíduos em classes comuns e que considera o contexto inserido. Os resultados de desempenho indicam que a ferramenta com abordagem paralela desenvolvida foi capaz de reduzir em cerca de 11 vezes o tempo de préprocessamento, extração de características e classificação.The amount of data has grown significantly in recent years with the effective collaboration of social media. Such platforms can be defined as internet applications that can be web or mobile and allow the creation, access and exchange of user-created content. With this, the data set produced by these media can be called Big Data and are especially important for computational searches of knowledge extraction. The term Big Data can be defined as a large volume of complex data from multiple sources that challenge the storage and processing capacity of computers with today's technologies. In this sense, the techniques of framework Apache Spark and its parallelized implementation have been widely used to return in a timely manner the results of the algorithms of knowledge extraction in social media data. Given the large amount of data generated is social media and the increase of people in the world with problems related to health disorders, tools that analyze these data to find correlations can contribute to the current scenario. Thus, the scientific contribution of this work is in the development of parallel algorithms for prospecting knowledge in textual data, with a focus on social media, which allows the classification of individuals in common classes and considering the inserted context. The performance results indicate that the tool with a parallel approach developed was able to reduce the pre-processing time, extraction of characteristics and classification by approximately 11 times.Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)CNPq. Proc. 134172/2017-5Universidade Estadual Paulista (Unesp)Valêncio, Carlos Roberto [UNESP]Universidade Estadual Paulista (Unesp)Martins, Victor Hugo Penhalves2020-03-18T13:37:13Z2020-03-18T13:37:13Z2020-02-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/11449/19189300092976233004153073P2porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-12-04T06:14:28Zoai:repositorio.unesp.br:11449/191893Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T19:28:44.203459Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais
Parallel algorithm for behavioral analysis of social media users in detecting mental disorders
title Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais
spellingShingle Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais
Martins, Victor Hugo Penhalves
Ciência da computação
Processamento de textos (Computação)
Processamento paralelo (Computadores)
Big data
Computer science
Text mining
Parallel processing
title_short Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais
title_full Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais
title_fullStr Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais
title_full_unstemmed Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais
title_sort Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais
author Martins, Victor Hugo Penhalves
author_facet Martins, Victor Hugo Penhalves
author_role author
dc.contributor.none.fl_str_mv Valêncio, Carlos Roberto [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Martins, Victor Hugo Penhalves
dc.subject.por.fl_str_mv Ciência da computação
Processamento de textos (Computação)
Processamento paralelo (Computadores)
Big data
Computer science
Text mining
Parallel processing
topic Ciência da computação
Processamento de textos (Computação)
Processamento paralelo (Computadores)
Big data
Computer science
Text mining
Parallel processing
description A quantidade de dados tem crescido significativamente nos últimos anos, principalmente em formatos de textos e não estruturados, com a colaboração efetiva das mídias sociais. Tais plataformas podem ser definidas como aplicativos de internet que podem ser web ou mobile e permitem a criação, acesso e a troca de conteúdos criados por usuários. Com isso, o conjunto de dados produzidos por essas mídias podem ser chamados de Big Data e são especialmente importantes para pesquisas computacionais de extração de conhecimento. O termo Big Data pode ser definido como um grande volume de dados complexos provenientes de múltiplas fontes que desafiam a capacidade de armazenamento e processamento dos computadores com as tecnologias atuais. Com isso, as técnicas de programação distribuída e paralela têm sido amplamente utilizadas a fim de retornar em tempo hábil os resultados dos algoritmos de extração de conhecimento em dados de mídias sociais. Tendo em vista as características dos dados criados nas mídias sociais e o aumento de pessoas no mundo com problemas relacionados a transtornos de saúde, ferramentas que analisam esses dados para encontrar correlações podem contribuir para o cenário atual. Dessa forma, a contribuição científica deste trabalho está no desenvolvimento de algoritmos paralelos para prospecção de conhecimento em dados textuais, com foco em mídias sociais, que permita a classificação dos indivíduos em classes comuns e que considera o contexto inserido. Os resultados de desempenho indicam que a ferramenta com abordagem paralela desenvolvida foi capaz de reduzir em cerca de 11 vezes o tempo de préprocessamento, extração de características e classificação.
publishDate 2020
dc.date.none.fl_str_mv 2020-03-18T13:37:13Z
2020-03-18T13:37:13Z
2020-02-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/191893
000929762
33004153073P2
url http://hdl.handle.net/11449/191893
identifier_str_mv 000929762
33004153073P2
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808129074502041600