Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UNESP |
Texto Completo: | http://hdl.handle.net/11449/191893 |
Resumo: | A quantidade de dados tem crescido significativamente nos últimos anos, principalmente em formatos de textos e não estruturados, com a colaboração efetiva das mídias sociais. Tais plataformas podem ser definidas como aplicativos de internet que podem ser web ou mobile e permitem a criação, acesso e a troca de conteúdos criados por usuários. Com isso, o conjunto de dados produzidos por essas mídias podem ser chamados de Big Data e são especialmente importantes para pesquisas computacionais de extração de conhecimento. O termo Big Data pode ser definido como um grande volume de dados complexos provenientes de múltiplas fontes que desafiam a capacidade de armazenamento e processamento dos computadores com as tecnologias atuais. Com isso, as técnicas de programação distribuída e paralela têm sido amplamente utilizadas a fim de retornar em tempo hábil os resultados dos algoritmos de extração de conhecimento em dados de mídias sociais. Tendo em vista as características dos dados criados nas mídias sociais e o aumento de pessoas no mundo com problemas relacionados a transtornos de saúde, ferramentas que analisam esses dados para encontrar correlações podem contribuir para o cenário atual. Dessa forma, a contribuição científica deste trabalho está no desenvolvimento de algoritmos paralelos para prospecção de conhecimento em dados textuais, com foco em mídias sociais, que permita a classificação dos indivíduos em classes comuns e que considera o contexto inserido. Os resultados de desempenho indicam que a ferramenta com abordagem paralela desenvolvida foi capaz de reduzir em cerca de 11 vezes o tempo de préprocessamento, extração de características e classificação. |
id |
UNSP_6edd94f2cea397f9b581760477cd7f7e |
---|---|
oai_identifier_str |
oai:repositorio.unesp.br:11449/191893 |
network_acronym_str |
UNSP |
network_name_str |
Repositório Institucional da UNESP |
repository_id_str |
2946 |
spelling |
Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentaisParallel algorithm for behavioral analysis of social media users in detecting mental disordersCiência da computaçãoProcessamento de textos (Computação)Processamento paralelo (Computadores)Big dataComputer scienceText miningParallel processingA quantidade de dados tem crescido significativamente nos últimos anos, principalmente em formatos de textos e não estruturados, com a colaboração efetiva das mídias sociais. Tais plataformas podem ser definidas como aplicativos de internet que podem ser web ou mobile e permitem a criação, acesso e a troca de conteúdos criados por usuários. Com isso, o conjunto de dados produzidos por essas mídias podem ser chamados de Big Data e são especialmente importantes para pesquisas computacionais de extração de conhecimento. O termo Big Data pode ser definido como um grande volume de dados complexos provenientes de múltiplas fontes que desafiam a capacidade de armazenamento e processamento dos computadores com as tecnologias atuais. Com isso, as técnicas de programação distribuída e paralela têm sido amplamente utilizadas a fim de retornar em tempo hábil os resultados dos algoritmos de extração de conhecimento em dados de mídias sociais. Tendo em vista as características dos dados criados nas mídias sociais e o aumento de pessoas no mundo com problemas relacionados a transtornos de saúde, ferramentas que analisam esses dados para encontrar correlações podem contribuir para o cenário atual. Dessa forma, a contribuição científica deste trabalho está no desenvolvimento de algoritmos paralelos para prospecção de conhecimento em dados textuais, com foco em mídias sociais, que permita a classificação dos indivíduos em classes comuns e que considera o contexto inserido. Os resultados de desempenho indicam que a ferramenta com abordagem paralela desenvolvida foi capaz de reduzir em cerca de 11 vezes o tempo de préprocessamento, extração de características e classificação.The amount of data has grown significantly in recent years with the effective collaboration of social media. Such platforms can be defined as internet applications that can be web or mobile and allow the creation, access and exchange of user-created content. With this, the data set produced by these media can be called Big Data and are especially important for computational searches of knowledge extraction. The term Big Data can be defined as a large volume of complex data from multiple sources that challenge the storage and processing capacity of computers with today's technologies. In this sense, the techniques of framework Apache Spark and its parallelized implementation have been widely used to return in a timely manner the results of the algorithms of knowledge extraction in social media data. Given the large amount of data generated is social media and the increase of people in the world with problems related to health disorders, tools that analyze these data to find correlations can contribute to the current scenario. Thus, the scientific contribution of this work is in the development of parallel algorithms for prospecting knowledge in textual data, with a focus on social media, which allows the classification of individuals in common classes and considering the inserted context. The performance results indicate that the tool with a parallel approach developed was able to reduce the pre-processing time, extraction of characteristics and classification by approximately 11 times.Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)CNPq. Proc. 134172/2017-5Universidade Estadual Paulista (Unesp)Valêncio, Carlos Roberto [UNESP]Universidade Estadual Paulista (Unesp)Martins, Victor Hugo Penhalves2020-03-18T13:37:13Z2020-03-18T13:37:13Z2020-02-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/11449/19189300092976233004153073P2porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-12-04T06:14:28Zoai:repositorio.unesp.br:11449/191893Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T19:28:44.203459Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false |
dc.title.none.fl_str_mv |
Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais Parallel algorithm for behavioral analysis of social media users in detecting mental disorders |
title |
Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais |
spellingShingle |
Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais Martins, Victor Hugo Penhalves Ciência da computação Processamento de textos (Computação) Processamento paralelo (Computadores) Big data Computer science Text mining Parallel processing |
title_short |
Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais |
title_full |
Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais |
title_fullStr |
Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais |
title_full_unstemmed |
Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais |
title_sort |
Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais |
author |
Martins, Victor Hugo Penhalves |
author_facet |
Martins, Victor Hugo Penhalves |
author_role |
author |
dc.contributor.none.fl_str_mv |
Valêncio, Carlos Roberto [UNESP] Universidade Estadual Paulista (Unesp) |
dc.contributor.author.fl_str_mv |
Martins, Victor Hugo Penhalves |
dc.subject.por.fl_str_mv |
Ciência da computação Processamento de textos (Computação) Processamento paralelo (Computadores) Big data Computer science Text mining Parallel processing |
topic |
Ciência da computação Processamento de textos (Computação) Processamento paralelo (Computadores) Big data Computer science Text mining Parallel processing |
description |
A quantidade de dados tem crescido significativamente nos últimos anos, principalmente em formatos de textos e não estruturados, com a colaboração efetiva das mídias sociais. Tais plataformas podem ser definidas como aplicativos de internet que podem ser web ou mobile e permitem a criação, acesso e a troca de conteúdos criados por usuários. Com isso, o conjunto de dados produzidos por essas mídias podem ser chamados de Big Data e são especialmente importantes para pesquisas computacionais de extração de conhecimento. O termo Big Data pode ser definido como um grande volume de dados complexos provenientes de múltiplas fontes que desafiam a capacidade de armazenamento e processamento dos computadores com as tecnologias atuais. Com isso, as técnicas de programação distribuída e paralela têm sido amplamente utilizadas a fim de retornar em tempo hábil os resultados dos algoritmos de extração de conhecimento em dados de mídias sociais. Tendo em vista as características dos dados criados nas mídias sociais e o aumento de pessoas no mundo com problemas relacionados a transtornos de saúde, ferramentas que analisam esses dados para encontrar correlações podem contribuir para o cenário atual. Dessa forma, a contribuição científica deste trabalho está no desenvolvimento de algoritmos paralelos para prospecção de conhecimento em dados textuais, com foco em mídias sociais, que permita a classificação dos indivíduos em classes comuns e que considera o contexto inserido. Os resultados de desempenho indicam que a ferramenta com abordagem paralela desenvolvida foi capaz de reduzir em cerca de 11 vezes o tempo de préprocessamento, extração de características e classificação. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-03-18T13:37:13Z 2020-03-18T13:37:13Z 2020-02-28 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11449/191893 000929762 33004153073P2 |
url |
http://hdl.handle.net/11449/191893 |
identifier_str_mv |
000929762 33004153073P2 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNESP instname:Universidade Estadual Paulista (UNESP) instacron:UNESP |
instname_str |
Universidade Estadual Paulista (UNESP) |
instacron_str |
UNESP |
institution |
UNESP |
reponame_str |
Repositório Institucional da UNESP |
collection |
Repositório Institucional da UNESP |
repository.name.fl_str_mv |
Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP) |
repository.mail.fl_str_mv |
|
_version_ |
1808129074502041600 |