Framework Oráculo: camada de coleta e mineração de textos para o Twitter

Detalhes bibliográficos
Autor(a) principal: Oliveira, Hércules Batista de
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFVJM
Texto Completo: https://acervo.ufvjm.edu.br/items/183e3b4f-40cd-4fb2-bb6a-e0806bd2740d
Resumo: As redes sociais online constituem um importante espaço de convivência para a população, com aplicações em comunicação, diversão, propaganda, mobilização social e comunitária. Os dados compartilhados em tais redes constituem fonte de pesquisa de diversos trabalhos que buscam analisar as interações dos seus usuários. Para que se possam analisar os dados coletados de maneira eficiente, devido ao grande volume produzido por essas redes, faz-se necessária a utilização de técnicas de mineração de textos. Nesse processo de mineração de texto apresenta-se o desafio da falta de acesso direto aos dados das redes sociais online, o que torna necessário utilizar ferramentas especializadas para realizar a coleta de dados. O framework Oráculo, em desenvolvimento pelo grupo de pesquisa MTPLNAM, é formado por diferentes camadas. Nesta pesquisa foi desenvolvida a camada de coleta e mineração de textos, que aplica diferentes técnicas e algoritmos para coletar texto do Twitter, buscando contornar as limitações impostas pela API disponibilizada por ele, e integra um minerador de textos para analisar as coletas realizadas. Essa camada do framework dispõe de interface web, permitindo a utilização por pesquisadores não familiarizados com a área de computação. Foram realizados testes comparativos de desempenho entre o framework Oráculo e outra ferramenta semelhante de coleta e mineração de textos, o DMIT-CAT. Os resultados desses testes apontam que o framework Oráculo teve desempenho superior ao DMI-TCAT em número de tweets coletados nos cenários analisados. Testes estatísticos foram executados e validaram os resultados dos testes de desempenho.
id UFVJM-2_9b90d0ef79fccccc17791b4bc179e8af
oai_identifier_str oai:acervo.ufvjm.edu.br:1/2281
network_acronym_str UFVJM-2
network_name_str Repositório Institucional da UFVJM
repository_id_str 2145
spelling Oliveira, Hércules Batista deGuelpeli, Marcus Vinícius CarvalhoFonseca, Alexandre RamosVillela, Maria Lúcia BentoMaia, Renato DouradoUniversidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)Guelpeli, Marcus Vinícius Carvalho2020-09-15T19:31:07Z2020-09-15T19:31:07Z20192019-11-08OLIVEIRA, Hércules Batista de. Framework Oráculo: camada de coleta e mineração de textos para o Twitter. 2019. 73 p. Dissertação (Mestrado Profissional em Educação) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2019.https://acervo.ufvjm.edu.br/items/183e3b4f-40cd-4fb2-bb6a-e0806bd2740dAs redes sociais online constituem um importante espaço de convivência para a população, com aplicações em comunicação, diversão, propaganda, mobilização social e comunitária. Os dados compartilhados em tais redes constituem fonte de pesquisa de diversos trabalhos que buscam analisar as interações dos seus usuários. Para que se possam analisar os dados coletados de maneira eficiente, devido ao grande volume produzido por essas redes, faz-se necessária a utilização de técnicas de mineração de textos. Nesse processo de mineração de texto apresenta-se o desafio da falta de acesso direto aos dados das redes sociais online, o que torna necessário utilizar ferramentas especializadas para realizar a coleta de dados. O framework Oráculo, em desenvolvimento pelo grupo de pesquisa MTPLNAM, é formado por diferentes camadas. Nesta pesquisa foi desenvolvida a camada de coleta e mineração de textos, que aplica diferentes técnicas e algoritmos para coletar texto do Twitter, buscando contornar as limitações impostas pela API disponibilizada por ele, e integra um minerador de textos para analisar as coletas realizadas. Essa camada do framework dispõe de interface web, permitindo a utilização por pesquisadores não familiarizados com a área de computação. Foram realizados testes comparativos de desempenho entre o framework Oráculo e outra ferramenta semelhante de coleta e mineração de textos, o DMIT-CAT. Os resultados desses testes apontam que o framework Oráculo teve desempenho superior ao DMI-TCAT em número de tweets coletados nos cenários analisados. Testes estatísticos foram executados e validaram os resultados dos testes de desempenho.Dissertação (Mestrado Profissional) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, 2019.Online social networks are an important social space for the population, with applications in communication, entertainment, advertising, social and community mobilization. The data shared in such networks is a source of research for several works that seek to analyze the interactions of their users. In order to analyze the collected data efficiently, due to the large volume produced by these networks, it is necessary to use text mining techniques. This text mining process presents the challenge of the lack of direct access to data from online social networks, which makes it necessary to use specialized tools to perform data collection. The Oracle framework, under development by the MTPLNAM research group, is made up of different layers. This research developed the text collection and mining layer, which applies different techniques and algorithms to collect text from Twitter, seeking to circumvent the limitations imposed by the API provided by Twitter, and integrates a text miner to analyze the collections made. This layer of the framework has web interface, allowing the use by researchers unfamiliar with the area of computing. Comparative performance tests were performed between the Oracle framework and another similar text collection and mining tool, DMI-TCAT. The results of these tests indicate that the Oracle framework outperformed the DMI-TCAT in the number of tweets collected in the analyzed scenarios. Statistical tests were performed and validated the results of the performance tests.porUFVJMA concessão da licença deste item refere-se ao à termo de autorização impresso assinado pelo autor, assim como na licença Creative Commons, com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade Federal dos Vales do Jequitinhonha e Mucuri e o IBICT a disponibilizar por meio de seus repositórios, sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, e preservação, a partir desta data.info:eu-repo/semantics/openAccessFramework Oráculo: camada de coleta e mineração de textos para o Twitterinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisColeta de textosMineração de textosTwitterText collectText miningreponame:Repositório Institucional da UFVJMinstname:Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)instacron:UFVJMTHUMBNAILhercules_batista_oliveira.pdf.jpghercules_batista_oliveira.pdf.jpgGenerated Thumbnailimage/jpeg2443https://acervo.ufvjm.edu.br//bitstreams/ed4e26b7-ac73-4efe-ab52-0580493ee95c/downloadbdb81357a9ec71f39bfb3321e536865aMD57falseAnonymousREADORIGINALhercules_batista_oliveira.pdfhercules_batista_oliveira.pdfapplication/pdf3231128https://acervo.ufvjm.edu.br//bitstreams/2f41d91b-aa56-47bb-beca-3b806a7d896c/download291baa70a603accce53efdf56a9d7597MD51trueAnonymousREADCC-LICENSElicense_urllicense_urltext/plain; charset=utf-849https://acervo.ufvjm.edu.br//bitstreams/5947ea26-e1b2-4b53-80b9-f73e83d3230c/download4afdbb8c545fd630ea7db775da747b2fMD52falseAnonymousREADlicense_textlicense_texttext/html; charset=utf-80https://acervo.ufvjm.edu.br//bitstreams/997b169c-1cf2-41de-86ad-3875691a9760/downloadd41d8cd98f00b204e9800998ecf8427eMD53falseAnonymousREADlicense_rdflicense_rdfapplication/rdf+xml; charset=utf-80https://acervo.ufvjm.edu.br//bitstreams/60006155-8d61-4fd6-b292-c6fc1ec2410b/downloadd41d8cd98f00b204e9800998ecf8427eMD54falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-82157https://acervo.ufvjm.edu.br//bitstreams/e87feffa-4f72-496c-875c-74786b7807cd/downloadc0fe10782d3e2994b7c028f47c86ff9eMD55falseAnonymousREADTEXThercules_batista_oliveira.pdf.txthercules_batista_oliveira.pdf.txtExtracted texttext/plain109914https://acervo.ufvjm.edu.br//bitstreams/861cf136-57af-4f34-922f-24de34d274d9/downloadf4412ee9783b68900e1f12b26b84d6aeMD56falseAnonymousREAD1/22812024-09-12 06:05:19.135open.accessoai:acervo.ufvjm.edu.br:1/2281https://acervo.ufvjm.edu.br/Repositório InstitucionalPUBhttps://repositorio.ufvjm.edu.brrepositorio@ufvjm.edu.bropendoar:21452024-09-12T06:05:19Repositório Institucional da UFVJM - Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKQW8gY29uY29yZGFyIGNvbSBlc3RhIGxpY2Vuw6dhLCB2b2PDqihzKSBhdXRvcihlcykgb3UgdGl0dWxhcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIG9icmEgYXF1aSBkZXNjcml0YSBjb25jZWRlKG0pIArDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkb3MgVmFsZXMgZG8gSmVxdWl0aW5ob25oYSBlIE11Y3VyaSwgZ2VzdG9yYSBkbyBSZXBvc2l0w7NyaW8sIGRlbm9taW5hZG8gUkkvVUZWSk0sIApvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4bykgZS9vdSBkaXN0cmlidWlyIG8gCmRvY3VtZW50byBkZXBvc2l0YWRvIGVtIGZvcm1hdG8gaW1wcmVzc28sIGVsZXRyw7RuaWNvIG91IGVtIHF1YWxxdWVyIG91dHJvIG1laW8uClZvY8OqKHMpIGNvbmNvcmRhKG0pIHF1ZSBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRvcyBWYWxlcyBkbyBKZXF1aXRpbmhvbmhhIGUgTXVjdXJpLCAKZ2VzdG9yYSBkbyBSSS9VRlZKTSwgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIGNvbnZlcnRlciBvIGFycXVpdm8gZGVwb3NpdGFkbyBhIHF1YWxxdWVyIG1laW8gb3UgCmZvcm1hdG8gY29tIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KVm9jw6oocykgdGFtYsOpbSBjb25jb3JkYShtKSBxdWUgYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkb3MgVmFsZXMgZG8gSmVxdWl0aW5ob25oYSBlIE11Y3VyaSwgCmdlc3RvcmEgZG8gUkkvVUZWSk0sIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkZXDDs3NpdG8gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZS9vdSBwcmVzZXJ2YcOnw6NvLgpWb2PDqihzKSBkZWNsYXJhKG0pIHF1ZSBhIGFwcmVzZW50YcOnw6NvIGRvIHNldSB0cmFiYWxobyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqihzKSBwb2RlKG0pIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIApuZXN0YSBsaWNlbsOnYSBlIG5vIFRlcm1vIGRlIEF1dG9yaXphw6fDo28gYSBzZXIgZW50cmVndWUuClZvY8OqKHMpIHRhbWLDqW0gZGVjbGFyYShtKSBxdWUgbyBlbnZpbyDDqSBkZSBzZXUgY29uaGVjaW1lbnRvIGUgbsOjbyBpbmZyaW5nZSBvcyBkaXJlaXRvcyBhdXRvcmFpcyAKZGUgb3V0cmEgcGVzc29hIG91IGluc3RpdHVpw6fDo28uCkNhc28gbyBkb2N1bWVudG8gYSBzZXIgZGVwb3NpdGFkbyBjb250ZW5oYSBtYXRlcmlhbCBwYXJhIG8gcXVhbCB2b2PDqihzKSBuw6NvIGRldMOpbSBhIHRpdHVsYXJpZGFkZSBkb3MgZGlyZWl0b3MgZGUgYXV0b3JhaXMsCnZvY8OqKHMpIGRlY2xhcmEobSkgcXVlIG9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkZSBjb25jZWRlciDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbApkb3MgVmFsZXMgZG8gSmVxdWl0aW5ob25oYSBlIE11Y3VyaSwgZ2VzdG9yYSBkbyBSSS9VRlZKTSwgb3MgZGlyZWl0b3MgcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSBlIHF1ZSBvcyBtYXRlcmlhaXMgCmRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcywgZXN0w6NvIGRldmlkYW1lbnRlIGlkZW50aWZpY2Fkb3MgZSByZWNvbmhlY2lkb3Mgbm8gdGV4dG8gb3UgY29udGXDumRvIGRhIGFwcmVzZW50YcOnw6NvLgpDQVNPIE8gVFJBQkFMSE8gREVQT1NJVEFETyBURU5IQSBTSURPIEZJTkFOQ0lBRE8gT1UgQVBPSUFETyBQT1IgVU0gw5NSR8ODTywgUVVFIE7Dg08gQSBJTlNUSVRVScOHw4NPIERFU1RFIFJFUE9TSVTDk1JJTzogVk9Dw4ogREVDTEFSQSBURVIgQ1VNUFJJRE8gVE9ET1MgT1MgRElSRUlUT1MgREUgUkVWSVPDg08gRSBRVUFJU1FVRVIgT1VUUkFTIE9CUklHQcOHw5VFUyBSRVFVRVJJREFTIApQRUxPUyBDT05UUkFUT1MgT1UgQUNPUkRPUy4gCk8gUkkvVUZWSk0gaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8gc2V1KHMpIG5vbWUocykgY29tbyBhdXRvcihlcykgb3UgdGl0dWxhcihlcykgZG8gZGlyZWl0byBkZSAKYXV0b3IoZXMpIGRvIGRvY3VtZW50byBzdWJtZXRpZG8gZSBkZWNsYXJhIHF1ZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgoK
dc.title.pt_BR.fl_str_mv Framework Oráculo: camada de coleta e mineração de textos para o Twitter
title Framework Oráculo: camada de coleta e mineração de textos para o Twitter
spellingShingle Framework Oráculo: camada de coleta e mineração de textos para o Twitter
Oliveira, Hércules Batista de
Coleta de textos
Mineração de textos
Twitter
Text collect
Text mining
title_short Framework Oráculo: camada de coleta e mineração de textos para o Twitter
title_full Framework Oráculo: camada de coleta e mineração de textos para o Twitter
title_fullStr Framework Oráculo: camada de coleta e mineração de textos para o Twitter
title_full_unstemmed Framework Oráculo: camada de coleta e mineração de textos para o Twitter
title_sort Framework Oráculo: camada de coleta e mineração de textos para o Twitter
author Oliveira, Hércules Batista de
author_facet Oliveira, Hércules Batista de
author_role author
dc.contributor.referee.none.fl_str_mv Guelpeli, Marcus Vinícius Carvalho
Fonseca, Alexandre Ramos
Villela, Maria Lúcia Bento
Maia, Renato Dourado
dc.contributor.institution.pt_BR.fl_str_mv Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)
dc.contributor.author.fl_str_mv Oliveira, Hércules Batista de
dc.contributor.advisor1.fl_str_mv Guelpeli, Marcus Vinícius Carvalho
contributor_str_mv Guelpeli, Marcus Vinícius Carvalho
dc.subject.keyword.pt_BR.fl_str_mv Coleta de textos
Mineração de textos
topic Coleta de textos
Mineração de textos
Twitter
Text collect
Text mining
dc.subject.keyword.en.fl_str_mv Twitter
Text collect
Text mining
description As redes sociais online constituem um importante espaço de convivência para a população, com aplicações em comunicação, diversão, propaganda, mobilização social e comunitária. Os dados compartilhados em tais redes constituem fonte de pesquisa de diversos trabalhos que buscam analisar as interações dos seus usuários. Para que se possam analisar os dados coletados de maneira eficiente, devido ao grande volume produzido por essas redes, faz-se necessária a utilização de técnicas de mineração de textos. Nesse processo de mineração de texto apresenta-se o desafio da falta de acesso direto aos dados das redes sociais online, o que torna necessário utilizar ferramentas especializadas para realizar a coleta de dados. O framework Oráculo, em desenvolvimento pelo grupo de pesquisa MTPLNAM, é formado por diferentes camadas. Nesta pesquisa foi desenvolvida a camada de coleta e mineração de textos, que aplica diferentes técnicas e algoritmos para coletar texto do Twitter, buscando contornar as limitações impostas pela API disponibilizada por ele, e integra um minerador de textos para analisar as coletas realizadas. Essa camada do framework dispõe de interface web, permitindo a utilização por pesquisadores não familiarizados com a área de computação. Foram realizados testes comparativos de desempenho entre o framework Oráculo e outra ferramenta semelhante de coleta e mineração de textos, o DMIT-CAT. Os resultados desses testes apontam que o framework Oráculo teve desempenho superior ao DMI-TCAT em número de tweets coletados nos cenários analisados. Testes estatísticos foram executados e validaram os resultados dos testes de desempenho.
publishDate 2019
dc.date.submitted.none.fl_str_mv 2019-11-08
dc.date.issued.fl_str_mv 2019
dc.date.accessioned.fl_str_mv 2020-09-15T19:31:07Z
dc.date.available.fl_str_mv 2020-09-15T19:31:07Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv OLIVEIRA, Hércules Batista de. Framework Oráculo: camada de coleta e mineração de textos para o Twitter. 2019. 73 p. Dissertação (Mestrado Profissional em Educação) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2019.
dc.identifier.uri.fl_str_mv https://acervo.ufvjm.edu.br/items/183e3b4f-40cd-4fb2-bb6a-e0806bd2740d
identifier_str_mv OLIVEIRA, Hércules Batista de. Framework Oráculo: camada de coleta e mineração de textos para o Twitter. 2019. 73 p. Dissertação (Mestrado Profissional em Educação) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2019.
url https://acervo.ufvjm.edu.br/items/183e3b4f-40cd-4fb2-bb6a-e0806bd2740d
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv UFVJM
publisher.none.fl_str_mv UFVJM
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFVJM
instname:Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)
instacron:UFVJM
instname_str Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)
instacron_str UFVJM
institution UFVJM
reponame_str Repositório Institucional da UFVJM
collection Repositório Institucional da UFVJM
bitstream.url.fl_str_mv https://acervo.ufvjm.edu.br//bitstreams/ed4e26b7-ac73-4efe-ab52-0580493ee95c/download
https://acervo.ufvjm.edu.br//bitstreams/2f41d91b-aa56-47bb-beca-3b806a7d896c/download
https://acervo.ufvjm.edu.br//bitstreams/5947ea26-e1b2-4b53-80b9-f73e83d3230c/download
https://acervo.ufvjm.edu.br//bitstreams/997b169c-1cf2-41de-86ad-3875691a9760/download
https://acervo.ufvjm.edu.br//bitstreams/60006155-8d61-4fd6-b292-c6fc1ec2410b/download
https://acervo.ufvjm.edu.br//bitstreams/e87feffa-4f72-496c-875c-74786b7807cd/download
https://acervo.ufvjm.edu.br//bitstreams/861cf136-57af-4f34-922f-24de34d274d9/download
bitstream.checksum.fl_str_mv bdb81357a9ec71f39bfb3321e536865a
291baa70a603accce53efdf56a9d7597
4afdbb8c545fd630ea7db775da747b2f
d41d8cd98f00b204e9800998ecf8427e
d41d8cd98f00b204e9800998ecf8427e
c0fe10782d3e2994b7c028f47c86ff9e
f4412ee9783b68900e1f12b26b84d6ae
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFVJM - Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)
repository.mail.fl_str_mv repositorio@ufvjm.edu.br
_version_ 1813710510061780992