Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline

Detalhes bibliográficos
Autor(a) principal: Ribeiro Afonso, Alexandre
Data de Publicação: 2020
Outros Autores: Gottschalg Duque, Cláudio
Tipo de documento: Artigo
Idioma: por
Título da fonte: Liinc em Revista
Texto Completo: http://revista.ibict.br/liinc/article/view/5325
Resumo: This article describes a research about the mining of posts collected from Twitter, containing two keywords: “Coronavírus” and “Brasil”. The focus is on listing the frequencies of nouns, and verifying those frequencies as indicators about the interests of discussion, in four time periods: from February to June 2020. The research method is quantitative and involves the collection, filtering, text mining and analysis of results. In text mining, the K-Means clustering algorithm is used and, subsequently, AntConc corpus analysis software. It is concluded that the applied method signals about the main points of discussion and their changes over time. Such signs could contribute to the creation of more detailed categories of posts in a later Content Analysis
id IBICT-2_21a95331654edf27526fb5a43082e964
oai_identifier_str oai:ojs.revista.ibict.br:article/5325
network_acronym_str IBICT-2
network_name_str Liinc em Revista
spelling Text mining applied to Twitter posts on Coronavirus: an analysis in the timelineMineração de textos aplicada a postagens do Twitter sobre Coronavírus: uma análise na linha do tempoText MiningCorpusTwitterCoronavírusBrasilMineração de TextosCorpusTwitterCoronavírusBrasilThis article describes a research about the mining of posts collected from Twitter, containing two keywords: “Coronavírus” and “Brasil”. The focus is on listing the frequencies of nouns, and verifying those frequencies as indicators about the interests of discussion, in four time periods: from February to June 2020. The research method is quantitative and involves the collection, filtering, text mining and analysis of results. In text mining, the K-Means clustering algorithm is used and, subsequently, AntConc corpus analysis software. It is concluded that the applied method signals about the main points of discussion and their changes over time. Such signs could contribute to the creation of more detailed categories of posts in a later Content AnalysisEste artigo descreve uma pesquisa sobre a mineração de postagens coletadas do Twitter, contendo duas palavras-chave: “Coronavírus” e “Brasil”. O enfoque é a listagem das frequências dos substantivos (nouns), e a verificação de tais frequências como indicadores dos interesses de discussão, em quatro períodos de tempo: de fevereiro a junho de 2020. O método de pesquisa é quantitativo e envolve a coleta, filtragem, mineração dos textos e análise de resultados. Para a mineração de textos utiliza-se o algoritmo de clustering K-Means e, posteriormente, o software para análise de corpus AntConc. Conclui-se que o método aplicado sinaliza sobre os principais pontos de discussão e suas mudanças ao longo do tempo. Tais sinalizações poderiam contribuir para a criação de categorias de postagens mais detalhadas em uma posterior Análise de ConteúdoInstituto Brasileiro de Informação em Ciência e Tecnologia (Ibict)2020-12-11info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttp://revista.ibict.br/liinc/article/view/532510.18617/liinc.v16i2.5325Liinc em Revista; Vol. 16 No. 2 (2020): Informational Perspectives and Challenges in Times of the Covid-19 Pandemic; e5325Liinc em Revista; Vol. 16 Núm. 2 (2020): Perspectivas y desafíos de la información en tiempos de la Pandemia de Covid-19; e5325Liinc em Revista; v. 16 n. 2 (2020): Perspectivas e desafios informacionais em tempos da pandemia da Covid-19; e53251808-3536reponame:Liinc em Revistainstname:Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT)instacron:IBICTporhttp://revista.ibict.br/liinc/article/view/5325/5104Todos os direitos (c) 2020 Alexandre Ribeiro Afonso, Cláudio Gottschalg Duquehttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessRibeiro Afonso, AlexandreGottschalg Duque, Cláudio2021-05-27T11:34:14Zoai:ojs.revista.ibict.br:article/5325Revistahttp://revista.ibict.br/liincPUBhttp://revista.ibict.br/liinc/oai1808-35361808-3536opendoar:null2021-05-27 11:34:15.049Liinc em Revista - Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT)false
dc.title.none.fl_str_mv Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline
Mineração de textos aplicada a postagens do Twitter sobre Coronavírus: uma análise na linha do tempo
title Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline
spellingShingle Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline
Ribeiro Afonso, Alexandre
Text Mining
Corpus
Twitter
Coronavírus
Brasil
Mineração de Textos
Corpus
Twitter
Coronavírus
Brasil
title_short Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline
title_full Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline
title_fullStr Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline
title_full_unstemmed Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline
title_sort Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline
author Ribeiro Afonso, Alexandre
author_facet Ribeiro Afonso, Alexandre
Gottschalg Duque, Cláudio
author_role author
author2 Gottschalg Duque, Cláudio
author2_role author
dc.contributor.author.fl_str_mv Ribeiro Afonso, Alexandre
Gottschalg Duque, Cláudio
dc.subject.por.fl_str_mv Text Mining
Corpus
Twitter
Coronavírus
Brasil
Mineração de Textos
Corpus
Twitter
Coronavírus
Brasil
topic Text Mining
Corpus
Twitter
Coronavírus
Brasil
Mineração de Textos
Corpus
Twitter
Coronavírus
Brasil
dc.description.none.fl_txt_mv This article describes a research about the mining of posts collected from Twitter, containing two keywords: “Coronavírus” and “Brasil”. The focus is on listing the frequencies of nouns, and verifying those frequencies as indicators about the interests of discussion, in four time periods: from February to June 2020. The research method is quantitative and involves the collection, filtering, text mining and analysis of results. In text mining, the K-Means clustering algorithm is used and, subsequently, AntConc corpus analysis software. It is concluded that the applied method signals about the main points of discussion and their changes over time. Such signs could contribute to the creation of more detailed categories of posts in a later Content Analysis
Este artigo descreve uma pesquisa sobre a mineração de postagens coletadas do Twitter, contendo duas palavras-chave: “Coronavírus” e “Brasil”. O enfoque é a listagem das frequências dos substantivos (nouns), e a verificação de tais frequências como indicadores dos interesses de discussão, em quatro períodos de tempo: de fevereiro a junho de 2020. O método de pesquisa é quantitativo e envolve a coleta, filtragem, mineração dos textos e análise de resultados. Para a mineração de textos utiliza-se o algoritmo de clustering K-Means e, posteriormente, o software para análise de corpus AntConc. Conclui-se que o método aplicado sinaliza sobre os principais pontos de discussão e suas mudanças ao longo do tempo. Tais sinalizações poderiam contribuir para a criação de categorias de postagens mais detalhadas em uma posterior Análise de Conteúdo
description This article describes a research about the mining of posts collected from Twitter, containing two keywords: “Coronavírus” and “Brasil”. The focus is on listing the frequencies of nouns, and verifying those frequencies as indicators about the interests of discussion, in four time periods: from February to June 2020. The research method is quantitative and involves the collection, filtering, text mining and analysis of results. In text mining, the K-Means clustering algorithm is used and, subsequently, AntConc corpus analysis software. It is concluded that the applied method signals about the main points of discussion and their changes over time. Such signs could contribute to the creation of more detailed categories of posts in a later Content Analysis
publishDate 2020
dc.date.none.fl_str_mv 2020-12-11
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://revista.ibict.br/liinc/article/view/5325
10.18617/liinc.v16i2.5325
url http://revista.ibict.br/liinc/article/view/5325
identifier_str_mv 10.18617/liinc.v16i2.5325
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv http://revista.ibict.br/liinc/article/view/5325/5104
dc.rights.driver.fl_str_mv Todos os direitos (c) 2020 Alexandre Ribeiro Afonso, Cláudio Gottschalg Duque
https://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Todos os direitos (c) 2020 Alexandre Ribeiro Afonso, Cláudio Gottschalg Duque
https://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict)
publisher.none.fl_str_mv Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict)
dc.source.none.fl_str_mv Liinc em Revista; Vol. 16 No. 2 (2020): Informational Perspectives and Challenges in Times of the Covid-19 Pandemic; e5325
Liinc em Revista; Vol. 16 Núm. 2 (2020): Perspectivas y desafíos de la información en tiempos de la Pandemia de Covid-19; e5325
Liinc em Revista; v. 16 n. 2 (2020): Perspectivas e desafios informacionais em tempos da pandemia da Covid-19; e5325
1808-3536
reponame:Liinc em Revista
instname:Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT)
instacron:IBICT
reponame_str Liinc em Revista
collection Liinc em Revista
instname_str Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT)
instacron_str IBICT
institution IBICT
repository.name.fl_str_mv Liinc em Revista - Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT)
repository.mail.fl_str_mv
subject_por_txtF_mv Text Mining
Corpus
Twitter
Coronavírus
Brasil
Mineração de Textos
Corpus
Twitter
Coronavírus
Brasil
_version_ 1700924326611517440