Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline

Ribeiro Afonso, Alexandre; Gottschalg Duque, Cláudio

Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline

Detalhes bibliográficos
Autor(a) principal:	Ribeiro Afonso, Alexandre
Data de Publicação:	2020
Outros Autores:	Gottschalg Duque, Cláudio
Tipo de documento:	Artigo
Idioma:	por
Título da fonte:	Liinc em Revista
Texto Completo:	http://revista.ibict.br/liinc/article/view/5325
Resumo:	This article describes a research about the mining of posts collected from Twitter, containing two keywords: “Coronavírus” and “Brasil”. The focus is on listing the frequencies of nouns, and verifying those frequencies as indicators about the interests of discussion, in four time periods: from February to June 2020. The research method is quantitative and involves the collection, filtering, text mining and analysis of results. In text mining, the K-Means clustering algorithm is used and, subsequently, AntConc corpus analysis software. It is concluded that the applied method signals about the main points of discussion and their changes over time. Such signs could contribute to the creation of more detailed categories of posts in a later Content Analysis

Metadados do item

id	IBICT-2_21a95331654edf27526fb5a43082e964
oai_identifier_str	oai:ojs.revista.ibict.br:article/5325
network_acronym_str	IBICT-2
network_name_str	Liinc em Revista
spelling	Text mining applied to Twitter posts on Coronavirus: an analysis in the timelineMineração de textos aplicada a postagens do Twitter sobre Coronavírus: uma análise na linha do tempoText MiningCorpusTwitterCoronavírusBrasilMineração de TextosCorpusTwitterCoronavírusBrasilThis article describes a research about the mining of posts collected from Twitter, containing two keywords: “Coronavírus” and “Brasil”. The focus is on listing the frequencies of nouns, and verifying those frequencies as indicators about the interests of discussion, in four time periods: from February to June 2020. The research method is quantitative and involves the collection, filtering, text mining and analysis of results. In text mining, the K-Means clustering algorithm is used and, subsequently, AntConc corpus analysis software. It is concluded that the applied method signals about the main points of discussion and their changes over time. Such signs could contribute to the creation of more detailed categories of posts in a later Content AnalysisEste artigo descreve uma pesquisa sobre a mineração de postagens coletadas do Twitter, contendo duas palavras-chave: “Coronavírus” e “Brasil”. O enfoque é a listagem das frequências dos substantivos (nouns), e a verificação de tais frequências como indicadores dos interesses de discussão, em quatro períodos de tempo: de fevereiro a junho de 2020. O método de pesquisa é quantitativo e envolve a coleta, filtragem, mineração dos textos e análise de resultados. Para a mineração de textos utiliza-se o algoritmo de clustering K-Means e, posteriormente, o software para análise de corpus AntConc. Conclui-se que o método aplicado sinaliza sobre os principais pontos de discussão e suas mudanças ao longo do tempo. Tais sinalizações poderiam contribuir para a criação de categorias de postagens mais detalhadas em uma posterior Análise de ConteúdoInstituto Brasileiro de Informação em Ciência e Tecnologia (Ibict)2020-12-11info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttp://revista.ibict.br/liinc/article/view/532510.18617/liinc.v16i2.5325Liinc em Revista; Vol. 16 No. 2 (2020): Informational Perspectives and Challenges in Times of the Covid-19 Pandemic; e5325Liinc em Revista; Vol. 16 Núm. 2 (2020): Perspectivas y desafíos de la información en tiempos de la Pandemia de Covid-19; e5325Liinc em Revista; v. 16 n. 2 (2020): Perspectivas e desafios informacionais em tempos da pandemia da Covid-19; e53251808-3536reponame:Liinc em Revistainstname:Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT)instacron:IBICTporhttp://revista.ibict.br/liinc/article/view/5325/5104Todos os direitos (c) 2020 Alexandre Ribeiro Afonso, Cláudio Gottschalg Duquehttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessRibeiro Afonso, AlexandreGottschalg Duque, Cláudio2021-05-27T11:34:14Zoai:ojs.revista.ibict.br:article/5325Revistahttp://revista.ibict.br/liincPUBhttp://revista.ibict.br/liinc/oai1808-35361808-3536opendoar:null2021-05-27 11:34:15.049Liinc em Revista - Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT)false
dc.title.none.fl_str_mv	Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline Mineração de textos aplicada a postagens do Twitter sobre Coronavírus: uma análise na linha do tempo
title	Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline
spellingShingle	Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline Ribeiro Afonso, Alexandre Text Mining Corpus Twitter Coronavírus Brasil Mineração de Textos Corpus Twitter Coronavírus Brasil
title_short	Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline
title_full	Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline
title_fullStr	Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline
title_full_unstemmed	Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline
title_sort	Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline
author	Ribeiro Afonso, Alexandre
author_facet	Ribeiro Afonso, Alexandre Gottschalg Duque, Cláudio
author_role	author
author2	Gottschalg Duque, Cláudio
author2_role	author
dc.contributor.author.fl_str_mv	Ribeiro Afonso, Alexandre Gottschalg Duque, Cláudio
dc.subject.por.fl_str_mv	Text Mining Corpus Twitter Coronavírus Brasil Mineração de Textos Corpus Twitter Coronavírus Brasil
topic	Text Mining Corpus Twitter Coronavírus Brasil Mineração de Textos Corpus Twitter Coronavírus Brasil
dc.description.none.fl_txt_mv	This article describes a research about the mining of posts collected from Twitter, containing two keywords: “Coronavírus” and “Brasil”. The focus is on listing the frequencies of nouns, and verifying those frequencies as indicators about the interests of discussion, in four time periods: from February to June 2020. The research method is quantitative and involves the collection, filtering, text mining and analysis of results. In text mining, the K-Means clustering algorithm is used and, subsequently, AntConc corpus analysis software. It is concluded that the applied method signals about the main points of discussion and their changes over time. Such signs could contribute to the creation of more detailed categories of posts in a later Content Analysis Este artigo descreve uma pesquisa sobre a mineração de postagens coletadas do Twitter, contendo duas palavras-chave: “Coronavírus” e “Brasil”. O enfoque é a listagem das frequências dos substantivos (nouns), e a verificação de tais frequências como indicadores dos interesses de discussão, em quatro períodos de tempo: de fevereiro a junho de 2020. O método de pesquisa é quantitativo e envolve a coleta, filtragem, mineração dos textos e análise de resultados. Para a mineração de textos utiliza-se o algoritmo de clustering K-Means e, posteriormente, o software para análise de corpus AntConc. Conclui-se que o método aplicado sinaliza sobre os principais pontos de discussão e suas mudanças ao longo do tempo. Tais sinalizações poderiam contribuir para a criação de categorias de postagens mais detalhadas em uma posterior Análise de Conteúdo
description	This article describes a research about the mining of posts collected from Twitter, containing two keywords: “Coronavírus” and “Brasil”. The focus is on listing the frequencies of nouns, and verifying those frequencies as indicators about the interests of discussion, in four time periods: from February to June 2020. The research method is quantitative and involves the collection, filtering, text mining and analysis of results. In text mining, the K-Means clustering algorithm is used and, subsequently, AntConc corpus analysis software. It is concluded that the applied method signals about the main points of discussion and their changes over time. Such signs could contribute to the creation of more detailed categories of posts in a later Content Analysis
publishDate	2020
dc.date.none.fl_str_mv	2020-12-11
dc.type.driver.fl_str_mv	info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion
format	article
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://revista.ibict.br/liinc/article/view/5325 10.18617/liinc.v16i2.5325
url	http://revista.ibict.br/liinc/article/view/5325
identifier_str_mv	10.18617/liinc.v16i2.5325
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv	http://revista.ibict.br/liinc/article/view/5325/5104
dc.rights.driver.fl_str_mv	Todos os direitos (c) 2020 Alexandre Ribeiro Afonso, Cláudio Gottschalg Duque https://creativecommons.org/licenses/by/4.0 info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Todos os direitos (c) 2020 Alexandre Ribeiro Afonso, Cláudio Gottschalg Duque https://creativecommons.org/licenses/by/4.0
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict)
publisher.none.fl_str_mv	Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict)
dc.source.none.fl_str_mv	Liinc em Revista; Vol. 16 No. 2 (2020): Informational Perspectives and Challenges in Times of the Covid-19 Pandemic; e5325 Liinc em Revista; Vol. 16 Núm. 2 (2020): Perspectivas y desafíos de la información en tiempos de la Pandemia de Covid-19; e5325 Liinc em Revista; v. 16 n. 2 (2020): Perspectivas e desafios informacionais em tempos da pandemia da Covid-19; e5325 1808-3536 reponame:Liinc em Revista instname:Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT) instacron:IBICT
reponame_str	Liinc em Revista
collection	Liinc em Revista
instname_str	Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT)
instacron_str	IBICT
institution	IBICT
repository.name.fl_str_mv	Liinc em Revista - Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT)
repository.mail.fl_str_mv
subject_por_txtF_mv	Text Mining Corpus Twitter Coronavírus Brasil Mineração de Textos Corpus Twitter Coronavírus Brasil
_version_	1700924326611517440

Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline

Registros relacionados