Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Outros Autores: | |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Liinc em Revista |
Texto Completo: | http://revista.ibict.br/liinc/article/view/5325 |
Resumo: | This article describes a research about the mining of posts collected from Twitter, containing two keywords: “Coronavírus” and “Brasil”. The focus is on listing the frequencies of nouns, and verifying those frequencies as indicators about the interests of discussion, in four time periods: from February to June 2020. The research method is quantitative and involves the collection, filtering, text mining and analysis of results. In text mining, the K-Means clustering algorithm is used and, subsequently, AntConc corpus analysis software. It is concluded that the applied method signals about the main points of discussion and their changes over time. Such signs could contribute to the creation of more detailed categories of posts in a later Content Analysis |
id |
IBICT-2_21a95331654edf27526fb5a43082e964 |
---|---|
oai_identifier_str |
oai:ojs.revista.ibict.br:article/5325 |
network_acronym_str |
IBICT-2 |
network_name_str |
Liinc em Revista |
spelling |
Text mining applied to Twitter posts on Coronavirus: an analysis in the timelineMineração de textos aplicada a postagens do Twitter sobre Coronavírus: uma análise na linha do tempoText MiningCorpusTwitterCoronavírusBrasilMineração de TextosCorpusTwitterCoronavírusBrasilThis article describes a research about the mining of posts collected from Twitter, containing two keywords: “Coronavírus” and “Brasil”. The focus is on listing the frequencies of nouns, and verifying those frequencies as indicators about the interests of discussion, in four time periods: from February to June 2020. The research method is quantitative and involves the collection, filtering, text mining and analysis of results. In text mining, the K-Means clustering algorithm is used and, subsequently, AntConc corpus analysis software. It is concluded that the applied method signals about the main points of discussion and their changes over time. Such signs could contribute to the creation of more detailed categories of posts in a later Content AnalysisEste artigo descreve uma pesquisa sobre a mineração de postagens coletadas do Twitter, contendo duas palavras-chave: “Coronavírus” e “Brasil”. O enfoque é a listagem das frequências dos substantivos (nouns), e a verificação de tais frequências como indicadores dos interesses de discussão, em quatro períodos de tempo: de fevereiro a junho de 2020. O método de pesquisa é quantitativo e envolve a coleta, filtragem, mineração dos textos e análise de resultados. Para a mineração de textos utiliza-se o algoritmo de clustering K-Means e, posteriormente, o software para análise de corpus AntConc. Conclui-se que o método aplicado sinaliza sobre os principais pontos de discussão e suas mudanças ao longo do tempo. Tais sinalizações poderiam contribuir para a criação de categorias de postagens mais detalhadas em uma posterior Análise de ConteúdoInstituto Brasileiro de Informação em Ciência e Tecnologia (Ibict)2020-12-11info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttp://revista.ibict.br/liinc/article/view/532510.18617/liinc.v16i2.5325Liinc em Revista; Vol. 16 No. 2 (2020): Informational Perspectives and Challenges in Times of the Covid-19 Pandemic; e5325Liinc em Revista; Vol. 16 Núm. 2 (2020): Perspectivas y desafíos de la información en tiempos de la Pandemia de Covid-19; e5325Liinc em Revista; v. 16 n. 2 (2020): Perspectivas e desafios informacionais em tempos da pandemia da Covid-19; e53251808-3536reponame:Liinc em Revistainstname:Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT)instacron:IBICTporhttp://revista.ibict.br/liinc/article/view/5325/5104Todos os direitos (c) 2020 Alexandre Ribeiro Afonso, Cláudio Gottschalg Duquehttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessRibeiro Afonso, AlexandreGottschalg Duque, Cláudio2021-05-27T11:34:14Zoai:ojs.revista.ibict.br:article/5325Revistahttp://revista.ibict.br/liincPUBhttp://revista.ibict.br/liinc/oai1808-35361808-3536opendoar:null2021-05-27 11:34:15.049Liinc em Revista - Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT)false |
dc.title.none.fl_str_mv |
Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline Mineração de textos aplicada a postagens do Twitter sobre Coronavírus: uma análise na linha do tempo |
title |
Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline |
spellingShingle |
Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline Ribeiro Afonso, Alexandre Text Mining Corpus Coronavírus Brasil Mineração de Textos Corpus Coronavírus Brasil |
title_short |
Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline |
title_full |
Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline |
title_fullStr |
Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline |
title_full_unstemmed |
Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline |
title_sort |
Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline |
author |
Ribeiro Afonso, Alexandre |
author_facet |
Ribeiro Afonso, Alexandre Gottschalg Duque, Cláudio |
author_role |
author |
author2 |
Gottschalg Duque, Cláudio |
author2_role |
author |
dc.contributor.author.fl_str_mv |
Ribeiro Afonso, Alexandre Gottschalg Duque, Cláudio |
dc.subject.por.fl_str_mv |
Text Mining Corpus Coronavírus Brasil Mineração de Textos Corpus Coronavírus Brasil |
topic |
Text Mining Corpus Coronavírus Brasil Mineração de Textos Corpus Coronavírus Brasil |
dc.description.none.fl_txt_mv |
This article describes a research about the mining of posts collected from Twitter, containing two keywords: “Coronavírus” and “Brasil”. The focus is on listing the frequencies of nouns, and verifying those frequencies as indicators about the interests of discussion, in four time periods: from February to June 2020. The research method is quantitative and involves the collection, filtering, text mining and analysis of results. In text mining, the K-Means clustering algorithm is used and, subsequently, AntConc corpus analysis software. It is concluded that the applied method signals about the main points of discussion and their changes over time. Such signs could contribute to the creation of more detailed categories of posts in a later Content Analysis Este artigo descreve uma pesquisa sobre a mineração de postagens coletadas do Twitter, contendo duas palavras-chave: “Coronavírus” e “Brasil”. O enfoque é a listagem das frequências dos substantivos (nouns), e a verificação de tais frequências como indicadores dos interesses de discussão, em quatro períodos de tempo: de fevereiro a junho de 2020. O método de pesquisa é quantitativo e envolve a coleta, filtragem, mineração dos textos e análise de resultados. Para a mineração de textos utiliza-se o algoritmo de clustering K-Means e, posteriormente, o software para análise de corpus AntConc. Conclui-se que o método aplicado sinaliza sobre os principais pontos de discussão e suas mudanças ao longo do tempo. Tais sinalizações poderiam contribuir para a criação de categorias de postagens mais detalhadas em uma posterior Análise de Conteúdo |
description |
This article describes a research about the mining of posts collected from Twitter, containing two keywords: “Coronavírus” and “Brasil”. The focus is on listing the frequencies of nouns, and verifying those frequencies as indicators about the interests of discussion, in four time periods: from February to June 2020. The research method is quantitative and involves the collection, filtering, text mining and analysis of results. In text mining, the K-Means clustering algorithm is used and, subsequently, AntConc corpus analysis software. It is concluded that the applied method signals about the main points of discussion and their changes over time. Such signs could contribute to the creation of more detailed categories of posts in a later Content Analysis |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-12-11 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://revista.ibict.br/liinc/article/view/5325 10.18617/liinc.v16i2.5325 |
url |
http://revista.ibict.br/liinc/article/view/5325 |
identifier_str_mv |
10.18617/liinc.v16i2.5325 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
http://revista.ibict.br/liinc/article/view/5325/5104 |
dc.rights.driver.fl_str_mv |
Todos os direitos (c) 2020 Alexandre Ribeiro Afonso, Cláudio Gottschalg Duque https://creativecommons.org/licenses/by/4.0 info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Todos os direitos (c) 2020 Alexandre Ribeiro Afonso, Cláudio Gottschalg Duque https://creativecommons.org/licenses/by/4.0 |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict) |
publisher.none.fl_str_mv |
Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict) |
dc.source.none.fl_str_mv |
Liinc em Revista; Vol. 16 No. 2 (2020): Informational Perspectives and Challenges in Times of the Covid-19 Pandemic; e5325 Liinc em Revista; Vol. 16 Núm. 2 (2020): Perspectivas y desafíos de la información en tiempos de la Pandemia de Covid-19; e5325 Liinc em Revista; v. 16 n. 2 (2020): Perspectivas e desafios informacionais em tempos da pandemia da Covid-19; e5325 1808-3536 reponame:Liinc em Revista instname:Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT) instacron:IBICT |
reponame_str |
Liinc em Revista |
collection |
Liinc em Revista |
instname_str |
Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT) |
instacron_str |
IBICT |
institution |
IBICT |
repository.name.fl_str_mv |
Liinc em Revista - Instituto Brasileiro de Informação Ciência e Tecnologia (IBICT) |
repository.mail.fl_str_mv |
|
subject_por_txtF_mv |
Text Mining Corpus Coronavírus Brasil Mineração de Textos Corpus Coronavírus Brasil |
_version_ |
1700924326611517440 |