An application of tools for data collection and analysis in linguistics

Detalhes bibliográficos
Autor(a) principal: Bertucci, Roberlei Alves
Data de Publicação: 2020
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://doi.org/10.21814/diacritica.576
Resumo: O uso de tecnologias influencia diferentes campos de saber e atividade humanos, inclusive a linguagem. Nesse sentido, as potencialidades verificadas nos ambientes digitais para circulação de dados linguísticos precisam ser exploradas. Para isso, este trabalho descreve três ferramentas digitais relacionadas à coleta e análise de dados: primeiro, o aplicativo Netvizz, integrado ao Facebook, que auxilia na montagem de corpora com dados dessa rede; segundo, o software Tropes, capaz de analisar textos a partir do processamento lexical, indicando elementos como o estilo e frequência das categorias lexicais; finalmente, o programa Linguakit, que seleciona palavras-chave, apresenta a frequência de palavras e realiza análise de sentimentos, entre outras tarefas. Para testar as ferramentas, selecionamos um conjunto de dados, retirado dapágina do El País Brasil por ocasião da prisão do ex-presidente Lula. Após a coletade comentários, a aplicação no Tropes mostrou uma ocorrência alta de conectivos emodalizadores, além de itens lexicais referentes à situação (“universo de referência”). Já a análise no Linguakit apontou, além da alta frequência de termos específicos nasituação, elementos típicos da Comunicação Mediada por Computador (como abreviações), bem como um sentimento mais negativo associado aos comentários.
id RCAP_5228185a914842e6ac2ff5fd0362b5a8
oai_identifier_str oai:journals.uminho.pt:article/5159
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling An application of tools for data collection and analysis in linguisticsAplicação de ferramentas para coleta e análise de dados em linguísticaLanguage and technologyData collectionAutomatic text analysisSocial networkLinguagem e tecnologiaColeta de dadosAnálise automática de textosRede socialO uso de tecnologias influencia diferentes campos de saber e atividade humanos, inclusive a linguagem. Nesse sentido, as potencialidades verificadas nos ambientes digitais para circulação de dados linguísticos precisam ser exploradas. Para isso, este trabalho descreve três ferramentas digitais relacionadas à coleta e análise de dados: primeiro, o aplicativo Netvizz, integrado ao Facebook, que auxilia na montagem de corpora com dados dessa rede; segundo, o software Tropes, capaz de analisar textos a partir do processamento lexical, indicando elementos como o estilo e frequência das categorias lexicais; finalmente, o programa Linguakit, que seleciona palavras-chave, apresenta a frequência de palavras e realiza análise de sentimentos, entre outras tarefas. Para testar as ferramentas, selecionamos um conjunto de dados, retirado dapágina do El País Brasil por ocasião da prisão do ex-presidente Lula. Após a coletade comentários, a aplicação no Tropes mostrou uma ocorrência alta de conectivos emodalizadores, além de itens lexicais referentes à situação (“universo de referência”). Já a análise no Linguakit apontou, além da alta frequência de termos específicos nasituação, elementos típicos da Comunicação Mediada por Computador (como abreviações), bem como um sentimento mais negativo associado aos comentários.Technologies modify different human activities and knowledge fields, including language. Thus, some potentialities verified on digital environments for linguistic data interaction must be explored. In order to discuss how to do that, this paper describes three digital tools related to data collection and analysis: firstly, Netvizz App, on Facebook, which contributes to organize corpora by using data from this social network; secondly, Tropes software, which analyses texts from a lexical process, describing elements like text style and word frequency; thirdly, Linguakit program, which selects keyword, presents word frequency and does some sentiment analysis, among other tasks. To show how these tools work, we collect data from El País Brasilon Facebook, at the day which former president Lula has arrested. After this collection, Tropes analysis presented a higher frequency of both connectives and modal expressions, besides lexical items related to that situation. In turn, Linguakit analysis described current elements of Computer Mediated Communication (like abbreviations), besides a higher frequency of specific situation expressions, as well as a negative sentiment related to those comments.CEHUM2020-03-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://doi.org/10.21814/diacritica.576https://doi.org/10.21814/diacritica.576Diacrítica; Vol. 32 N.º 3 (2018): Corpora nas humanidades digitais; 129-155Diacrítica; Vol. 32 No. 3 (2018): Corpora in the Digital Humanities; 129-1552183-91740870-896710.21814/10.21814/diacritica.32.3reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPporhttps://revistas.uminho.pt/index.php/diacritica/article/view/5159https://revistas.uminho.pt/index.php/diacritica/article/view/5159/5706Direitos de Autor (c) 2023 Roberlei Alves Bertucciinfo:eu-repo/semantics/openAccessBertucci, Roberlei Alves2023-07-28T07:48:16Zoai:journals.uminho.pt:article/5159Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T18:34:45.533221Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv An application of tools for data collection and analysis in linguistics
Aplicação de ferramentas para coleta e análise de dados em linguística
title An application of tools for data collection and analysis in linguistics
spellingShingle An application of tools for data collection and analysis in linguistics
Bertucci, Roberlei Alves
Language and technology
Data collection
Automatic text analysis
Social network
Linguagem e tecnologia
Coleta de dados
Análise automática de textos
Rede social
title_short An application of tools for data collection and analysis in linguistics
title_full An application of tools for data collection and analysis in linguistics
title_fullStr An application of tools for data collection and analysis in linguistics
title_full_unstemmed An application of tools for data collection and analysis in linguistics
title_sort An application of tools for data collection and analysis in linguistics
author Bertucci, Roberlei Alves
author_facet Bertucci, Roberlei Alves
author_role author
dc.contributor.author.fl_str_mv Bertucci, Roberlei Alves
dc.subject.por.fl_str_mv Language and technology
Data collection
Automatic text analysis
Social network
Linguagem e tecnologia
Coleta de dados
Análise automática de textos
Rede social
topic Language and technology
Data collection
Automatic text analysis
Social network
Linguagem e tecnologia
Coleta de dados
Análise automática de textos
Rede social
description O uso de tecnologias influencia diferentes campos de saber e atividade humanos, inclusive a linguagem. Nesse sentido, as potencialidades verificadas nos ambientes digitais para circulação de dados linguísticos precisam ser exploradas. Para isso, este trabalho descreve três ferramentas digitais relacionadas à coleta e análise de dados: primeiro, o aplicativo Netvizz, integrado ao Facebook, que auxilia na montagem de corpora com dados dessa rede; segundo, o software Tropes, capaz de analisar textos a partir do processamento lexical, indicando elementos como o estilo e frequência das categorias lexicais; finalmente, o programa Linguakit, que seleciona palavras-chave, apresenta a frequência de palavras e realiza análise de sentimentos, entre outras tarefas. Para testar as ferramentas, selecionamos um conjunto de dados, retirado dapágina do El País Brasil por ocasião da prisão do ex-presidente Lula. Após a coletade comentários, a aplicação no Tropes mostrou uma ocorrência alta de conectivos emodalizadores, além de itens lexicais referentes à situação (“universo de referência”). Já a análise no Linguakit apontou, além da alta frequência de termos específicos nasituação, elementos típicos da Comunicação Mediada por Computador (como abreviações), bem como um sentimento mais negativo associado aos comentários.
publishDate 2020
dc.date.none.fl_str_mv 2020-03-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.21814/diacritica.576
https://doi.org/10.21814/diacritica.576
url https://doi.org/10.21814/diacritica.576
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://revistas.uminho.pt/index.php/diacritica/article/view/5159
https://revistas.uminho.pt/index.php/diacritica/article/view/5159/5706
dc.rights.driver.fl_str_mv Direitos de Autor (c) 2023 Roberlei Alves Bertucci
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Direitos de Autor (c) 2023 Roberlei Alves Bertucci
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv CEHUM
publisher.none.fl_str_mv CEHUM
dc.source.none.fl_str_mv Diacrítica; Vol. 32 N.º 3 (2018): Corpora nas humanidades digitais; 129-155
Diacrítica; Vol. 32 No. 3 (2018): Corpora in the Digital Humanities; 129-155
2183-9174
0870-8967
10.21814/10.21814/diacritica.32.3
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132073562210304