An application of tools for data collection and analysis in linguistics
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://doi.org/10.21814/diacritica.576 |
Resumo: | O uso de tecnologias influencia diferentes campos de saber e atividade humanos, inclusive a linguagem. Nesse sentido, as potencialidades verificadas nos ambientes digitais para circulação de dados linguísticos precisam ser exploradas. Para isso, este trabalho descreve três ferramentas digitais relacionadas à coleta e análise de dados: primeiro, o aplicativo Netvizz, integrado ao Facebook, que auxilia na montagem de corpora com dados dessa rede; segundo, o software Tropes, capaz de analisar textos a partir do processamento lexical, indicando elementos como o estilo e frequência das categorias lexicais; finalmente, o programa Linguakit, que seleciona palavras-chave, apresenta a frequência de palavras e realiza análise de sentimentos, entre outras tarefas. Para testar as ferramentas, selecionamos um conjunto de dados, retirado dapágina do El País Brasil por ocasião da prisão do ex-presidente Lula. Após a coletade comentários, a aplicação no Tropes mostrou uma ocorrência alta de conectivos emodalizadores, além de itens lexicais referentes à situação (“universo de referência”). Já a análise no Linguakit apontou, além da alta frequência de termos específicos nasituação, elementos típicos da Comunicação Mediada por Computador (como abreviações), bem como um sentimento mais negativo associado aos comentários. |
id |
RCAP_5228185a914842e6ac2ff5fd0362b5a8 |
---|---|
oai_identifier_str |
oai:journals.uminho.pt:article/5159 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
An application of tools for data collection and analysis in linguisticsAplicação de ferramentas para coleta e análise de dados em linguísticaLanguage and technologyData collectionAutomatic text analysisSocial networkLinguagem e tecnologiaColeta de dadosAnálise automática de textosRede socialO uso de tecnologias influencia diferentes campos de saber e atividade humanos, inclusive a linguagem. Nesse sentido, as potencialidades verificadas nos ambientes digitais para circulação de dados linguísticos precisam ser exploradas. Para isso, este trabalho descreve três ferramentas digitais relacionadas à coleta e análise de dados: primeiro, o aplicativo Netvizz, integrado ao Facebook, que auxilia na montagem de corpora com dados dessa rede; segundo, o software Tropes, capaz de analisar textos a partir do processamento lexical, indicando elementos como o estilo e frequência das categorias lexicais; finalmente, o programa Linguakit, que seleciona palavras-chave, apresenta a frequência de palavras e realiza análise de sentimentos, entre outras tarefas. Para testar as ferramentas, selecionamos um conjunto de dados, retirado dapágina do El País Brasil por ocasião da prisão do ex-presidente Lula. Após a coletade comentários, a aplicação no Tropes mostrou uma ocorrência alta de conectivos emodalizadores, além de itens lexicais referentes à situação (“universo de referência”). Já a análise no Linguakit apontou, além da alta frequência de termos específicos nasituação, elementos típicos da Comunicação Mediada por Computador (como abreviações), bem como um sentimento mais negativo associado aos comentários.Technologies modify different human activities and knowledge fields, including language. Thus, some potentialities verified on digital environments for linguistic data interaction must be explored. In order to discuss how to do that, this paper describes three digital tools related to data collection and analysis: firstly, Netvizz App, on Facebook, which contributes to organize corpora by using data from this social network; secondly, Tropes software, which analyses texts from a lexical process, describing elements like text style and word frequency; thirdly, Linguakit program, which selects keyword, presents word frequency and does some sentiment analysis, among other tasks. To show how these tools work, we collect data from El País Brasilon Facebook, at the day which former president Lula has arrested. After this collection, Tropes analysis presented a higher frequency of both connectives and modal expressions, besides lexical items related to that situation. In turn, Linguakit analysis described current elements of Computer Mediated Communication (like abbreviations), besides a higher frequency of specific situation expressions, as well as a negative sentiment related to those comments.CEHUM2020-03-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://doi.org/10.21814/diacritica.576https://doi.org/10.21814/diacritica.576Diacrítica; Vol. 32 N.º 3 (2018): Corpora nas humanidades digitais; 129-155Diacrítica; Vol. 32 No. 3 (2018): Corpora in the Digital Humanities; 129-1552183-91740870-896710.21814/10.21814/diacritica.32.3reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPporhttps://revistas.uminho.pt/index.php/diacritica/article/view/5159https://revistas.uminho.pt/index.php/diacritica/article/view/5159/5706Direitos de Autor (c) 2023 Roberlei Alves Bertucciinfo:eu-repo/semantics/openAccessBertucci, Roberlei Alves2023-07-28T07:48:16Zoai:journals.uminho.pt:article/5159Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T18:34:45.533221Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
An application of tools for data collection and analysis in linguistics Aplicação de ferramentas para coleta e análise de dados em linguística |
title |
An application of tools for data collection and analysis in linguistics |
spellingShingle |
An application of tools for data collection and analysis in linguistics Bertucci, Roberlei Alves Language and technology Data collection Automatic text analysis Social network Linguagem e tecnologia Coleta de dados Análise automática de textos Rede social |
title_short |
An application of tools for data collection and analysis in linguistics |
title_full |
An application of tools for data collection and analysis in linguistics |
title_fullStr |
An application of tools for data collection and analysis in linguistics |
title_full_unstemmed |
An application of tools for data collection and analysis in linguistics |
title_sort |
An application of tools for data collection and analysis in linguistics |
author |
Bertucci, Roberlei Alves |
author_facet |
Bertucci, Roberlei Alves |
author_role |
author |
dc.contributor.author.fl_str_mv |
Bertucci, Roberlei Alves |
dc.subject.por.fl_str_mv |
Language and technology Data collection Automatic text analysis Social network Linguagem e tecnologia Coleta de dados Análise automática de textos Rede social |
topic |
Language and technology Data collection Automatic text analysis Social network Linguagem e tecnologia Coleta de dados Análise automática de textos Rede social |
description |
O uso de tecnologias influencia diferentes campos de saber e atividade humanos, inclusive a linguagem. Nesse sentido, as potencialidades verificadas nos ambientes digitais para circulação de dados linguísticos precisam ser exploradas. Para isso, este trabalho descreve três ferramentas digitais relacionadas à coleta e análise de dados: primeiro, o aplicativo Netvizz, integrado ao Facebook, que auxilia na montagem de corpora com dados dessa rede; segundo, o software Tropes, capaz de analisar textos a partir do processamento lexical, indicando elementos como o estilo e frequência das categorias lexicais; finalmente, o programa Linguakit, que seleciona palavras-chave, apresenta a frequência de palavras e realiza análise de sentimentos, entre outras tarefas. Para testar as ferramentas, selecionamos um conjunto de dados, retirado dapágina do El País Brasil por ocasião da prisão do ex-presidente Lula. Após a coletade comentários, a aplicação no Tropes mostrou uma ocorrência alta de conectivos emodalizadores, além de itens lexicais referentes à situação (“universo de referência”). Já a análise no Linguakit apontou, além da alta frequência de termos específicos nasituação, elementos típicos da Comunicação Mediada por Computador (como abreviações), bem como um sentimento mais negativo associado aos comentários. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-03-24 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://doi.org/10.21814/diacritica.576 https://doi.org/10.21814/diacritica.576 |
url |
https://doi.org/10.21814/diacritica.576 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://revistas.uminho.pt/index.php/diacritica/article/view/5159 https://revistas.uminho.pt/index.php/diacritica/article/view/5159/5706 |
dc.rights.driver.fl_str_mv |
Direitos de Autor (c) 2023 Roberlei Alves Bertucci info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Direitos de Autor (c) 2023 Roberlei Alves Bertucci |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
CEHUM |
publisher.none.fl_str_mv |
CEHUM |
dc.source.none.fl_str_mv |
Diacrítica; Vol. 32 N.º 3 (2018): Corpora nas humanidades digitais; 129-155 Diacrítica; Vol. 32 No. 3 (2018): Corpora in the Digital Humanities; 129-155 2183-9174 0870-8967 10.21814/10.21814/diacritica.32.3 reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799132073562210304 |