Identificação automática da presença social em discussões online escritas em português
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal de Alagoas (UFAL) |
Texto Completo: | http://www.repositorio.ufal.br/handle/riufal/7348 |
Resumo: | This M.Sc. dissertation presents a method that allows the automatic identification of messages from distance learning online forums written in Brazilian Portuguese. In particular, it analyzes the problem of coding discussion messages according to the categories of social presence, an important construct of the Community of Inquiry (CoI) model widely used in online learning. Although there are coding techniques for social presence in the English language, the literature is still lacking in methods for other languages, such as Portuguese. The method proposed here uses a set of characteristics derived from the frequency of words and 158 characteristics extracted from two resources, LIWC and Coh-Metrix, available for textual analysis using Text Mining techniques, to create a classifier for each one of the three categories of social presence (Affective, Interactive and Cohesive). For that, three types of algorithms were used, Random Forest, AdaBoost and XGBoost where the best model developed used the XGBoost algorithm reaching 85.68% accuracy and Kappa index (k) of 0.71, which represents a substantial agreement, and is well above the level of pure chance. This work also provides an analysis of the nature of social presence, observing the classification characteristics that were most relevant to distinguish the three categories of presence and a comparative analysis on the main characteristics identified in the phases of social presence in different domains. |
id |
UFAL_788414b0078e181050e4a0617174af5e |
---|---|
oai_identifier_str |
oai:www.repositorio.ufal.br:riufal/7348 |
network_acronym_str |
UFAL |
network_name_str |
Repositório Institucional da Universidade Federal de Alagoas (UFAL) |
repository_id_str |
4648 |
spelling |
Identificação automática da presença social em discussões online escritas em portuguêsAutomatic identification of social presence in online discussions written in portugueseCodificação de mensagensDiscussões onlinePresença socialComunidades de investigaçãoMineração de textosSocial presenceCommunity of inquiry (CoI) modelOnline discussionText classificationCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThis M.Sc. dissertation presents a method that allows the automatic identification of messages from distance learning online forums written in Brazilian Portuguese. In particular, it analyzes the problem of coding discussion messages according to the categories of social presence, an important construct of the Community of Inquiry (CoI) model widely used in online learning. Although there are coding techniques for social presence in the English language, the literature is still lacking in methods for other languages, such as Portuguese. The method proposed here uses a set of characteristics derived from the frequency of words and 158 characteristics extracted from two resources, LIWC and Coh-Metrix, available for textual analysis using Text Mining techniques, to create a classifier for each one of the three categories of social presence (Affective, Interactive and Cohesive). For that, three types of algorithms were used, Random Forest, AdaBoost and XGBoost where the best model developed used the XGBoost algorithm reaching 85.68% accuracy and Kappa index (k) of 0.71, which represents a substantial agreement, and is well above the level of pure chance. This work also provides an analysis of the nature of social presence, observing the classification characteristics that were most relevant to distinguish the three categories of presence and a comparative analysis on the main characteristics identified in the phases of social presence in different domains.Esta dissertação de mestrado apresenta um método que permite a identificação automática de mensagens provenientes de fóruns online de ensino a distância escritas em português brasileiro. Particularmente, analisa o problema da codificação de mensagens de discussão segundo as categorias de presença social, um importante construto do modelo de Comunidade de Investigação amplamente utilizado na aprendizagem online. Apesar de existirem técnicas de codificação para a presença social na língua inglesa, a literatura ainda é carente em métodos para as demais línguas, como o português. O método aqui proposto utiliza-se de um conjunto de características provenientes da frequência de palavras e 158 características extraídas de dois recursos, LIWC e Coh-Metrix, disponíveis para análise textual através de técnicas de Mineração de Texto, para criar um classificador para cada uma das três categorias da presença social (Afetiva, Interativa e Coesiva). Para isso foram utilizados três tipos de algoritmos, Random Forest, AdaBoost e XGBoost onde o melhor modelo desenvolvido utilizou o algoritmo XGBoost atingindo 85,68% de acurácia e índice Kappa (k) de 0,71, o que representa uma concordância substancial, e está bem acima do grau de puro acaso. Este trabalho também provê uma análise da natureza da presença social, observando as características de classificação que foram mais relevantes para distinguir as três categorias da presença e uma análise comparativa sobre as principais características identificadas nas fases da presença social em diferentes domínios.Universidade Federal de AlagoasBrasilPrograma de Pós-Graduação em InformáticaUFALCosta, Evandro de Barroshttp://lattes.cnpq.br/5760364940162939Mello, Rafael Ferreira Leite dehttp://lattes.cnpq.br/6190254569597745Brito, Patrick Henrique da Silvahttp://lattes.cnpq.br/4155051332618408Mello, Rafael Ferreira Leite dehttp://lattes.cnpq.br/6190254569597745Rodrigues, Rodrigo Linshttp://lattes.cnpq.br/5512849006877767Teixeira, Jean Barros2020-12-14T21:11:43Z2020-12-042020-12-14T21:11:43Z2020-08-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfTEIXEIRA, Jean Barros. Identificação automática da presença social em discussões online escritas em português. 2020. 101 f. Dissertação (Mestrado em Informática) – Instituto de Computação, Programa de Pós Graduação em Informática, Universidade Federal de Alagoas, Maceió, 2020.http://www.repositorio.ufal.br/handle/riufal/7348porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal de Alagoas (UFAL)instname:Universidade Federal de Alagoas (UFAL)instacron:UFAL2020-12-14T21:20:20Zoai:www.repositorio.ufal.br:riufal/7348Repositório InstitucionalPUBhttp://www.repositorio.ufal.br/oai/requestri@sibi.ufal.bropendoar:46482020-12-14T21:20:20Repositório Institucional da Universidade Federal de Alagoas (UFAL) - Universidade Federal de Alagoas (UFAL)false |
dc.title.none.fl_str_mv |
Identificação automática da presença social em discussões online escritas em português Automatic identification of social presence in online discussions written in portuguese |
title |
Identificação automática da presença social em discussões online escritas em português |
spellingShingle |
Identificação automática da presença social em discussões online escritas em português Teixeira, Jean Barros Codificação de mensagens Discussões online Presença social Comunidades de investigação Mineração de textos Social presence Community of inquiry (CoI) model Online discussion Text classification CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Identificação automática da presença social em discussões online escritas em português |
title_full |
Identificação automática da presença social em discussões online escritas em português |
title_fullStr |
Identificação automática da presença social em discussões online escritas em português |
title_full_unstemmed |
Identificação automática da presença social em discussões online escritas em português |
title_sort |
Identificação automática da presença social em discussões online escritas em português |
author |
Teixeira, Jean Barros |
author_facet |
Teixeira, Jean Barros |
author_role |
author |
dc.contributor.none.fl_str_mv |
Costa, Evandro de Barros http://lattes.cnpq.br/5760364940162939 Mello, Rafael Ferreira Leite de http://lattes.cnpq.br/6190254569597745 Brito, Patrick Henrique da Silva http://lattes.cnpq.br/4155051332618408 Mello, Rafael Ferreira Leite de http://lattes.cnpq.br/6190254569597745 Rodrigues, Rodrigo Lins http://lattes.cnpq.br/5512849006877767 |
dc.contributor.author.fl_str_mv |
Teixeira, Jean Barros |
dc.subject.por.fl_str_mv |
Codificação de mensagens Discussões online Presença social Comunidades de investigação Mineração de textos Social presence Community of inquiry (CoI) model Online discussion Text classification CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
Codificação de mensagens Discussões online Presença social Comunidades de investigação Mineração de textos Social presence Community of inquiry (CoI) model Online discussion Text classification CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
This M.Sc. dissertation presents a method that allows the automatic identification of messages from distance learning online forums written in Brazilian Portuguese. In particular, it analyzes the problem of coding discussion messages according to the categories of social presence, an important construct of the Community of Inquiry (CoI) model widely used in online learning. Although there are coding techniques for social presence in the English language, the literature is still lacking in methods for other languages, such as Portuguese. The method proposed here uses a set of characteristics derived from the frequency of words and 158 characteristics extracted from two resources, LIWC and Coh-Metrix, available for textual analysis using Text Mining techniques, to create a classifier for each one of the three categories of social presence (Affective, Interactive and Cohesive). For that, three types of algorithms were used, Random Forest, AdaBoost and XGBoost where the best model developed used the XGBoost algorithm reaching 85.68% accuracy and Kappa index (k) of 0.71, which represents a substantial agreement, and is well above the level of pure chance. This work also provides an analysis of the nature of social presence, observing the classification characteristics that were most relevant to distinguish the three categories of presence and a comparative analysis on the main characteristics identified in the phases of social presence in different domains. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-12-14T21:11:43Z 2020-12-04 2020-12-14T21:11:43Z 2020-08-28 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
TEIXEIRA, Jean Barros. Identificação automática da presença social em discussões online escritas em português. 2020. 101 f. Dissertação (Mestrado em Informática) – Instituto de Computação, Programa de Pós Graduação em Informática, Universidade Federal de Alagoas, Maceió, 2020. http://www.repositorio.ufal.br/handle/riufal/7348 |
identifier_str_mv |
TEIXEIRA, Jean Barros. Identificação automática da presença social em discussões online escritas em português. 2020. 101 f. Dissertação (Mestrado em Informática) – Instituto de Computação, Programa de Pós Graduação em Informática, Universidade Federal de Alagoas, Maceió, 2020. |
url |
http://www.repositorio.ufal.br/handle/riufal/7348 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Alagoas Brasil Programa de Pós-Graduação em Informática UFAL |
publisher.none.fl_str_mv |
Universidade Federal de Alagoas Brasil Programa de Pós-Graduação em Informática UFAL |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal de Alagoas (UFAL) instname:Universidade Federal de Alagoas (UFAL) instacron:UFAL |
instname_str |
Universidade Federal de Alagoas (UFAL) |
instacron_str |
UFAL |
institution |
UFAL |
reponame_str |
Repositório Institucional da Universidade Federal de Alagoas (UFAL) |
collection |
Repositório Institucional da Universidade Federal de Alagoas (UFAL) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal de Alagoas (UFAL) - Universidade Federal de Alagoas (UFAL) |
repository.mail.fl_str_mv |
ri@sibi.ufal.br |
_version_ |
1817557403210612736 |