Identificação automática da presença social em discussões online escritas em português

Detalhes bibliográficos
Autor(a) principal: Teixeira, Jean Barros
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal de Alagoas (UFAL)
Texto Completo: http://www.repositorio.ufal.br/handle/riufal/7348
Resumo: This M.Sc. dissertation presents a method that allows the automatic identification of messages from distance learning online forums written in Brazilian Portuguese. In particular, it analyzes the problem of coding discussion messages according to the categories of social presence, an important construct of the Community of Inquiry (CoI) model widely used in online learning. Although there are coding techniques for social presence in the English language, the literature is still lacking in methods for other languages, such as Portuguese. The method proposed here uses a set of characteristics derived from the frequency of words and 158 characteristics extracted from two resources, LIWC and Coh-Metrix, available for textual analysis using Text Mining techniques, to create a classifier for each one of the three categories of social presence (Affective, Interactive and Cohesive). For that, three types of algorithms were used, Random Forest, AdaBoost and XGBoost where the best model developed used the XGBoost algorithm reaching 85.68% accuracy and Kappa index (k) of 0.71, which represents a substantial agreement, and is well above the level of pure chance. This work also provides an analysis of the nature of social presence, observing the classification characteristics that were most relevant to distinguish the three categories of presence and a comparative analysis on the main characteristics identified in the phases of social presence in different domains.
id UFAL_788414b0078e181050e4a0617174af5e
oai_identifier_str oai:www.repositorio.ufal.br:riufal/7348
network_acronym_str UFAL
network_name_str Repositório Institucional da Universidade Federal de Alagoas (UFAL)
repository_id_str 4648
spelling Identificação automática da presença social em discussões online escritas em portuguêsAutomatic identification of social presence in online discussions written in portugueseCodificação de mensagensDiscussões onlinePresença socialComunidades de investigaçãoMineração de textosSocial presenceCommunity of inquiry (CoI) modelOnline discussionText classificationCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThis M.Sc. dissertation presents a method that allows the automatic identification of messages from distance learning online forums written in Brazilian Portuguese. In particular, it analyzes the problem of coding discussion messages according to the categories of social presence, an important construct of the Community of Inquiry (CoI) model widely used in online learning. Although there are coding techniques for social presence in the English language, the literature is still lacking in methods for other languages, such as Portuguese. The method proposed here uses a set of characteristics derived from the frequency of words and 158 characteristics extracted from two resources, LIWC and Coh-Metrix, available for textual analysis using Text Mining techniques, to create a classifier for each one of the three categories of social presence (Affective, Interactive and Cohesive). For that, three types of algorithms were used, Random Forest, AdaBoost and XGBoost where the best model developed used the XGBoost algorithm reaching 85.68% accuracy and Kappa index (k) of 0.71, which represents a substantial agreement, and is well above the level of pure chance. This work also provides an analysis of the nature of social presence, observing the classification characteristics that were most relevant to distinguish the three categories of presence and a comparative analysis on the main characteristics identified in the phases of social presence in different domains.Esta dissertação de mestrado apresenta um método que permite a identificação automática de mensagens provenientes de fóruns online de ensino a distância escritas em português brasileiro. Particularmente, analisa o problema da codificação de mensagens de discussão segundo as categorias de presença social, um importante construto do modelo de Comunidade de Investigação amplamente utilizado na aprendizagem online. Apesar de existirem técnicas de codificação para a presença social na língua inglesa, a literatura ainda é carente em métodos para as demais línguas, como o português. O método aqui proposto utiliza-se de um conjunto de características provenientes da frequência de palavras e 158 características extraídas de dois recursos, LIWC e Coh-Metrix, disponíveis para análise textual através de técnicas de Mineração de Texto, para criar um classificador para cada uma das três categorias da presença social (Afetiva, Interativa e Coesiva). Para isso foram utilizados três tipos de algoritmos, Random Forest, AdaBoost e XGBoost onde o melhor modelo desenvolvido utilizou o algoritmo XGBoost atingindo 85,68% de acurácia e índice Kappa (k) de 0,71, o que representa uma concordância substancial, e está bem acima do grau de puro acaso. Este trabalho também provê uma análise da natureza da presença social, observando as características de classificação que foram mais relevantes para distinguir as três categorias da presença e uma análise comparativa sobre as principais características identificadas nas fases da presença social em diferentes domínios.Universidade Federal de AlagoasBrasilPrograma de Pós-Graduação em InformáticaUFALCosta, Evandro de Barroshttp://lattes.cnpq.br/5760364940162939Mello, Rafael Ferreira Leite dehttp://lattes.cnpq.br/6190254569597745Brito, Patrick Henrique da Silvahttp://lattes.cnpq.br/4155051332618408Mello, Rafael Ferreira Leite dehttp://lattes.cnpq.br/6190254569597745Rodrigues, Rodrigo Linshttp://lattes.cnpq.br/5512849006877767Teixeira, Jean Barros2020-12-14T21:11:43Z2020-12-042020-12-14T21:11:43Z2020-08-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfTEIXEIRA, Jean Barros. Identificação automática da presença social em discussões online escritas em português. 2020. 101 f. Dissertação (Mestrado em Informática) – Instituto de Computação, Programa de Pós Graduação em Informática, Universidade Federal de Alagoas, Maceió, 2020.http://www.repositorio.ufal.br/handle/riufal/7348porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal de Alagoas (UFAL)instname:Universidade Federal de Alagoas (UFAL)instacron:UFAL2020-12-14T21:20:20Zoai:www.repositorio.ufal.br:riufal/7348Repositório InstitucionalPUBhttp://www.repositorio.ufal.br/oai/requestri@sibi.ufal.bropendoar:46482020-12-14T21:20:20Repositório Institucional da Universidade Federal de Alagoas (UFAL) - Universidade Federal de Alagoas (UFAL)false
dc.title.none.fl_str_mv Identificação automática da presença social em discussões online escritas em português
Automatic identification of social presence in online discussions written in portuguese
title Identificação automática da presença social em discussões online escritas em português
spellingShingle Identificação automática da presença social em discussões online escritas em português
Teixeira, Jean Barros
Codificação de mensagens
Discussões online
Presença social
Comunidades de investigação
Mineração de textos
Social presence
Community of inquiry (CoI) model
Online discussion
Text classification
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Identificação automática da presença social em discussões online escritas em português
title_full Identificação automática da presença social em discussões online escritas em português
title_fullStr Identificação automática da presença social em discussões online escritas em português
title_full_unstemmed Identificação automática da presença social em discussões online escritas em português
title_sort Identificação automática da presença social em discussões online escritas em português
author Teixeira, Jean Barros
author_facet Teixeira, Jean Barros
author_role author
dc.contributor.none.fl_str_mv Costa, Evandro de Barros
http://lattes.cnpq.br/5760364940162939
Mello, Rafael Ferreira Leite de
http://lattes.cnpq.br/6190254569597745
Brito, Patrick Henrique da Silva
http://lattes.cnpq.br/4155051332618408
Mello, Rafael Ferreira Leite de
http://lattes.cnpq.br/6190254569597745
Rodrigues, Rodrigo Lins
http://lattes.cnpq.br/5512849006877767
dc.contributor.author.fl_str_mv Teixeira, Jean Barros
dc.subject.por.fl_str_mv Codificação de mensagens
Discussões online
Presença social
Comunidades de investigação
Mineração de textos
Social presence
Community of inquiry (CoI) model
Online discussion
Text classification
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic Codificação de mensagens
Discussões online
Presença social
Comunidades de investigação
Mineração de textos
Social presence
Community of inquiry (CoI) model
Online discussion
Text classification
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description This M.Sc. dissertation presents a method that allows the automatic identification of messages from distance learning online forums written in Brazilian Portuguese. In particular, it analyzes the problem of coding discussion messages according to the categories of social presence, an important construct of the Community of Inquiry (CoI) model widely used in online learning. Although there are coding techniques for social presence in the English language, the literature is still lacking in methods for other languages, such as Portuguese. The method proposed here uses a set of characteristics derived from the frequency of words and 158 characteristics extracted from two resources, LIWC and Coh-Metrix, available for textual analysis using Text Mining techniques, to create a classifier for each one of the three categories of social presence (Affective, Interactive and Cohesive). For that, three types of algorithms were used, Random Forest, AdaBoost and XGBoost where the best model developed used the XGBoost algorithm reaching 85.68% accuracy and Kappa index (k) of 0.71, which represents a substantial agreement, and is well above the level of pure chance. This work also provides an analysis of the nature of social presence, observing the classification characteristics that were most relevant to distinguish the three categories of presence and a comparative analysis on the main characteristics identified in the phases of social presence in different domains.
publishDate 2020
dc.date.none.fl_str_mv 2020-12-14T21:11:43Z
2020-12-04
2020-12-14T21:11:43Z
2020-08-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv TEIXEIRA, Jean Barros. Identificação automática da presença social em discussões online escritas em português. 2020. 101 f. Dissertação (Mestrado em Informática) – Instituto de Computação, Programa de Pós Graduação em Informática, Universidade Federal de Alagoas, Maceió, 2020.
http://www.repositorio.ufal.br/handle/riufal/7348
identifier_str_mv TEIXEIRA, Jean Barros. Identificação automática da presença social em discussões online escritas em português. 2020. 101 f. Dissertação (Mestrado em Informática) – Instituto de Computação, Programa de Pós Graduação em Informática, Universidade Federal de Alagoas, Maceió, 2020.
url http://www.repositorio.ufal.br/handle/riufal/7348
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Alagoas
Brasil
Programa de Pós-Graduação em Informática
UFAL
publisher.none.fl_str_mv Universidade Federal de Alagoas
Brasil
Programa de Pós-Graduação em Informática
UFAL
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal de Alagoas (UFAL)
instname:Universidade Federal de Alagoas (UFAL)
instacron:UFAL
instname_str Universidade Federal de Alagoas (UFAL)
instacron_str UFAL
institution UFAL
reponame_str Repositório Institucional da Universidade Federal de Alagoas (UFAL)
collection Repositório Institucional da Universidade Federal de Alagoas (UFAL)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal de Alagoas (UFAL) - Universidade Federal de Alagoas (UFAL)
repository.mail.fl_str_mv ri@sibi.ufal.br
_version_ 1817557403210612736