Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto

Detalhes bibliográficos
Autor(a) principal: Guimarães, Fabrício dos Reis Neto
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFLA
Texto Completo: http://repositorio.ufla.br/jspui/handle/1/5570
Resumo: Dissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em Ciência da Computação, área de concentração em Inteligência Computacional e Processamento Gráfico, para a obtenção do título de Mestre.
id UFLA_ae04821919f69dd0841ce07f1a9f982e
oai_identifier_str oai:localhost:1/5570
network_acronym_str UFLA
network_name_str Repositório Institucional da UFLA
repository_id_str
spelling Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de textoDiscovering genres patterns of e-learning discussion forums via text miningMineração de textoClassificação multi-classeClassificação multi-rótuloDesbalanceamento de dadosText miningMulti-class classificationMulti-label classificationUnbalance DataCNPQ_NÃO_INFORMADODissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em Ciência da Computação, área de concentração em Inteligência Computacional e Processamento Gráfico, para a obtenção do título de Mestre.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Inteligência Computacional e Processamento GráficoVirtual Learning Environments provide a set of tools to assist in teaching and learning processes. Among them, the discussion forums are widely used, given that they allow the exchange of text messages between students and tutors. The monitoring of a large number of messages is a task that requires a great amount of time and effort, making necessary the use of techniques for grouping messages with the same content. In this context, text classification can be used to group messages by genres, providing a new insight over the messages in order to monitor these discussion forums. To classify the message by a genre, multi-class classification algorithms are used and, to classify more than one genre, multi-label classification algorithms are used. A known issue of text classification, which occurred in this study, was the unbalance of data distribution between classes, which leads the classification algorithms to presenting good results for classes with more data and poor results for classes with less data. To solve this issue, data balancing algorithms can be used by means of creating, deleting or redistributing data, in addition to a few classification model distribution approaches. This work conducted studies and researches in order to find the best way to classify the messages from the forums into genres. As main result, we proposed an approach that classifies the message into one or more genres, with good success rates when compared with classification algorithms from literature. With the advantage of being built with only multi-class classification algorithms, which are already well established in the literature, and with a dataset of messages classified in one genre.Ambientes Virtuais de Aprendizagem fornecem um conjunto de ferramentas para auxiliar o processo de ensino e aprendizagem. Dentre elas, os fóruns de discussões são muito utilizados, pois permitem a troca de mensagens textuais entre alunos e tutores. O acompanhamento da grande quantidade de mensagens é uma tarefa que demanda grande quantidade de tempo e esforço tornando-se necessário o uso de técnicas para encontrar mensagens com mesmo conteúdo. Neste contexto a classificação de texto pode ser utilizada para agrupar as mensagens por gêneros, fornecendo uma nova visão sobre as mensagens para o acompanhamento destes fóruns. Para classificar a mensagem em um gênero, são utilizados algoritmos de classificação multi-classe, e para classificar mais de um gênero são utilizados algoritmos de classificação multi-rótulo. Um problema da classificação de texto conhecido e ocorrido neste trabalho foi o desbalanceamento da distribuição dos dados entre as classes, o que faz com que algoritmos de classificação tenham bons resultados para as classes com mais dados e resultados ruins para classes com menos dados. Para contornar este problema podem ser utilizados algoritmos de balanceamento dos dados, através da criação, remoção ou redistribuição dos dados e também abordagens de distribuição de modelos de classificação. Este trabalho realizou estudos e investigações com o objetivo de encontrar a melhor forma de classificar as mensagens de fóruns em gêneros. Como resultado principal é proposta uma abordagem que classifica a mensagem em um ou mais gêneros, com boas taxas de acerto comparadas com algoritmos de classificação da literatura. Com a vantagem de ser construída somente com algoritmos de classificação multiclasse, que já estão bem consolidados na literatura, e com o conjunto de mensagens de treino classificadas em um gênero.UNIVERSIDADE FEDERAL DE LAVRASDCC - Programa de Pós-graduaçãoUFLABRASILEsmin, Ahmed Ali AbdallaEsmin, Ahmed Ali AbdallaZambalde, André LuizCastro, Cristiano Leite deGuimarães, Fabrício dos Reis Neto2015-04-29T17:46:14Z2015-04-29T17:46:14Z2015-04-292015-02-06info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfGUIMARÃES, F. dos R. Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto. 2015. 114 p. Dissertação (Mestrado em Ciência da Computação)-Universidade Federal de Lavras, Lavras, 2015.http://repositorio.ufla.br/jspui/handle/1/5570info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLA2023-04-13T17:16:57Zoai:localhost:1/5570Repositório InstitucionalPUBhttp://repositorio.ufla.br/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2023-04-13T17:16:57Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)false
dc.title.none.fl_str_mv Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto
Discovering genres patterns of e-learning discussion forums via text mining
title Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto
spellingShingle Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto
Guimarães, Fabrício dos Reis Neto
Mineração de texto
Classificação multi-classe
Classificação multi-rótulo
Desbalanceamento de dados
Text mining
Multi-class classification
Multi-label classification
Unbalance Data
CNPQ_NÃO_INFORMADO
title_short Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto
title_full Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto
title_fullStr Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto
title_full_unstemmed Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto
title_sort Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto
author Guimarães, Fabrício dos Reis Neto
author_facet Guimarães, Fabrício dos Reis Neto
author_role author
dc.contributor.none.fl_str_mv Esmin, Ahmed Ali Abdalla
Esmin, Ahmed Ali Abdalla
Zambalde, André Luiz
Castro, Cristiano Leite de
dc.contributor.author.fl_str_mv Guimarães, Fabrício dos Reis Neto
dc.subject.por.fl_str_mv Mineração de texto
Classificação multi-classe
Classificação multi-rótulo
Desbalanceamento de dados
Text mining
Multi-class classification
Multi-label classification
Unbalance Data
CNPQ_NÃO_INFORMADO
topic Mineração de texto
Classificação multi-classe
Classificação multi-rótulo
Desbalanceamento de dados
Text mining
Multi-class classification
Multi-label classification
Unbalance Data
CNPQ_NÃO_INFORMADO
description Dissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em Ciência da Computação, área de concentração em Inteligência Computacional e Processamento Gráfico, para a obtenção do título de Mestre.
publishDate 2015
dc.date.none.fl_str_mv 2015-04-29T17:46:14Z
2015-04-29T17:46:14Z
2015-04-29
2015-02-06
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv GUIMARÃES, F. dos R. Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto. 2015. 114 p. Dissertação (Mestrado em Ciência da Computação)-Universidade Federal de Lavras, Lavras, 2015.
http://repositorio.ufla.br/jspui/handle/1/5570
identifier_str_mv GUIMARÃES, F. dos R. Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto. 2015. 114 p. Dissertação (Mestrado em Ciência da Computação)-Universidade Federal de Lavras, Lavras, 2015.
url http://repositorio.ufla.br/jspui/handle/1/5570
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv UNIVERSIDADE FEDERAL DE LAVRAS
DCC - Programa de Pós-graduação
UFLA
BRASIL
publisher.none.fl_str_mv UNIVERSIDADE FEDERAL DE LAVRAS
DCC - Programa de Pós-graduação
UFLA
BRASIL
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFLA
instname:Universidade Federal de Lavras (UFLA)
instacron:UFLA
instname_str Universidade Federal de Lavras (UFLA)
instacron_str UFLA
institution UFLA
reponame_str Repositório Institucional da UFLA
collection Repositório Institucional da UFLA
repository.name.fl_str_mv Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)
repository.mail.fl_str_mv nivaldo@ufla.br || repositorio.biblioteca@ufla.br
_version_ 1807835219933265920