Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFLA |
Texto Completo: | http://repositorio.ufla.br/jspui/handle/1/5570 |
Resumo: | Dissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em Ciência da Computação, área de concentração em Inteligência Computacional e Processamento Gráfico, para a obtenção do título de Mestre. |
id |
UFLA_ae04821919f69dd0841ce07f1a9f982e |
---|---|
oai_identifier_str |
oai:localhost:1/5570 |
network_acronym_str |
UFLA |
network_name_str |
Repositório Institucional da UFLA |
repository_id_str |
|
spelling |
Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de textoDiscovering genres patterns of e-learning discussion forums via text miningMineração de textoClassificação multi-classeClassificação multi-rótuloDesbalanceamento de dadosText miningMulti-class classificationMulti-label classificationUnbalance DataCNPQ_NÃO_INFORMADODissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em Ciência da Computação, área de concentração em Inteligência Computacional e Processamento Gráfico, para a obtenção do título de Mestre.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Inteligência Computacional e Processamento GráficoVirtual Learning Environments provide a set of tools to assist in teaching and learning processes. Among them, the discussion forums are widely used, given that they allow the exchange of text messages between students and tutors. The monitoring of a large number of messages is a task that requires a great amount of time and effort, making necessary the use of techniques for grouping messages with the same content. In this context, text classification can be used to group messages by genres, providing a new insight over the messages in order to monitor these discussion forums. To classify the message by a genre, multi-class classification algorithms are used and, to classify more than one genre, multi-label classification algorithms are used. A known issue of text classification, which occurred in this study, was the unbalance of data distribution between classes, which leads the classification algorithms to presenting good results for classes with more data and poor results for classes with less data. To solve this issue, data balancing algorithms can be used by means of creating, deleting or redistributing data, in addition to a few classification model distribution approaches. This work conducted studies and researches in order to find the best way to classify the messages from the forums into genres. As main result, we proposed an approach that classifies the message into one or more genres, with good success rates when compared with classification algorithms from literature. With the advantage of being built with only multi-class classification algorithms, which are already well established in the literature, and with a dataset of messages classified in one genre.Ambientes Virtuais de Aprendizagem fornecem um conjunto de ferramentas para auxiliar o processo de ensino e aprendizagem. Dentre elas, os fóruns de discussões são muito utilizados, pois permitem a troca de mensagens textuais entre alunos e tutores. O acompanhamento da grande quantidade de mensagens é uma tarefa que demanda grande quantidade de tempo e esforço tornando-se necessário o uso de técnicas para encontrar mensagens com mesmo conteúdo. Neste contexto a classificação de texto pode ser utilizada para agrupar as mensagens por gêneros, fornecendo uma nova visão sobre as mensagens para o acompanhamento destes fóruns. Para classificar a mensagem em um gênero, são utilizados algoritmos de classificação multi-classe, e para classificar mais de um gênero são utilizados algoritmos de classificação multi-rótulo. Um problema da classificação de texto conhecido e ocorrido neste trabalho foi o desbalanceamento da distribuição dos dados entre as classes, o que faz com que algoritmos de classificação tenham bons resultados para as classes com mais dados e resultados ruins para classes com menos dados. Para contornar este problema podem ser utilizados algoritmos de balanceamento dos dados, através da criação, remoção ou redistribuição dos dados e também abordagens de distribuição de modelos de classificação. Este trabalho realizou estudos e investigações com o objetivo de encontrar a melhor forma de classificar as mensagens de fóruns em gêneros. Como resultado principal é proposta uma abordagem que classifica a mensagem em um ou mais gêneros, com boas taxas de acerto comparadas com algoritmos de classificação da literatura. Com a vantagem de ser construída somente com algoritmos de classificação multiclasse, que já estão bem consolidados na literatura, e com o conjunto de mensagens de treino classificadas em um gênero.UNIVERSIDADE FEDERAL DE LAVRASDCC - Programa de Pós-graduaçãoUFLABRASILEsmin, Ahmed Ali AbdallaEsmin, Ahmed Ali AbdallaZambalde, André LuizCastro, Cristiano Leite deGuimarães, Fabrício dos Reis Neto2015-04-29T17:46:14Z2015-04-29T17:46:14Z2015-04-292015-02-06info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfGUIMARÃES, F. dos R. Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto. 2015. 114 p. Dissertação (Mestrado em Ciência da Computação)-Universidade Federal de Lavras, Lavras, 2015.http://repositorio.ufla.br/jspui/handle/1/5570info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLA2023-04-13T17:16:57Zoai:localhost:1/5570Repositório InstitucionalPUBhttp://repositorio.ufla.br/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2023-04-13T17:16:57Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)false |
dc.title.none.fl_str_mv |
Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto Discovering genres patterns of e-learning discussion forums via text mining |
title |
Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto |
spellingShingle |
Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto Guimarães, Fabrício dos Reis Neto Mineração de texto Classificação multi-classe Classificação multi-rótulo Desbalanceamento de dados Text mining Multi-class classification Multi-label classification Unbalance Data CNPQ_NÃO_INFORMADO |
title_short |
Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto |
title_full |
Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto |
title_fullStr |
Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto |
title_full_unstemmed |
Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto |
title_sort |
Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto |
author |
Guimarães, Fabrício dos Reis Neto |
author_facet |
Guimarães, Fabrício dos Reis Neto |
author_role |
author |
dc.contributor.none.fl_str_mv |
Esmin, Ahmed Ali Abdalla Esmin, Ahmed Ali Abdalla Zambalde, André Luiz Castro, Cristiano Leite de |
dc.contributor.author.fl_str_mv |
Guimarães, Fabrício dos Reis Neto |
dc.subject.por.fl_str_mv |
Mineração de texto Classificação multi-classe Classificação multi-rótulo Desbalanceamento de dados Text mining Multi-class classification Multi-label classification Unbalance Data CNPQ_NÃO_INFORMADO |
topic |
Mineração de texto Classificação multi-classe Classificação multi-rótulo Desbalanceamento de dados Text mining Multi-class classification Multi-label classification Unbalance Data CNPQ_NÃO_INFORMADO |
description |
Dissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em Ciência da Computação, área de concentração em Inteligência Computacional e Processamento Gráfico, para a obtenção do título de Mestre. |
publishDate |
2015 |
dc.date.none.fl_str_mv |
2015-04-29T17:46:14Z 2015-04-29T17:46:14Z 2015-04-29 2015-02-06 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
GUIMARÃES, F. dos R. Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto. 2015. 114 p. Dissertação (Mestrado em Ciência da Computação)-Universidade Federal de Lavras, Lavras, 2015. http://repositorio.ufla.br/jspui/handle/1/5570 |
identifier_str_mv |
GUIMARÃES, F. dos R. Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto. 2015. 114 p. Dissertação (Mestrado em Ciência da Computação)-Universidade Federal de Lavras, Lavras, 2015. |
url |
http://repositorio.ufla.br/jspui/handle/1/5570 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
UNIVERSIDADE FEDERAL DE LAVRAS DCC - Programa de Pós-graduação UFLA BRASIL |
publisher.none.fl_str_mv |
UNIVERSIDADE FEDERAL DE LAVRAS DCC - Programa de Pós-graduação UFLA BRASIL |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFLA instname:Universidade Federal de Lavras (UFLA) instacron:UFLA |
instname_str |
Universidade Federal de Lavras (UFLA) |
instacron_str |
UFLA |
institution |
UFLA |
reponame_str |
Repositório Institucional da UFLA |
collection |
Repositório Institucional da UFLA |
repository.name.fl_str_mv |
Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA) |
repository.mail.fl_str_mv |
nivaldo@ufla.br || repositorio.biblioteca@ufla.br |
_version_ |
1815439351240196096 |