WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSC |
Texto Completo: | https://repositorio.ufsc.br/handle/123456789/214550 |
Resumo: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019. |
id |
UFSC_bdb2de2056b9229783ff11ff7aa97b3d |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/214550 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostasComputaçãoPerguntas e respostasRecuperação da informaçãoDissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.Grandes repositórios de conhecimento estão distribuídos pela Web, sendo um dos mais populares e colaborativos as comunidades de perguntas e respostas, ou as chamadas Community Question Answering (CQA). Nessas comunidades, os usuários perguntam e respondem questões uns dos outros, além de avaliarem o conteúdo produzido. Entretanto, devido ao grande volume de questões postadas diariamente, muitas dessas questões não recebem respostas. Esse problema vem sendo estudado para entender sua razão e evitar que novas questões permaneçam sem retorno. Nesses estudos, características específicas presentes nestas comunidades foram exploradas de forma a se criar abordagens que classifiquem questões recém postadas em respondíveis ou não respondíveis. Entretanto, as abordagens anteriores são altamente dependentes das características existentes em uma determinada comunidade, como votos que o usuário recebe ou pontos de reputação. Dessa forma não é possível sua portabilidade a comunidades que não possuem as mesmas características. Para resolver este problema, neste trabalho é proposta uma abordagem que gera um modelo capaz de classificar uma nova questão em respondível ou não respondível que seja aplicável na maioria, ou até mesmo em todas as comunidades. Para isso, diferentes comunidades foram analisadas a fim de se extrair o maior número de características comuns possíveis. Com esse conjunto pode-se treinar um modelo de classificação para uma categoria de questões em qualquer comunidade de perguntas e respostas. A finalidade desse modelo é avaliar novas questões no momento em que o usuário as submete. Dessa forma, as novas questões não respondíveis serão detectadas pelo modelo classificador e assim o usuário pode ser informado para ajustar a questão sendo postada. A proposta WANQA foi testada através de um conjunto de experimentos realizados em diferentes comunidades de pergunta e resposta, com diferentes algoritmos classificadores. Os resultados foram maior acurácia, precisão e revocação do que os baselines experimentados.<br>Abstract : There are large knowledge repositories spread over the web. A kind of these repositories is the Community Question Answering (CQA). In these communities, the people ask and answer questions one from another. Besides, the users can evaluate the posted content. However, because of the large daily volume of new questions, many of them remain unanswered. This problem has been studied to understand its reason and to avoid new questions without answers. In these projects, the question and user features were explored to classify the questions' answerability. The previous approaches are highly dependent of the existing characteristics of each community as votes and user reputation. This condition turns the approaches not portable to other communities with different features. To solve this problem, our approach generates a classification model to identify new questions as answerable or not and that it can be used in the most of the communities. For this, we analyzed several communities to find a set of common characteristics. With this set, we can train a classification model for a category of questions in any community question answering. The goal of this model is to prove a new question at the time when the user submit it. Thus, the new unanswerable questions can be detected by the classifier model and the user can be informed to adjust a submitted question. The WANQA approach was tested through a set of experiments with data from several communities and different classification algorithms. The results were better values for accuracy, precision and revocation than seen at the baseline experiments.Dorneles, Carina FriedrichUniversidade Federal de Santa CatarinaKnochenhauer, Lucas Viana2020-10-21T21:06:54Z2020-10-21T21:06:54Z2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis77 p.| il., gráfs., tabs.application/pdf362304https://repositorio.ufsc.br/handle/123456789/214550porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2020-10-21T21:06:54Zoai:repositorio.ufsc.br:123456789/214550Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732020-10-21T21:06:54Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas |
title |
WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas |
spellingShingle |
WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas Knochenhauer, Lucas Viana Computação Perguntas e respostas Recuperação da informação |
title_short |
WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas |
title_full |
WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas |
title_fullStr |
WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas |
title_full_unstemmed |
WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas |
title_sort |
WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas |
author |
Knochenhauer, Lucas Viana |
author_facet |
Knochenhauer, Lucas Viana |
author_role |
author |
dc.contributor.none.fl_str_mv |
Dorneles, Carina Friedrich Universidade Federal de Santa Catarina |
dc.contributor.author.fl_str_mv |
Knochenhauer, Lucas Viana |
dc.subject.por.fl_str_mv |
Computação Perguntas e respostas Recuperação da informação |
topic |
Computação Perguntas e respostas Recuperação da informação |
description |
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019 2020-10-21T21:06:54Z 2020-10-21T21:06:54Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
362304 https://repositorio.ufsc.br/handle/123456789/214550 |
identifier_str_mv |
362304 |
url |
https://repositorio.ufsc.br/handle/123456789/214550 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
77 p.| il., gráfs., tabs. application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
|
_version_ |
1808652097625784320 |