WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas

Detalhes bibliográficos
Autor(a) principal: Knochenhauer, Lucas Viana
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/214550
Resumo: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.
id UFSC_bdb2de2056b9229783ff11ff7aa97b3d
oai_identifier_str oai:repositorio.ufsc.br:123456789/214550
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostasComputaçãoPerguntas e respostasRecuperação da informaçãoDissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.Grandes repositórios de conhecimento estão distribuídos pela Web, sendo um dos mais populares e colaborativos as comunidades de perguntas e respostas, ou as chamadas Community Question Answering (CQA). Nessas comunidades, os usuários perguntam e respondem questões uns dos outros, além de avaliarem o conteúdo produzido. Entretanto, devido ao grande volume de questões postadas diariamente, muitas dessas questões não recebem respostas. Esse problema vem sendo estudado para entender sua razão e evitar que novas questões permaneçam sem retorno. Nesses estudos, características específicas presentes nestas comunidades foram exploradas de forma a se criar abordagens que classifiquem questões recém postadas em respondíveis ou não respondíveis. Entretanto, as abordagens anteriores são altamente dependentes das características existentes em uma determinada comunidade, como votos que o usuário recebe ou pontos de reputação. Dessa forma não é possível sua portabilidade a comunidades que não possuem as mesmas características. Para resolver este problema, neste trabalho é proposta uma abordagem que gera um modelo capaz de classificar uma nova questão em respondível ou não respondível que seja aplicável na maioria, ou até mesmo em todas as comunidades. Para isso, diferentes comunidades foram analisadas a fim de se extrair o maior número de características comuns possíveis. Com esse conjunto pode-se treinar um modelo de classificação para uma categoria de questões em qualquer comunidade de perguntas e respostas. A finalidade desse modelo é avaliar novas questões no momento em que o usuário as submete. Dessa forma, as novas questões não respondíveis serão detectadas pelo modelo classificador e assim o usuário pode ser informado para ajustar a questão sendo postada. A proposta WANQA foi testada através de um conjunto de experimentos realizados em diferentes comunidades de pergunta e resposta, com diferentes algoritmos classificadores. Os resultados foram maior acurácia, precisão e revocação do que os baselines experimentados.<br>Abstract : There are large knowledge repositories spread over the web. A kind of these repositories is the Community Question Answering (CQA). In these communities, the people ask and answer questions one from another. Besides, the users can evaluate the posted content. However, because of the large daily volume of new questions, many of them remain unanswered. This problem has been studied to understand its reason and to avoid new questions without answers. In these projects, the question and user features were explored to classify the questions' answerability. The previous approaches are highly dependent of the existing characteristics of each community as votes and user reputation. This condition turns the approaches not portable to other communities with different features. To solve this problem, our approach generates a classification model to identify new questions as answerable or not and that it can be used in the most of the communities. For this, we analyzed several communities to find a set of common characteristics. With this set, we can train a classification model for a category of questions in any community question answering. The goal of this model is to prove a new question at the time when the user submit it. Thus, the new unanswerable questions can be detected by the classifier model and the user can be informed to adjust a submitted question. The WANQA approach was tested through a set of experiments with data from several communities and different classification algorithms. The results were better values for accuracy, precision and revocation than seen at the baseline experiments.Dorneles, Carina FriedrichUniversidade Federal de Santa CatarinaKnochenhauer, Lucas Viana2020-10-21T21:06:54Z2020-10-21T21:06:54Z2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis77 p.| il., gráfs., tabs.application/pdf362304https://repositorio.ufsc.br/handle/123456789/214550porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2020-10-21T21:06:54Zoai:repositorio.ufsc.br:123456789/214550Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732020-10-21T21:06:54Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas
title WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas
spellingShingle WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas
Knochenhauer, Lucas Viana
Computação
Perguntas e respostas
Recuperação da informação
title_short WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas
title_full WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas
title_fullStr WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas
title_full_unstemmed WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas
title_sort WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas
author Knochenhauer, Lucas Viana
author_facet Knochenhauer, Lucas Viana
author_role author
dc.contributor.none.fl_str_mv Dorneles, Carina Friedrich
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Knochenhauer, Lucas Viana
dc.subject.por.fl_str_mv Computação
Perguntas e respostas
Recuperação da informação
topic Computação
Perguntas e respostas
Recuperação da informação
description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.
publishDate 2019
dc.date.none.fl_str_mv 2019
2020-10-21T21:06:54Z
2020-10-21T21:06:54Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv 362304
https://repositorio.ufsc.br/handle/123456789/214550
identifier_str_mv 362304
url https://repositorio.ufsc.br/handle/123456789/214550
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 77 p.| il., gráfs., tabs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808652097625784320