Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP.

Detalhes bibliográficos
Autor(a) principal: Berbel, Talita dos Reis Lopes
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/632
Resumo: With the rapid growth of unstructured data, such as text documents, it becomes more and more interesting and necessary to extract such information to support decision making in business intelligence systems. Recommendations can be used in the OLAP process, because they allow users to have a particular experience in exploiting data. The process of recommendation, together with the possibility of query personalisation, allows recommendations to be increasingly relevant. The main contribution of this work is to propose an effective solution for semantic recommendation of documents through personalisation of OLAP aggregation queries in a data warehousing environment. In order to aggregate and recommend documents, we propose the use of semantic similarity. Domain ontology and the statistical measure of frequency are used in order to verify the similarity between documents. The threshold of similarity between documents in the recommendation process is adjustable and this is the personalisation that provides to the user an interactive way to improve the relevance of the results. The proposed case study is based on articles from PubMed and its domain ontology in order to create a prototype using real data. The results of the experiments are presented and discussed, showing that good recommendations and aggregations are possible with the suggested approach. The results are discussed on the basis of evaluation measures: precision, recall and F1-measure.
id SCAR_6ede57672054ed33598a4cc59770d2b0
oai_identifier_str oai:repositorio.ufscar.br:ufscar/632
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Berbel, Talita dos Reis LopesGonzalez, Sahudy Montenegrohttp://lattes.cnpq.br/9826346918182685Oikawa, Marcio Katsumihttp://lattes.cnpq.br/4438914190540949Sakata, Tiemi Christinehttp://lattes.cnpq.br/3560505262283874http://lattes.cnpq.br/507975678540500877fe9198-7e25-411e-acd8-7fe2e429755f2016-06-02T19:07:09Z2015-10-132016-06-02T19:07:09Z2015-03-23BERBEL, Talita dos Reis Lopes. Semantic recommendation of text documents through personalizing OLAP aggregation. 2015. 116 f. Dissertação (Mestrado em Ciências Exatas) - Universidade Federal de São Carlos, Sorocaba, 2015.https://repositorio.ufscar.br/handle/ufscar/632With the rapid growth of unstructured data, such as text documents, it becomes more and more interesting and necessary to extract such information to support decision making in business intelligence systems. Recommendations can be used in the OLAP process, because they allow users to have a particular experience in exploiting data. The process of recommendation, together with the possibility of query personalisation, allows recommendations to be increasingly relevant. The main contribution of this work is to propose an effective solution for semantic recommendation of documents through personalisation of OLAP aggregation queries in a data warehousing environment. In order to aggregate and recommend documents, we propose the use of semantic similarity. Domain ontology and the statistical measure of frequency are used in order to verify the similarity between documents. The threshold of similarity between documents in the recommendation process is adjustable and this is the personalisation that provides to the user an interactive way to improve the relevance of the results. The proposed case study is based on articles from PubMed and its domain ontology in order to create a prototype using real data. The results of the experiments are presented and discussed, showing that good recommendations and aggregations are possible with the suggested approach. The results are discussed on the basis of evaluation measures: precision, recall and F1-measure.Com o crescimento do volume dos dados não estruturados, como os documentos de texto, torna-se cada vez mais interessante e necessário extrair informações deste tipo de dado para dar suporte à tomada de decisão em sistemas de Business Intelligence. Recomendações podem ser utilizadas no processo OLAP, pois permitem que os usuários tenham uma experiência diferenciada na exploração dos dados. O processo de recomendação, aliado à possibilidade da personalização das consultas dos usuários, tomadores de decisão, permite que as recomendações possam ser cada vez mais relevantes. A principal contribuição deste trabalho é a proposta de uma solução eficaz para a recomendação semântica de documentos mediante a personalização de consultas de agregação OLAP em um ambiente de Data Warehousing. Com o intuito de agregar e recomendar documentos propõe-se a utilização da similaridade semântica. A ontologia de domínio e a medida estatística de frequência são utilizadas com o objetivo de verificar a similaridade entre os documentos. O limiar de similaridade entre os documentos no processo de recomendação pode ser parametrizado e é esta a personalização que oferece ao usuário uma maneira interativa de melhorar a relevância dos resultados obtidos. O estudo de caso proposto se baseia em artigos da PubMed e em sua ontologia de domínio com o propósito de criar um protótipo utilizando dados reais. Os resultados dos experimentos realizados são expostos e analisados, mostrando que boas recomendações e agregações são possíveis utilizando a abordagem sugerida. Os resultados são discutidos com base nas métricas de avaliação: precision, recall e F1-measure.application/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCC-SoUFSCarBRdata warehouseOLAPdados textuaisagregaçãorecomendaçãosemânticaontologiaLCApersonalização de consultasMeSHTecnologia OLAPontologiasemânticadata warehouseOLAPtextual dataaggregationrecommendationsemanticontologyLCAQuery PersonalizationMeSHCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAORecomendação semântica de documentos de texto mediante a personalização de agregações OLAP.Semantic recommendation of text documents through personalizing OLAP aggregationinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-1650ef0c9-17ab-462d-9df3-e6221084fe8cinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALBERBEL_Talita_2015.pdfapplication/pdf2383674https://repositorio.ufscar.br/bitstream/ufscar/632/1/BERBEL_Talita_2015.pdf3c3c42908a145864cffb9aa42b7d45b7MD51TEXTBERBEL_Talita_2015.pdf.txtBERBEL_Talita_2015.pdf.txtExtracted texttext/plain0https://repositorio.ufscar.br/bitstream/ufscar/632/2/BERBEL_Talita_2015.pdf.txtd41d8cd98f00b204e9800998ecf8427eMD52THUMBNAILBERBEL_Talita_2015.pdf.jpgBERBEL_Talita_2015.pdf.jpgIM Thumbnailimage/jpeg5794https://repositorio.ufscar.br/bitstream/ufscar/632/3/BERBEL_Talita_2015.pdf.jpgb0206aa287b09d516607a90cf6cd93abMD53ufscar/6322023-09-18 18:31:27.732oai:repositorio.ufscar.br:ufscar/632Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:27Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP.
dc.title.alternative.eng.fl_str_mv Semantic recommendation of text documents through personalizing OLAP aggregation
title Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP.
spellingShingle Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP.
Berbel, Talita dos Reis Lopes
data warehouse
OLAP
dados textuais
agregação
recomendação
semântica
ontologia
LCA
personalização de consultas
MeSH
Tecnologia OLAP
ontologia
semântica
data warehouse
OLAP
textual data
aggregation
recommendation
semantic
ontology
LCA
Query Personalization
MeSH
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP.
title_full Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP.
title_fullStr Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP.
title_full_unstemmed Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP.
title_sort Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP.
author Berbel, Talita dos Reis Lopes
author_facet Berbel, Talita dos Reis Lopes
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/5079756785405008
dc.contributor.author.fl_str_mv Berbel, Talita dos Reis Lopes
dc.contributor.advisor1.fl_str_mv Gonzalez, Sahudy Montenegro
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/9826346918182685
dc.contributor.referee1.fl_str_mv Oikawa, Marcio Katsumi
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/4438914190540949
dc.contributor.referee2.fl_str_mv Sakata, Tiemi Christine
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/3560505262283874
dc.contributor.authorID.fl_str_mv 77fe9198-7e25-411e-acd8-7fe2e429755f
contributor_str_mv Gonzalez, Sahudy Montenegro
Oikawa, Marcio Katsumi
Sakata, Tiemi Christine
dc.subject.por.fl_str_mv data warehouse
OLAP
dados textuais
agregação
recomendação
semântica
ontologia
LCA
personalização de consultas
MeSH
Tecnologia OLAP
ontologia
semântica
topic data warehouse
OLAP
dados textuais
agregação
recomendação
semântica
ontologia
LCA
personalização de consultas
MeSH
Tecnologia OLAP
ontologia
semântica
data warehouse
OLAP
textual data
aggregation
recommendation
semantic
ontology
LCA
Query Personalization
MeSH
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv data warehouse
OLAP
textual data
aggregation
recommendation
semantic
ontology
LCA
Query Personalization
MeSH
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description With the rapid growth of unstructured data, such as text documents, it becomes more and more interesting and necessary to extract such information to support decision making in business intelligence systems. Recommendations can be used in the OLAP process, because they allow users to have a particular experience in exploiting data. The process of recommendation, together with the possibility of query personalisation, allows recommendations to be increasingly relevant. The main contribution of this work is to propose an effective solution for semantic recommendation of documents through personalisation of OLAP aggregation queries in a data warehousing environment. In order to aggregate and recommend documents, we propose the use of semantic similarity. Domain ontology and the statistical measure of frequency are used in order to verify the similarity between documents. The threshold of similarity between documents in the recommendation process is adjustable and this is the personalisation that provides to the user an interactive way to improve the relevance of the results. The proposed case study is based on articles from PubMed and its domain ontology in order to create a prototype using real data. The results of the experiments are presented and discussed, showing that good recommendations and aggregations are possible with the suggested approach. The results are discussed on the basis of evaluation measures: precision, recall and F1-measure.
publishDate 2015
dc.date.available.fl_str_mv 2015-10-13
2016-06-02T19:07:09Z
dc.date.issued.fl_str_mv 2015-03-23
dc.date.accessioned.fl_str_mv 2016-06-02T19:07:09Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv BERBEL, Talita dos Reis Lopes. Semantic recommendation of text documents through personalizing OLAP aggregation. 2015. 116 f. Dissertação (Mestrado em Ciências Exatas) - Universidade Federal de São Carlos, Sorocaba, 2015.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/632
identifier_str_mv BERBEL, Talita dos Reis Lopes. Semantic recommendation of text documents through personalizing OLAP aggregation. 2015. 116 f. Dissertação (Mestrado em Ciências Exatas) - Universidade Federal de São Carlos, Sorocaba, 2015.
url https://repositorio.ufscar.br/handle/ufscar/632
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv -1
-1
dc.relation.authority.fl_str_mv 650ef0c9-17ab-462d-9df3-e6221084fe8c
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC-So
dc.publisher.initials.fl_str_mv UFSCar
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/632/1/BERBEL_Talita_2015.pdf
https://repositorio.ufscar.br/bitstream/ufscar/632/2/BERBEL_Talita_2015.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/632/3/BERBEL_Talita_2015.pdf.jpg
bitstream.checksum.fl_str_mv 3c3c42908a145864cffb9aa42b7d45b7
d41d8cd98f00b204e9800998ecf8427e
b0206aa287b09d516607a90cf6cd93ab
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1813715504273031168