Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/632 |
Resumo: | With the rapid growth of unstructured data, such as text documents, it becomes more and more interesting and necessary to extract such information to support decision making in business intelligence systems. Recommendations can be used in the OLAP process, because they allow users to have a particular experience in exploiting data. The process of recommendation, together with the possibility of query personalisation, allows recommendations to be increasingly relevant. The main contribution of this work is to propose an effective solution for semantic recommendation of documents through personalisation of OLAP aggregation queries in a data warehousing environment. In order to aggregate and recommend documents, we propose the use of semantic similarity. Domain ontology and the statistical measure of frequency are used in order to verify the similarity between documents. The threshold of similarity between documents in the recommendation process is adjustable and this is the personalisation that provides to the user an interactive way to improve the relevance of the results. The proposed case study is based on articles from PubMed and its domain ontology in order to create a prototype using real data. The results of the experiments are presented and discussed, showing that good recommendations and aggregations are possible with the suggested approach. The results are discussed on the basis of evaluation measures: precision, recall and F1-measure. |
id |
SCAR_6ede57672054ed33598a4cc59770d2b0 |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/632 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Berbel, Talita dos Reis LopesGonzalez, Sahudy Montenegrohttp://lattes.cnpq.br/9826346918182685Oikawa, Marcio Katsumihttp://lattes.cnpq.br/4438914190540949Sakata, Tiemi Christinehttp://lattes.cnpq.br/3560505262283874http://lattes.cnpq.br/507975678540500877fe9198-7e25-411e-acd8-7fe2e429755f2016-06-02T19:07:09Z2015-10-132016-06-02T19:07:09Z2015-03-23BERBEL, Talita dos Reis Lopes. Semantic recommendation of text documents through personalizing OLAP aggregation. 2015. 116 f. Dissertação (Mestrado em Ciências Exatas) - Universidade Federal de São Carlos, Sorocaba, 2015.https://repositorio.ufscar.br/handle/ufscar/632With the rapid growth of unstructured data, such as text documents, it becomes more and more interesting and necessary to extract such information to support decision making in business intelligence systems. Recommendations can be used in the OLAP process, because they allow users to have a particular experience in exploiting data. The process of recommendation, together with the possibility of query personalisation, allows recommendations to be increasingly relevant. The main contribution of this work is to propose an effective solution for semantic recommendation of documents through personalisation of OLAP aggregation queries in a data warehousing environment. In order to aggregate and recommend documents, we propose the use of semantic similarity. Domain ontology and the statistical measure of frequency are used in order to verify the similarity between documents. The threshold of similarity between documents in the recommendation process is adjustable and this is the personalisation that provides to the user an interactive way to improve the relevance of the results. The proposed case study is based on articles from PubMed and its domain ontology in order to create a prototype using real data. The results of the experiments are presented and discussed, showing that good recommendations and aggregations are possible with the suggested approach. The results are discussed on the basis of evaluation measures: precision, recall and F1-measure.Com o crescimento do volume dos dados não estruturados, como os documentos de texto, torna-se cada vez mais interessante e necessário extrair informações deste tipo de dado para dar suporte à tomada de decisão em sistemas de Business Intelligence. Recomendações podem ser utilizadas no processo OLAP, pois permitem que os usuários tenham uma experiência diferenciada na exploração dos dados. O processo de recomendação, aliado à possibilidade da personalização das consultas dos usuários, tomadores de decisão, permite que as recomendações possam ser cada vez mais relevantes. A principal contribuição deste trabalho é a proposta de uma solução eficaz para a recomendação semântica de documentos mediante a personalização de consultas de agregação OLAP em um ambiente de Data Warehousing. Com o intuito de agregar e recomendar documentos propõe-se a utilização da similaridade semântica. A ontologia de domínio e a medida estatística de frequência são utilizadas com o objetivo de verificar a similaridade entre os documentos. O limiar de similaridade entre os documentos no processo de recomendação pode ser parametrizado e é esta a personalização que oferece ao usuário uma maneira interativa de melhorar a relevância dos resultados obtidos. O estudo de caso proposto se baseia em artigos da PubMed e em sua ontologia de domínio com o propósito de criar um protótipo utilizando dados reais. Os resultados dos experimentos realizados são expostos e analisados, mostrando que boas recomendações e agregações são possíveis utilizando a abordagem sugerida. Os resultados são discutidos com base nas métricas de avaliação: precision, recall e F1-measure.application/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCC-SoUFSCarBRdata warehouseOLAPdados textuaisagregaçãorecomendaçãosemânticaontologiaLCApersonalização de consultasMeSHTecnologia OLAPontologiasemânticadata warehouseOLAPtextual dataaggregationrecommendationsemanticontologyLCAQuery PersonalizationMeSHCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAORecomendação semântica de documentos de texto mediante a personalização de agregações OLAP.Semantic recommendation of text documents through personalizing OLAP aggregationinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-1650ef0c9-17ab-462d-9df3-e6221084fe8cinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALBERBEL_Talita_2015.pdfapplication/pdf2383674https://repositorio.ufscar.br/bitstream/ufscar/632/1/BERBEL_Talita_2015.pdf3c3c42908a145864cffb9aa42b7d45b7MD51TEXTBERBEL_Talita_2015.pdf.txtBERBEL_Talita_2015.pdf.txtExtracted texttext/plain0https://repositorio.ufscar.br/bitstream/ufscar/632/2/BERBEL_Talita_2015.pdf.txtd41d8cd98f00b204e9800998ecf8427eMD52THUMBNAILBERBEL_Talita_2015.pdf.jpgBERBEL_Talita_2015.pdf.jpgIM Thumbnailimage/jpeg5794https://repositorio.ufscar.br/bitstream/ufscar/632/3/BERBEL_Talita_2015.pdf.jpgb0206aa287b09d516607a90cf6cd93abMD53ufscar/6322023-09-18 18:31:27.732oai:repositorio.ufscar.br:ufscar/632Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:27Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP. |
dc.title.alternative.eng.fl_str_mv |
Semantic recommendation of text documents through personalizing OLAP aggregation |
title |
Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP. |
spellingShingle |
Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP. Berbel, Talita dos Reis Lopes data warehouse OLAP dados textuais agregação recomendação semântica ontologia LCA personalização de consultas MeSH Tecnologia OLAP ontologia semântica data warehouse OLAP textual data aggregation recommendation semantic ontology LCA Query Personalization MeSH CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP. |
title_full |
Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP. |
title_fullStr |
Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP. |
title_full_unstemmed |
Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP. |
title_sort |
Recomendação semântica de documentos de texto mediante a personalização de agregações OLAP. |
author |
Berbel, Talita dos Reis Lopes |
author_facet |
Berbel, Talita dos Reis Lopes |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/5079756785405008 |
dc.contributor.author.fl_str_mv |
Berbel, Talita dos Reis Lopes |
dc.contributor.advisor1.fl_str_mv |
Gonzalez, Sahudy Montenegro |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/9826346918182685 |
dc.contributor.referee1.fl_str_mv |
Oikawa, Marcio Katsumi |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/4438914190540949 |
dc.contributor.referee2.fl_str_mv |
Sakata, Tiemi Christine |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/3560505262283874 |
dc.contributor.authorID.fl_str_mv |
77fe9198-7e25-411e-acd8-7fe2e429755f |
contributor_str_mv |
Gonzalez, Sahudy Montenegro Oikawa, Marcio Katsumi Sakata, Tiemi Christine |
dc.subject.por.fl_str_mv |
data warehouse OLAP dados textuais agregação recomendação semântica ontologia LCA personalização de consultas MeSH Tecnologia OLAP ontologia semântica |
topic |
data warehouse OLAP dados textuais agregação recomendação semântica ontologia LCA personalização de consultas MeSH Tecnologia OLAP ontologia semântica data warehouse OLAP textual data aggregation recommendation semantic ontology LCA Query Personalization MeSH CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
data warehouse OLAP textual data aggregation recommendation semantic ontology LCA Query Personalization MeSH |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
With the rapid growth of unstructured data, such as text documents, it becomes more and more interesting and necessary to extract such information to support decision making in business intelligence systems. Recommendations can be used in the OLAP process, because they allow users to have a particular experience in exploiting data. The process of recommendation, together with the possibility of query personalisation, allows recommendations to be increasingly relevant. The main contribution of this work is to propose an effective solution for semantic recommendation of documents through personalisation of OLAP aggregation queries in a data warehousing environment. In order to aggregate and recommend documents, we propose the use of semantic similarity. Domain ontology and the statistical measure of frequency are used in order to verify the similarity between documents. The threshold of similarity between documents in the recommendation process is adjustable and this is the personalisation that provides to the user an interactive way to improve the relevance of the results. The proposed case study is based on articles from PubMed and its domain ontology in order to create a prototype using real data. The results of the experiments are presented and discussed, showing that good recommendations and aggregations are possible with the suggested approach. The results are discussed on the basis of evaluation measures: precision, recall and F1-measure. |
publishDate |
2015 |
dc.date.available.fl_str_mv |
2015-10-13 2016-06-02T19:07:09Z |
dc.date.issued.fl_str_mv |
2015-03-23 |
dc.date.accessioned.fl_str_mv |
2016-06-02T19:07:09Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
BERBEL, Talita dos Reis Lopes. Semantic recommendation of text documents through personalizing OLAP aggregation. 2015. 116 f. Dissertação (Mestrado em Ciências Exatas) - Universidade Federal de São Carlos, Sorocaba, 2015. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/632 |
identifier_str_mv |
BERBEL, Talita dos Reis Lopes. Semantic recommendation of text documents through personalizing OLAP aggregation. 2015. 116 f. Dissertação (Mestrado em Ciências Exatas) - Universidade Federal de São Carlos, Sorocaba, 2015. |
url |
https://repositorio.ufscar.br/handle/ufscar/632 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
-1 -1 |
dc.relation.authority.fl_str_mv |
650ef0c9-17ab-462d-9df3-e6221084fe8c |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC-So |
dc.publisher.initials.fl_str_mv |
UFSCar |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/632/1/BERBEL_Talita_2015.pdf https://repositorio.ufscar.br/bitstream/ufscar/632/2/BERBEL_Talita_2015.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/632/3/BERBEL_Talita_2015.pdf.jpg |
bitstream.checksum.fl_str_mv |
3c3c42908a145864cffb9aa42b7d45b7 d41d8cd98f00b204e9800998ecf8427e b0206aa287b09d516607a90cf6cd93ab |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1813715504273031168 |