Uma metodologia de caracterização de serviços de mineração de dados

Detalhes bibliográficos
Autor(a) principal: Leonardo Chaves Dutra da Rocha
Data de Publicação: 2005
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/SLBS-6GUL2M
Resumo: Serviços Web estão se tornando um padrão para o desenvolvimento de um grande conjunto de aplicações que utilizam a Internet. Um exemplo desse tipo de aplicação é a mineração de dados, cujo objetivo é extrair informações úteis de um grande conjunto de dados. Um serviço Web de mineração de dados bem sucedido deve cumprir os requisitos de interação de uma tarefa de mineração de dados e os requisitos de processamento intensivo e armazenamento de grandes conjuntos de dados geralmente associados às técnicas empregadas. Nesta tese apresentamos uma metodologia para caracterização de serviços Web computacionalmente intensivos, em particular serviços de mineração de dados. Nossa metodologia de caracterização foca em ambos os lados do serviço, interativo e não interativo, bem como o relacionamento entre eles. Nós aplicamos nossa metodologia a um serviço de mineração de dados real, o Tamanduá. Os resultados mostram que há uma alta variabilidade entre os usuários em termos de comportamento, mas eles agem de forma similar com respeito à natureza das tarefas de mineração que eles requisitam e em como eles analisam os resultados. Nossos resultados também mostram que nós podemos dividir os usuários em dois grupos distintos, um grupo que utiliza o sistema de forma seqüencial e outro que apresenta um comportamento assíncrono, impondo uma demanda maior ao sistema. Esses resultados não só mostram a aplicabilidade de nossa proposta, mas também abre novas direções em termos de mecanismos de sustentação para esse tipo de sistema Web. Além disso, nós também determinamos modelos de distribuições estatísticas que podem ser utilizadas para a geração de cargas sintéticas com a finalidade de realizar uma detalhada análise de desempenho do sistema.
id UFMG_90b8069a7cd6b22fc83201f6cb45a4c7
oai_identifier_str oai:repositorio.ufmg.br:1843/SLBS-6GUL2M
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Wagner Meira JuniorLucila IshitaniDorgival Olavo Guedes NetoRenato Antonio Celso FerreiraLeonardo Chaves Dutra da Rocha2019-08-12T16:00:18Z2019-08-12T16:00:18Z2005-08-12http://hdl.handle.net/1843/SLBS-6GUL2MServiços Web estão se tornando um padrão para o desenvolvimento de um grande conjunto de aplicações que utilizam a Internet. Um exemplo desse tipo de aplicação é a mineração de dados, cujo objetivo é extrair informações úteis de um grande conjunto de dados. Um serviço Web de mineração de dados bem sucedido deve cumprir os requisitos de interação de uma tarefa de mineração de dados e os requisitos de processamento intensivo e armazenamento de grandes conjuntos de dados geralmente associados às técnicas empregadas. Nesta tese apresentamos uma metodologia para caracterização de serviços Web computacionalmente intensivos, em particular serviços de mineração de dados. Nossa metodologia de caracterização foca em ambos os lados do serviço, interativo e não interativo, bem como o relacionamento entre eles. Nós aplicamos nossa metodologia a um serviço de mineração de dados real, o Tamanduá. Os resultados mostram que há uma alta variabilidade entre os usuários em termos de comportamento, mas eles agem de forma similar com respeito à natureza das tarefas de mineração que eles requisitam e em como eles analisam os resultados. Nossos resultados também mostram que nós podemos dividir os usuários em dois grupos distintos, um grupo que utiliza o sistema de forma seqüencial e outro que apresenta um comportamento assíncrono, impondo uma demanda maior ao sistema. Esses resultados não só mostram a aplicabilidade de nossa proposta, mas também abre novas direções em termos de mecanismos de sustentação para esse tipo de sistema Web. Além disso, nós também determinamos modelos de distribuições estatísticas que podem ser utilizadas para a geração de cargas sintéticas com a finalidade de realizar uma detalhada análise de desempenho do sistema.Web services are becoming a standard for deploying a large spectrum of applications using the Internet. One example of such application is data mining, which aims to extract useful information from large sets of data. A successful data mining service must fulfill both interaction requirements of a data mining task, and the intensive processing and large storage requirements usually associated with the techniques employed. In this paper we present a methodology for characterizing computationally intensive Web services, in particular data mining services. Our characterization methodology focuses on both the interactive and non-interactive sides of the service, as well as their relationships. We applied our methodology on an actual data mining service, Tamanduá. The results show that there is a high variability among users in terms of their behavior, but they act similarly with respect to the nature of the data mining tasks they request and how they analyze the results. Our results also show that we are able to divide the users into two distinct groups, one that uses the system in a sequential fashion and other that presents an asynchronous behavior, placing a bigger demand on the system. These results not only show the applicability of our approach, but also open new directions in terms of system support mechanisms for such Web services. Further, we are also able to determine statistical distributions that may be used for generating synthetic workloads that would allow a detailed performance analysis of the system.Universidade Federal de Minas GeraisUFMGWorld Wide Web (Sistema de recuperação da informação)Mineração de dados (Computação)Sistemas de recuperação da informaçãoTecnologia da informaçãoData mining (Sistemas de recuperação da informação)Mineração de DadosServiçosUma metodologia de caracterização de serviços de mineração de dadosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALleonardochavesdutradarocha.pdfapplication/pdf893569https://repositorio.ufmg.br/bitstream/1843/SLBS-6GUL2M/1/leonardochavesdutradarocha.pdf75261e37e86962fdf7d2c6f585945609MD51TEXTleonardochavesdutradarocha.pdf.txtleonardochavesdutradarocha.pdf.txtExtracted texttext/plain150332https://repositorio.ufmg.br/bitstream/1843/SLBS-6GUL2M/2/leonardochavesdutradarocha.pdf.txtb807f149cebd89df76479a551a9d6019MD521843/SLBS-6GUL2M2019-11-14 18:29:47.651oai:repositorio.ufmg.br:1843/SLBS-6GUL2MRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T21:29:47Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Uma metodologia de caracterização de serviços de mineração de dados
title Uma metodologia de caracterização de serviços de mineração de dados
spellingShingle Uma metodologia de caracterização de serviços de mineração de dados
Leonardo Chaves Dutra da Rocha
Mineração de Dados
Serviços
World Wide Web (Sistema de recuperação da informação)
Mineração de dados (Computação)
Sistemas de recuperação da informação
Tecnologia da informação
Data mining (Sistemas de recuperação da informação)
title_short Uma metodologia de caracterização de serviços de mineração de dados
title_full Uma metodologia de caracterização de serviços de mineração de dados
title_fullStr Uma metodologia de caracterização de serviços de mineração de dados
title_full_unstemmed Uma metodologia de caracterização de serviços de mineração de dados
title_sort Uma metodologia de caracterização de serviços de mineração de dados
author Leonardo Chaves Dutra da Rocha
author_facet Leonardo Chaves Dutra da Rocha
author_role author
dc.contributor.advisor1.fl_str_mv Wagner Meira Junior
dc.contributor.referee1.fl_str_mv Lucila Ishitani
dc.contributor.referee2.fl_str_mv Dorgival Olavo Guedes Neto
dc.contributor.referee3.fl_str_mv Renato Antonio Celso Ferreira
dc.contributor.author.fl_str_mv Leonardo Chaves Dutra da Rocha
contributor_str_mv Wagner Meira Junior
Lucila Ishitani
Dorgival Olavo Guedes Neto
Renato Antonio Celso Ferreira
dc.subject.por.fl_str_mv Mineração de Dados
Serviços
topic Mineração de Dados
Serviços
World Wide Web (Sistema de recuperação da informação)
Mineração de dados (Computação)
Sistemas de recuperação da informação
Tecnologia da informação
Data mining (Sistemas de recuperação da informação)
dc.subject.other.pt_BR.fl_str_mv World Wide Web (Sistema de recuperação da informação)
Mineração de dados (Computação)
Sistemas de recuperação da informação
Tecnologia da informação
Data mining (Sistemas de recuperação da informação)
description Serviços Web estão se tornando um padrão para o desenvolvimento de um grande conjunto de aplicações que utilizam a Internet. Um exemplo desse tipo de aplicação é a mineração de dados, cujo objetivo é extrair informações úteis de um grande conjunto de dados. Um serviço Web de mineração de dados bem sucedido deve cumprir os requisitos de interação de uma tarefa de mineração de dados e os requisitos de processamento intensivo e armazenamento de grandes conjuntos de dados geralmente associados às técnicas empregadas. Nesta tese apresentamos uma metodologia para caracterização de serviços Web computacionalmente intensivos, em particular serviços de mineração de dados. Nossa metodologia de caracterização foca em ambos os lados do serviço, interativo e não interativo, bem como o relacionamento entre eles. Nós aplicamos nossa metodologia a um serviço de mineração de dados real, o Tamanduá. Os resultados mostram que há uma alta variabilidade entre os usuários em termos de comportamento, mas eles agem de forma similar com respeito à natureza das tarefas de mineração que eles requisitam e em como eles analisam os resultados. Nossos resultados também mostram que nós podemos dividir os usuários em dois grupos distintos, um grupo que utiliza o sistema de forma seqüencial e outro que apresenta um comportamento assíncrono, impondo uma demanda maior ao sistema. Esses resultados não só mostram a aplicabilidade de nossa proposta, mas também abre novas direções em termos de mecanismos de sustentação para esse tipo de sistema Web. Além disso, nós também determinamos modelos de distribuições estatísticas que podem ser utilizadas para a geração de cargas sintéticas com a finalidade de realizar uma detalhada análise de desempenho do sistema.
publishDate 2005
dc.date.issued.fl_str_mv 2005-08-12
dc.date.accessioned.fl_str_mv 2019-08-12T16:00:18Z
dc.date.available.fl_str_mv 2019-08-12T16:00:18Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/SLBS-6GUL2M
url http://hdl.handle.net/1843/SLBS-6GUL2M
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/SLBS-6GUL2M/1/leonardochavesdutradarocha.pdf
https://repositorio.ufmg.br/bitstream/1843/SLBS-6GUL2M/2/leonardochavesdutradarocha.pdf.txt
bitstream.checksum.fl_str_mv 75261e37e86962fdf7d2c6f585945609
b807f149cebd89df76479a551a9d6019
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1801676992658014208