Reutilização de Processos de Descoberta de Conhecimento
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.22/11144 |
Resumo: | Nesta dissertação é apresentada uma prova de conceito tendo como objetivo automatizar a adaptação de um processo de descoberta de conhecimento previamente definido, a uma nova fonte de dados. Um processo de descoberta de conhecimento pode usar uma ou mais fonte de dados e, na maioria das vezes necessita, de ajustes quando essas fontes são trocadas por outras pertencentes ao mesmo domínio, uma vez que as fontes de dados anteriores e as novas raramente possuem o mesmo esquema de dados associado. Esses ajustes por vezes fazem com que o analista dispense mais tempo a reformular a configuração do processo implementado anteriormente. As ferramentas de descoberta de conhecimento existentes permitem que seja executado o processo, mas em nenhuma delas é possível efetuar a troca da fonte de dados e, de uma forma automatizada, criar e ajustar os componentes para que possa ser usado o mesmo processo de descoberta de conhecimento, excetuando os casos em que os esquemas de ambas são rigorosamente iguais. Esta limitação levou à criação de uma solução que permite complementar as ações das ferramentas de descoberta de conhecimento e, desta forma, simplificar a atuação do analista. A solução desenvolvida foi implementada em C# e permite adaptar o esquema da nova fonte de dados ao processo de descoberta de conhecimento previamente definido, com base na fonte anterior, criando e utilizando os componentes especificados anteriormente. Esta nova solução permite uma maior rapidez no processo de reutilização de um processo de descoberta de conhecimento em novas fontes de dados pertencentes ao mesmo domínio. |
id |
RCAP_d9e945bdb11e72383cf10f5f9775ad93 |
---|---|
oai_identifier_str |
oai:recipp.ipp.pt:10400.22/11144 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Reutilização de Processos de Descoberta de ConhecimentoData MiningDescoberta de ConhecimentoC#ClemScriptIBM SPSS ModelerWEKASistemas de Informação e ConhecimentoNesta dissertação é apresentada uma prova de conceito tendo como objetivo automatizar a adaptação de um processo de descoberta de conhecimento previamente definido, a uma nova fonte de dados. Um processo de descoberta de conhecimento pode usar uma ou mais fonte de dados e, na maioria das vezes necessita, de ajustes quando essas fontes são trocadas por outras pertencentes ao mesmo domínio, uma vez que as fontes de dados anteriores e as novas raramente possuem o mesmo esquema de dados associado. Esses ajustes por vezes fazem com que o analista dispense mais tempo a reformular a configuração do processo implementado anteriormente. As ferramentas de descoberta de conhecimento existentes permitem que seja executado o processo, mas em nenhuma delas é possível efetuar a troca da fonte de dados e, de uma forma automatizada, criar e ajustar os componentes para que possa ser usado o mesmo processo de descoberta de conhecimento, excetuando os casos em que os esquemas de ambas são rigorosamente iguais. Esta limitação levou à criação de uma solução que permite complementar as ações das ferramentas de descoberta de conhecimento e, desta forma, simplificar a atuação do analista. A solução desenvolvida foi implementada em C# e permite adaptar o esquema da nova fonte de dados ao processo de descoberta de conhecimento previamente definido, com base na fonte anterior, criando e utilizando os componentes especificados anteriormente. Esta nova solução permite uma maior rapidez no processo de reutilização de um processo de descoberta de conhecimento em novas fontes de dados pertencentes ao mesmo domínio.This thesis presents a proof of concept aiming to automate the adaptation of a process of knowledge discovery previously defined to the new data source. The Knowledge discovery process can use one or more data sources, and most of time they require adjustments when the data source is exchanged for another one with different schema, but related with the same domain. These adjustments sometimes take a lot of time from analyst due to the need to reshape the process configuration created for the old data source. The existing tools allow the process to run, but none of them can be used to exchange data source and readjust the process by an automatic method, allowing the creation of new components and redefine the previously implemented components, in order to get the same structure of previous data source. To overcome this limitation, a new solution was developed which not only makes the KDD tools more user friendly but also allows the simplification of the actions needed by analyst. The developed solution was implemented in C# and allows the new data source to be adjusted to the target schema, based on the previous data source, creating and reusing used previous existing components. This solution allows for greater speed in the adjustment process of the new data source within the same domain.Oliveira, Paulo Jorge MachadoRepositório Científico do Instituto Politécnico do PortoSousa, Ricardo Filipe Marques de2019-11-25T01:30:31Z20162016-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/11144TID:201750724porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-04-19T01:46:23Zoai:recipp.ipp.pt:10400.22/11144Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T17:31:32.217962Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Reutilização de Processos de Descoberta de Conhecimento |
title |
Reutilização de Processos de Descoberta de Conhecimento |
spellingShingle |
Reutilização de Processos de Descoberta de Conhecimento Sousa, Ricardo Filipe Marques de Data Mining Descoberta de Conhecimento C# ClemScript IBM SPSS Modeler WEKA Sistemas de Informação e Conhecimento |
title_short |
Reutilização de Processos de Descoberta de Conhecimento |
title_full |
Reutilização de Processos de Descoberta de Conhecimento |
title_fullStr |
Reutilização de Processos de Descoberta de Conhecimento |
title_full_unstemmed |
Reutilização de Processos de Descoberta de Conhecimento |
title_sort |
Reutilização de Processos de Descoberta de Conhecimento |
author |
Sousa, Ricardo Filipe Marques de |
author_facet |
Sousa, Ricardo Filipe Marques de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Oliveira, Paulo Jorge Machado Repositório Científico do Instituto Politécnico do Porto |
dc.contributor.author.fl_str_mv |
Sousa, Ricardo Filipe Marques de |
dc.subject.por.fl_str_mv |
Data Mining Descoberta de Conhecimento C# ClemScript IBM SPSS Modeler WEKA Sistemas de Informação e Conhecimento |
topic |
Data Mining Descoberta de Conhecimento C# ClemScript IBM SPSS Modeler WEKA Sistemas de Informação e Conhecimento |
description |
Nesta dissertação é apresentada uma prova de conceito tendo como objetivo automatizar a adaptação de um processo de descoberta de conhecimento previamente definido, a uma nova fonte de dados. Um processo de descoberta de conhecimento pode usar uma ou mais fonte de dados e, na maioria das vezes necessita, de ajustes quando essas fontes são trocadas por outras pertencentes ao mesmo domínio, uma vez que as fontes de dados anteriores e as novas raramente possuem o mesmo esquema de dados associado. Esses ajustes por vezes fazem com que o analista dispense mais tempo a reformular a configuração do processo implementado anteriormente. As ferramentas de descoberta de conhecimento existentes permitem que seja executado o processo, mas em nenhuma delas é possível efetuar a troca da fonte de dados e, de uma forma automatizada, criar e ajustar os componentes para que possa ser usado o mesmo processo de descoberta de conhecimento, excetuando os casos em que os esquemas de ambas são rigorosamente iguais. Esta limitação levou à criação de uma solução que permite complementar as ações das ferramentas de descoberta de conhecimento e, desta forma, simplificar a atuação do analista. A solução desenvolvida foi implementada em C# e permite adaptar o esquema da nova fonte de dados ao processo de descoberta de conhecimento previamente definido, com base na fonte anterior, criando e utilizando os componentes especificados anteriormente. Esta nova solução permite uma maior rapidez no processo de reutilização de um processo de descoberta de conhecimento em novas fontes de dados pertencentes ao mesmo domínio. |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016 2016-01-01T00:00:00Z 2019-11-25T01:30:31Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.22/11144 TID:201750724 |
url |
http://hdl.handle.net/10400.22/11144 |
identifier_str_mv |
TID:201750724 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799131410168020992 |