Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UNESP |
Texto Completo: | http://hdl.handle.net/11449/110986 |
Resumo: | The development of technologies for collecting spatial information has resulted in a large volume of stored data, which makes inappropriate the use of conventional data mining techniques for knowledge extraction in spatial databases, due to the high complexity of these data and its relationships. Therefore, several algorithms have been proposed, and the spatial clustering ones stand out due to their high applicability in many fields. However, these algorithms still need to overcome many challenges to reach satisfactory results in a timely manner. In this work, we present a new algorithm, namely CHSMST+, which works with spatial clustering considering both distance and similarity, allowing to correlate spatial and non-spatial attributes. These tasks are performed without input parameters and user interaction, eliminating the dependence of the user interpretation for cluster generation and enabling the achievement of cluster in a more efficient way, since the calculations performed by the algorithm are more accurate than visual analysis of them. Together with these techniques, we use a multithreading approach, which allowed an average reduction of 38,52% in processing time. The CHSMST+ algorithm was applied in spatial databases of health and environment, showing the ability to apply it in different contexts, which makes this work even more relevant |
id |
UNSP_e12351de59f676a3c413b81622d84652 |
---|---|
oai_identifier_str |
oai:repositorio.unesp.br:11449/110986 |
network_acronym_str |
UNSP |
network_name_str |
Repositório Institucional da UNESP |
repository_id_str |
2946 |
spelling |
Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+ComputaçãoSistemas de informação geograficaInfra-estruturas de dados espaciaisBanco de dadosAnálise espacial (Estatística)Geographic information systemsThe development of technologies for collecting spatial information has resulted in a large volume of stored data, which makes inappropriate the use of conventional data mining techniques for knowledge extraction in spatial databases, due to the high complexity of these data and its relationships. Therefore, several algorithms have been proposed, and the spatial clustering ones stand out due to their high applicability in many fields. However, these algorithms still need to overcome many challenges to reach satisfactory results in a timely manner. In this work, we present a new algorithm, namely CHSMST+, which works with spatial clustering considering both distance and similarity, allowing to correlate spatial and non-spatial attributes. These tasks are performed without input parameters and user interaction, eliminating the dependence of the user interpretation for cluster generation and enabling the achievement of cluster in a more efficient way, since the calculations performed by the algorithm are more accurate than visual analysis of them. Together with these techniques, we use a multithreading approach, which allowed an average reduction of 38,52% in processing time. The CHSMST+ algorithm was applied in spatial databases of health and environment, showing the ability to apply it in different contexts, which makes this work even more relevantO desenvolvimento de tecnologias de coleta de informações espaciais resultou no armazenamento de um grande volume de dados, que devido à complexidade dos dados e dos respectivos relacionamentos torna-se impraticável a aplicação de técnicas tradicionais para prospecção em bases de dados espaciais. Nesse sentido, diversos algoritmos vêm sendo propostos, sendo que os algoritmos de agrupamento de dados espaciais são os que mais se destacam devido a sua alta aplicabilidade em diversas áreas. No entanto, tais algoritmos ainda necessitam superar vários desafios para que encontrem resultados satisfatórios em tempo hábil. Com o propósito de contribuir neste sentido, neste trabalho é apresentado um novo algoritmo, denominado CHSMST+, que realiza o agrupamento de dados considerando tanto a distância quanto a similaridade, o que possibilita correlacionar atributos espaciais e não espaciais. Tais tarefas são realizadas sem parâmetros de entrada e interação com usuário, o que elimina a dependência da interpretação do usuário para geração dos agrupamentos, bem como possibilita a obtenção de agrupamentos mais eficientes uma vez que os cálculos realizados pelo algoritmo são mais precisos que uma análise visual dos mesmos. Além destas técnicas, é utilizada a abordagem multithreading, que possibilitou uma redução média de 38,52% no tempo de processamento. O algoritmo CHSMST+ foi aplicado em bases de dados espaciais da área da saúde e meio ambiente, mostrando a capacidade de utilizá-lo em diferentes contextos, o que torna ainda mais relevante o trabalho realizadoUniversidade Estadual Paulista (Unesp)Valêncio, Carlos Roberto [UNESP]Universidade Estadual Paulista (Unesp)Medeiros, Camila Alves de [UNESP]2014-12-02T11:16:48Z2014-12-02T11:16:48Z2014-03-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis106 f. : il. color., tabs.application/pdfMEDEIROS, Camila Alves de. Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+. 2014. 106 f. Dissertação (mestrado) - Universidade Estadual Paulista Julio de Mesquita Filho, Instituto de Biociências, Letras e Ciências Exatas, 2014.http://hdl.handle.net/11449/110986000792056000792056.pdf33004153073P2Alephreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESPporinfo:eu-repo/semantics/openAccess2024-01-13T06:33:44Zoai:repositorio.unesp.br:11449/110986Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T22:52:03.559410Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false |
dc.title.none.fl_str_mv |
Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+ |
title |
Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+ |
spellingShingle |
Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+ Medeiros, Camila Alves de [UNESP] Computação Sistemas de informação geografica Infra-estruturas de dados espaciais Banco de dados Análise espacial (Estatística) Geographic information systems |
title_short |
Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+ |
title_full |
Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+ |
title_fullStr |
Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+ |
title_full_unstemmed |
Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+ |
title_sort |
Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+ |
author |
Medeiros, Camila Alves de [UNESP] |
author_facet |
Medeiros, Camila Alves de [UNESP] |
author_role |
author |
dc.contributor.none.fl_str_mv |
Valêncio, Carlos Roberto [UNESP] Universidade Estadual Paulista (Unesp) |
dc.contributor.author.fl_str_mv |
Medeiros, Camila Alves de [UNESP] |
dc.subject.por.fl_str_mv |
Computação Sistemas de informação geografica Infra-estruturas de dados espaciais Banco de dados Análise espacial (Estatística) Geographic information systems |
topic |
Computação Sistemas de informação geografica Infra-estruturas de dados espaciais Banco de dados Análise espacial (Estatística) Geographic information systems |
description |
The development of technologies for collecting spatial information has resulted in a large volume of stored data, which makes inappropriate the use of conventional data mining techniques for knowledge extraction in spatial databases, due to the high complexity of these data and its relationships. Therefore, several algorithms have been proposed, and the spatial clustering ones stand out due to their high applicability in many fields. However, these algorithms still need to overcome many challenges to reach satisfactory results in a timely manner. In this work, we present a new algorithm, namely CHSMST+, which works with spatial clustering considering both distance and similarity, allowing to correlate spatial and non-spatial attributes. These tasks are performed without input parameters and user interaction, eliminating the dependence of the user interpretation for cluster generation and enabling the achievement of cluster in a more efficient way, since the calculations performed by the algorithm are more accurate than visual analysis of them. Together with these techniques, we use a multithreading approach, which allowed an average reduction of 38,52% in processing time. The CHSMST+ algorithm was applied in spatial databases of health and environment, showing the ability to apply it in different contexts, which makes this work even more relevant |
publishDate |
2014 |
dc.date.none.fl_str_mv |
2014-12-02T11:16:48Z 2014-12-02T11:16:48Z 2014-03-28 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
MEDEIROS, Camila Alves de. Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+. 2014. 106 f. Dissertação (mestrado) - Universidade Estadual Paulista Julio de Mesquita Filho, Instituto de Biociências, Letras e Ciências Exatas, 2014. http://hdl.handle.net/11449/110986 000792056 000792056.pdf 33004153073P2 |
identifier_str_mv |
MEDEIROS, Camila Alves de. Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+. 2014. 106 f. Dissertação (mestrado) - Universidade Estadual Paulista Julio de Mesquita Filho, Instituto de Biociências, Letras e Ciências Exatas, 2014. 000792056 000792056.pdf 33004153073P2 |
url |
http://hdl.handle.net/11449/110986 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
106 f. : il. color., tabs. application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
dc.source.none.fl_str_mv |
Aleph reponame:Repositório Institucional da UNESP instname:Universidade Estadual Paulista (UNESP) instacron:UNESP |
instname_str |
Universidade Estadual Paulista (UNESP) |
instacron_str |
UNESP |
institution |
UNESP |
reponame_str |
Repositório Institucional da UNESP |
collection |
Repositório Institucional da UNESP |
repository.name.fl_str_mv |
Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP) |
repository.mail.fl_str_mv |
|
_version_ |
1808129468633448448 |