Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+

Detalhes bibliográficos
Autor(a) principal: Medeiros, Camila Alves de [UNESP]
Data de Publicação: 2014
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/110986
Resumo: The development of technologies for collecting spatial information has resulted in a large volume of stored data, which makes inappropriate the use of conventional data mining techniques for knowledge extraction in spatial databases, due to the high complexity of these data and its relationships. Therefore, several algorithms have been proposed, and the spatial clustering ones stand out due to their high applicability in many fields. However, these algorithms still need to overcome many challenges to reach satisfactory results in a timely manner. In this work, we present a new algorithm, namely CHSMST+, which works with spatial clustering considering both distance and similarity, allowing to correlate spatial and non-spatial attributes. These tasks are performed without input parameters and user interaction, eliminating the dependence of the user interpretation for cluster generation and enabling the achievement of cluster in a more efficient way, since the calculations performed by the algorithm are more accurate than visual analysis of them. Together with these techniques, we use a multithreading approach, which allowed an average reduction of 38,52% in processing time. The CHSMST+ algorithm was applied in spatial databases of health and environment, showing the ability to apply it in different contexts, which makes this work even more relevant
id UNSP_e12351de59f676a3c413b81622d84652
oai_identifier_str oai:repositorio.unesp.br:11449/110986
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+ComputaçãoSistemas de informação geograficaInfra-estruturas de dados espaciaisBanco de dadosAnálise espacial (Estatística)Geographic information systemsThe development of technologies for collecting spatial information has resulted in a large volume of stored data, which makes inappropriate the use of conventional data mining techniques for knowledge extraction in spatial databases, due to the high complexity of these data and its relationships. Therefore, several algorithms have been proposed, and the spatial clustering ones stand out due to their high applicability in many fields. However, these algorithms still need to overcome many challenges to reach satisfactory results in a timely manner. In this work, we present a new algorithm, namely CHSMST+, which works with spatial clustering considering both distance and similarity, allowing to correlate spatial and non-spatial attributes. These tasks are performed without input parameters and user interaction, eliminating the dependence of the user interpretation for cluster generation and enabling the achievement of cluster in a more efficient way, since the calculations performed by the algorithm are more accurate than visual analysis of them. Together with these techniques, we use a multithreading approach, which allowed an average reduction of 38,52% in processing time. The CHSMST+ algorithm was applied in spatial databases of health and environment, showing the ability to apply it in different contexts, which makes this work even more relevantO desenvolvimento de tecnologias de coleta de informações espaciais resultou no armazenamento de um grande volume de dados, que devido à complexidade dos dados e dos respectivos relacionamentos torna-se impraticável a aplicação de técnicas tradicionais para prospecção em bases de dados espaciais. Nesse sentido, diversos algoritmos vêm sendo propostos, sendo que os algoritmos de agrupamento de dados espaciais são os que mais se destacam devido a sua alta aplicabilidade em diversas áreas. No entanto, tais algoritmos ainda necessitam superar vários desafios para que encontrem resultados satisfatórios em tempo hábil. Com o propósito de contribuir neste sentido, neste trabalho é apresentado um novo algoritmo, denominado CHSMST+, que realiza o agrupamento de dados considerando tanto a distância quanto a similaridade, o que possibilita correlacionar atributos espaciais e não espaciais. Tais tarefas são realizadas sem parâmetros de entrada e interação com usuário, o que elimina a dependência da interpretação do usuário para geração dos agrupamentos, bem como possibilita a obtenção de agrupamentos mais eficientes uma vez que os cálculos realizados pelo algoritmo são mais precisos que uma análise visual dos mesmos. Além destas técnicas, é utilizada a abordagem multithreading, que possibilitou uma redução média de 38,52% no tempo de processamento. O algoritmo CHSMST+ foi aplicado em bases de dados espaciais da área da saúde e meio ambiente, mostrando a capacidade de utilizá-lo em diferentes contextos, o que torna ainda mais relevante o trabalho realizadoUniversidade Estadual Paulista (Unesp)Valêncio, Carlos Roberto [UNESP]Universidade Estadual Paulista (Unesp)Medeiros, Camila Alves de [UNESP]2014-12-02T11:16:48Z2014-12-02T11:16:48Z2014-03-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis106 f. : il. color., tabs.application/pdfMEDEIROS, Camila Alves de. Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+. 2014. 106 f. Dissertação (mestrado) - Universidade Estadual Paulista Julio de Mesquita Filho, Instituto de Biociências, Letras e Ciências Exatas, 2014.http://hdl.handle.net/11449/110986000792056000792056.pdf33004153073P2Alephreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESPporinfo:eu-repo/semantics/openAccess2024-01-13T06:33:44Zoai:repositorio.unesp.br:11449/110986Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T22:52:03.559410Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+
title Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+
spellingShingle Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+
Medeiros, Camila Alves de [UNESP]
Computação
Sistemas de informação geografica
Infra-estruturas de dados espaciais
Banco de dados
Análise espacial (Estatística)
Geographic information systems
title_short Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+
title_full Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+
title_fullStr Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+
title_full_unstemmed Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+
title_sort Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+
author Medeiros, Camila Alves de [UNESP]
author_facet Medeiros, Camila Alves de [UNESP]
author_role author
dc.contributor.none.fl_str_mv Valêncio, Carlos Roberto [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Medeiros, Camila Alves de [UNESP]
dc.subject.por.fl_str_mv Computação
Sistemas de informação geografica
Infra-estruturas de dados espaciais
Banco de dados
Análise espacial (Estatística)
Geographic information systems
topic Computação
Sistemas de informação geografica
Infra-estruturas de dados espaciais
Banco de dados
Análise espacial (Estatística)
Geographic information systems
description The development of technologies for collecting spatial information has resulted in a large volume of stored data, which makes inappropriate the use of conventional data mining techniques for knowledge extraction in spatial databases, due to the high complexity of these data and its relationships. Therefore, several algorithms have been proposed, and the spatial clustering ones stand out due to their high applicability in many fields. However, these algorithms still need to overcome many challenges to reach satisfactory results in a timely manner. In this work, we present a new algorithm, namely CHSMST+, which works with spatial clustering considering both distance and similarity, allowing to correlate spatial and non-spatial attributes. These tasks are performed without input parameters and user interaction, eliminating the dependence of the user interpretation for cluster generation and enabling the achievement of cluster in a more efficient way, since the calculations performed by the algorithm are more accurate than visual analysis of them. Together with these techniques, we use a multithreading approach, which allowed an average reduction of 38,52% in processing time. The CHSMST+ algorithm was applied in spatial databases of health and environment, showing the ability to apply it in different contexts, which makes this work even more relevant
publishDate 2014
dc.date.none.fl_str_mv 2014-12-02T11:16:48Z
2014-12-02T11:16:48Z
2014-03-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv MEDEIROS, Camila Alves de. Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+. 2014. 106 f. Dissertação (mestrado) - Universidade Estadual Paulista Julio de Mesquita Filho, Instituto de Biociências, Letras e Ciências Exatas, 2014.
http://hdl.handle.net/11449/110986
000792056
000792056.pdf
33004153073P2
identifier_str_mv MEDEIROS, Camila Alves de. Extração de conhecimento em bases de dados espaciais: algoritmo CHSMST+. 2014. 106 f. Dissertação (mestrado) - Universidade Estadual Paulista Julio de Mesquita Filho, Instituto de Biociências, Letras e Ciências Exatas, 2014.
000792056
000792056.pdf
33004153073P2
url http://hdl.handle.net/11449/110986
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 106 f. : il. color., tabs.
application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv Aleph
reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808129468633448448