Análise exploratória e regressão espacial para dados simbólicos intervalares
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
dARK ID: | ark:/64986/0013000005pkx |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/48976 |
Resumo: | A Análise de Dados Espaciais é uma área que busca identificar padrões existentes em uma determinada região através de diversas metodologias, como índices e testes de autocorrelação espacial. A compreensão da dependência espacial de um fenômeno em uma dada região pode ser mensurada através de abordagens envolvendo a noção de autocorrelação espacial. Essas técnicas são usualmente empregadas no contexto de variáveis clássicas (pontuais). Por outro lado, a Análise de Dados Simbólicos é uma área de pesquisa e aplicação relacionada às áreas de aprendizagem de máquina e estatística, que fornecem ferramentas para descrever unidades (objetos), permitindo lidar com diversos tipos de variáveis, inclusive variáveis do tipo intervalar. Uma questão relevante consiste em tentar obter uma descrição da autocorrelação espacial para variáveis do tipo intervalar. Assim, neste trabalho buscamos conciliar a análise de dados simbólicos (variáveis intervalares) com a análise de dados espaciais. Mais especificamente, o presente estudo tem o intuito de identificar o comportamento de informações georreferenciadas para dados intervalares na Análise de Dados Simbólicos. Os objetivos principais são: i) estender o índice de autocorrelação espacial de Moran da Análise Exploratória Espacial para o caso de dados intervalares e ii) modelar dados utilizando diferentes modelos de regressão. Para analisarmos os índices de autocorrelação espacial intervalar propostos, realizamos experimentos com conjuntos de dados sintéticos do tipo intervalar. Além disso, analisamos duas aplicações para dados reais. A primeira utiliza dados de notificações de casos de COVID-19 para o nordeste brasileiro e a segunda está relacionada ao preço de aluguel de imóveis na cidade de Munique. No contexto de regressão, utilizamos o modelo de regressão linear para dados do tipo intervalar e um modelo de regressão espacial, que leva em consideração a conectividade existente entre as regiões. Para avaliarmos o desempenho dessas abordagens, realizamos simulações de Monte Carlo em que calculamos a média e o desvio padrão da magnitude média relativa do erro da estimativa dos modelos analisados. Além disso, avaliamos o desempenho dos modelos de regressão em conjuntos de dados reais. |
id |
UFPE_e78ce533c1276a75fce1b4ec8035924f |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/48976 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
FREITAS, Wanessa Weridiana da Luzhttp://lattes.cnpq.br/5897265240100184http://lattes.cnpq.br/9289080285504453http://lattes.cnpq.br/7674916684282039SOUZA, Renata Maria Cardoso Rodrigues deAMARAL, Getúlio José Amorim do2023-02-08T12:27:27Z2023-02-08T12:27:27Z2022-08-15FREITAS, Wanessa Weridiana da Luz. Análise exploratória e regressão espacial para dados simbólicos intervalares. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.https://repositorio.ufpe.br/handle/123456789/48976ark:/64986/0013000005pkxA Análise de Dados Espaciais é uma área que busca identificar padrões existentes em uma determinada região através de diversas metodologias, como índices e testes de autocorrelação espacial. A compreensão da dependência espacial de um fenômeno em uma dada região pode ser mensurada através de abordagens envolvendo a noção de autocorrelação espacial. Essas técnicas são usualmente empregadas no contexto de variáveis clássicas (pontuais). Por outro lado, a Análise de Dados Simbólicos é uma área de pesquisa e aplicação relacionada às áreas de aprendizagem de máquina e estatística, que fornecem ferramentas para descrever unidades (objetos), permitindo lidar com diversos tipos de variáveis, inclusive variáveis do tipo intervalar. Uma questão relevante consiste em tentar obter uma descrição da autocorrelação espacial para variáveis do tipo intervalar. Assim, neste trabalho buscamos conciliar a análise de dados simbólicos (variáveis intervalares) com a análise de dados espaciais. Mais especificamente, o presente estudo tem o intuito de identificar o comportamento de informações georreferenciadas para dados intervalares na Análise de Dados Simbólicos. Os objetivos principais são: i) estender o índice de autocorrelação espacial de Moran da Análise Exploratória Espacial para o caso de dados intervalares e ii) modelar dados utilizando diferentes modelos de regressão. Para analisarmos os índices de autocorrelação espacial intervalar propostos, realizamos experimentos com conjuntos de dados sintéticos do tipo intervalar. Além disso, analisamos duas aplicações para dados reais. A primeira utiliza dados de notificações de casos de COVID-19 para o nordeste brasileiro e a segunda está relacionada ao preço de aluguel de imóveis na cidade de Munique. No contexto de regressão, utilizamos o modelo de regressão linear para dados do tipo intervalar e um modelo de regressão espacial, que leva em consideração a conectividade existente entre as regiões. Para avaliarmos o desempenho dessas abordagens, realizamos simulações de Monte Carlo em que calculamos a média e o desvio padrão da magnitude média relativa do erro da estimativa dos modelos analisados. Além disso, avaliamos o desempenho dos modelos de regressão em conjuntos de dados reais.FACEPESpatial Data Analysis is a research area that seeks to identify the existence of patterns in a given spatial region by employing appropriate methodologies. The understanding of the spatial dependence of a phenomenon of interest in a given region can be measured through the concept of spatial autocorrelation. Usually, such machinery is employed only in the context of classic variables (punctual variables). On the other hand, Symbolic Data Analysis is a research field related to the framework of machine learning and statistics, which provide us tools to deal with several types of variables, including interval-type variables. A relevant issue regards the description of the spatial autocorrelation in the case of interval type variables. In this work, we seek to unify concepts of symbolic data analysis (for interval variables) and spatial data analysis. More specifically, the present study aims to identify the behavior of georeferenced information for interval data in Symbolic Data Analysis. The main objectives are i) to extend the Moran’s spatial autocorrelation index of Spatial Exploratory Analysis for the case of interval data and ii) to investigate such data through regression models. To analyze the proposed interval spatial autocorrelation indexes, we carried out experiments with interval- type synthetic data sets. Also, we have analyzed two applications for real data. The first one considers data involving the number of COVID-19 notifications in northeastern Brazil, while the second application refers to the rental price of houses in the city of Munich. In the context of regression, we use the linear regression model for interval-type data and a spatial regression model, which takes into account the existing connectivity between regions. To examine the performance of these approaches, we make Monte Carlo simulations and calculate the mean and standard deviation of the performance metric for the models analyzed.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessInteligência computacionalModelos de regressãoDados intervalaresAnálise exploratória e regressão espacial para dados simbólicos intervalaresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisdoutoradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETEXTTESE Wanessa Weridiana da Luz Freitas.pdf.txtTESE Wanessa Weridiana da Luz Freitas.pdf.txtExtracted texttext/plain244933https://repositorio.ufpe.br/bitstream/123456789/48976/4/TESE%20Wanessa%20Weridiana%20da%20Luz%20Freitas.pdf.txt4f4a9a72633c976f58046bcfa8d42e17MD54THUMBNAILTESE Wanessa Weridiana da Luz Freitas.pdf.jpgTESE Wanessa Weridiana da Luz Freitas.pdf.jpgGenerated Thumbnailimage/jpeg1239https://repositorio.ufpe.br/bitstream/123456789/48976/5/TESE%20Wanessa%20Weridiana%20da%20Luz%20Freitas.pdf.jpg18c539fbe1813f861403b881b81b88e0MD55ORIGINALTESE Wanessa Weridiana da Luz Freitas.pdfTESE Wanessa Weridiana da Luz Freitas.pdfapplication/pdf3993100https://repositorio.ufpe.br/bitstream/123456789/48976/1/TESE%20Wanessa%20Weridiana%20da%20Luz%20Freitas.pdf92b62ce669f674f937a584aaf240ba8bMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/48976/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82362https://repositorio.ufpe.br/bitstream/123456789/48976/3/license.txt5e89a1613ddc8510c6576f4b23a78973MD53123456789/489762023-02-09 02:20:41.614oai:repositorio.ufpe.br:123456789/48976VGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2l6YcOnw6NvIGRlIERvY3VtZW50b3Mgbm8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRQoKCkRlY2xhcm8gZXN0YXIgY2llbnRlIGRlIHF1ZSBlc3RlIFRlcm1vIGRlIERlcMOzc2l0byBMZWdhbCBlIEF1dG9yaXphw6fDo28gdGVtIG8gb2JqZXRpdm8gZGUgZGl2dWxnYcOnw6NvIGRvcyBkb2N1bWVudG9zIGRlcG9zaXRhZG9zIG5vIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUgZSBkZWNsYXJvIHF1ZToKCkkgLSBvcyBkYWRvcyBwcmVlbmNoaWRvcyBubyBmb3JtdWzDoXJpbyBkZSBkZXDDs3NpdG8gc8OjbyB2ZXJkYWRlaXJvcyBlIGF1dMOqbnRpY29zOwoKSUkgLSAgbyBjb250ZcO6ZG8gZGlzcG9uaWJpbGl6YWRvIMOpIGRlIHJlc3BvbnNhYmlsaWRhZGUgZGUgc3VhIGF1dG9yaWE7CgpJSUkgLSBvIGNvbnRlw7pkbyDDqSBvcmlnaW5hbCwgZSBzZSBvIHRyYWJhbGhvIGUvb3UgcGFsYXZyYXMgZGUgb3V0cmFzIHBlc3NvYXMgZm9yYW0gdXRpbGl6YWRvcywgZXN0YXMgZm9yYW0gZGV2aWRhbWVudGUgcmVjb25oZWNpZGFzOwoKSVYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIG9icmEgY29sZXRpdmEgKG1haXMgZGUgdW0gYXV0b3IpOiB0b2RvcyBvcyBhdXRvcmVzIGVzdMOjbyBjaWVudGVzIGRvIGRlcMOzc2l0byBlIGRlIGFjb3JkbyBjb20gZXN0ZSB0ZXJtbzsKClYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIFRyYWJhbGhvIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28sIERpc3NlcnRhw6fDo28gb3UgVGVzZTogbyBhcnF1aXZvIGRlcG9zaXRhZG8gY29ycmVzcG9uZGUgw6AgdmVyc8OjbyBmaW5hbCBkbyB0cmFiYWxobzsKClZJIC0gcXVhbmRvIHRyYXRhci1zZSBkZSBUcmFiYWxobyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvLCBEaXNzZXJ0YcOnw6NvIG91IFRlc2U6IGVzdG91IGNpZW50ZSBkZSBxdWUgYSBhbHRlcmHDp8OjbyBkYSBtb2RhbGlkYWRlIGRlIGFjZXNzbyBhbyBkb2N1bWVudG8gYXDDs3MgbyBkZXDDs3NpdG8gZSBhbnRlcyBkZSBmaW5kYXIgbyBwZXLDrW9kbyBkZSBlbWJhcmdvLCBxdWFuZG8gZm9yIGVzY29saGlkbyBhY2Vzc28gcmVzdHJpdG8sIHNlcsOhIHBlcm1pdGlkYSBtZWRpYW50ZSBzb2xpY2l0YcOnw6NvIGRvIChhKSBhdXRvciAoYSkgYW8gU2lzdGVtYSBJbnRlZ3JhZG8gZGUgQmlibGlvdGVjYXMgZGEgVUZQRSAoU0lCL1VGUEUpLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gQWJlcnRvOgoKTmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRlIGF1dG9yIHF1ZSByZWNhZW0gc29icmUgZXN0ZSBkb2N1bWVudG8sIGZ1bmRhbWVudGFkbyBuYSBMZWkgZGUgRGlyZWl0byBBdXRvcmFsIG5vIDkuNjEwLCBkZSAxOSBkZSBmZXZlcmVpcm8gZGUgMTk5OCwgYXJ0LiAyOSwgaW5jaXNvIElJSSwgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIGEgZGlzcG9uaWJpbGl6YXIgZ3JhdHVpdGFtZW50ZSwgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkIChhcXVpc2nDp8OjbykgYXRyYXbDqXMgZG8gc2l0ZSBkbyBSZXBvc2l0w7NyaW8gRGlnaXRhbCBkYSBVRlBFIG5vIGVuZGVyZcOnbyBodHRwOi8vd3d3LnJlcG9zaXRvcmlvLnVmcGUuYnIsIGEgcGFydGlyIGRhIGRhdGEgZGUgZGVww7NzaXRvLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gUmVzdHJpdG86CgpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgYXV0b3IgcXVlIHJlY2FlbSBzb2JyZSBlc3RlIGRvY3VtZW50bywgZnVuZGFtZW50YWRvIG5hIExlaSBkZSBEaXJlaXRvIEF1dG9yYWwgbm8gOS42MTAgZGUgMTkgZGUgZmV2ZXJlaXJvIGRlIDE5OTgsIGFydC4gMjksIGluY2lzbyBJSUksIGF1dG9yaXpvIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgUGVybmFtYnVjbyBhIGRpc3BvbmliaWxpemFyIGdyYXR1aXRhbWVudGUsIHNlbSByZXNzYXJjaW1lbnRvIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gZS9vdSBkb3dubG9hZCAoYXF1aXNpw6fDo28pIGF0cmF2w6lzIGRvIHNpdGUgZG8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRSBubyBlbmRlcmXDp28gaHR0cDovL3d3dy5yZXBvc2l0b3Jpby51ZnBlLmJyLCBxdWFuZG8gZmluZGFyIG8gcGVyw61vZG8gZGUgZW1iYXJnbyBjb25kaXplbnRlIGFvIHRpcG8gZGUgZG9jdW1lbnRvLCBjb25mb3JtZSBpbmRpY2FkbyBubyBjYW1wbyBEYXRhIGRlIEVtYmFyZ28uCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212023-02-09T05:20:41Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Análise exploratória e regressão espacial para dados simbólicos intervalares |
title |
Análise exploratória e regressão espacial para dados simbólicos intervalares |
spellingShingle |
Análise exploratória e regressão espacial para dados simbólicos intervalares FREITAS, Wanessa Weridiana da Luz Inteligência computacional Modelos de regressão Dados intervalares |
title_short |
Análise exploratória e regressão espacial para dados simbólicos intervalares |
title_full |
Análise exploratória e regressão espacial para dados simbólicos intervalares |
title_fullStr |
Análise exploratória e regressão espacial para dados simbólicos intervalares |
title_full_unstemmed |
Análise exploratória e regressão espacial para dados simbólicos intervalares |
title_sort |
Análise exploratória e regressão espacial para dados simbólicos intervalares |
author |
FREITAS, Wanessa Weridiana da Luz |
author_facet |
FREITAS, Wanessa Weridiana da Luz |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/5897265240100184 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/9289080285504453 |
dc.contributor.advisor-coLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/7674916684282039 |
dc.contributor.author.fl_str_mv |
FREITAS, Wanessa Weridiana da Luz |
dc.contributor.advisor1.fl_str_mv |
SOUZA, Renata Maria Cardoso Rodrigues de |
dc.contributor.advisor-co1.fl_str_mv |
AMARAL, Getúlio José Amorim do |
contributor_str_mv |
SOUZA, Renata Maria Cardoso Rodrigues de AMARAL, Getúlio José Amorim do |
dc.subject.por.fl_str_mv |
Inteligência computacional Modelos de regressão Dados intervalares |
topic |
Inteligência computacional Modelos de regressão Dados intervalares |
description |
A Análise de Dados Espaciais é uma área que busca identificar padrões existentes em uma determinada região através de diversas metodologias, como índices e testes de autocorrelação espacial. A compreensão da dependência espacial de um fenômeno em uma dada região pode ser mensurada através de abordagens envolvendo a noção de autocorrelação espacial. Essas técnicas são usualmente empregadas no contexto de variáveis clássicas (pontuais). Por outro lado, a Análise de Dados Simbólicos é uma área de pesquisa e aplicação relacionada às áreas de aprendizagem de máquina e estatística, que fornecem ferramentas para descrever unidades (objetos), permitindo lidar com diversos tipos de variáveis, inclusive variáveis do tipo intervalar. Uma questão relevante consiste em tentar obter uma descrição da autocorrelação espacial para variáveis do tipo intervalar. Assim, neste trabalho buscamos conciliar a análise de dados simbólicos (variáveis intervalares) com a análise de dados espaciais. Mais especificamente, o presente estudo tem o intuito de identificar o comportamento de informações georreferenciadas para dados intervalares na Análise de Dados Simbólicos. Os objetivos principais são: i) estender o índice de autocorrelação espacial de Moran da Análise Exploratória Espacial para o caso de dados intervalares e ii) modelar dados utilizando diferentes modelos de regressão. Para analisarmos os índices de autocorrelação espacial intervalar propostos, realizamos experimentos com conjuntos de dados sintéticos do tipo intervalar. Além disso, analisamos duas aplicações para dados reais. A primeira utiliza dados de notificações de casos de COVID-19 para o nordeste brasileiro e a segunda está relacionada ao preço de aluguel de imóveis na cidade de Munique. No contexto de regressão, utilizamos o modelo de regressão linear para dados do tipo intervalar e um modelo de regressão espacial, que leva em consideração a conectividade existente entre as regiões. Para avaliarmos o desempenho dessas abordagens, realizamos simulações de Monte Carlo em que calculamos a média e o desvio padrão da magnitude média relativa do erro da estimativa dos modelos analisados. Além disso, avaliamos o desempenho dos modelos de regressão em conjuntos de dados reais. |
publishDate |
2022 |
dc.date.issued.fl_str_mv |
2022-08-15 |
dc.date.accessioned.fl_str_mv |
2023-02-08T12:27:27Z |
dc.date.available.fl_str_mv |
2023-02-08T12:27:27Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
FREITAS, Wanessa Weridiana da Luz. Análise exploratória e regressão espacial para dados simbólicos intervalares. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/48976 |
dc.identifier.dark.fl_str_mv |
ark:/64986/0013000005pkx |
identifier_str_mv |
FREITAS, Wanessa Weridiana da Luz. Análise exploratória e regressão espacial para dados simbólicos intervalares. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022. ark:/64986/0013000005pkx |
url |
https://repositorio.ufpe.br/handle/123456789/48976 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Computacao |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/48976/4/TESE%20Wanessa%20Weridiana%20da%20Luz%20Freitas.pdf.txt https://repositorio.ufpe.br/bitstream/123456789/48976/5/TESE%20Wanessa%20Weridiana%20da%20Luz%20Freitas.pdf.jpg https://repositorio.ufpe.br/bitstream/123456789/48976/1/TESE%20Wanessa%20Weridiana%20da%20Luz%20Freitas.pdf https://repositorio.ufpe.br/bitstream/123456789/48976/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/48976/3/license.txt |
bitstream.checksum.fl_str_mv |
4f4a9a72633c976f58046bcfa8d42e17 18c539fbe1813f861403b881b81b88e0 92b62ce669f674f937a584aaf240ba8b e39d27027a6cc9cb039ad269a5db8e34 5e89a1613ddc8510c6576f4b23a78973 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1815172732246032384 |