Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais

Detalhes bibliográficos
Autor(a) principal: Freitas, Lucas Kaminski de
Data de Publicação: 2021
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/28990
Resumo: A análise, contextualização e compreensão de outliers em datasets complexos, com muitos atributos heterogêneos, apresenta grandes desafios. Para o especialista realizando a análise, nem sempre é trivial identificar quais dados e atributos são relevantes para o problema em questão, mesmo com a utilização de técnicas de visualização de dados. Este problema é ainda mais desafiador em datasets que demandam a interpretação geográfica de outliers, como por exemplo: (i) dados meteorológicos; (ii) dados de censos demográficos; (iii) dados socioeconômicos de diversos municípios. Este trabalho tem como objetivo propor ferramentas que simplifiquem a tarefa de interpretação e contextualização geográfica de outliers, através de visualizações criadas com o auxílio de algoritmos de Outlying Aspect Mining. Com essas ferramentas, pretende-se propiciar análises mais precisas, diretas e eficientes, permitindo que o especialista compreenda e contextualize os outliers com mais facilidade, sob uma perspectiva geográfica. Como caso de teste, serão utilizados os dados públicos de vacinação contra a Covid-19 no Brasil, disponibilizados pelo OpenDataSus.
id UTFPR-12_22196a4ddb10620e982e2e3399bb5cc9
oai_identifier_str oai:repositorio.utfpr.edu.br:1/28990
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2022-07-04T17:49:24Z2022-07-04T17:49:24Z2021-12-07FREITAS, Lucas Kaminski de. Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação) - Universidade Tecnológica Federal do Paraná, Curitiba, 2021.http://repositorio.utfpr.edu.br/jspui/handle/1/28990A análise, contextualização e compreensão de outliers em datasets complexos, com muitos atributos heterogêneos, apresenta grandes desafios. Para o especialista realizando a análise, nem sempre é trivial identificar quais dados e atributos são relevantes para o problema em questão, mesmo com a utilização de técnicas de visualização de dados. Este problema é ainda mais desafiador em datasets que demandam a interpretação geográfica de outliers, como por exemplo: (i) dados meteorológicos; (ii) dados de censos demográficos; (iii) dados socioeconômicos de diversos municípios. Este trabalho tem como objetivo propor ferramentas que simplifiquem a tarefa de interpretação e contextualização geográfica de outliers, através de visualizações criadas com o auxílio de algoritmos de Outlying Aspect Mining. Com essas ferramentas, pretende-se propiciar análises mais precisas, diretas e eficientes, permitindo que o especialista compreenda e contextualize os outliers com mais facilidade, sob uma perspectiva geográfica. Como caso de teste, serão utilizados os dados públicos de vacinação contra a Covid-19 no Brasil, disponibilizados pelo OpenDataSus.Analyzing, contextualizing, and understanding outliers in complex datasets, with many heterogeneous attributes, presents big challenges. For the specialist performing the analysis, it is not always trivial to identify which attributes are relevant to the problem at hand, even with the usage of data visualization techniques. This problem is even more challenging in datasets that demand the geographic interpretation of outliers, such as (i) meteorological data; (ii) demographic census data; (iii) socio-economic data from several cities. The present work proposes tools for simplifying the task of geographic contextualization and interpretation of outliers, through visualizations generated with the help of Outlying Aspect Mining algorithms. With these tools, it is expected that more accurate, direct, and efficient analyses are possible, allowing the specialist to understand and contextualize outliers more easily, from a geographic perspective. As a test case, public data on vaccination against Covid-19 in Brazil, made available by OpenDataSus, will be used.porUniversidade Tecnológica Federal do ParanáCuritibaBacharelado em Engenharia de ComputaçãoUTFPRBrasilhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOArmazenamento de dadosMineração de dados (Computação)Sistemas de informação geográficaBanco de dados geográficosVisualização da informaçãoData WarehousingData miningGeographic information systemsGeodatabasesInformation visualizationFerramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionaisTools for geographic contextualization of outliers in multidimensional datasetsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisCuritibaGomes Junior, Luiz CelsoGomes Junior, Luiz CelsoBuiar, José AntonioBenghi, Felipe MarxFreitas, Lucas Kaminski dereponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALoutliers.pdfoutliers.pdfapplication/pdf1388596http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/1/outliers.pdff66dc46f0cd3ab99daf57507e835ed70MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8908http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/2/license_rdf0175ea4a2d4caec4bbcc37e300941108MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/3/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD53TEXToutliers.pdf.txtoutliers.pdf.txtExtracted texttext/plain66139http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/4/outliers.pdf.txtccf44871b84d3cac53246ad48b588e9aMD54THUMBNAILoutliers.pdf.jpgoutliers.pdf.jpgGenerated Thumbnailimage/jpeg1264http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/5/outliers.pdf.jpgffd4c39bda6282f5797e9e6e9b5cc106MD551/289902022-07-05 03:06:42.758oai:repositorio.utfpr.edu.br:1/28990TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2022-07-05T06:06:42Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais
dc.title.alternative.pt_BR.fl_str_mv Tools for geographic contextualization of outliers in multidimensional datasets
title Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais
spellingShingle Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais
Freitas, Lucas Kaminski de
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Armazenamento de dados
Mineração de dados (Computação)
Sistemas de informação geográfica
Banco de dados geográficos
Visualização da informação
Data Warehousing
Data mining
Geographic information systems
Geodatabases
Information visualization
title_short Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais
title_full Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais
title_fullStr Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais
title_full_unstemmed Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais
title_sort Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais
author Freitas, Lucas Kaminski de
author_facet Freitas, Lucas Kaminski de
author_role author
dc.contributor.advisor1.fl_str_mv Gomes Junior, Luiz Celso
dc.contributor.referee1.fl_str_mv Gomes Junior, Luiz Celso
dc.contributor.referee2.fl_str_mv Buiar, José Antonio
dc.contributor.referee3.fl_str_mv Benghi, Felipe Marx
dc.contributor.author.fl_str_mv Freitas, Lucas Kaminski de
contributor_str_mv Gomes Junior, Luiz Celso
Gomes Junior, Luiz Celso
Buiar, José Antonio
Benghi, Felipe Marx
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Armazenamento de dados
Mineração de dados (Computação)
Sistemas de informação geográfica
Banco de dados geográficos
Visualização da informação
Data Warehousing
Data mining
Geographic information systems
Geodatabases
Information visualization
dc.subject.por.fl_str_mv Armazenamento de dados
Mineração de dados (Computação)
Sistemas de informação geográfica
Banco de dados geográficos
Visualização da informação
Data Warehousing
Data mining
Geographic information systems
Geodatabases
Information visualization
description A análise, contextualização e compreensão de outliers em datasets complexos, com muitos atributos heterogêneos, apresenta grandes desafios. Para o especialista realizando a análise, nem sempre é trivial identificar quais dados e atributos são relevantes para o problema em questão, mesmo com a utilização de técnicas de visualização de dados. Este problema é ainda mais desafiador em datasets que demandam a interpretação geográfica de outliers, como por exemplo: (i) dados meteorológicos; (ii) dados de censos demográficos; (iii) dados socioeconômicos de diversos municípios. Este trabalho tem como objetivo propor ferramentas que simplifiquem a tarefa de interpretação e contextualização geográfica de outliers, através de visualizações criadas com o auxílio de algoritmos de Outlying Aspect Mining. Com essas ferramentas, pretende-se propiciar análises mais precisas, diretas e eficientes, permitindo que o especialista compreenda e contextualize os outliers com mais facilidade, sob uma perspectiva geográfica. Como caso de teste, serão utilizados os dados públicos de vacinação contra a Covid-19 no Brasil, disponibilizados pelo OpenDataSus.
publishDate 2021
dc.date.issued.fl_str_mv 2021-12-07
dc.date.accessioned.fl_str_mv 2022-07-04T17:49:24Z
dc.date.available.fl_str_mv 2022-07-04T17:49:24Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv FREITAS, Lucas Kaminski de. Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação) - Universidade Tecnológica Federal do Paraná, Curitiba, 2021.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/28990
identifier_str_mv FREITAS, Lucas Kaminski de. Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação) - Universidade Tecnológica Federal do Paraná, Curitiba, 2021.
url http://repositorio.utfpr.edu.br/jspui/handle/1/28990
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Curitiba
dc.publisher.program.fl_str_mv Bacharelado em Engenharia de Computação
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Curitiba
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/1/outliers.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/2/license_rdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/3/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/4/outliers.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/5/outliers.pdf.jpg
bitstream.checksum.fl_str_mv f66dc46f0cd3ab99daf57507e835ed70
0175ea4a2d4caec4bbcc37e300941108
b9d82215ab23456fa2d8b49c5df1b95b
ccf44871b84d3cac53246ad48b588e9a
ffd4c39bda6282f5797e9e6e9b5cc106
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805922957187350528