Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/28990 |
Resumo: | A análise, contextualização e compreensão de outliers em datasets complexos, com muitos atributos heterogêneos, apresenta grandes desafios. Para o especialista realizando a análise, nem sempre é trivial identificar quais dados e atributos são relevantes para o problema em questão, mesmo com a utilização de técnicas de visualização de dados. Este problema é ainda mais desafiador em datasets que demandam a interpretação geográfica de outliers, como por exemplo: (i) dados meteorológicos; (ii) dados de censos demográficos; (iii) dados socioeconômicos de diversos municípios. Este trabalho tem como objetivo propor ferramentas que simplifiquem a tarefa de interpretação e contextualização geográfica de outliers, através de visualizações criadas com o auxílio de algoritmos de Outlying Aspect Mining. Com essas ferramentas, pretende-se propiciar análises mais precisas, diretas e eficientes, permitindo que o especialista compreenda e contextualize os outliers com mais facilidade, sob uma perspectiva geográfica. Como caso de teste, serão utilizados os dados públicos de vacinação contra a Covid-19 no Brasil, disponibilizados pelo OpenDataSus. |
id |
UTFPR-12_22196a4ddb10620e982e2e3399bb5cc9 |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/28990 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2022-07-04T17:49:24Z2022-07-04T17:49:24Z2021-12-07FREITAS, Lucas Kaminski de. Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação) - Universidade Tecnológica Federal do Paraná, Curitiba, 2021.http://repositorio.utfpr.edu.br/jspui/handle/1/28990A análise, contextualização e compreensão de outliers em datasets complexos, com muitos atributos heterogêneos, apresenta grandes desafios. Para o especialista realizando a análise, nem sempre é trivial identificar quais dados e atributos são relevantes para o problema em questão, mesmo com a utilização de técnicas de visualização de dados. Este problema é ainda mais desafiador em datasets que demandam a interpretação geográfica de outliers, como por exemplo: (i) dados meteorológicos; (ii) dados de censos demográficos; (iii) dados socioeconômicos de diversos municípios. Este trabalho tem como objetivo propor ferramentas que simplifiquem a tarefa de interpretação e contextualização geográfica de outliers, através de visualizações criadas com o auxílio de algoritmos de Outlying Aspect Mining. Com essas ferramentas, pretende-se propiciar análises mais precisas, diretas e eficientes, permitindo que o especialista compreenda e contextualize os outliers com mais facilidade, sob uma perspectiva geográfica. Como caso de teste, serão utilizados os dados públicos de vacinação contra a Covid-19 no Brasil, disponibilizados pelo OpenDataSus.Analyzing, contextualizing, and understanding outliers in complex datasets, with many heterogeneous attributes, presents big challenges. For the specialist performing the analysis, it is not always trivial to identify which attributes are relevant to the problem at hand, even with the usage of data visualization techniques. This problem is even more challenging in datasets that demand the geographic interpretation of outliers, such as (i) meteorological data; (ii) demographic census data; (iii) socio-economic data from several cities. The present work proposes tools for simplifying the task of geographic contextualization and interpretation of outliers, through visualizations generated with the help of Outlying Aspect Mining algorithms. With these tools, it is expected that more accurate, direct, and efficient analyses are possible, allowing the specialist to understand and contextualize outliers more easily, from a geographic perspective. As a test case, public data on vaccination against Covid-19 in Brazil, made available by OpenDataSus, will be used.porUniversidade Tecnológica Federal do ParanáCuritibaBacharelado em Engenharia de ComputaçãoUTFPRBrasilhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOArmazenamento de dadosMineração de dados (Computação)Sistemas de informação geográficaBanco de dados geográficosVisualização da informaçãoData WarehousingData miningGeographic information systemsGeodatabasesInformation visualizationFerramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionaisTools for geographic contextualization of outliers in multidimensional datasetsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisCuritibaGomes Junior, Luiz CelsoGomes Junior, Luiz CelsoBuiar, José AntonioBenghi, Felipe MarxFreitas, Lucas Kaminski dereponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALoutliers.pdfoutliers.pdfapplication/pdf1388596http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/1/outliers.pdff66dc46f0cd3ab99daf57507e835ed70MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8908http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/2/license_rdf0175ea4a2d4caec4bbcc37e300941108MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/3/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD53TEXToutliers.pdf.txtoutliers.pdf.txtExtracted texttext/plain66139http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/4/outliers.pdf.txtccf44871b84d3cac53246ad48b588e9aMD54THUMBNAILoutliers.pdf.jpgoutliers.pdf.jpgGenerated Thumbnailimage/jpeg1264http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/5/outliers.pdf.jpgffd4c39bda6282f5797e9e6e9b5cc106MD551/289902022-07-05 03:06:42.758oai:repositorio.utfpr.edu.br:1/28990TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2022-07-05T06:06:42Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais |
dc.title.alternative.pt_BR.fl_str_mv |
Tools for geographic contextualization of outliers in multidimensional datasets |
title |
Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais |
spellingShingle |
Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais Freitas, Lucas Kaminski de CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Armazenamento de dados Mineração de dados (Computação) Sistemas de informação geográfica Banco de dados geográficos Visualização da informação Data Warehousing Data mining Geographic information systems Geodatabases Information visualization |
title_short |
Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais |
title_full |
Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais |
title_fullStr |
Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais |
title_full_unstemmed |
Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais |
title_sort |
Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais |
author |
Freitas, Lucas Kaminski de |
author_facet |
Freitas, Lucas Kaminski de |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Gomes Junior, Luiz Celso |
dc.contributor.referee1.fl_str_mv |
Gomes Junior, Luiz Celso |
dc.contributor.referee2.fl_str_mv |
Buiar, José Antonio |
dc.contributor.referee3.fl_str_mv |
Benghi, Felipe Marx |
dc.contributor.author.fl_str_mv |
Freitas, Lucas Kaminski de |
contributor_str_mv |
Gomes Junior, Luiz Celso Gomes Junior, Luiz Celso Buiar, José Antonio Benghi, Felipe Marx |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Armazenamento de dados Mineração de dados (Computação) Sistemas de informação geográfica Banco de dados geográficos Visualização da informação Data Warehousing Data mining Geographic information systems Geodatabases Information visualization |
dc.subject.por.fl_str_mv |
Armazenamento de dados Mineração de dados (Computação) Sistemas de informação geográfica Banco de dados geográficos Visualização da informação Data Warehousing Data mining Geographic information systems Geodatabases Information visualization |
description |
A análise, contextualização e compreensão de outliers em datasets complexos, com muitos atributos heterogêneos, apresenta grandes desafios. Para o especialista realizando a análise, nem sempre é trivial identificar quais dados e atributos são relevantes para o problema em questão, mesmo com a utilização de técnicas de visualização de dados. Este problema é ainda mais desafiador em datasets que demandam a interpretação geográfica de outliers, como por exemplo: (i) dados meteorológicos; (ii) dados de censos demográficos; (iii) dados socioeconômicos de diversos municípios. Este trabalho tem como objetivo propor ferramentas que simplifiquem a tarefa de interpretação e contextualização geográfica de outliers, através de visualizações criadas com o auxílio de algoritmos de Outlying Aspect Mining. Com essas ferramentas, pretende-se propiciar análises mais precisas, diretas e eficientes, permitindo que o especialista compreenda e contextualize os outliers com mais facilidade, sob uma perspectiva geográfica. Como caso de teste, serão utilizados os dados públicos de vacinação contra a Covid-19 no Brasil, disponibilizados pelo OpenDataSus. |
publishDate |
2021 |
dc.date.issued.fl_str_mv |
2021-12-07 |
dc.date.accessioned.fl_str_mv |
2022-07-04T17:49:24Z |
dc.date.available.fl_str_mv |
2022-07-04T17:49:24Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
FREITAS, Lucas Kaminski de. Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação) - Universidade Tecnológica Federal do Paraná, Curitiba, 2021. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/28990 |
identifier_str_mv |
FREITAS, Lucas Kaminski de. Ferramentas para contextualização geográfica de outliers em conjuntos de dados multidimensionais. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação) - Universidade Tecnológica Federal do Paraná, Curitiba, 2021. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/28990 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by/4.0/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by/4.0/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Curitiba |
dc.publisher.program.fl_str_mv |
Bacharelado em Engenharia de Computação |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Curitiba |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/1/outliers.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/2/license_rdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/3/license.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/4/outliers.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28990/5/outliers.pdf.jpg |
bitstream.checksum.fl_str_mv |
f66dc46f0cd3ab99daf57507e835ed70 0175ea4a2d4caec4bbcc37e300941108 b9d82215ab23456fa2d8b49c5df1b95b ccf44871b84d3cac53246ad48b588e9a ffd4c39bda6282f5797e9e6e9b5cc106 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1805922957187350528 |