Exploração das propriedades de hubness para detecção semissupervisionada de outliers em dados de alta dimensão
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFU |
Texto Completo: | https://repositorio.ufu.br/handle/123456789/19905 http://dx.doi.org/10.14393/ufu.di.2017.51 |
Resumo: | Com o crescente aumento da quantidade de dados armazenados, a área de mineração de dados tornou-se imprescindível para que seja possível manipular e extrair conhecimento a partir desses dados. Grande parte dos trabalhos nessa área focam em encontrar padrão nos dados, porém os dados fora do padrão (anomalias) também podem agregar muito no conhecimento do conjunto de dados em estudo. O estudo, o desenvolvimento e o aprimoramento de técnicas de detecção de outliers são objetivos importantes e têm se mostrado útil em diversos cenários, como: detecção de fraudes, detecção de intrusão e monitoramento de condições médicas entre outros. O trabalho apresentado aqui descreve um novo método para detecção semissupervisionada de outliers em dados com alta dimensionalidade. Os experimentos realizados com diversos conjuntos de dados reais indicam a superioridade do método proposto em relação aos métodos da literatura selecionados como linha de base. |
id |
UFU_50c062e89fc41b209ac26bd0d7300b3a |
---|---|
oai_identifier_str |
oai:repositorio.ufu.br:123456789/19905 |
network_acronym_str |
UFU |
network_name_str |
Repositório Institucional da UFU |
repository_id_str |
|
spelling |
2017-11-27T16:49:41Z2017-11-27T16:49:41Z2017-09-01SILVA, Lucimeire Alves da. Exploração das propriedades de hubness para detecção semissupervisionada de outliers em dados de alta dimensão - Uberlândia - 2015 à 2017. 2017. 88 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2017.https://repositorio.ufu.br/handle/123456789/19905http://dx.doi.org/10.14393/ufu.di.2017.51Com o crescente aumento da quantidade de dados armazenados, a área de mineração de dados tornou-se imprescindível para que seja possível manipular e extrair conhecimento a partir desses dados. Grande parte dos trabalhos nessa área focam em encontrar padrão nos dados, porém os dados fora do padrão (anomalias) também podem agregar muito no conhecimento do conjunto de dados em estudo. O estudo, o desenvolvimento e o aprimoramento de técnicas de detecção de outliers são objetivos importantes e têm se mostrado útil em diversos cenários, como: detecção de fraudes, detecção de intrusão e monitoramento de condições médicas entre outros. O trabalho apresentado aqui descreve um novo método para detecção semissupervisionada de outliers em dados com alta dimensionalidade. Os experimentos realizados com diversos conjuntos de dados reais indicam a superioridade do método proposto em relação aos métodos da literatura selecionados como linha de base.With the increase in the amount of data stored, the area of data mining has become essential for it to be possible to manipulate and extract knowledge from these data. Much of the work in this area focuses on finding patterns in the data, but non-standard data (anomalies) can also add much to the knowledge of the data set under study. The study, development and enhancement of outliers detection techniques are important objectives and have proven useful in several scenarios, such as: fraud detection, intrusion detection and monitoring of medical conditions, among others. The paper presented here describes a novel method for semi-supervised detection of outliers in high dimensional data. Experiments with several real datasets indicate the superiority of the proposed method in relation to the literature methods selected as the baseline.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorDissertação (Mestrado)porUniversidade Federal de UberlândiaPrograma de Pós-graduação em Ciência da ComputaçãoBrasilCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOOutliersDetecção semissupervisionada de OutliersAnálise de dados em alta dimensãoHubnessMineração de dadosAprendizado de MáquinaSemissupervisãoExploração das propriedades de hubness para detecção semissupervisionada de outliers em dados de alta dimensãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisBarioni, Maria Camila Nardinihttp://lattes.cnpq.br/3785426518998830Bueno, Renatohttp://lattes.cnpq.br/7189857417959804Travençolo, Bruno Augusto Nassifhttp://lattes.cnpq.br/2590427557264952http://lattes.cnpq.br/4640457621080674Silva, Lucimeire Alves da88info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFUTHUMBNAILExploracaoPropriedadesHubness.pdf.jpgExploracaoPropriedadesHubness.pdf.jpgGenerated Thumbnailimage/jpeg1370https://repositorio.ufu.br/bitstream/123456789/19905/6/ExploracaoPropriedadesHubness.pdf.jpg3ad9fb524675592fb5effe8d83fbce57MD56ORIGINALExploracaoPropriedadesHubness.pdfExploracaoPropriedadesHubness.pdfDissertaçãoapplication/pdf986874https://repositorio.ufu.br/bitstream/123456789/19905/3/ExploracaoPropriedadesHubness.pdf56b8002981bb361c613eaced1f93691dMD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81792https://repositorio.ufu.br/bitstream/123456789/19905/4/license.txt48ded82ce41b8d2426af12aed6b3cbf3MD54TEXTExploracaoPropriedadesHubness.pdf.txtExploracaoPropriedadesHubness.pdf.txtExtracted texttext/plain133500https://repositorio.ufu.br/bitstream/123456789/19905/5/ExploracaoPropriedadesHubness.pdf.txt32665608effd7a34c1859ab8c62d7cc2MD55123456789/199052017-11-28 03:02:27.699oai:repositorio.ufu.br:123456789/19905w4kgbmVjZXNzw6FyaW8gY29uY29yZGFyIGNvbSBhIGxpY2Vuw6dhIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhLCBhbnRlcyBxdWUgbyBkb2N1bWVudG8gcG9zc2EgYXBhcmVjZXIgbm8gUmVwb3NpdMOzcmlvLiBQb3IgZmF2b3IsIGxlaWEgYSBsaWNlbsOnYSBhdGVudGFtZW50ZS4gQ2FzbyBuZWNlc3NpdGUgZGUgYWxndW0gZXNjbGFyZWNpbWVudG8gZW50cmUgZW0gY29udGF0byBhdHJhdsOpcyBkbyBlLW1haWwgIHJlcG9zaXRvcmlvQHVmdS5ici4KCkxJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpBbyBhc3NpbmFyIGUgZW50cmVnYXIgZXN0YSBsaWNlbsOnYSwgby9hIFNyLi9TcmEuIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpOgoKYSkgQ29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBVYmVybMOibmRpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0gZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MgZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFViZXJsw6JuZGlhIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgY3Vqb3MgZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBjb250ZcO6ZG8gZG8gZG9jdW1lbnRvIGVudHJlZ3VlLgoKU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBVYmVybMOibmRpYSwgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFViZXJsw6JuZGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldShzKSBub21lKHMpIGNvbW8gbyhzKSBhdXRvcihlcykgb3UgZGV0ZW50b3IgKGVzKSBkb3MgZGlyZWl0b3MgZG8gZG9jdW1lbnRvIGVudHJlZ3VlLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZGFzIHBlcm1pdGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2017-11-28T05:02:27Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false |
dc.title.pt_BR.fl_str_mv |
Exploração das propriedades de hubness para detecção semissupervisionada de outliers em dados de alta dimensão |
title |
Exploração das propriedades de hubness para detecção semissupervisionada de outliers em dados de alta dimensão |
spellingShingle |
Exploração das propriedades de hubness para detecção semissupervisionada de outliers em dados de alta dimensão Silva, Lucimeire Alves da CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO Outliers Detecção semissupervisionada de Outliers Análise de dados em alta dimensão Hubness Mineração de dados Aprendizado de Máquina Semissupervisão |
title_short |
Exploração das propriedades de hubness para detecção semissupervisionada de outliers em dados de alta dimensão |
title_full |
Exploração das propriedades de hubness para detecção semissupervisionada de outliers em dados de alta dimensão |
title_fullStr |
Exploração das propriedades de hubness para detecção semissupervisionada de outliers em dados de alta dimensão |
title_full_unstemmed |
Exploração das propriedades de hubness para detecção semissupervisionada de outliers em dados de alta dimensão |
title_sort |
Exploração das propriedades de hubness para detecção semissupervisionada de outliers em dados de alta dimensão |
author |
Silva, Lucimeire Alves da |
author_facet |
Silva, Lucimeire Alves da |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Barioni, Maria Camila Nardini |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/3785426518998830 |
dc.contributor.referee1.fl_str_mv |
Bueno, Renato |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/7189857417959804 |
dc.contributor.referee2.fl_str_mv |
Travençolo, Bruno Augusto Nassif |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/2590427557264952 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/4640457621080674 |
dc.contributor.author.fl_str_mv |
Silva, Lucimeire Alves da |
contributor_str_mv |
Barioni, Maria Camila Nardini Bueno, Renato Travençolo, Bruno Augusto Nassif |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO Outliers Detecção semissupervisionada de Outliers Análise de dados em alta dimensão Hubness Mineração de dados Aprendizado de Máquina Semissupervisão |
dc.subject.por.fl_str_mv |
Outliers Detecção semissupervisionada de Outliers Análise de dados em alta dimensão Hubness Mineração de dados Aprendizado de Máquina Semissupervisão |
description |
Com o crescente aumento da quantidade de dados armazenados, a área de mineração de dados tornou-se imprescindível para que seja possível manipular e extrair conhecimento a partir desses dados. Grande parte dos trabalhos nessa área focam em encontrar padrão nos dados, porém os dados fora do padrão (anomalias) também podem agregar muito no conhecimento do conjunto de dados em estudo. O estudo, o desenvolvimento e o aprimoramento de técnicas de detecção de outliers são objetivos importantes e têm se mostrado útil em diversos cenários, como: detecção de fraudes, detecção de intrusão e monitoramento de condições médicas entre outros. O trabalho apresentado aqui descreve um novo método para detecção semissupervisionada de outliers em dados com alta dimensionalidade. Os experimentos realizados com diversos conjuntos de dados reais indicam a superioridade do método proposto em relação aos métodos da literatura selecionados como linha de base. |
publishDate |
2017 |
dc.date.accessioned.fl_str_mv |
2017-11-27T16:49:41Z |
dc.date.available.fl_str_mv |
2017-11-27T16:49:41Z |
dc.date.issued.fl_str_mv |
2017-09-01 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SILVA, Lucimeire Alves da. Exploração das propriedades de hubness para detecção semissupervisionada de outliers em dados de alta dimensão - Uberlândia - 2015 à 2017. 2017. 88 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2017. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufu.br/handle/123456789/19905 |
dc.identifier.doi.pt_BR.fl_str_mv |
http://dx.doi.org/10.14393/ufu.di.2017.51 |
identifier_str_mv |
SILVA, Lucimeire Alves da. Exploração das propriedades de hubness para detecção semissupervisionada de outliers em dados de alta dimensão - Uberlândia - 2015 à 2017. 2017. 88 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2017. |
url |
https://repositorio.ufu.br/handle/123456789/19905 http://dx.doi.org/10.14393/ufu.di.2017.51 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Uberlândia |
dc.publisher.program.fl_str_mv |
Programa de Pós-graduação em Ciência da Computação |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Uberlândia |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFU instname:Universidade Federal de Uberlândia (UFU) instacron:UFU |
instname_str |
Universidade Federal de Uberlândia (UFU) |
instacron_str |
UFU |
institution |
UFU |
reponame_str |
Repositório Institucional da UFU |
collection |
Repositório Institucional da UFU |
bitstream.url.fl_str_mv |
https://repositorio.ufu.br/bitstream/123456789/19905/6/ExploracaoPropriedadesHubness.pdf.jpg https://repositorio.ufu.br/bitstream/123456789/19905/3/ExploracaoPropriedadesHubness.pdf https://repositorio.ufu.br/bitstream/123456789/19905/4/license.txt https://repositorio.ufu.br/bitstream/123456789/19905/5/ExploracaoPropriedadesHubness.pdf.txt |
bitstream.checksum.fl_str_mv |
3ad9fb524675592fb5effe8d83fbce57 56b8002981bb361c613eaced1f93691d 48ded82ce41b8d2426af12aed6b3cbf3 32665608effd7a34c1859ab8c62d7cc2 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU) |
repository.mail.fl_str_mv |
diinf@dirbi.ufu.br |
_version_ |
1802110373204066304 |