Detecção de outliers multivariados em redes de sensores.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFOP |
Texto Completo: | http://www.repositorio.ufop.br/handle/123456789/3024 |
Resumo: | Esse trabalho apresenta uma análise, via detecção de outliers, sobre os dados multivariados proveniente de uma rede de sensores. Inicialmente, caracterizamos o problema de detecção de outliers nestas redes. Em seguida, realizamos, via simulação, uma comparação entre três métodos gerais para a identificação dos outliers, Minimum Volume Ellipsoid (MVE), Minimum Covariance Determinant (MCD) e Max-Eigen Difference (MED), considerando cenários específicos de uma rede de sensores. Os dados utilizados na simulação foram gerados a partir de uma base de dados reais proveniente da medição de poluentes no ar. Essa geração nos permitiu representar o cenário de uma rede de sensores. O fenômeno avaliado segue um comportamento Normal, e utilizamos outras duas distribuições, Skew-Normal e T-Student, para representar a imprecisão inerente do processo de sensoriamento, que nem sempre consegue representar satisfatoriamente o ambiente monitorado. Adicionalmente, representamos a presença de ruídos nos dados (outliers pontuais), inseridos com base em uma distribuição de Bernoulli. Essa distribuição foi utilizada para selecionar quais amostras seriam substituídas por ruídos. A avaliação da representatividade dos dados após a remoção dos outliers é realizada por intermédio de um ferramental estatístico formado pelos seguintes testes, valor absoluto do erro relativo, ANOVA, medidas de tendência central e a contagem de outliers. Todas as simulações foram realizadas no software estatístico R. Os resultados das avaliações demonstraram que os erros encontrados podem ser tolerados por grande parte das aplicações em redes de sensores, quando aplicados os métodos MVE e MCD. O método MED não conseguiu identificar todos os outliers, logo, sua aplicação não traz benefícios às aplicações consideradas. |
id |
UFOP_30231046b7c9dd144144a1a8d884e4ce |
---|---|
oai_identifier_str |
oai:repositorio.ufop.br:123456789/3024 |
network_acronym_str |
UFOP |
network_name_str |
Repositório Institucional da UFOP |
repository_id_str |
3233 |
spelling |
Detecção de outliers multivariados em redes de sensores.Redes de sensores sem fioValores estranhos - estatísticaAnálise multivariadaSimulação - computadoresEsse trabalho apresenta uma análise, via detecção de outliers, sobre os dados multivariados proveniente de uma rede de sensores. Inicialmente, caracterizamos o problema de detecção de outliers nestas redes. Em seguida, realizamos, via simulação, uma comparação entre três métodos gerais para a identificação dos outliers, Minimum Volume Ellipsoid (MVE), Minimum Covariance Determinant (MCD) e Max-Eigen Difference (MED), considerando cenários específicos de uma rede de sensores. Os dados utilizados na simulação foram gerados a partir de uma base de dados reais proveniente da medição de poluentes no ar. Essa geração nos permitiu representar o cenário de uma rede de sensores. O fenômeno avaliado segue um comportamento Normal, e utilizamos outras duas distribuições, Skew-Normal e T-Student, para representar a imprecisão inerente do processo de sensoriamento, que nem sempre consegue representar satisfatoriamente o ambiente monitorado. Adicionalmente, representamos a presença de ruídos nos dados (outliers pontuais), inseridos com base em uma distribuição de Bernoulli. Essa distribuição foi utilizada para selecionar quais amostras seriam substituídas por ruídos. A avaliação da representatividade dos dados após a remoção dos outliers é realizada por intermédio de um ferramental estatístico formado pelos seguintes testes, valor absoluto do erro relativo, ANOVA, medidas de tendência central e a contagem de outliers. Todas as simulações foram realizadas no software estatístico R. Os resultados das avaliações demonstraram que os erros encontrados podem ser tolerados por grande parte das aplicações em redes de sensores, quando aplicados os métodos MVE e MCD. O método MED não conseguiu identificar todos os outliers, logo, sua aplicação não traz benefícios às aplicações consideradas.This work presents an analysis based on outliers detection on multivariate dataset of sensor networks. Initially, we characterize the outliers detection problem in these networks. Then, three general methods for outliers detection methods Minimum Volume Ellipsoid (MVE), Minimum Covariance Determinant (MCD) and Max-Eigen Difference (MED) were used and evalueted. The dataset used in the simulation was generated from an air pollutants dataset. This generation allowed the use of this dataset in sensor networks scenarios. The phenomenon has characterized by a Normal distribution. To represent the sensor perception fails, two different distributions was used, the Skew-Normal and T-Student. In addition, the sensor noise was inserted by using a Bernoulli process. The data representativeness, after the outlier removal, was performed by statistical tools: the absolute relative error, ANOVA, measures of central tendency and the number of outliers. The simulations were performed by software R. The results showed that the MVE and MCD can be used satisfatory in general sensor networks applications. The MED does not remove all outliers, so, its usage is not recommended in these applicationsPrograma de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.Pereira Junior, Álvaro RodriguesValadares, Fabricio Geraldo2013-07-01T18:13:13Z2013-07-01T18:13:13Z2012info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfVALADARES, F. G. Detecção de outliers multivariados em redes de sensores. 2012. 53 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Ouro Preto, Ouro Preto, 2012.http://www.repositorio.ufop.br/handle/123456789/3024porreponame:Repositório Institucional da UFOPinstname:Universidade Federal de Ouro Preto (UFOP)instacron:UFOPinfo:eu-repo/semantics/openAccess2019-04-23T12:02:29Zoai:repositorio.ufop.br:123456789/3024Repositório InstitucionalPUBhttp://www.repositorio.ufop.br/oai/requestrepositorio@ufop.edu.bropendoar:32332019-04-23T12:02:29Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)false |
dc.title.none.fl_str_mv |
Detecção de outliers multivariados em redes de sensores. |
title |
Detecção de outliers multivariados em redes de sensores. |
spellingShingle |
Detecção de outliers multivariados em redes de sensores. Valadares, Fabricio Geraldo Redes de sensores sem fio Valores estranhos - estatística Análise multivariada Simulação - computadores |
title_short |
Detecção de outliers multivariados em redes de sensores. |
title_full |
Detecção de outliers multivariados em redes de sensores. |
title_fullStr |
Detecção de outliers multivariados em redes de sensores. |
title_full_unstemmed |
Detecção de outliers multivariados em redes de sensores. |
title_sort |
Detecção de outliers multivariados em redes de sensores. |
author |
Valadares, Fabricio Geraldo |
author_facet |
Valadares, Fabricio Geraldo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Pereira Junior, Álvaro Rodrigues |
dc.contributor.author.fl_str_mv |
Valadares, Fabricio Geraldo |
dc.subject.por.fl_str_mv |
Redes de sensores sem fio Valores estranhos - estatística Análise multivariada Simulação - computadores |
topic |
Redes de sensores sem fio Valores estranhos - estatística Análise multivariada Simulação - computadores |
description |
Esse trabalho apresenta uma análise, via detecção de outliers, sobre os dados multivariados proveniente de uma rede de sensores. Inicialmente, caracterizamos o problema de detecção de outliers nestas redes. Em seguida, realizamos, via simulação, uma comparação entre três métodos gerais para a identificação dos outliers, Minimum Volume Ellipsoid (MVE), Minimum Covariance Determinant (MCD) e Max-Eigen Difference (MED), considerando cenários específicos de uma rede de sensores. Os dados utilizados na simulação foram gerados a partir de uma base de dados reais proveniente da medição de poluentes no ar. Essa geração nos permitiu representar o cenário de uma rede de sensores. O fenômeno avaliado segue um comportamento Normal, e utilizamos outras duas distribuições, Skew-Normal e T-Student, para representar a imprecisão inerente do processo de sensoriamento, que nem sempre consegue representar satisfatoriamente o ambiente monitorado. Adicionalmente, representamos a presença de ruídos nos dados (outliers pontuais), inseridos com base em uma distribuição de Bernoulli. Essa distribuição foi utilizada para selecionar quais amostras seriam substituídas por ruídos. A avaliação da representatividade dos dados após a remoção dos outliers é realizada por intermédio de um ferramental estatístico formado pelos seguintes testes, valor absoluto do erro relativo, ANOVA, medidas de tendência central e a contagem de outliers. Todas as simulações foram realizadas no software estatístico R. Os resultados das avaliações demonstraram que os erros encontrados podem ser tolerados por grande parte das aplicações em redes de sensores, quando aplicados os métodos MVE e MCD. O método MED não conseguiu identificar todos os outliers, logo, sua aplicação não traz benefícios às aplicações consideradas. |
publishDate |
2012 |
dc.date.none.fl_str_mv |
2012 2013-07-01T18:13:13Z 2013-07-01T18:13:13Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
VALADARES, F. G. Detecção de outliers multivariados em redes de sensores. 2012. 53 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Ouro Preto, Ouro Preto, 2012. http://www.repositorio.ufop.br/handle/123456789/3024 |
identifier_str_mv |
VALADARES, F. G. Detecção de outliers multivariados em redes de sensores. 2012. 53 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Ouro Preto, Ouro Preto, 2012. |
url |
http://www.repositorio.ufop.br/handle/123456789/3024 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. |
publisher.none.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFOP instname:Universidade Federal de Ouro Preto (UFOP) instacron:UFOP |
instname_str |
Universidade Federal de Ouro Preto (UFOP) |
instacron_str |
UFOP |
institution |
UFOP |
reponame_str |
Repositório Institucional da UFOP |
collection |
Repositório Institucional da UFOP |
repository.name.fl_str_mv |
Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP) |
repository.mail.fl_str_mv |
repositorio@ufop.edu.br |
_version_ |
1813002802849382400 |