Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/45961 |
Resumo: | Um dado simbólico de tipo boxplot pode ser considerado como um caso particular das variáveis numéricas multi-valoradas no contexto da Análises de Dados Simbólicos (ADS). Este tipo de dado tem uma estrutura simples que permite resumir informações de unidades agregadas, chamadas de classes. No entanto, esse tipo de estrutura tem sido pouco explorada na literatura de ADS. Este trabalho apresenta duas novas abordagens de predição com o objetivo de extrair conhecimento e fazer inferência usando dados de boxplot. A primeira abordagem considera um modelo de regressão para boxplot através da equação paramétrica da reta. Esta parametrização permite o ajuste dos pontos nas variáveis regressoras que permite melhorar a qualidade da variável resposta. Nessa direção, um critério é também proposto para verificar a coerência matemática da predição. Se a coerência não é garantida, uma nova estratégia, através de transformações Box − Cox é aplicada sobre a variável resposta de tipo boxplot. A segunda abordagem proposta nesse trabalho consiste de um modelo que combina agregação, seleção de protótipos e previsão de séries temporais. Inicialmente, as séries temporais são agregadas em classes de entidades e representadas por boxplots. Um processo de seleção de protótipos baseado na informação mútua é aplicado para mitigar ruídos no conjunto de dados. Por último, um modelo multivariado para previsão de boxplots é construído. Ambos modelos são avaliados com conjuntos de dados sintéticos e reais. Uma comparação entre as abordagens propostas e outros métodos de predição da literatura de ADS é também descrita. Os resultados obtidos reforçam que para os conjuntos de dados usados, o poder preditivo das abordagens propostas é superior aos métodos da literatura usados para comparar. Além disso, este trabalho apresenta uma aplicação do mundo real no Setor Elétrico Brasileiro para fazer predição da temperatura dos motores usando a abordagem de regressão paramétrica para dados de boxplot. |
id |
UFPE_f37395fe5eb17c075a6403c8a2311358 |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/45961 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
REYES, Dailys Maite Aliagahttp://lattes.cnpq.br/5549427916153795http://lattes.cnpq.br/5194381227316437http://lattes.cnpq.br/9289080285504453OLIVEIRA, Adriano Lorena Inacio deSOUZA, Renata Maria Cardoso Rodrigues de2022-08-25T12:33:28Z2022-08-25T12:33:28Z2022-02-23REYES, Dailys Maite Aliaga. Predição para dados simbólicos multi-valorados de tipo quartis: caso especial dados representados por boxplots. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.https://repositorio.ufpe.br/handle/123456789/45961Um dado simbólico de tipo boxplot pode ser considerado como um caso particular das variáveis numéricas multi-valoradas no contexto da Análises de Dados Simbólicos (ADS). Este tipo de dado tem uma estrutura simples que permite resumir informações de unidades agregadas, chamadas de classes. No entanto, esse tipo de estrutura tem sido pouco explorada na literatura de ADS. Este trabalho apresenta duas novas abordagens de predição com o objetivo de extrair conhecimento e fazer inferência usando dados de boxplot. A primeira abordagem considera um modelo de regressão para boxplot através da equação paramétrica da reta. Esta parametrização permite o ajuste dos pontos nas variáveis regressoras que permite melhorar a qualidade da variável resposta. Nessa direção, um critério é também proposto para verificar a coerência matemática da predição. Se a coerência não é garantida, uma nova estratégia, através de transformações Box − Cox é aplicada sobre a variável resposta de tipo boxplot. A segunda abordagem proposta nesse trabalho consiste de um modelo que combina agregação, seleção de protótipos e previsão de séries temporais. Inicialmente, as séries temporais são agregadas em classes de entidades e representadas por boxplots. Um processo de seleção de protótipos baseado na informação mútua é aplicado para mitigar ruídos no conjunto de dados. Por último, um modelo multivariado para previsão de boxplots é construído. Ambos modelos são avaliados com conjuntos de dados sintéticos e reais. Uma comparação entre as abordagens propostas e outros métodos de predição da literatura de ADS é também descrita. Os resultados obtidos reforçam que para os conjuntos de dados usados, o poder preditivo das abordagens propostas é superior aos métodos da literatura usados para comparar. Além disso, este trabalho apresenta uma aplicação do mundo real no Setor Elétrico Brasileiro para fazer predição da temperatura dos motores usando a abordagem de regressão paramétrica para dados de boxplot.FACEPEA symbolic boxplot data can be considered as a particular case of the numerical multivalued variables in the context of Simbolic Data Analysis (SDA). This data type has a simple structure that allows to summarize information from aggregated units, called classes. However, this type of structure has been little explored in the SDA literature. This work presents two new prediction approaches with the objective of extracting knowledge and making inferences using boxplot data. The first approach considers a regression model for boxplot through the parametric equation of the line. This parameterization allows the adjustment of the points in the regressors, which improves the quality of the response variable. In this direction, a criterion is also proposed to verify the mathematical coherence of the prediction. If coherence is not guaranteed, a new strategy, through Box-Cox transformations, is applied on the response variable of type boxplot. The second approach proposed in this work consists of a model that combines aggregation, prototype selection and time series prediction. Initially, time series are aggregated into entity classes and represented by boxplots. A prototype selection process based on mutual information is applied to mitigate noise in the dataset. Finally, a multivariate model for forecasting boxplots is built. Both models are evaluated with synthetic and real data sets. A comparison between the proposed approaches and other prediction methods from the SDA literature is also described. In addition, this work presents a real-world application in the Brazilian Electricity Sector to predict the temperature of motors using the parametric regression approach for boxplot data.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/embargoedAccessInteligência computacionalSéries temporaisPredição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplotsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisdoutoradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEORIGINALTESE Dailys Maité Aliaga Reyes.pdfTESE Dailys Maité Aliaga Reyes.pdfapplication/pdf10985505https://repositorio.ufpe.br/bitstream/123456789/45961/1/TESE%20Dailys%20Mait%c3%a9%20Aliaga%20Reyes.pdfdabffa2e2a368790353c2fb0bdeb7321MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/45961/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82142https://repositorio.ufpe.br/bitstream/123456789/45961/3/license.txt6928b9260b07fb2755249a5ca9903395MD53TEXTTESE Dailys Maité Aliaga Reyes.pdf.txtTESE Dailys Maité Aliaga Reyes.pdf.txtExtracted texttext/plain229896https://repositorio.ufpe.br/bitstream/123456789/45961/4/TESE%20Dailys%20Mait%c3%a9%20Aliaga%20Reyes.pdf.txtae0070e68d72b3fa631722ab7177e1c7MD54THUMBNAILTESE Dailys Maité Aliaga Reyes.pdf.jpgTESE Dailys Maité Aliaga Reyes.pdf.jpgGenerated Thumbnailimage/jpeg1238https://repositorio.ufpe.br/bitstream/123456789/45961/5/TESE%20Dailys%20Mait%c3%a9%20Aliaga%20Reyes.pdf.jpga7caefcfb5e8861cce3b93eb15017072MD55123456789/459612022-08-26 02:21:04.965oai:repositorio.ufpe.br:123456789/45961VGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBkZSBEb2N1bWVudG9zIG5vIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUKIAoKRGVjbGFybyBlc3RhciBjaWVudGUgZGUgcXVlIGVzdGUgVGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyB0ZW0gbyBvYmpldGl2byBkZSBkaXZ1bGdhw6fDo28gZG9zIGRvY3VtZW50b3MgZGVwb3NpdGFkb3Mgbm8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRSBlIGRlY2xhcm8gcXVlOgoKSSAtICBvIGNvbnRlw7pkbyBkaXNwb25pYmlsaXphZG8gw6kgZGUgcmVzcG9uc2FiaWxpZGFkZSBkZSBzdWEgYXV0b3JpYTsKCklJIC0gbyBjb250ZcO6ZG8gw6kgb3JpZ2luYWwsIGUgc2UgbyB0cmFiYWxobyBlL291IHBhbGF2cmFzIGRlIG91dHJhcyBwZXNzb2FzIGZvcmFtIHV0aWxpemFkb3MsIGVzdGFzIGZvcmFtIGRldmlkYW1lbnRlIHJlY29uaGVjaWRhczsKCklJSSAtIHF1YW5kbyB0cmF0YXItc2UgZGUgVHJhYmFsaG8gZGUgQ29uY2x1c8OjbyBkZSBDdXJzbywgRGlzc2VydGHDp8OjbyBvdSBUZXNlOiBvIGFycXVpdm8gZGVwb3NpdGFkbyBjb3JyZXNwb25kZSDDoCB2ZXJzw6NvIGZpbmFsIGRvIHRyYWJhbGhvOwoKSVYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIFRyYWJhbGhvIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28sIERpc3NlcnRhw6fDo28gb3UgVGVzZTogZXN0b3UgY2llbnRlIGRlIHF1ZSBhIGFsdGVyYcOnw6NvIGRhIG1vZGFsaWRhZGUgZGUgYWNlc3NvIGFvIGRvY3VtZW50byBhcMOzcyBvIGRlcMOzc2l0byBlIGFudGVzIGRlIGZpbmRhciBvIHBlcsOtb2RvIGRlIGVtYmFyZ28sIHF1YW5kbyBmb3IgZXNjb2xoaWRvIGFjZXNzbyByZXN0cml0bywgc2Vyw6EgcGVybWl0aWRhIG1lZGlhbnRlIHNvbGljaXRhw6fDo28gZG8gKGEpIGF1dG9yIChhKSBhbyBTaXN0ZW1hIEludGVncmFkbyBkZSBCaWJsaW90ZWNhcyBkYSBVRlBFIChTSUIvVUZQRSkuCgogClBhcmEgdHJhYmFsaG9zIGVtIEFjZXNzbyBBYmVydG86CgpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgYXV0b3IgcXVlIHJlY2FlbSBzb2JyZSBlc3RlIGRvY3VtZW50bywgZnVuZGFtZW50YWRvIG5hIExlaSBkZSBEaXJlaXRvIEF1dG9yYWwgbm8gOS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBhcnQuIDI5LCBpbmNpc28gSUlJLCBhdXRvcml6byBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFBlcm5hbWJ1Y28gYSBkaXNwb25pYmlsaXphciBncmF0dWl0YW1lbnRlLCBzZW0gcmVzc2FyY2ltZW50byBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIHBhcmEgZmlucyBkZSBsZWl0dXJhLCBpbXByZXNzw6NvIGUvb3UgZG93bmxvYWQgKGFxdWlzacOnw6NvKSBhdHJhdsOpcyBkbyBzaXRlIGRvIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUgbm8gZW5kZXJlw6dvIGh0dHA6Ly93d3cucmVwb3NpdG9yaW8udWZwZS5iciwgYSBwYXJ0aXIgZGEgZGF0YSBkZSBkZXDDs3NpdG8uCgogClBhcmEgdHJhYmFsaG9zIGVtIEFjZXNzbyBSZXN0cml0bzoKCk5hIHF1YWxpZGFkZSBkZSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkZSBhdXRvciBxdWUgcmVjYWVtIHNvYnJlIGVzdGUgZG9jdW1lbnRvLCBmdW5kYW1lbnRhZG8gbmEgTGVpIGRlIERpcmVpdG8gQXV0b3JhbCBubyA5LjYxMCBkZSAxOSBkZSBmZXZlcmVpcm8gZGUgMTk5OCwgYXJ0LiAyOSwgaW5jaXNvIElJSSwgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIGEgZGlzcG9uaWJpbGl6YXIgZ3JhdHVpdGFtZW50ZSwgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkIChhcXVpc2nDp8OjbykgYXRyYXbDqXMgZG8gc2l0ZSBkbyBSZXBvc2l0w7NyaW8gRGlnaXRhbCBkYSBVRlBFIG5vIGVuZGVyZcOnbyBodHRwOi8vd3d3LnJlcG9zaXRvcmlvLnVmcGUuYnIsIHF1YW5kbyBmaW5kYXIgbyBwZXLDrW9kbyBkZSBlbWJhcmdvIGNvbmRpemVudGUgYW8gdGlwbyBkZSBkb2N1bWVudG8sIGNvbmZvcm1lIGluZGljYWRvIG5vIGNhbXBvIERhdGEgZGUgRW1iYXJnby4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212022-08-26T05:21:04Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots |
title |
Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots |
spellingShingle |
Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots REYES, Dailys Maite Aliaga Inteligência computacional Séries temporais |
title_short |
Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots |
title_full |
Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots |
title_fullStr |
Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots |
title_full_unstemmed |
Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots |
title_sort |
Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots |
author |
REYES, Dailys Maite Aliaga |
author_facet |
REYES, Dailys Maite Aliaga |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/5549427916153795 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/5194381227316437 |
dc.contributor.advisor-coLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/9289080285504453 |
dc.contributor.author.fl_str_mv |
REYES, Dailys Maite Aliaga |
dc.contributor.advisor1.fl_str_mv |
OLIVEIRA, Adriano Lorena Inacio de |
dc.contributor.advisor-co1.fl_str_mv |
SOUZA, Renata Maria Cardoso Rodrigues de |
contributor_str_mv |
OLIVEIRA, Adriano Lorena Inacio de SOUZA, Renata Maria Cardoso Rodrigues de |
dc.subject.por.fl_str_mv |
Inteligência computacional Séries temporais |
topic |
Inteligência computacional Séries temporais |
description |
Um dado simbólico de tipo boxplot pode ser considerado como um caso particular das variáveis numéricas multi-valoradas no contexto da Análises de Dados Simbólicos (ADS). Este tipo de dado tem uma estrutura simples que permite resumir informações de unidades agregadas, chamadas de classes. No entanto, esse tipo de estrutura tem sido pouco explorada na literatura de ADS. Este trabalho apresenta duas novas abordagens de predição com o objetivo de extrair conhecimento e fazer inferência usando dados de boxplot. A primeira abordagem considera um modelo de regressão para boxplot através da equação paramétrica da reta. Esta parametrização permite o ajuste dos pontos nas variáveis regressoras que permite melhorar a qualidade da variável resposta. Nessa direção, um critério é também proposto para verificar a coerência matemática da predição. Se a coerência não é garantida, uma nova estratégia, através de transformações Box − Cox é aplicada sobre a variável resposta de tipo boxplot. A segunda abordagem proposta nesse trabalho consiste de um modelo que combina agregação, seleção de protótipos e previsão de séries temporais. Inicialmente, as séries temporais são agregadas em classes de entidades e representadas por boxplots. Um processo de seleção de protótipos baseado na informação mútua é aplicado para mitigar ruídos no conjunto de dados. Por último, um modelo multivariado para previsão de boxplots é construído. Ambos modelos são avaliados com conjuntos de dados sintéticos e reais. Uma comparação entre as abordagens propostas e outros métodos de predição da literatura de ADS é também descrita. Os resultados obtidos reforçam que para os conjuntos de dados usados, o poder preditivo das abordagens propostas é superior aos métodos da literatura usados para comparar. Além disso, este trabalho apresenta uma aplicação do mundo real no Setor Elétrico Brasileiro para fazer predição da temperatura dos motores usando a abordagem de regressão paramétrica para dados de boxplot. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-08-25T12:33:28Z |
dc.date.available.fl_str_mv |
2022-08-25T12:33:28Z |
dc.date.issued.fl_str_mv |
2022-02-23 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
REYES, Dailys Maite Aliaga. Predição para dados simbólicos multi-valorados de tipo quartis: caso especial dados representados por boxplots. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/45961 |
identifier_str_mv |
REYES, Dailys Maite Aliaga. Predição para dados simbólicos multi-valorados de tipo quartis: caso especial dados representados por boxplots. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022. |
url |
https://repositorio.ufpe.br/handle/123456789/45961 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/embargoedAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
embargoedAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Computacao |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/45961/1/TESE%20Dailys%20Mait%c3%a9%20Aliaga%20Reyes.pdf https://repositorio.ufpe.br/bitstream/123456789/45961/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/45961/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/45961/4/TESE%20Dailys%20Mait%c3%a9%20Aliaga%20Reyes.pdf.txt https://repositorio.ufpe.br/bitstream/123456789/45961/5/TESE%20Dailys%20Mait%c3%a9%20Aliaga%20Reyes.pdf.jpg |
bitstream.checksum.fl_str_mv |
dabffa2e2a368790353c2fb0bdeb7321 e39d27027a6cc9cb039ad269a5db8e34 6928b9260b07fb2755249a5ca9903395 ae0070e68d72b3fa631722ab7177e1c7 a7caefcfb5e8861cce3b93eb15017072 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1802310762500194304 |