Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots

Detalhes bibliográficos
Autor(a) principal: REYES, Dailys Maite Aliaga
Data de Publicação: 2022
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFPE
Texto Completo: https://repositorio.ufpe.br/handle/123456789/45961
Resumo: Um dado simbólico de tipo boxplot pode ser considerado como um caso particular das variáveis numéricas multi-valoradas no contexto da Análises de Dados Simbólicos (ADS). Este tipo de dado tem uma estrutura simples que permite resumir informações de unidades agregadas, chamadas de classes. No entanto, esse tipo de estrutura tem sido pouco explorada na literatura de ADS. Este trabalho apresenta duas novas abordagens de predição com o objetivo de extrair conhecimento e fazer inferência usando dados de boxplot. A primeira abordagem considera um modelo de regressão para boxplot através da equação paramétrica da reta. Esta parametrização permite o ajuste dos pontos nas variáveis regressoras que permite melhorar a qualidade da variável resposta. Nessa direção, um critério é também proposto para verificar a coerência matemática da predição. Se a coerência não é garantida, uma nova estratégia, através de transformações Box − Cox é aplicada sobre a variável resposta de tipo boxplot. A segunda abordagem proposta nesse trabalho consiste de um modelo que combina agregação, seleção de protótipos e previsão de séries temporais. Inicialmente, as séries temporais são agregadas em classes de entidades e representadas por boxplots. Um processo de seleção de protótipos baseado na informação mútua é aplicado para mitigar ruídos no conjunto de dados. Por último, um modelo multivariado para previsão de boxplots é construído. Ambos modelos são avaliados com conjuntos de dados sintéticos e reais. Uma comparação entre as abordagens propostas e outros métodos de predição da literatura de ADS é também descrita. Os resultados obtidos reforçam que para os conjuntos de dados usados, o poder preditivo das abordagens propostas é superior aos métodos da literatura usados para comparar. Além disso, este trabalho apresenta uma aplicação do mundo real no Setor Elétrico Brasileiro para fazer predição da temperatura dos motores usando a abordagem de regressão paramétrica para dados de boxplot.
id UFPE_f37395fe5eb17c075a6403c8a2311358
oai_identifier_str oai:repositorio.ufpe.br:123456789/45961
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling REYES, Dailys Maite Aliagahttp://lattes.cnpq.br/5549427916153795http://lattes.cnpq.br/5194381227316437http://lattes.cnpq.br/9289080285504453OLIVEIRA, Adriano Lorena Inacio deSOUZA, Renata Maria Cardoso Rodrigues de2022-08-25T12:33:28Z2022-08-25T12:33:28Z2022-02-23REYES, Dailys Maite Aliaga. Predição para dados simbólicos multi-valorados de tipo quartis: caso especial dados representados por boxplots. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.https://repositorio.ufpe.br/handle/123456789/45961Um dado simbólico de tipo boxplot pode ser considerado como um caso particular das variáveis numéricas multi-valoradas no contexto da Análises de Dados Simbólicos (ADS). Este tipo de dado tem uma estrutura simples que permite resumir informações de unidades agregadas, chamadas de classes. No entanto, esse tipo de estrutura tem sido pouco explorada na literatura de ADS. Este trabalho apresenta duas novas abordagens de predição com o objetivo de extrair conhecimento e fazer inferência usando dados de boxplot. A primeira abordagem considera um modelo de regressão para boxplot através da equação paramétrica da reta. Esta parametrização permite o ajuste dos pontos nas variáveis regressoras que permite melhorar a qualidade da variável resposta. Nessa direção, um critério é também proposto para verificar a coerência matemática da predição. Se a coerência não é garantida, uma nova estratégia, através de transformações Box − Cox é aplicada sobre a variável resposta de tipo boxplot. A segunda abordagem proposta nesse trabalho consiste de um modelo que combina agregação, seleção de protótipos e previsão de séries temporais. Inicialmente, as séries temporais são agregadas em classes de entidades e representadas por boxplots. Um processo de seleção de protótipos baseado na informação mútua é aplicado para mitigar ruídos no conjunto de dados. Por último, um modelo multivariado para previsão de boxplots é construído. Ambos modelos são avaliados com conjuntos de dados sintéticos e reais. Uma comparação entre as abordagens propostas e outros métodos de predição da literatura de ADS é também descrita. Os resultados obtidos reforçam que para os conjuntos de dados usados, o poder preditivo das abordagens propostas é superior aos métodos da literatura usados para comparar. Além disso, este trabalho apresenta uma aplicação do mundo real no Setor Elétrico Brasileiro para fazer predição da temperatura dos motores usando a abordagem de regressão paramétrica para dados de boxplot.FACEPEA symbolic boxplot data can be considered as a particular case of the numerical multivalued variables in the context of Simbolic Data Analysis (SDA). This data type has a simple structure that allows to summarize information from aggregated units, called classes. However, this type of structure has been little explored in the SDA literature. This work presents two new prediction approaches with the objective of extracting knowledge and making inferences using boxplot data. The first approach considers a regression model for boxplot through the parametric equation of the line. This parameterization allows the adjustment of the points in the regressors, which improves the quality of the response variable. In this direction, a criterion is also proposed to verify the mathematical coherence of the prediction. If coherence is not guaranteed, a new strategy, through Box-Cox transformations, is applied on the response variable of type boxplot. The second approach proposed in this work consists of a model that combines aggregation, prototype selection and time series prediction. Initially, time series are aggregated into entity classes and represented by boxplots. A prototype selection process based on mutual information is applied to mitigate noise in the dataset. Finally, a multivariate model for forecasting boxplots is built. Both models are evaluated with synthetic and real data sets. A comparison between the proposed approaches and other prediction methods from the SDA literature is also described. In addition, this work presents a real-world application in the Brazilian Electricity Sector to predict the temperature of motors using the parametric regression approach for boxplot data.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/embargoedAccessInteligência computacionalSéries temporaisPredição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplotsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisdoutoradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEORIGINALTESE Dailys Maité Aliaga Reyes.pdfTESE Dailys Maité Aliaga Reyes.pdfapplication/pdf10985505https://repositorio.ufpe.br/bitstream/123456789/45961/1/TESE%20Dailys%20Mait%c3%a9%20Aliaga%20Reyes.pdfdabffa2e2a368790353c2fb0bdeb7321MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/45961/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82142https://repositorio.ufpe.br/bitstream/123456789/45961/3/license.txt6928b9260b07fb2755249a5ca9903395MD53TEXTTESE Dailys Maité Aliaga Reyes.pdf.txtTESE Dailys Maité Aliaga Reyes.pdf.txtExtracted texttext/plain229896https://repositorio.ufpe.br/bitstream/123456789/45961/4/TESE%20Dailys%20Mait%c3%a9%20Aliaga%20Reyes.pdf.txtae0070e68d72b3fa631722ab7177e1c7MD54THUMBNAILTESE Dailys Maité Aliaga Reyes.pdf.jpgTESE Dailys Maité Aliaga Reyes.pdf.jpgGenerated Thumbnailimage/jpeg1238https://repositorio.ufpe.br/bitstream/123456789/45961/5/TESE%20Dailys%20Mait%c3%a9%20Aliaga%20Reyes.pdf.jpga7caefcfb5e8861cce3b93eb15017072MD55123456789/459612022-08-26 02:21:04.965oai:repositorio.ufpe.br:123456789/45961VGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBkZSBEb2N1bWVudG9zIG5vIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUKIAoKRGVjbGFybyBlc3RhciBjaWVudGUgZGUgcXVlIGVzdGUgVGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyB0ZW0gbyBvYmpldGl2byBkZSBkaXZ1bGdhw6fDo28gZG9zIGRvY3VtZW50b3MgZGVwb3NpdGFkb3Mgbm8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRSBlIGRlY2xhcm8gcXVlOgoKSSAtICBvIGNvbnRlw7pkbyBkaXNwb25pYmlsaXphZG8gw6kgZGUgcmVzcG9uc2FiaWxpZGFkZSBkZSBzdWEgYXV0b3JpYTsKCklJIC0gbyBjb250ZcO6ZG8gw6kgb3JpZ2luYWwsIGUgc2UgbyB0cmFiYWxobyBlL291IHBhbGF2cmFzIGRlIG91dHJhcyBwZXNzb2FzIGZvcmFtIHV0aWxpemFkb3MsIGVzdGFzIGZvcmFtIGRldmlkYW1lbnRlIHJlY29uaGVjaWRhczsKCklJSSAtIHF1YW5kbyB0cmF0YXItc2UgZGUgVHJhYmFsaG8gZGUgQ29uY2x1c8OjbyBkZSBDdXJzbywgRGlzc2VydGHDp8OjbyBvdSBUZXNlOiBvIGFycXVpdm8gZGVwb3NpdGFkbyBjb3JyZXNwb25kZSDDoCB2ZXJzw6NvIGZpbmFsIGRvIHRyYWJhbGhvOwoKSVYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIFRyYWJhbGhvIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28sIERpc3NlcnRhw6fDo28gb3UgVGVzZTogZXN0b3UgY2llbnRlIGRlIHF1ZSBhIGFsdGVyYcOnw6NvIGRhIG1vZGFsaWRhZGUgZGUgYWNlc3NvIGFvIGRvY3VtZW50byBhcMOzcyBvIGRlcMOzc2l0byBlIGFudGVzIGRlIGZpbmRhciBvIHBlcsOtb2RvIGRlIGVtYmFyZ28sIHF1YW5kbyBmb3IgZXNjb2xoaWRvIGFjZXNzbyByZXN0cml0bywgc2Vyw6EgcGVybWl0aWRhIG1lZGlhbnRlIHNvbGljaXRhw6fDo28gZG8gKGEpIGF1dG9yIChhKSBhbyBTaXN0ZW1hIEludGVncmFkbyBkZSBCaWJsaW90ZWNhcyBkYSBVRlBFIChTSUIvVUZQRSkuCgogClBhcmEgdHJhYmFsaG9zIGVtIEFjZXNzbyBBYmVydG86CgpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgYXV0b3IgcXVlIHJlY2FlbSBzb2JyZSBlc3RlIGRvY3VtZW50bywgZnVuZGFtZW50YWRvIG5hIExlaSBkZSBEaXJlaXRvIEF1dG9yYWwgbm8gOS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBhcnQuIDI5LCBpbmNpc28gSUlJLCBhdXRvcml6byBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFBlcm5hbWJ1Y28gYSBkaXNwb25pYmlsaXphciBncmF0dWl0YW1lbnRlLCBzZW0gcmVzc2FyY2ltZW50byBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIHBhcmEgZmlucyBkZSBsZWl0dXJhLCBpbXByZXNzw6NvIGUvb3UgZG93bmxvYWQgKGFxdWlzacOnw6NvKSBhdHJhdsOpcyBkbyBzaXRlIGRvIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUgbm8gZW5kZXJlw6dvIGh0dHA6Ly93d3cucmVwb3NpdG9yaW8udWZwZS5iciwgYSBwYXJ0aXIgZGEgZGF0YSBkZSBkZXDDs3NpdG8uCgogClBhcmEgdHJhYmFsaG9zIGVtIEFjZXNzbyBSZXN0cml0bzoKCk5hIHF1YWxpZGFkZSBkZSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkZSBhdXRvciBxdWUgcmVjYWVtIHNvYnJlIGVzdGUgZG9jdW1lbnRvLCBmdW5kYW1lbnRhZG8gbmEgTGVpIGRlIERpcmVpdG8gQXV0b3JhbCBubyA5LjYxMCBkZSAxOSBkZSBmZXZlcmVpcm8gZGUgMTk5OCwgYXJ0LiAyOSwgaW5jaXNvIElJSSwgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIGEgZGlzcG9uaWJpbGl6YXIgZ3JhdHVpdGFtZW50ZSwgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkIChhcXVpc2nDp8OjbykgYXRyYXbDqXMgZG8gc2l0ZSBkbyBSZXBvc2l0w7NyaW8gRGlnaXRhbCBkYSBVRlBFIG5vIGVuZGVyZcOnbyBodHRwOi8vd3d3LnJlcG9zaXRvcmlvLnVmcGUuYnIsIHF1YW5kbyBmaW5kYXIgbyBwZXLDrW9kbyBkZSBlbWJhcmdvIGNvbmRpemVudGUgYW8gdGlwbyBkZSBkb2N1bWVudG8sIGNvbmZvcm1lIGluZGljYWRvIG5vIGNhbXBvIERhdGEgZGUgRW1iYXJnby4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212022-08-26T05:21:04Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots
title Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots
spellingShingle Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots
REYES, Dailys Maite Aliaga
Inteligência computacional
Séries temporais
title_short Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots
title_full Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots
title_fullStr Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots
title_full_unstemmed Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots
title_sort Predição para dados simbólicos multi-valorados de tipo quartis : caso especial dados representados por boxplots
author REYES, Dailys Maite Aliaga
author_facet REYES, Dailys Maite Aliaga
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/5549427916153795
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/5194381227316437
dc.contributor.advisor-coLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/9289080285504453
dc.contributor.author.fl_str_mv REYES, Dailys Maite Aliaga
dc.contributor.advisor1.fl_str_mv OLIVEIRA, Adriano Lorena Inacio de
dc.contributor.advisor-co1.fl_str_mv SOUZA, Renata Maria Cardoso Rodrigues de
contributor_str_mv OLIVEIRA, Adriano Lorena Inacio de
SOUZA, Renata Maria Cardoso Rodrigues de
dc.subject.por.fl_str_mv Inteligência computacional
Séries temporais
topic Inteligência computacional
Séries temporais
description Um dado simbólico de tipo boxplot pode ser considerado como um caso particular das variáveis numéricas multi-valoradas no contexto da Análises de Dados Simbólicos (ADS). Este tipo de dado tem uma estrutura simples que permite resumir informações de unidades agregadas, chamadas de classes. No entanto, esse tipo de estrutura tem sido pouco explorada na literatura de ADS. Este trabalho apresenta duas novas abordagens de predição com o objetivo de extrair conhecimento e fazer inferência usando dados de boxplot. A primeira abordagem considera um modelo de regressão para boxplot através da equação paramétrica da reta. Esta parametrização permite o ajuste dos pontos nas variáveis regressoras que permite melhorar a qualidade da variável resposta. Nessa direção, um critério é também proposto para verificar a coerência matemática da predição. Se a coerência não é garantida, uma nova estratégia, através de transformações Box − Cox é aplicada sobre a variável resposta de tipo boxplot. A segunda abordagem proposta nesse trabalho consiste de um modelo que combina agregação, seleção de protótipos e previsão de séries temporais. Inicialmente, as séries temporais são agregadas em classes de entidades e representadas por boxplots. Um processo de seleção de protótipos baseado na informação mútua é aplicado para mitigar ruídos no conjunto de dados. Por último, um modelo multivariado para previsão de boxplots é construído. Ambos modelos são avaliados com conjuntos de dados sintéticos e reais. Uma comparação entre as abordagens propostas e outros métodos de predição da literatura de ADS é também descrita. Os resultados obtidos reforçam que para os conjuntos de dados usados, o poder preditivo das abordagens propostas é superior aos métodos da literatura usados para comparar. Além disso, este trabalho apresenta uma aplicação do mundo real no Setor Elétrico Brasileiro para fazer predição da temperatura dos motores usando a abordagem de regressão paramétrica para dados de boxplot.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-08-25T12:33:28Z
dc.date.available.fl_str_mv 2022-08-25T12:33:28Z
dc.date.issued.fl_str_mv 2022-02-23
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv REYES, Dailys Maite Aliaga. Predição para dados simbólicos multi-valorados de tipo quartis: caso especial dados representados por boxplots. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/45961
identifier_str_mv REYES, Dailys Maite Aliaga. Predição para dados simbólicos multi-valorados de tipo quartis: caso especial dados representados por boxplots. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.
url https://repositorio.ufpe.br/handle/123456789/45961
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/embargoedAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv embargoedAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Computacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/45961/1/TESE%20Dailys%20Mait%c3%a9%20Aliaga%20Reyes.pdf
https://repositorio.ufpe.br/bitstream/123456789/45961/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/45961/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/45961/4/TESE%20Dailys%20Mait%c3%a9%20Aliaga%20Reyes.pdf.txt
https://repositorio.ufpe.br/bitstream/123456789/45961/5/TESE%20Dailys%20Mait%c3%a9%20Aliaga%20Reyes.pdf.jpg
bitstream.checksum.fl_str_mv dabffa2e2a368790353c2fb0bdeb7321
e39d27027a6cc9cb039ad269a5db8e34
6928b9260b07fb2755249a5ca9903395
ae0070e68d72b3fa631722ab7177e1c7
a7caefcfb5e8861cce3b93eb15017072
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1802310762500194304