Métodos robustos em regressão linear para dados simbólicos do tipo intervalo

Detalhes bibliográficos
Autor(a) principal: DOMINGUES, Marco Antonio de Oliveira
Data de Publicação: 2010
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFPE
Texto Completo: https://repositorio.ufpe.br/handle/123456789/1700
Resumo: A análise de dados simbólicos (Symbolic Data Analysis - SDA) tem se destacado como um conjunto de ferramentas úteis à análise de grandes bases de dados, aprendizagem de máquina e reconhecimento de padrões. Os dados simbólicos podem representar variáveis estruturadas, listas, intervalos e distribuições. Nesse contexto, vários métodos estatísticos têm sido estendidos para o domínio de SDA (análise de cluster, estatísticas descritivas, componentes principais, análise fatorial, regressão linear, e outras). Como exemplo, os métodos de regressão linear propostos recentemente para dados simbólicos são extensões do método dos mínimos quadrados para minimização dos erros do modelo. Estes métodos estimam os parâmetros do modelo da regressão linear considerando apenas as informações sobre os pontos médios (centros) das variáveis simbólicas, considerando os valores dos limites inferiores e superiores dos intervalos e considerando os valores dos pontos médios e das amplitudes dos intervalos. Apesar da técnica dos mínimos quadrados ser computacionalmente simples, a qualidade dos ajustes é degradada quando o conjunto sob investigação contém dados atípicos. Na análise de regressão clássica, esses dados atípicos são frequentemente removidos do conjunto de dados sob investigação, sendo normalmente considerados como erros do processo. Contudo, em SDA, esse tipo de procedimento não é aconselhável, haja vista um dado simbólico poder representar a generalização de um conjunto de outras observações clássicas. Este trabalho propõe um método resistente (robusto) de regressão linear para dados simbólicos do tipo intervalo, paramétrico, inspirado na análise de regressão simétrica, cujos estimadores tenham alto ponto de ruptura . O método proposto permite ainda a construção de intervalos de confiança e testes de hipóteses para os parâmetros do ajuste, enquanto os métodos encontrados na literatura não estabelecem suposições probabilísticas. Além disso, considerando que a ausência de observações atípicas em um conjunto de dados indica a possibilidade de utilização de métodos baseados nos mínimos quadrados, esta tese também propõe um conjunto de técnicas para a identificação de dados simbólicos intervalares atípicos
id UFPE_200ea2def346d94cc940ea77b1ff1146
oai_identifier_str oai:repositorio.ufpe.br:123456789/1700
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling DOMINGUES, Marco Antonio de OliveiraSOUZA, Renata Maria Cardoso Rodrigues de2014-06-12T15:51:56Z2014-06-12T15:51:56Z2010-01-31Antonio de Oliveira Domingues, Marco; Maria Cardoso Rodrigues de Souza, Renata. Métodos robustos em regressão linear para dados simbólicos do tipo intervalo. 2010. Tese (Doutorado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2010.https://repositorio.ufpe.br/handle/123456789/1700A análise de dados simbólicos (Symbolic Data Analysis - SDA) tem se destacado como um conjunto de ferramentas úteis à análise de grandes bases de dados, aprendizagem de máquina e reconhecimento de padrões. Os dados simbólicos podem representar variáveis estruturadas, listas, intervalos e distribuições. Nesse contexto, vários métodos estatísticos têm sido estendidos para o domínio de SDA (análise de cluster, estatísticas descritivas, componentes principais, análise fatorial, regressão linear, e outras). Como exemplo, os métodos de regressão linear propostos recentemente para dados simbólicos são extensões do método dos mínimos quadrados para minimização dos erros do modelo. Estes métodos estimam os parâmetros do modelo da regressão linear considerando apenas as informações sobre os pontos médios (centros) das variáveis simbólicas, considerando os valores dos limites inferiores e superiores dos intervalos e considerando os valores dos pontos médios e das amplitudes dos intervalos. Apesar da técnica dos mínimos quadrados ser computacionalmente simples, a qualidade dos ajustes é degradada quando o conjunto sob investigação contém dados atípicos. Na análise de regressão clássica, esses dados atípicos são frequentemente removidos do conjunto de dados sob investigação, sendo normalmente considerados como erros do processo. Contudo, em SDA, esse tipo de procedimento não é aconselhável, haja vista um dado simbólico poder representar a generalização de um conjunto de outras observações clássicas. Este trabalho propõe um método resistente (robusto) de regressão linear para dados simbólicos do tipo intervalo, paramétrico, inspirado na análise de regressão simétrica, cujos estimadores tenham alto ponto de ruptura . O método proposto permite ainda a construção de intervalos de confiança e testes de hipóteses para os parâmetros do ajuste, enquanto os métodos encontrados na literatura não estabelecem suposições probabilísticas. Além disso, considerando que a ausência de observações atípicas em um conjunto de dados indica a possibilidade de utilização de métodos baseados nos mínimos quadrados, esta tese também propõe um conjunto de técnicas para a identificação de dados simbólicos intervalares atípicosFundação de Amparo à Pesquisa do Estado do AmazonasporUniversidade Federal de PernambucoAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessAnálise de dados simbólicosModelo resistente de regressão linear simbólicaDetecção de outliers simbólicos intervalaresMétodos robustos em regressão linear para dados simbólicos do tipo intervaloinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILarquivo2961_1.pdf.jpgarquivo2961_1.pdf.jpgGenerated Thumbnailimage/jpeg1247https://repositorio.ufpe.br/bitstream/123456789/1700/4/arquivo2961_1.pdf.jpg0f5054c8e147da19aa4711d80a80d641MD54ORIGINALarquivo2961_1.pdfapplication/pdf1358041https://repositorio.ufpe.br/bitstream/123456789/1700/1/arquivo2961_1.pdf6856c7acfe3c44063d89520f13a9da5fMD51LICENSElicense.txttext/plain1748https://repositorio.ufpe.br/bitstream/123456789/1700/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTarquivo2961_1.pdf.txtarquivo2961_1.pdf.txtExtracted texttext/plain162052https://repositorio.ufpe.br/bitstream/123456789/1700/3/arquivo2961_1.pdf.txt8bffb03d57074acd20dfed38e2e95b34MD53123456789/17002019-10-25 02:57:22.105oai:repositorio.ufpe.br:123456789/1700Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T05:57:22Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Métodos robustos em regressão linear para dados simbólicos do tipo intervalo
title Métodos robustos em regressão linear para dados simbólicos do tipo intervalo
spellingShingle Métodos robustos em regressão linear para dados simbólicos do tipo intervalo
DOMINGUES, Marco Antonio de Oliveira
Análise de dados simbólicos
Modelo resistente de regressão linear simbólica
Detecção de outliers simbólicos intervalares
title_short Métodos robustos em regressão linear para dados simbólicos do tipo intervalo
title_full Métodos robustos em regressão linear para dados simbólicos do tipo intervalo
title_fullStr Métodos robustos em regressão linear para dados simbólicos do tipo intervalo
title_full_unstemmed Métodos robustos em regressão linear para dados simbólicos do tipo intervalo
title_sort Métodos robustos em regressão linear para dados simbólicos do tipo intervalo
author DOMINGUES, Marco Antonio de Oliveira
author_facet DOMINGUES, Marco Antonio de Oliveira
author_role author
dc.contributor.author.fl_str_mv DOMINGUES, Marco Antonio de Oliveira
dc.contributor.advisor1.fl_str_mv SOUZA, Renata Maria Cardoso Rodrigues de
contributor_str_mv SOUZA, Renata Maria Cardoso Rodrigues de
dc.subject.por.fl_str_mv Análise de dados simbólicos
Modelo resistente de regressão linear simbólica
Detecção de outliers simbólicos intervalares
topic Análise de dados simbólicos
Modelo resistente de regressão linear simbólica
Detecção de outliers simbólicos intervalares
description A análise de dados simbólicos (Symbolic Data Analysis - SDA) tem se destacado como um conjunto de ferramentas úteis à análise de grandes bases de dados, aprendizagem de máquina e reconhecimento de padrões. Os dados simbólicos podem representar variáveis estruturadas, listas, intervalos e distribuições. Nesse contexto, vários métodos estatísticos têm sido estendidos para o domínio de SDA (análise de cluster, estatísticas descritivas, componentes principais, análise fatorial, regressão linear, e outras). Como exemplo, os métodos de regressão linear propostos recentemente para dados simbólicos são extensões do método dos mínimos quadrados para minimização dos erros do modelo. Estes métodos estimam os parâmetros do modelo da regressão linear considerando apenas as informações sobre os pontos médios (centros) das variáveis simbólicas, considerando os valores dos limites inferiores e superiores dos intervalos e considerando os valores dos pontos médios e das amplitudes dos intervalos. Apesar da técnica dos mínimos quadrados ser computacionalmente simples, a qualidade dos ajustes é degradada quando o conjunto sob investigação contém dados atípicos. Na análise de regressão clássica, esses dados atípicos são frequentemente removidos do conjunto de dados sob investigação, sendo normalmente considerados como erros do processo. Contudo, em SDA, esse tipo de procedimento não é aconselhável, haja vista um dado simbólico poder representar a generalização de um conjunto de outras observações clássicas. Este trabalho propõe um método resistente (robusto) de regressão linear para dados simbólicos do tipo intervalo, paramétrico, inspirado na análise de regressão simétrica, cujos estimadores tenham alto ponto de ruptura . O método proposto permite ainda a construção de intervalos de confiança e testes de hipóteses para os parâmetros do ajuste, enquanto os métodos encontrados na literatura não estabelecem suposições probabilísticas. Além disso, considerando que a ausência de observações atípicas em um conjunto de dados indica a possibilidade de utilização de métodos baseados nos mínimos quadrados, esta tese também propõe um conjunto de técnicas para a identificação de dados simbólicos intervalares atípicos
publishDate 2010
dc.date.issued.fl_str_mv 2010-01-31
dc.date.accessioned.fl_str_mv 2014-06-12T15:51:56Z
dc.date.available.fl_str_mv 2014-06-12T15:51:56Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv Antonio de Oliveira Domingues, Marco; Maria Cardoso Rodrigues de Souza, Renata. Métodos robustos em regressão linear para dados simbólicos do tipo intervalo. 2010. Tese (Doutorado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2010.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/1700
identifier_str_mv Antonio de Oliveira Domingues, Marco; Maria Cardoso Rodrigues de Souza, Renata. Métodos robustos em regressão linear para dados simbólicos do tipo intervalo. 2010. Tese (Doutorado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2010.
url https://repositorio.ufpe.br/handle/123456789/1700
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/1700/4/arquivo2961_1.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/1700/1/arquivo2961_1.pdf
https://repositorio.ufpe.br/bitstream/123456789/1700/2/license.txt
https://repositorio.ufpe.br/bitstream/123456789/1700/3/arquivo2961_1.pdf.txt
bitstream.checksum.fl_str_mv 0f5054c8e147da19aa4711d80a80d641
6856c7acfe3c44063d89520f13a9da5f
8a4605be74aa9ea9d79846c1fba20a33
8bffb03d57074acd20dfed38e2e95b34
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1802310706230460416