K vizinhos mais próximos circular: uma nova proposta para predição de dados angulares

Detalhes bibliográficos
Autor(a) principal: Facco, Maicon
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações do UFSM
Texto Completo: http://repositorio.ufsm.br/handle/1/24597
Resumo: Circular data are present in several areas of science and lack specific statistical methods for their treatment. The calculation of descriptive statistics for data of a linear nature, for example, does not result in adequate values or that has practical meaning for data in the circumference. Regarding regression models, the literature presents parametric regression models for circular data, which presupposes certain circular probability distributions for their adjustments. On the other hand, in the machine learning field, a supervised prediction approach for continuous data involves non-parametric regression models, which may not be suitable for situations where the variable of interest is circular. In this context, the main goal of the present work is to develop non-parametric predictive models for circular data, based on the concepts of machine learning, namely, the circular k nearest neighbors (CkNN). This methodology was employed in the development of machine learning algorithms for circular data and predictions of directional wind data in different automatic weather stations of several municipalities in the Rio Grande do Sul estate, Brazil, in addition to some municipalities in the states of Bahia and Santa Catarina. The quality of the chosen models was measured using a specific risk measure.
id UFSM_b59467b904f12bead4aba31b99b634bd
oai_identifier_str oai:repositorio.ufsm.br:1/24597
network_acronym_str UFSM
network_name_str Biblioteca Digital de Teses e Dissertações do UFSM
repository_id_str
spelling 2022-05-31T14:02:18Z2022-05-31T14:02:18Z2022-03-11http://repositorio.ufsm.br/handle/1/24597Circular data are present in several areas of science and lack specific statistical methods for their treatment. The calculation of descriptive statistics for data of a linear nature, for example, does not result in adequate values or that has practical meaning for data in the circumference. Regarding regression models, the literature presents parametric regression models for circular data, which presupposes certain circular probability distributions for their adjustments. On the other hand, in the machine learning field, a supervised prediction approach for continuous data involves non-parametric regression models, which may not be suitable for situations where the variable of interest is circular. In this context, the main goal of the present work is to develop non-parametric predictive models for circular data, based on the concepts of machine learning, namely, the circular k nearest neighbors (CkNN). This methodology was employed in the development of machine learning algorithms for circular data and predictions of directional wind data in different automatic weather stations of several municipalities in the Rio Grande do Sul estate, Brazil, in addition to some municipalities in the states of Bahia and Santa Catarina. The quality of the chosen models was measured using a specific risk measure.Dados circulares estão presentes em várias áreas da ciência e carecem de métodos estatísticos específicos para seu tratamento. O cálculo de estatísticas descritivas para dados de natureza linear, por exemplo, não resulta em valores adequados ou que possuam significado prático para dados na circunferência. No âmbito de modelos de regressão, a literatura apresenta modelos de regressão paramétricos para dados circulares, os quais fazem suposições de determinadas distribuições de probabilidade circulares para seus ajustes. Por outro lado, na área de aprendizado de máquina, uma abordagem de predição supervisionada para dados contínuos envolve modelos de regressão não paramétricos, os quais podem não ser adequados para situações em que a variável de interesse é circular. Neste contexto, o presente trabalho objetivou desenvolver modelos preditivos não paramétricos para dados circulares baseados nos conceitos de aprendizagem de máquina, qual seja, o k vizinhos mais próximos circular (CkNN - circular k-nearest neighbors). Essa metodologia foi empregada no desenvolvimento de algoritmos de aprendizado de máquina para dados circulares, na criação de modelos preditivos e na predição de dados direcionais de vento em diferentes estações automáticas meteorológicas de diversos municípios do estado do Rio Grande do Sul, além de um município da Bahia e outro de Santa Catarina. A qualidade dos modelos escolhidos foi mensurada por meio de uma medida de risco específica.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESporUniversidade Federal de Santa MariaCentro de TecnologiaPrograma de Pós-Graduação em Engenharia de ProduçãoUFSMBrasilEngenharia de ProduçãoAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessAprendizado de máquinaCkNNDados circularesDireção de ventokNNCircular dataMachine learningWind directionCNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAOK vizinhos mais próximos circular: uma nova proposta para predição de dados angularesCircular K nearest neighbors: a new proposal for angular data predictioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisBayer, Fabio Marianohttp://lattes.cnpq.br/9904863693302949Prass, Taiane SchaedlerSilva, Augusto Maciel dahttp://lattes.cnpq.br/9747495223244947Facco, Maicon3008000000056006006006006004956805e-e316-42b3-9b13-89f0ccaf22ca311117df-3b23-48e4-8109-567fc1dd9050dcca6ea3-1d8a-432c-91ca-2f13ca00c25a4985d025-8b4e-4483-bde7-448d2a785d1breponame:Biblioteca Digital de Teses e Dissertações do UFSMinstname:Universidade Federal de Santa Maria (UFSM)instacron:UFSMCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805http://repositorio.ufsm.br/bitstream/1/24597/2/license_rdf4460e5956bc1d1639be9ae6146a50347MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81956http://repositorio.ufsm.br/bitstream/1/24597/3/license.txt2f0571ecee68693bd5cd3f17c1e075dfMD53ORIGINALDIS_PPGEP_2022_FACCO_MAICON.pdfDIS_PPGEP_2022_FACCO_MAICON.pdfDissertaçãoapplication/pdf5450513http://repositorio.ufsm.br/bitstream/1/24597/1/DIS_PPGEP_2022_FACCO_MAICON.pdfa25aa35d97e93418b4f1559fe863a200MD511/245972022-05-31 11:02:19.047oai:repositorio.ufsm.br:1/24597TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlCkZlZGVyYWwgZGUgU2FudGEgTWFyaWEgKFVGU00pIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UKZGlzdHJpYnVpciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gKGluY2x1aW5kbyBvIHJlc3VtbykgcG9yIHRvZG8gbyBtdW5kbyBubyBmb3JtYXRvIGltcHJlc3NvIGUgZWxldHLDtG5pY28gZQplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVGU00gcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbwpwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgVUZTTSBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgYSBzdWEgdGVzZSBvdQpkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcwpuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldQpjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6oKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFVGU00Kb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlCmlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IG5vIGNvbnRlw7pkbyBkYSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gb3JhIGRlcG9zaXRhZGEuCgpDQVNPIEEgVEVTRSBPVSBESVNTRVJUQcOHw4NPIE9SQSBERVBPU0lUQURBIFRFTkhBIFNJRE8gUkVTVUxUQURPIERFIFVNIFBBVFJPQ8ONTklPIE9VCkFQT0lPIERFIFVNQSBBR8OKTkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTyBRVUUgTsODTyBTRUpBIEEgVUZTTQosIFZPQ8OKIERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJU8ODTyBDT01PClRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVRlNNIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKQpkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbywgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcwpjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgoKBiblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufsm.br/ONGhttps://repositorio.ufsm.br/oai/requestatendimento.sib@ufsm.br||tedebc@gmail.comopendoar:2022-05-31T14:02:19Biblioteca Digital de Teses e Dissertações do UFSM - Universidade Federal de Santa Maria (UFSM)false
dc.title.por.fl_str_mv K vizinhos mais próximos circular: uma nova proposta para predição de dados angulares
dc.title.alternative.eng.fl_str_mv Circular K nearest neighbors: a new proposal for angular data prediction
title K vizinhos mais próximos circular: uma nova proposta para predição de dados angulares
spellingShingle K vizinhos mais próximos circular: uma nova proposta para predição de dados angulares
Facco, Maicon
Aprendizado de máquina
CkNN
Dados circulares
Direção de vento
kNN
Circular data
Machine learning
Wind direction
CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO
title_short K vizinhos mais próximos circular: uma nova proposta para predição de dados angulares
title_full K vizinhos mais próximos circular: uma nova proposta para predição de dados angulares
title_fullStr K vizinhos mais próximos circular: uma nova proposta para predição de dados angulares
title_full_unstemmed K vizinhos mais próximos circular: uma nova proposta para predição de dados angulares
title_sort K vizinhos mais próximos circular: uma nova proposta para predição de dados angulares
author Facco, Maicon
author_facet Facco, Maicon
author_role author
dc.contributor.advisor1.fl_str_mv Bayer, Fabio Mariano
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/9904863693302949
dc.contributor.referee1.fl_str_mv Prass, Taiane Schaedler
dc.contributor.referee2.fl_str_mv Silva, Augusto Maciel da
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/9747495223244947
dc.contributor.author.fl_str_mv Facco, Maicon
contributor_str_mv Bayer, Fabio Mariano
Prass, Taiane Schaedler
Silva, Augusto Maciel da
dc.subject.por.fl_str_mv Aprendizado de máquina
CkNN
Dados circulares
Direção de vento
kNN
topic Aprendizado de máquina
CkNN
Dados circulares
Direção de vento
kNN
Circular data
Machine learning
Wind direction
CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO
dc.subject.eng.fl_str_mv Circular data
Machine learning
Wind direction
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO
description Circular data are present in several areas of science and lack specific statistical methods for their treatment. The calculation of descriptive statistics for data of a linear nature, for example, does not result in adequate values or that has practical meaning for data in the circumference. Regarding regression models, the literature presents parametric regression models for circular data, which presupposes certain circular probability distributions for their adjustments. On the other hand, in the machine learning field, a supervised prediction approach for continuous data involves non-parametric regression models, which may not be suitable for situations where the variable of interest is circular. In this context, the main goal of the present work is to develop non-parametric predictive models for circular data, based on the concepts of machine learning, namely, the circular k nearest neighbors (CkNN). This methodology was employed in the development of machine learning algorithms for circular data and predictions of directional wind data in different automatic weather stations of several municipalities in the Rio Grande do Sul estate, Brazil, in addition to some municipalities in the states of Bahia and Santa Catarina. The quality of the chosen models was measured using a specific risk measure.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-05-31T14:02:18Z
dc.date.available.fl_str_mv 2022-05-31T14:02:18Z
dc.date.issued.fl_str_mv 2022-03-11
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.ufsm.br/handle/1/24597
url http://repositorio.ufsm.br/handle/1/24597
dc.language.iso.fl_str_mv por
language por
dc.relation.cnpq.fl_str_mv 300800000005
dc.relation.confidence.fl_str_mv 600
600
600
600
600
dc.relation.authority.fl_str_mv 4956805e-e316-42b3-9b13-89f0ccaf22ca
311117df-3b23-48e4-8109-567fc1dd9050
dcca6ea3-1d8a-432c-91ca-2f13ca00c25a
4985d025-8b4e-4483-bde7-448d2a785d1b
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Santa Maria
Centro de Tecnologia
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia de Produção
dc.publisher.initials.fl_str_mv UFSM
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Engenharia de Produção
publisher.none.fl_str_mv Universidade Federal de Santa Maria
Centro de Tecnologia
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do UFSM
instname:Universidade Federal de Santa Maria (UFSM)
instacron:UFSM
instname_str Universidade Federal de Santa Maria (UFSM)
instacron_str UFSM
institution UFSM
reponame_str Biblioteca Digital de Teses e Dissertações do UFSM
collection Biblioteca Digital de Teses e Dissertações do UFSM
bitstream.url.fl_str_mv http://repositorio.ufsm.br/bitstream/1/24597/2/license_rdf
http://repositorio.ufsm.br/bitstream/1/24597/3/license.txt
http://repositorio.ufsm.br/bitstream/1/24597/1/DIS_PPGEP_2022_FACCO_MAICON.pdf
bitstream.checksum.fl_str_mv 4460e5956bc1d1639be9ae6146a50347
2f0571ecee68693bd5cd3f17c1e075df
a25aa35d97e93418b4f1559fe863a200
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do UFSM - Universidade Federal de Santa Maria (UFSM)
repository.mail.fl_str_mv atendimento.sib@ufsm.br||tedebc@gmail.com
_version_ 1801485102028423168