Data Mining: Classification of Wine and Pima Indians Datasets

Detalhes bibliográficos
Autor(a) principal: Passinho, Francisco
Data de Publicação: 2021
Outros Autores: Cavique, Luís
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://doi.org/10.34627/rcc.v16i0.265
Resumo: Data mining is a multidisciplinary area that aims to extract and find patterns in large groups of data using intelligent algorithms. In this paper, we performed a classification study of two widely used datasets in the literature: Italian wine recognition data and Pima indigenous diabetes data. A statistical analysis of the data and the respective classification was carried out with several classification algorithms. Similar results and, in some cases, better results were obtained when compared to those reported in the literature. The best classifiers were Random Forests and Neural Networks with accuracy values above 80%.
id RCAP_2f541eeb5cebab0d862627ae5cf3e8a1
oai_identifier_str oai:ojs2.journals.uab.pt:article/265
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Data Mining: Classification of Wine and Pima Indians DatasetsProspeção de dados: Classificação de dados de Vinho e IndígenasData mining is a multidisciplinary area that aims to extract and find patterns in large groups of data using intelligent algorithms. In this paper, we performed a classification study of two widely used datasets in the literature: Italian wine recognition data and Pima indigenous diabetes data. A statistical analysis of the data and the respective classification was carried out with several classification algorithms. Similar results and, in some cases, better results were obtained when compared to those reported in the literature. The best classifiers were Random Forests and Neural Networks with accuracy values above 80%.O data mining é uma área multidisciplinar que tem como objetivo extrair e descobrir padrões em grandes grupos de dados através de algoritmos de inteligentes. Neste artigo, foi realizado um estudo de classificação de dois datasets amplamente usados na literatura: dados de reconhecimento de vinhos italianos e dados de diabetes de indígenas Pima.  Foi realizada uma análise estatística dos dados e a respetiva classificação com vários algoritmos de classificação. Foram obtidos resultados semelhantes e em alguns casos superiores aos reportados na literatura. Os melhores classificadores foram as Florestas Aleatórias e as Redes Neuronais com valores de exatidão acima dos 80%.Universidade Aberta2021-12-07info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://doi.org/10.34627/rcc.v16i0.265https://doi.org/10.34627/rcc.v16i0.265Revista de Ciências da Computação; v. 16 (2021); 47-802182-18011646-633010.34627/rcc.v16i0reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPporhttps://journals.uab.pt/index.php/rcc/article/view/265https://journals.uab.pt/index.php/rcc/article/view/265/220Direitos de Autor (c) 2021 Universidade Abertahttp://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessPassinho, FranciscoCavique, Luís2022-12-23T06:30:14Zoai:ojs2.journals.uab.pt:article/265Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T16:14:02.444679Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Data Mining: Classification of Wine and Pima Indians Datasets
Prospeção de dados: Classificação de dados de Vinho e Indígenas
title Data Mining: Classification of Wine and Pima Indians Datasets
spellingShingle Data Mining: Classification of Wine and Pima Indians Datasets
Passinho, Francisco
title_short Data Mining: Classification of Wine and Pima Indians Datasets
title_full Data Mining: Classification of Wine and Pima Indians Datasets
title_fullStr Data Mining: Classification of Wine and Pima Indians Datasets
title_full_unstemmed Data Mining: Classification of Wine and Pima Indians Datasets
title_sort Data Mining: Classification of Wine and Pima Indians Datasets
author Passinho, Francisco
author_facet Passinho, Francisco
Cavique, Luís
author_role author
author2 Cavique, Luís
author2_role author
dc.contributor.author.fl_str_mv Passinho, Francisco
Cavique, Luís
description Data mining is a multidisciplinary area that aims to extract and find patterns in large groups of data using intelligent algorithms. In this paper, we performed a classification study of two widely used datasets in the literature: Italian wine recognition data and Pima indigenous diabetes data. A statistical analysis of the data and the respective classification was carried out with several classification algorithms. Similar results and, in some cases, better results were obtained when compared to those reported in the literature. The best classifiers were Random Forests and Neural Networks with accuracy values above 80%.
publishDate 2021
dc.date.none.fl_str_mv 2021-12-07
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.34627/rcc.v16i0.265
https://doi.org/10.34627/rcc.v16i0.265
url https://doi.org/10.34627/rcc.v16i0.265
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://journals.uab.pt/index.php/rcc/article/view/265
https://journals.uab.pt/index.php/rcc/article/view/265/220
dc.rights.driver.fl_str_mv Direitos de Autor (c) 2021 Universidade Aberta
http://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Direitos de Autor (c) 2021 Universidade Aberta
http://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Aberta
publisher.none.fl_str_mv Universidade Aberta
dc.source.none.fl_str_mv Revista de Ciências da Computação; v. 16 (2021); 47-80
2182-1801
1646-6330
10.34627/rcc.v16i0
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799130593810710528