Data Mining: Classification of Wine and Pima Indians Datasets
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Outros Autores: | |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://doi.org/10.34627/rcc.v16i0.265 |
Resumo: | Data mining is a multidisciplinary area that aims to extract and find patterns in large groups of data using intelligent algorithms. In this paper, we performed a classification study of two widely used datasets in the literature: Italian wine recognition data and Pima indigenous diabetes data. A statistical analysis of the data and the respective classification was carried out with several classification algorithms. Similar results and, in some cases, better results were obtained when compared to those reported in the literature. The best classifiers were Random Forests and Neural Networks with accuracy values above 80%. |
id |
RCAP_2f541eeb5cebab0d862627ae5cf3e8a1 |
---|---|
oai_identifier_str |
oai:ojs2.journals.uab.pt:article/265 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Data Mining: Classification of Wine and Pima Indians DatasetsProspeção de dados: Classificação de dados de Vinho e IndígenasData mining is a multidisciplinary area that aims to extract and find patterns in large groups of data using intelligent algorithms. In this paper, we performed a classification study of two widely used datasets in the literature: Italian wine recognition data and Pima indigenous diabetes data. A statistical analysis of the data and the respective classification was carried out with several classification algorithms. Similar results and, in some cases, better results were obtained when compared to those reported in the literature. The best classifiers were Random Forests and Neural Networks with accuracy values above 80%.O data mining é uma área multidisciplinar que tem como objetivo extrair e descobrir padrões em grandes grupos de dados através de algoritmos de inteligentes. Neste artigo, foi realizado um estudo de classificação de dois datasets amplamente usados na literatura: dados de reconhecimento de vinhos italianos e dados de diabetes de indígenas Pima. Foi realizada uma análise estatística dos dados e a respetiva classificação com vários algoritmos de classificação. Foram obtidos resultados semelhantes e em alguns casos superiores aos reportados na literatura. Os melhores classificadores foram as Florestas Aleatórias e as Redes Neuronais com valores de exatidão acima dos 80%.Universidade Aberta2021-12-07info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://doi.org/10.34627/rcc.v16i0.265https://doi.org/10.34627/rcc.v16i0.265Revista de Ciências da Computação; v. 16 (2021); 47-802182-18011646-633010.34627/rcc.v16i0reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPporhttps://journals.uab.pt/index.php/rcc/article/view/265https://journals.uab.pt/index.php/rcc/article/view/265/220Direitos de Autor (c) 2021 Universidade Abertahttp://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessPassinho, FranciscoCavique, Luís2022-12-23T06:30:14Zoai:ojs2.journals.uab.pt:article/265Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T16:14:02.444679Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Data Mining: Classification of Wine and Pima Indians Datasets Prospeção de dados: Classificação de dados de Vinho e Indígenas |
title |
Data Mining: Classification of Wine and Pima Indians Datasets |
spellingShingle |
Data Mining: Classification of Wine and Pima Indians Datasets Passinho, Francisco |
title_short |
Data Mining: Classification of Wine and Pima Indians Datasets |
title_full |
Data Mining: Classification of Wine and Pima Indians Datasets |
title_fullStr |
Data Mining: Classification of Wine and Pima Indians Datasets |
title_full_unstemmed |
Data Mining: Classification of Wine and Pima Indians Datasets |
title_sort |
Data Mining: Classification of Wine and Pima Indians Datasets |
author |
Passinho, Francisco |
author_facet |
Passinho, Francisco Cavique, Luís |
author_role |
author |
author2 |
Cavique, Luís |
author2_role |
author |
dc.contributor.author.fl_str_mv |
Passinho, Francisco Cavique, Luís |
description |
Data mining is a multidisciplinary area that aims to extract and find patterns in large groups of data using intelligent algorithms. In this paper, we performed a classification study of two widely used datasets in the literature: Italian wine recognition data and Pima indigenous diabetes data. A statistical analysis of the data and the respective classification was carried out with several classification algorithms. Similar results and, in some cases, better results were obtained when compared to those reported in the literature. The best classifiers were Random Forests and Neural Networks with accuracy values above 80%. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-12-07 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://doi.org/10.34627/rcc.v16i0.265 https://doi.org/10.34627/rcc.v16i0.265 |
url |
https://doi.org/10.34627/rcc.v16i0.265 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://journals.uab.pt/index.php/rcc/article/view/265 https://journals.uab.pt/index.php/rcc/article/view/265/220 |
dc.rights.driver.fl_str_mv |
Direitos de Autor (c) 2021 Universidade Aberta http://creativecommons.org/licenses/by/4.0 info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Direitos de Autor (c) 2021 Universidade Aberta http://creativecommons.org/licenses/by/4.0 |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Aberta |
publisher.none.fl_str_mv |
Universidade Aberta |
dc.source.none.fl_str_mv |
Revista de Ciências da Computação; v. 16 (2021); 47-80 2182-1801 1646-6330 10.34627/rcc.v16i0 reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799130593810710528 |