Prospeção de dados: classificação de dados de vinho e indígenas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Outros Autores: | |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.2/11549 |
Resumo: | O data mining é uma área multidisciplinar que tem como objetivo extrair e descobrir padrões em grandes grupos de dados através de algoritmos de inteligentes. Neste artigo, foi realizado um estudo de classificação de dois datasets amplamente usados na literatura: dados de reconhecimento de vinhos italianos e dados de diabetes de indígenas Pima. Foi realizada uma análise estatística dos dados e a respetiva classificação com vários algoritmos de classificação. Foram obtidos resultados semelhantes e em alguns casos superiores aos reportados na literatura. Os melhores classificadores foram as Florestas Aleatórias e as Redes Neuronais com valores de exatidão acima dos 80%. |
id |
RCAP_630a8c9e1802a0e0503258d9188667e7 |
---|---|
oai_identifier_str |
oai:repositorioaberto.uab.pt:10400.2/11549 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Prospeção de dados: classificação de dados de vinho e indígenasData mining: classification of wine and pima indians datasetsClassificaçãoProspeção de dadosClassificationData miningODS::04:Educação de QualidadeO data mining é uma área multidisciplinar que tem como objetivo extrair e descobrir padrões em grandes grupos de dados através de algoritmos de inteligentes. Neste artigo, foi realizado um estudo de classificação de dois datasets amplamente usados na literatura: dados de reconhecimento de vinhos italianos e dados de diabetes de indígenas Pima. Foi realizada uma análise estatística dos dados e a respetiva classificação com vários algoritmos de classificação. Foram obtidos resultados semelhantes e em alguns casos superiores aos reportados na literatura. Os melhores classificadores foram as Florestas Aleatórias e as Redes Neuronais com valores de exatidão acima dos 80%.Data mining is a multidisciplinary area that aims to extract and find patterns in large groups of data using intelligent algorithms. In this paper, we performed a classification study of two widely used datasets in the literature: Italian wine recognition data and Pima indigenous diabetes data. A statistical analysis of the data and the respective classification was carried out with several classification algorithms. Similar results and, in some cases, better results were obtained when compared to those reported in the literature. The best classifiers were Random Forests and Neural Networks with accuracy values above 80%.Universidade AbertaRepositório AbertoPassinho, FranciscoCavique, Luís2021-12-22T17:34:52Z2021-122021-12-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttp://hdl.handle.net/10400.2/11549porPassinho, Francisco; Cavique, Luís - Prospeção de dados: classificação de dados de vinho e indígenas. "Revista de Ciências da Computação" [Em linha]. ISSN 1646-6330 (Print) 2182-1801 (Online). Vol. 16 (2021), p. 47-801646-6330https://doi.org/10.34627/rcc.v16i0.2652182-1801info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-25T01:47:48Zoai:repositorioaberto.uab.pt:10400.2/11549Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:50:55.918628Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Prospeção de dados: classificação de dados de vinho e indígenas Data mining: classification of wine and pima indians datasets |
title |
Prospeção de dados: classificação de dados de vinho e indígenas |
spellingShingle |
Prospeção de dados: classificação de dados de vinho e indígenas Passinho, Francisco Classificação Prospeção de dados Classification Data mining ODS::04:Educação de Qualidade |
title_short |
Prospeção de dados: classificação de dados de vinho e indígenas |
title_full |
Prospeção de dados: classificação de dados de vinho e indígenas |
title_fullStr |
Prospeção de dados: classificação de dados de vinho e indígenas |
title_full_unstemmed |
Prospeção de dados: classificação de dados de vinho e indígenas |
title_sort |
Prospeção de dados: classificação de dados de vinho e indígenas |
author |
Passinho, Francisco |
author_facet |
Passinho, Francisco Cavique, Luís |
author_role |
author |
author2 |
Cavique, Luís |
author2_role |
author |
dc.contributor.none.fl_str_mv |
Repositório Aberto |
dc.contributor.author.fl_str_mv |
Passinho, Francisco Cavique, Luís |
dc.subject.por.fl_str_mv |
Classificação Prospeção de dados Classification Data mining ODS::04:Educação de Qualidade |
topic |
Classificação Prospeção de dados Classification Data mining ODS::04:Educação de Qualidade |
description |
O data mining é uma área multidisciplinar que tem como objetivo extrair e descobrir padrões em grandes grupos de dados através de algoritmos de inteligentes. Neste artigo, foi realizado um estudo de classificação de dois datasets amplamente usados na literatura: dados de reconhecimento de vinhos italianos e dados de diabetes de indígenas Pima. Foi realizada uma análise estatística dos dados e a respetiva classificação com vários algoritmos de classificação. Foram obtidos resultados semelhantes e em alguns casos superiores aos reportados na literatura. Os melhores classificadores foram as Florestas Aleatórias e as Redes Neuronais com valores de exatidão acima dos 80%. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-12-22T17:34:52Z 2021-12 2021-12-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.2/11549 |
url |
http://hdl.handle.net/10400.2/11549 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
Passinho, Francisco; Cavique, Luís - Prospeção de dados: classificação de dados de vinho e indígenas. "Revista de Ciências da Computação" [Em linha]. ISSN 1646-6330 (Print) 2182-1801 (Online). Vol. 16 (2021), p. 47-80 1646-6330 https://doi.org/10.34627/rcc.v16i0.265 2182-1801 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Aberta |
publisher.none.fl_str_mv |
Universidade Aberta |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799135098584432640 |