Métodos de inteligência artificial aplicados em dados de biomassa para a caracterização dos diferentes tipos de pirólise
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UERJ |
Texto Completo: | http://www.bdtd.uerj.br/handle/1/20485 |
Resumo: | Este estudo aborda o problema de classificação de dados de biomassa. Um dos objetivos é identificar as variáveis de maior relevância para classificar o tipo de pirólise de biomassa. Além disso, avaliar se as classes dos tipos de pirólise são suficientes para caracterizar este processo químico. O algoritmo de Floresta Aleatória foi aplicado para identificar quais variáveis são relevantes no processo de classificação do tipo pirólise, obtendo uma exatidão em torno de 97%. Foi identificado que as variáveis mais importantes são: Tempo de residência médio no reator para o gás e de arraste, Porcentagem de carbono em base seca livre de cinza na matéria-prima, Tamanho da partícula média no reator e Porcentagem de hidrogênio em base seca livre de cinza na matéria-prima. Os seguintes métodos de agrupamentos foram usados com as variáveis de maior relevância encontradas: k-means, pam, clara, diana, fanny, hierárquico, som, sota e model. Para avaliar os métodos de agrupamentos, foram usadas as medidas de validação interna com as métricas de índice de Dunn e silhueta. As medidas de validação indicaram o agrupamento hierárquico e k-means com os melhores resultados para número de grupos maior do que o número de classes de pirólise já existentes. Assim, o conjunto de dados pode ser dividido em um número maior de tipos de pirólise, levando em consideração à conclusão que apenas as classes disponíveis são muito limitadas para caracterizar os tipos de pirólise, uma vez que os algoritmos de classificação não supervisionados indicam o número de agrupamentos como maior ou igual a cinco. |
id |
UERJ_79554891dae232132b94a9dc644cf709 |
---|---|
oai_identifier_str |
oai:www.bdtd.uerj.br:1/20485 |
network_acronym_str |
UERJ |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UERJ |
repository_id_str |
2903 |
spelling |
Métodos de inteligência artificial aplicados em dados de biomassa para a caracterização dos diferentes tipos de piróliseArtificial Intelligence methods applied to biomass data to characterize the different types of pyrolysisCluster AnalysisArtificial IntelligenceBiomassMachine LearningInteligência artificialAgrupamento de dados relacionadosBiomassaAprendizado de máquinaAnálises de agrupamentoCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOEste estudo aborda o problema de classificação de dados de biomassa. Um dos objetivos é identificar as variáveis de maior relevância para classificar o tipo de pirólise de biomassa. Além disso, avaliar se as classes dos tipos de pirólise são suficientes para caracterizar este processo químico. O algoritmo de Floresta Aleatória foi aplicado para identificar quais variáveis são relevantes no processo de classificação do tipo pirólise, obtendo uma exatidão em torno de 97%. Foi identificado que as variáveis mais importantes são: Tempo de residência médio no reator para o gás e de arraste, Porcentagem de carbono em base seca livre de cinza na matéria-prima, Tamanho da partícula média no reator e Porcentagem de hidrogênio em base seca livre de cinza na matéria-prima. Os seguintes métodos de agrupamentos foram usados com as variáveis de maior relevância encontradas: k-means, pam, clara, diana, fanny, hierárquico, som, sota e model. Para avaliar os métodos de agrupamentos, foram usadas as medidas de validação interna com as métricas de índice de Dunn e silhueta. As medidas de validação indicaram o agrupamento hierárquico e k-means com os melhores resultados para número de grupos maior do que o número de classes de pirólise já existentes. Assim, o conjunto de dados pode ser dividido em um número maior de tipos de pirólise, levando em consideração à conclusão que apenas as classes disponíveis são muito limitadas para caracterizar os tipos de pirólise, uma vez que os algoritmos de classificação não supervisionados indicam o número de agrupamentos como maior ou igual a cinco.This study addresses a biomass data classification problem. One of the objectives is to identify the most relevant variables for classifying the pyrolysis type of biomass. Also, to evaluate if the pyrolysis type classes are sufficient to characterize this chemical process. The Random Forest algorithm was applied to identify which variables are relevant in the pyrolysis-type classification process, obtaining an accuracy of around 97%. It was identified that the most important variables are: Average residence time in the reactor for the gas and carrier, Percentage of ash-free dry basis carbon in the feedstock, Average particle size in the reactor, and Percentage of ash-free dry basis hydrogen in the feedstock. The clustering methods were used with the most relevant variables: k-means, pam, clear, diana, fanny, hierarchical, sound, sota, and model. To evaluate the clustering methods, internal validation measures with Dunn’s index metrics and silhouette were used. The validation measures indicated the hierarchical clustering and k-means with better results for several groups greater than the number of existing pyrolysis classes. Thus, the dataset can be divided into more pyrolysis-type groups, considering only the available classes are too limited to characterize the pyrolysis type since the unsupervised classification algorithms indicate the number of clusters as greater than or equal to five.Universidade do Estado do Rio de JaneiroCentro de Tecnologia e Ciências::Instituto de Matemática e EstatísticaBrasilUERJPrograma de Pós-Graduação em Ciências ComputacionaisXavier, Vinicius LayterLuna, Aderval SeverinoTôrres, Alexandre RodriguesCastro, Maria Clícia Stelling dePaula, Daniela PolessaLima, Igor Campos de AlmeidaSouza, Sabrinna Rodrigues de Oliveira de2023-10-20T14:20:43Z2023-03-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSOUZA, Sabrinna Rodrigues de Oliveira de. Métodos de inteligência artificial aplicados em dados de biomassa para a caracterização dos diferentes tipos de pirólise. 2023. 77 f. Dissertação (Mestrado em Ciências Computacionais) - Instituto de Matemática e Estatística, Universidade do Estado do Rio de Janeiro, Rio de Janeiro, 2023.http://www.bdtd.uerj.br/handle/1/20485porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UERJinstname:Universidade do Estado do Rio de Janeiro (UERJ)instacron:UERJ2024-02-27T17:34:50Zoai:www.bdtd.uerj.br:1/20485Biblioteca Digital de Teses e Dissertaçõeshttp://www.bdtd.uerj.br/PUBhttps://www.bdtd.uerj.br:8443/oai/requestbdtd.suporte@uerj.bropendoar:29032024-02-27T17:34:50Biblioteca Digital de Teses e Dissertações da UERJ - Universidade do Estado do Rio de Janeiro (UERJ)false |
dc.title.none.fl_str_mv |
Métodos de inteligência artificial aplicados em dados de biomassa para a caracterização dos diferentes tipos de pirólise Artificial Intelligence methods applied to biomass data to characterize the different types of pyrolysis |
title |
Métodos de inteligência artificial aplicados em dados de biomassa para a caracterização dos diferentes tipos de pirólise |
spellingShingle |
Métodos de inteligência artificial aplicados em dados de biomassa para a caracterização dos diferentes tipos de pirólise Souza, Sabrinna Rodrigues de Oliveira de Cluster Analysis Artificial Intelligence Biomass Machine Learning Inteligência artificial Agrupamento de dados relacionados Biomassa Aprendizado de máquina Análises de agrupamento CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Métodos de inteligência artificial aplicados em dados de biomassa para a caracterização dos diferentes tipos de pirólise |
title_full |
Métodos de inteligência artificial aplicados em dados de biomassa para a caracterização dos diferentes tipos de pirólise |
title_fullStr |
Métodos de inteligência artificial aplicados em dados de biomassa para a caracterização dos diferentes tipos de pirólise |
title_full_unstemmed |
Métodos de inteligência artificial aplicados em dados de biomassa para a caracterização dos diferentes tipos de pirólise |
title_sort |
Métodos de inteligência artificial aplicados em dados de biomassa para a caracterização dos diferentes tipos de pirólise |
author |
Souza, Sabrinna Rodrigues de Oliveira de |
author_facet |
Souza, Sabrinna Rodrigues de Oliveira de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Xavier, Vinicius Layter Luna, Aderval Severino Tôrres, Alexandre Rodrigues Castro, Maria Clícia Stelling de Paula, Daniela Polessa Lima, Igor Campos de Almeida |
dc.contributor.author.fl_str_mv |
Souza, Sabrinna Rodrigues de Oliveira de |
dc.subject.por.fl_str_mv |
Cluster Analysis Artificial Intelligence Biomass Machine Learning Inteligência artificial Agrupamento de dados relacionados Biomassa Aprendizado de máquina Análises de agrupamento CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
Cluster Analysis Artificial Intelligence Biomass Machine Learning Inteligência artificial Agrupamento de dados relacionados Biomassa Aprendizado de máquina Análises de agrupamento CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
Este estudo aborda o problema de classificação de dados de biomassa. Um dos objetivos é identificar as variáveis de maior relevância para classificar o tipo de pirólise de biomassa. Além disso, avaliar se as classes dos tipos de pirólise são suficientes para caracterizar este processo químico. O algoritmo de Floresta Aleatória foi aplicado para identificar quais variáveis são relevantes no processo de classificação do tipo pirólise, obtendo uma exatidão em torno de 97%. Foi identificado que as variáveis mais importantes são: Tempo de residência médio no reator para o gás e de arraste, Porcentagem de carbono em base seca livre de cinza na matéria-prima, Tamanho da partícula média no reator e Porcentagem de hidrogênio em base seca livre de cinza na matéria-prima. Os seguintes métodos de agrupamentos foram usados com as variáveis de maior relevância encontradas: k-means, pam, clara, diana, fanny, hierárquico, som, sota e model. Para avaliar os métodos de agrupamentos, foram usadas as medidas de validação interna com as métricas de índice de Dunn e silhueta. As medidas de validação indicaram o agrupamento hierárquico e k-means com os melhores resultados para número de grupos maior do que o número de classes de pirólise já existentes. Assim, o conjunto de dados pode ser dividido em um número maior de tipos de pirólise, levando em consideração à conclusão que apenas as classes disponíveis são muito limitadas para caracterizar os tipos de pirólise, uma vez que os algoritmos de classificação não supervisionados indicam o número de agrupamentos como maior ou igual a cinco. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-10-20T14:20:43Z 2023-03-24 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
SOUZA, Sabrinna Rodrigues de Oliveira de. Métodos de inteligência artificial aplicados em dados de biomassa para a caracterização dos diferentes tipos de pirólise. 2023. 77 f. Dissertação (Mestrado em Ciências Computacionais) - Instituto de Matemática e Estatística, Universidade do Estado do Rio de Janeiro, Rio de Janeiro, 2023. http://www.bdtd.uerj.br/handle/1/20485 |
identifier_str_mv |
SOUZA, Sabrinna Rodrigues de Oliveira de. Métodos de inteligência artificial aplicados em dados de biomassa para a caracterização dos diferentes tipos de pirólise. 2023. 77 f. Dissertação (Mestrado em Ciências Computacionais) - Instituto de Matemática e Estatística, Universidade do Estado do Rio de Janeiro, Rio de Janeiro, 2023. |
url |
http://www.bdtd.uerj.br/handle/1/20485 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade do Estado do Rio de Janeiro Centro de Tecnologia e Ciências::Instituto de Matemática e Estatística Brasil UERJ Programa de Pós-Graduação em Ciências Computacionais |
publisher.none.fl_str_mv |
Universidade do Estado do Rio de Janeiro Centro de Tecnologia e Ciências::Instituto de Matemática e Estatística Brasil UERJ Programa de Pós-Graduação em Ciências Computacionais |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UERJ instname:Universidade do Estado do Rio de Janeiro (UERJ) instacron:UERJ |
instname_str |
Universidade do Estado do Rio de Janeiro (UERJ) |
instacron_str |
UERJ |
institution |
UERJ |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UERJ |
collection |
Biblioteca Digital de Teses e Dissertações da UERJ |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UERJ - Universidade do Estado do Rio de Janeiro (UERJ) |
repository.mail.fl_str_mv |
bdtd.suporte@uerj.br |
_version_ |
1818990689942241280 |