Análise de técnicas de agrupamentos para classificação de sementes de soja

Detalhes bibliográficos
Autor(a) principal: Oliveira, Eduardo Rodrigo de
Data de Publicação: 2020
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/28585
Resumo: Considerado o principal produto da agricultura brasileira, a soja é o quarto grão mais cultivado no mundo e sua produção tende a aumentar. Devido a este grande mercado, a garantia de qualidade do produto torna-se um fator indispensável para empresas que querem se manter competitivas. Maneiras de validar a qualidade e adquirir informações sobre o plantio são os testes de vigor, como o teste de tetrazólio que traz informações de danos ocasionados por umidade, percevejo ou dano mecânico. Entretanto, a verificação do tipo de dano e sua gravidade são realizadas, uma a uma e, visualmente por um analista, ou seja, além de um processo demorado é suscetível ao erro, visto que é um trabalho maçante e cansativo. Propostas envolvendo diferentes abordagens de aprendizado supervisionado, incluindo estratégias de aprendizado ativo, já foram utilizadas e trouxeram resultados significativos. Dessa forma, o objetivo deste trabalho é analisar o desempenho de técnicas não supervisionadas para a classificação de sementes de soja. Para tanto, foi realizada uma avaliação experimental extensiva, considerando (9) diferentes algoritmos de agrupamento (entre eles particionais, hierárquicos e baseados em densidade) aplicadas a (5) conjuntos de imagens de sementes de soja submetidas ao teste de tetrazólio, incluindo diferentes danos e/ou seus respectivos níveis. Para a descrição de tais imagens foram considerados (18) extratores de características tradicionais. Para validação foram consideradas (4) métricas (acurácia, FOWLKES, DAVIES e CALINSKI) e duas técnicas de redução de dimensionalidade (PCA e TSNE). A partir dos resultados obtidos, pode-se observar que o presente trabalho apresenta contribuições significativas, dado que possibilita identificar os descritores e algoritmos de agrupamento a serem utilizados como pré-processamento em outras abordagens de aprendizado, acelerando e melhorando o processo de classificação.
id UTFPR-12_8e6b5eda4690a55a035b1f09023c738c
oai_identifier_str oai:repositorio.utfpr.edu.br:1/28585
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2022-05-18T23:46:06Z2022-05-18T23:46:06Z2020-09-01OLIVEIRA, Eduardo Rodrigo de. Análise de técnicas de agrupamentos para classificação de sementes de soja. 2020. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020.http://repositorio.utfpr.edu.br/jspui/handle/1/28585Considerado o principal produto da agricultura brasileira, a soja é o quarto grão mais cultivado no mundo e sua produção tende a aumentar. Devido a este grande mercado, a garantia de qualidade do produto torna-se um fator indispensável para empresas que querem se manter competitivas. Maneiras de validar a qualidade e adquirir informações sobre o plantio são os testes de vigor, como o teste de tetrazólio que traz informações de danos ocasionados por umidade, percevejo ou dano mecânico. Entretanto, a verificação do tipo de dano e sua gravidade são realizadas, uma a uma e, visualmente por um analista, ou seja, além de um processo demorado é suscetível ao erro, visto que é um trabalho maçante e cansativo. Propostas envolvendo diferentes abordagens de aprendizado supervisionado, incluindo estratégias de aprendizado ativo, já foram utilizadas e trouxeram resultados significativos. Dessa forma, o objetivo deste trabalho é analisar o desempenho de técnicas não supervisionadas para a classificação de sementes de soja. Para tanto, foi realizada uma avaliação experimental extensiva, considerando (9) diferentes algoritmos de agrupamento (entre eles particionais, hierárquicos e baseados em densidade) aplicadas a (5) conjuntos de imagens de sementes de soja submetidas ao teste de tetrazólio, incluindo diferentes danos e/ou seus respectivos níveis. Para a descrição de tais imagens foram considerados (18) extratores de características tradicionais. Para validação foram consideradas (4) métricas (acurácia, FOWLKES, DAVIES e CALINSKI) e duas técnicas de redução de dimensionalidade (PCA e TSNE). A partir dos resultados obtidos, pode-se observar que o presente trabalho apresenta contribuições significativas, dado que possibilita identificar os descritores e algoritmos de agrupamento a serem utilizados como pré-processamento em outras abordagens de aprendizado, acelerando e melhorando o processo de classificação.Soy is the main product of Brazilian agriculture and the fourth most cultivated bean in the world. Since the cultivation of soy tends to increase and due to this large market, the guarantee of the product quality is an indispensable factor for enterprises to stay competitive. To acquire information and evaluate the quality of soy planting, industries perform vigor tests. The tetrazolium test, for example, provides information about moisture damage, bedbugs or mechanical damage. However, the verification of the damage reason and its severity are done by an analyst, one by one. Since this is a massive and exhausting work, it is susceptible to mistakes. Proposals involving different supervised learning approaches, including active learning strategies have already been used and brought significant results. Therefore, this paper analyzes the performance of non-supervised techniques for classifying soybeans. An extensive experimental evaluation was realized, considering (9) different clustering algorithms (partitional, hierarchical and density based) applied to (5) image datasets of soybeans seeds submitted to the tetrazolium test, including different damages and/or their levels. To describe those images, (18) extractors of traditional features were considered. (4) metrics (accuracy. FOWLKES, DAVIES, and CALINSKI) and two dimensionality reduction techniques (PCA and TSNE) were considered for validation. Results show that this paper presents important contributions, since it makes it possible to identify descriptors and clustering algorithms that shall be used as pre-processing in other learning processes, accelerating and improving the classification process.porUniversidade Tecnológica Federal do ParanáCornelio ProcopioEngenharia da ComputaçãoUTFPRBrasilCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOSojaAnálise por agrupamentoAprendizado do computadorSoybeanCluster analysisMachine learningAnálise de técnicas de agrupamentos para classificação de sementes de sojainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisCornélio ProcópioSaito, Priscila Tiemi MaedaSaito, Priscila Tiemi MaedaCorrêa, Cléber GimenezBugatti, Pedro HenriqueOliveira, Eduardo Rodrigo deinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALCP_DACOM_2020_1_15.pdfCP_DACOM_2020_1_15.pdfapplication/pdf13446108http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28585/1/CP_DACOM_2020_1_15.pdff74d1ca875e4c2eb66e0cbdb19cf4dd1MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28585/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTCP_DACOM_2020_1_15.pdf.txtCP_DACOM_2020_1_15.pdf.txtExtracted texttext/plain74http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28585/3/CP_DACOM_2020_1_15.pdf.txt4c79757f20643df89842171f60700773MD53THUMBNAILCP_DACOM_2020_1_15.pdf.jpgCP_DACOM_2020_1_15.pdf.jpgGenerated Thumbnailimage/jpeg1333http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28585/4/CP_DACOM_2020_1_15.pdf.jpg54e147f84a646cac566cb34dcd5b8892MD541/285852022-05-19 03:07:59.953oai:repositorio.utfpr.edu.br:1/28585TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2022-05-19T06:07:59Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Análise de técnicas de agrupamentos para classificação de sementes de soja
title Análise de técnicas de agrupamentos para classificação de sementes de soja
spellingShingle Análise de técnicas de agrupamentos para classificação de sementes de soja
Oliveira, Eduardo Rodrigo de
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Soja
Análise por agrupamento
Aprendizado do computador
Soybean
Cluster analysis
Machine learning
title_short Análise de técnicas de agrupamentos para classificação de sementes de soja
title_full Análise de técnicas de agrupamentos para classificação de sementes de soja
title_fullStr Análise de técnicas de agrupamentos para classificação de sementes de soja
title_full_unstemmed Análise de técnicas de agrupamentos para classificação de sementes de soja
title_sort Análise de técnicas de agrupamentos para classificação de sementes de soja
author Oliveira, Eduardo Rodrigo de
author_facet Oliveira, Eduardo Rodrigo de
author_role author
dc.contributor.advisor1.fl_str_mv Saito, Priscila Tiemi Maeda
dc.contributor.referee1.fl_str_mv Saito, Priscila Tiemi Maeda
dc.contributor.referee2.fl_str_mv Corrêa, Cléber Gimenez
dc.contributor.referee3.fl_str_mv Bugatti, Pedro Henrique
dc.contributor.author.fl_str_mv Oliveira, Eduardo Rodrigo de
contributor_str_mv Saito, Priscila Tiemi Maeda
Saito, Priscila Tiemi Maeda
Corrêa, Cléber Gimenez
Bugatti, Pedro Henrique
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Soja
Análise por agrupamento
Aprendizado do computador
Soybean
Cluster analysis
Machine learning
dc.subject.por.fl_str_mv Soja
Análise por agrupamento
Aprendizado do computador
Soybean
Cluster analysis
Machine learning
description Considerado o principal produto da agricultura brasileira, a soja é o quarto grão mais cultivado no mundo e sua produção tende a aumentar. Devido a este grande mercado, a garantia de qualidade do produto torna-se um fator indispensável para empresas que querem se manter competitivas. Maneiras de validar a qualidade e adquirir informações sobre o plantio são os testes de vigor, como o teste de tetrazólio que traz informações de danos ocasionados por umidade, percevejo ou dano mecânico. Entretanto, a verificação do tipo de dano e sua gravidade são realizadas, uma a uma e, visualmente por um analista, ou seja, além de um processo demorado é suscetível ao erro, visto que é um trabalho maçante e cansativo. Propostas envolvendo diferentes abordagens de aprendizado supervisionado, incluindo estratégias de aprendizado ativo, já foram utilizadas e trouxeram resultados significativos. Dessa forma, o objetivo deste trabalho é analisar o desempenho de técnicas não supervisionadas para a classificação de sementes de soja. Para tanto, foi realizada uma avaliação experimental extensiva, considerando (9) diferentes algoritmos de agrupamento (entre eles particionais, hierárquicos e baseados em densidade) aplicadas a (5) conjuntos de imagens de sementes de soja submetidas ao teste de tetrazólio, incluindo diferentes danos e/ou seus respectivos níveis. Para a descrição de tais imagens foram considerados (18) extratores de características tradicionais. Para validação foram consideradas (4) métricas (acurácia, FOWLKES, DAVIES e CALINSKI) e duas técnicas de redução de dimensionalidade (PCA e TSNE). A partir dos resultados obtidos, pode-se observar que o presente trabalho apresenta contribuições significativas, dado que possibilita identificar os descritores e algoritmos de agrupamento a serem utilizados como pré-processamento em outras abordagens de aprendizado, acelerando e melhorando o processo de classificação.
publishDate 2020
dc.date.issued.fl_str_mv 2020-09-01
dc.date.accessioned.fl_str_mv 2022-05-18T23:46:06Z
dc.date.available.fl_str_mv 2022-05-18T23:46:06Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv OLIVEIRA, Eduardo Rodrigo de. Análise de técnicas de agrupamentos para classificação de sementes de soja. 2020. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/28585
identifier_str_mv OLIVEIRA, Eduardo Rodrigo de. Análise de técnicas de agrupamentos para classificação de sementes de soja. 2020. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020.
url http://repositorio.utfpr.edu.br/jspui/handle/1/28585
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.publisher.program.fl_str_mv Engenharia da Computação
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28585/1/CP_DACOM_2020_1_15.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28585/2/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28585/3/CP_DACOM_2020_1_15.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28585/4/CP_DACOM_2020_1_15.pdf.jpg
bitstream.checksum.fl_str_mv f74d1ca875e4c2eb66e0cbdb19cf4dd1
b9d82215ab23456fa2d8b49c5df1b95b
4c79757f20643df89842171f60700773
54e147f84a646cac566cb34dcd5b8892
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805923060342063104