Análise de técnicas de agrupamentos para classificação de sementes de soja
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/28585 |
Resumo: | Considerado o principal produto da agricultura brasileira, a soja é o quarto grão mais cultivado no mundo e sua produção tende a aumentar. Devido a este grande mercado, a garantia de qualidade do produto torna-se um fator indispensável para empresas que querem se manter competitivas. Maneiras de validar a qualidade e adquirir informações sobre o plantio são os testes de vigor, como o teste de tetrazólio que traz informações de danos ocasionados por umidade, percevejo ou dano mecânico. Entretanto, a verificação do tipo de dano e sua gravidade são realizadas, uma a uma e, visualmente por um analista, ou seja, além de um processo demorado é suscetível ao erro, visto que é um trabalho maçante e cansativo. Propostas envolvendo diferentes abordagens de aprendizado supervisionado, incluindo estratégias de aprendizado ativo, já foram utilizadas e trouxeram resultados significativos. Dessa forma, o objetivo deste trabalho é analisar o desempenho de técnicas não supervisionadas para a classificação de sementes de soja. Para tanto, foi realizada uma avaliação experimental extensiva, considerando (9) diferentes algoritmos de agrupamento (entre eles particionais, hierárquicos e baseados em densidade) aplicadas a (5) conjuntos de imagens de sementes de soja submetidas ao teste de tetrazólio, incluindo diferentes danos e/ou seus respectivos níveis. Para a descrição de tais imagens foram considerados (18) extratores de características tradicionais. Para validação foram consideradas (4) métricas (acurácia, FOWLKES, DAVIES e CALINSKI) e duas técnicas de redução de dimensionalidade (PCA e TSNE). A partir dos resultados obtidos, pode-se observar que o presente trabalho apresenta contribuições significativas, dado que possibilita identificar os descritores e algoritmos de agrupamento a serem utilizados como pré-processamento em outras abordagens de aprendizado, acelerando e melhorando o processo de classificação. |
id |
UTFPR-12_8e6b5eda4690a55a035b1f09023c738c |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/28585 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2022-05-18T23:46:06Z2022-05-18T23:46:06Z2020-09-01OLIVEIRA, Eduardo Rodrigo de. Análise de técnicas de agrupamentos para classificação de sementes de soja. 2020. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020.http://repositorio.utfpr.edu.br/jspui/handle/1/28585Considerado o principal produto da agricultura brasileira, a soja é o quarto grão mais cultivado no mundo e sua produção tende a aumentar. Devido a este grande mercado, a garantia de qualidade do produto torna-se um fator indispensável para empresas que querem se manter competitivas. Maneiras de validar a qualidade e adquirir informações sobre o plantio são os testes de vigor, como o teste de tetrazólio que traz informações de danos ocasionados por umidade, percevejo ou dano mecânico. Entretanto, a verificação do tipo de dano e sua gravidade são realizadas, uma a uma e, visualmente por um analista, ou seja, além de um processo demorado é suscetível ao erro, visto que é um trabalho maçante e cansativo. Propostas envolvendo diferentes abordagens de aprendizado supervisionado, incluindo estratégias de aprendizado ativo, já foram utilizadas e trouxeram resultados significativos. Dessa forma, o objetivo deste trabalho é analisar o desempenho de técnicas não supervisionadas para a classificação de sementes de soja. Para tanto, foi realizada uma avaliação experimental extensiva, considerando (9) diferentes algoritmos de agrupamento (entre eles particionais, hierárquicos e baseados em densidade) aplicadas a (5) conjuntos de imagens de sementes de soja submetidas ao teste de tetrazólio, incluindo diferentes danos e/ou seus respectivos níveis. Para a descrição de tais imagens foram considerados (18) extratores de características tradicionais. Para validação foram consideradas (4) métricas (acurácia, FOWLKES, DAVIES e CALINSKI) e duas técnicas de redução de dimensionalidade (PCA e TSNE). A partir dos resultados obtidos, pode-se observar que o presente trabalho apresenta contribuições significativas, dado que possibilita identificar os descritores e algoritmos de agrupamento a serem utilizados como pré-processamento em outras abordagens de aprendizado, acelerando e melhorando o processo de classificação.Soy is the main product of Brazilian agriculture and the fourth most cultivated bean in the world. Since the cultivation of soy tends to increase and due to this large market, the guarantee of the product quality is an indispensable factor for enterprises to stay competitive. To acquire information and evaluate the quality of soy planting, industries perform vigor tests. The tetrazolium test, for example, provides information about moisture damage, bedbugs or mechanical damage. However, the verification of the damage reason and its severity are done by an analyst, one by one. Since this is a massive and exhausting work, it is susceptible to mistakes. Proposals involving different supervised learning approaches, including active learning strategies have already been used and brought significant results. Therefore, this paper analyzes the performance of non-supervised techniques for classifying soybeans. An extensive experimental evaluation was realized, considering (9) different clustering algorithms (partitional, hierarchical and density based) applied to (5) image datasets of soybeans seeds submitted to the tetrazolium test, including different damages and/or their levels. To describe those images, (18) extractors of traditional features were considered. (4) metrics (accuracy. FOWLKES, DAVIES, and CALINSKI) and two dimensionality reduction techniques (PCA and TSNE) were considered for validation. Results show that this paper presents important contributions, since it makes it possible to identify descriptors and clustering algorithms that shall be used as pre-processing in other learning processes, accelerating and improving the classification process.porUniversidade Tecnológica Federal do ParanáCornelio ProcopioEngenharia da ComputaçãoUTFPRBrasilCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOSojaAnálise por agrupamentoAprendizado do computadorSoybeanCluster analysisMachine learningAnálise de técnicas de agrupamentos para classificação de sementes de sojainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisCornélio ProcópioSaito, Priscila Tiemi MaedaSaito, Priscila Tiemi MaedaCorrêa, Cléber GimenezBugatti, Pedro HenriqueOliveira, Eduardo Rodrigo deinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALCP_DACOM_2020_1_15.pdfCP_DACOM_2020_1_15.pdfapplication/pdf13446108http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28585/1/CP_DACOM_2020_1_15.pdff74d1ca875e4c2eb66e0cbdb19cf4dd1MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28585/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTCP_DACOM_2020_1_15.pdf.txtCP_DACOM_2020_1_15.pdf.txtExtracted texttext/plain74http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28585/3/CP_DACOM_2020_1_15.pdf.txt4c79757f20643df89842171f60700773MD53THUMBNAILCP_DACOM_2020_1_15.pdf.jpgCP_DACOM_2020_1_15.pdf.jpgGenerated Thumbnailimage/jpeg1333http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28585/4/CP_DACOM_2020_1_15.pdf.jpg54e147f84a646cac566cb34dcd5b8892MD541/285852022-05-19 03:07:59.953oai:repositorio.utfpr.edu.br:1/28585TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2022-05-19T06:07:59Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Análise de técnicas de agrupamentos para classificação de sementes de soja |
title |
Análise de técnicas de agrupamentos para classificação de sementes de soja |
spellingShingle |
Análise de técnicas de agrupamentos para classificação de sementes de soja Oliveira, Eduardo Rodrigo de CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Soja Análise por agrupamento Aprendizado do computador Soybean Cluster analysis Machine learning |
title_short |
Análise de técnicas de agrupamentos para classificação de sementes de soja |
title_full |
Análise de técnicas de agrupamentos para classificação de sementes de soja |
title_fullStr |
Análise de técnicas de agrupamentos para classificação de sementes de soja |
title_full_unstemmed |
Análise de técnicas de agrupamentos para classificação de sementes de soja |
title_sort |
Análise de técnicas de agrupamentos para classificação de sementes de soja |
author |
Oliveira, Eduardo Rodrigo de |
author_facet |
Oliveira, Eduardo Rodrigo de |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Saito, Priscila Tiemi Maeda |
dc.contributor.referee1.fl_str_mv |
Saito, Priscila Tiemi Maeda |
dc.contributor.referee2.fl_str_mv |
Corrêa, Cléber Gimenez |
dc.contributor.referee3.fl_str_mv |
Bugatti, Pedro Henrique |
dc.contributor.author.fl_str_mv |
Oliveira, Eduardo Rodrigo de |
contributor_str_mv |
Saito, Priscila Tiemi Maeda Saito, Priscila Tiemi Maeda Corrêa, Cléber Gimenez Bugatti, Pedro Henrique |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Soja Análise por agrupamento Aprendizado do computador Soybean Cluster analysis Machine learning |
dc.subject.por.fl_str_mv |
Soja Análise por agrupamento Aprendizado do computador Soybean Cluster analysis Machine learning |
description |
Considerado o principal produto da agricultura brasileira, a soja é o quarto grão mais cultivado no mundo e sua produção tende a aumentar. Devido a este grande mercado, a garantia de qualidade do produto torna-se um fator indispensável para empresas que querem se manter competitivas. Maneiras de validar a qualidade e adquirir informações sobre o plantio são os testes de vigor, como o teste de tetrazólio que traz informações de danos ocasionados por umidade, percevejo ou dano mecânico. Entretanto, a verificação do tipo de dano e sua gravidade são realizadas, uma a uma e, visualmente por um analista, ou seja, além de um processo demorado é suscetível ao erro, visto que é um trabalho maçante e cansativo. Propostas envolvendo diferentes abordagens de aprendizado supervisionado, incluindo estratégias de aprendizado ativo, já foram utilizadas e trouxeram resultados significativos. Dessa forma, o objetivo deste trabalho é analisar o desempenho de técnicas não supervisionadas para a classificação de sementes de soja. Para tanto, foi realizada uma avaliação experimental extensiva, considerando (9) diferentes algoritmos de agrupamento (entre eles particionais, hierárquicos e baseados em densidade) aplicadas a (5) conjuntos de imagens de sementes de soja submetidas ao teste de tetrazólio, incluindo diferentes danos e/ou seus respectivos níveis. Para a descrição de tais imagens foram considerados (18) extratores de características tradicionais. Para validação foram consideradas (4) métricas (acurácia, FOWLKES, DAVIES e CALINSKI) e duas técnicas de redução de dimensionalidade (PCA e TSNE). A partir dos resultados obtidos, pode-se observar que o presente trabalho apresenta contribuições significativas, dado que possibilita identificar os descritores e algoritmos de agrupamento a serem utilizados como pré-processamento em outras abordagens de aprendizado, acelerando e melhorando o processo de classificação. |
publishDate |
2020 |
dc.date.issued.fl_str_mv |
2020-09-01 |
dc.date.accessioned.fl_str_mv |
2022-05-18T23:46:06Z |
dc.date.available.fl_str_mv |
2022-05-18T23:46:06Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
OLIVEIRA, Eduardo Rodrigo de. Análise de técnicas de agrupamentos para classificação de sementes de soja. 2020. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/28585 |
identifier_str_mv |
OLIVEIRA, Eduardo Rodrigo de. Análise de técnicas de agrupamentos para classificação de sementes de soja. 2020. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/28585 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio |
dc.publisher.program.fl_str_mv |
Engenharia da Computação |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28585/1/CP_DACOM_2020_1_15.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28585/2/license.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28585/3/CP_DACOM_2020_1_15.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28585/4/CP_DACOM_2020_1_15.pdf.jpg |
bitstream.checksum.fl_str_mv |
f74d1ca875e4c2eb66e0cbdb19cf4dd1 b9d82215ab23456fa2d8b49c5df1b95b 4c79757f20643df89842171f60700773 54e147f84a646cac566cb34dcd5b8892 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1805923060342063104 |