Plant species identification through leaf venation extraction and CNNs

Detalhes bibliográficos
Autor(a) principal: Cruz, Jorge Miguel Viana da
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/48366
Resumo: Tese de mestrado em Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2020
id RCAP_4e089c7a91afbe39a5436b85d5b33b35
oai_identifier_str oai:repositorio.ul.pt:10451/48366
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Plant species identification through leaf venation extraction and CNNsIdentificação de PlantasNervação da FolhaAprendizagem ProfundaProcessamento de ImagemTeses de mestrado - 2020Domínio/Área Científica::Ciências Naturais::Ciências BiológicasTese de mestrado em Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2020O declínio no número de especialistas em taxonomia de plantas é um problema conhecido. Delegar parte do trabalho de identificação dos taxonomistas a modelos de aprendizagem automática ajudaria a reduzir o trabalho do número, cada vez menor, de profissionais disponível. Este projeto tem como objetivo testar a possibilidade de identificar quatro espécies de plantas diferentes exclusivamente pela nervação das suas folhas. Especificamente, criamos uma rede neuronal convolucional de aprendizagem profunda que tenta aprender como distinguir diferentes espécies com base no conjunto de dados aumentado de folhas diafanizadas disponíveis. Folhas diafanizadas são folhas que foram submetidas a processos específicos (como métodos químicos e/ou raio-X) para permitir visualizar não só as nervuras principais, mas também nervuras menores. Devido à escassez de imagens originais de folhas diafanizadas de cada classe, usamos um conjunto de dados aumentado. Os testes foram executados com diferentes parâmetros para testar a capacidade do modelo de prever a classe correta com precisão, e com outras métricas. O modelo foi testado em imagens não utilizadas anteriormente para se assegurar que as imagens de treino não estavam a ser memorizadas. Os resultados obtidos foram positivos para os parâmetros selecionados nos testes de tentativa e erro: uma precisão média de teste de cerca de 79,3% para o conjunto final de parâmetros. Estes resultados sugerem, como aliás outros estudos já o vêm apontando, que pode ser possível utilizar o padrão de nervação como uma característica para a identificação de plantas, embora mais estudos em larga escala, com mais classes e significativamente mais dados, sejam necessários para obter uma resposta mais confiante para a hipótese.The decline in the number of plant taxonomy experts is a known issue. Delegating part of the identification work of taxonomists to machine learning models would help reduce the workload on the dwindling number of available personnel. This project aims to test the concept of classifying four different species of plants solely by the venation network of its leaves. Specifically, we create a convolutional deep learning neural network that attempts to learn how to distinguish the distinct species based on the available augmented dataset of cleared leaves. Cleared leaves are leaves in which the venation network is rendered visible, by specific chemical processes and/or by other methods such as X-ray. We use an augmented dataset because of the scarcity of images of cleared leaves from each class. Tests were run with different parameters to test the model’s ability to predict the correct class with accuracy, and with other metrics. The model was tested on previously unseen images to ensure that it was not memorizing the training images. The results obtained were positive for the parameters selected through trial and error testing: an average testing accuracy of around 79.3% for the final set of parameters. These results further suggest, as other studies before it, that it might be possible to rely on the venation network as an identifying characteristic for plants, although more large scale studies with more classes and significantly more data are necessary to obtain better support for the hypothesis.Correia, Luís Miguel Parreira e,1959-Duarte, Maria Cristina Reis de LimaRepositório da Universidade de LisboaCruz, Jorge Miguel Viana da2021-06-07T14:27:14Z202020202020-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/48366TID:202596605enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:51:45Zoai:repositorio.ul.pt:10451/48366Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:00:17.170559Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Plant species identification through leaf venation extraction and CNNs
title Plant species identification through leaf venation extraction and CNNs
spellingShingle Plant species identification through leaf venation extraction and CNNs
Cruz, Jorge Miguel Viana da
Identificação de Plantas
Nervação da Folha
Aprendizagem Profunda
Processamento de Imagem
Teses de mestrado - 2020
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
title_short Plant species identification through leaf venation extraction and CNNs
title_full Plant species identification through leaf venation extraction and CNNs
title_fullStr Plant species identification through leaf venation extraction and CNNs
title_full_unstemmed Plant species identification through leaf venation extraction and CNNs
title_sort Plant species identification through leaf venation extraction and CNNs
author Cruz, Jorge Miguel Viana da
author_facet Cruz, Jorge Miguel Viana da
author_role author
dc.contributor.none.fl_str_mv Correia, Luís Miguel Parreira e,1959-
Duarte, Maria Cristina Reis de Lima
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Cruz, Jorge Miguel Viana da
dc.subject.por.fl_str_mv Identificação de Plantas
Nervação da Folha
Aprendizagem Profunda
Processamento de Imagem
Teses de mestrado - 2020
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
topic Identificação de Plantas
Nervação da Folha
Aprendizagem Profunda
Processamento de Imagem
Teses de mestrado - 2020
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
description Tese de mestrado em Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2020
publishDate 2020
dc.date.none.fl_str_mv 2020
2020
2020-01-01T00:00:00Z
2021-06-07T14:27:14Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/48366
TID:202596605
url http://hdl.handle.net/10451/48366
identifier_str_mv TID:202596605
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134549966323712