Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas

Detalhes bibliográficos
Autor(a) principal: Silva, Rodney
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/19103
Resumo: One of the goals of Medicinal Chemistry is to discover new molecules with drug-like characteristics, which is challenging because the search space is discrete, unstructured, and enormous. In recent years, computation has been used as an auxiliary tool in chemical research, and one of the fields of computer science that has gained visibility and applied in various areas of knowledge in recent years is Machine Learning. The field of Machine Learning can be divided into several areas of study. In this research, two fields of Machine Learning are addressed: Constructive Machine Learning and Hierarchical Multi-label Classification. This work explores how Constructive Machine Learning can learn the intrinsic rules of molecule databases and generate instances with similar characteristics to these. The chosen Constructive Machine Learning methods for the study can be divided into two types, those that use the SMILES molecular representation and the methods that use graphs to represent molecules. Considering the different possibilities for evaluating methods and generated molecules, this work proposes the use of hierarchical classification in the evaluation process. Using a hierarchical classifier previously trained on molecule datasets, the generated molecules are classified into a taxonomy. In this way, the relevance of the generated molecules to existing taxonomies can be verified. This work also proposes a measure of dissimilarity between two groups of molecules, the hierarchical distance, which takes into account the taxonomy of the molecules present in these groups to determine the dissimilarity between them.
id SCAR_75f9739bcf4061afc6ee2714c019f82f
oai_identifier_str oai:repositorio.ufscar.br:ufscar/19103
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Silva, RodneyCerri, Ricardohttp://lattes.cnpq.br/6266519868438512http://lattes.cnpq.br/80415905431179122024-01-16T14:34:40Z2024-01-16T14:34:40Z2023-02-09SILVA, Rodney. Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/19103.https://repositorio.ufscar.br/handle/ufscar/19103One of the goals of Medicinal Chemistry is to discover new molecules with drug-like characteristics, which is challenging because the search space is discrete, unstructured, and enormous. In recent years, computation has been used as an auxiliary tool in chemical research, and one of the fields of computer science that has gained visibility and applied in various areas of knowledge in recent years is Machine Learning. The field of Machine Learning can be divided into several areas of study. In this research, two fields of Machine Learning are addressed: Constructive Machine Learning and Hierarchical Multi-label Classification. This work explores how Constructive Machine Learning can learn the intrinsic rules of molecule databases and generate instances with similar characteristics to these. The chosen Constructive Machine Learning methods for the study can be divided into two types, those that use the SMILES molecular representation and the methods that use graphs to represent molecules. Considering the different possibilities for evaluating methods and generated molecules, this work proposes the use of hierarchical classification in the evaluation process. Using a hierarchical classifier previously trained on molecule datasets, the generated molecules are classified into a taxonomy. In this way, the relevance of the generated molecules to existing taxonomies can be verified. This work also proposes a measure of dissimilarity between two groups of molecules, the hierarchical distance, which takes into account the taxonomy of the molecules present in these groups to determine the dissimilarity between them.Um dos objetivos da Química Medicinal é descobrir novas moléculas com características de fármacos, o que é desafiador, pois o espaço de busca é discreto, não estruturado e enorme. Nos últimos anos, a computação tem sido usada como ferramenta auxiliar na pesquisa química, e um dos campos da ciência da computação que ganhou visibilidade e foi aplicado em diversas áreas do conhecimento nos últimos anos é o Aprendizado de Máquina. O campo de Aprendizado de Máquina pode ser dividido em várias áreas de estudo. Nesta pesquisa, são abordados dois campos de Aprendizado de Máquina: Aprendizado de Máquina Construtivo e Classificação Hierárquica Multirrótulo. Este trabalho explora como o Aprendizado de Máquina Construtivo pode aprender as regras intrínsecas dos bancos de dados de moléculas e gerar instâncias com características semelhantes a essas. Os métodos de Aprendizado de Máquina Construtivo escolhidos para o estudo podem ser divididos em dois tipos: aqueles que usam a representação molecular SMILES e aqueles que usam grafos para representar moléculas. Considerando as diferentes possibilidades de avaliar os métodos e as moléculas geradas, este trabalho propõe o uso de classificação hierárquica no processo de avaliação. Usando um classificador hierárquico previamente treinado em conjuntos de dados de moléculas, as moléculas geradas são classificadas em uma taxonomia. Dessa forma, a relevância das moléculas geradas para as taxonomias existentes pode ser verificada. Este trabalho também propõe uma medida de dissimilaridade entre dois grupos de moléculas, a distância hierárquica, que leva em consideração a taxonomia das moléculas presentes nesses grupos para determinar a dissimilaridade entre eles.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)porUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessAprendizado de máquinaAprendizado de máquina construtivoClassificação hierárquicaCriação de drogasCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOAprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculasConstructive machine learning and hierarchical multi-label classification for molecules designinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDefesa_Mestrado_Rodney.pdfDefesa_Mestrado_Rodney.pdfapplication/pdf1633759https://repositorio.ufscar.br/bitstream/ufscar/19103/1/Defesa_Mestrado_Rodney.pdfbd960ef034202d131e2d6bc4a1996151MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8913https://repositorio.ufscar.br/bitstream/ufscar/19103/2/license_rdf3185b4de2190c2d366d1d324db01f8b8MD52TEXTDefesa_Mestrado_Rodney.pdf.txtDefesa_Mestrado_Rodney.pdf.txtExtracted texttext/plain101718https://repositorio.ufscar.br/bitstream/ufscar/19103/3/Defesa_Mestrado_Rodney.pdf.txtc71e704ea37d891d82fdf97762fe2158MD53ufscar/191032024-05-14 17:14:45.316oai:repositorio.ufscar.br:ufscar/19103Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222024-05-14T17:14:45Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas
dc.title.alternative.eng.fl_str_mv Constructive machine learning and hierarchical multi-label classification for molecules design
title Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas
spellingShingle Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas
Silva, Rodney
Aprendizado de máquina
Aprendizado de máquina construtivo
Classificação hierárquica
Criação de drogas
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
title_short Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas
title_full Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas
title_fullStr Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas
title_full_unstemmed Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas
title_sort Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas
author Silva, Rodney
author_facet Silva, Rodney
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/8041590543117912
dc.contributor.author.fl_str_mv Silva, Rodney
dc.contributor.advisor1.fl_str_mv Cerri, Ricardo
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6266519868438512
contributor_str_mv Cerri, Ricardo
dc.subject.por.fl_str_mv Aprendizado de máquina
Aprendizado de máquina construtivo
Classificação hierárquica
Criação de drogas
topic Aprendizado de máquina
Aprendizado de máquina construtivo
Classificação hierárquica
Criação de drogas
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
description One of the goals of Medicinal Chemistry is to discover new molecules with drug-like characteristics, which is challenging because the search space is discrete, unstructured, and enormous. In recent years, computation has been used as an auxiliary tool in chemical research, and one of the fields of computer science that has gained visibility and applied in various areas of knowledge in recent years is Machine Learning. The field of Machine Learning can be divided into several areas of study. In this research, two fields of Machine Learning are addressed: Constructive Machine Learning and Hierarchical Multi-label Classification. This work explores how Constructive Machine Learning can learn the intrinsic rules of molecule databases and generate instances with similar characteristics to these. The chosen Constructive Machine Learning methods for the study can be divided into two types, those that use the SMILES molecular representation and the methods that use graphs to represent molecules. Considering the different possibilities for evaluating methods and generated molecules, this work proposes the use of hierarchical classification in the evaluation process. Using a hierarchical classifier previously trained on molecule datasets, the generated molecules are classified into a taxonomy. In this way, the relevance of the generated molecules to existing taxonomies can be verified. This work also proposes a measure of dissimilarity between two groups of molecules, the hierarchical distance, which takes into account the taxonomy of the molecules present in these groups to determine the dissimilarity between them.
publishDate 2023
dc.date.issued.fl_str_mv 2023-02-09
dc.date.accessioned.fl_str_mv 2024-01-16T14:34:40Z
dc.date.available.fl_str_mv 2024-01-16T14:34:40Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Rodney. Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/19103.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/19103
identifier_str_mv SILVA, Rodney. Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/19103.
url https://repositorio.ufscar.br/handle/ufscar/19103
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/19103/1/Defesa_Mestrado_Rodney.pdf
https://repositorio.ufscar.br/bitstream/ufscar/19103/2/license_rdf
https://repositorio.ufscar.br/bitstream/ufscar/19103/3/Defesa_Mestrado_Rodney.pdf.txt
bitstream.checksum.fl_str_mv bd960ef034202d131e2d6bc4a1996151
3185b4de2190c2d366d1d324db01f8b8
c71e704ea37d891d82fdf97762fe2158
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1813715671198990336