Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/19103 |
Resumo: | One of the goals of Medicinal Chemistry is to discover new molecules with drug-like characteristics, which is challenging because the search space is discrete, unstructured, and enormous. In recent years, computation has been used as an auxiliary tool in chemical research, and one of the fields of computer science that has gained visibility and applied in various areas of knowledge in recent years is Machine Learning. The field of Machine Learning can be divided into several areas of study. In this research, two fields of Machine Learning are addressed: Constructive Machine Learning and Hierarchical Multi-label Classification. This work explores how Constructive Machine Learning can learn the intrinsic rules of molecule databases and generate instances with similar characteristics to these. The chosen Constructive Machine Learning methods for the study can be divided into two types, those that use the SMILES molecular representation and the methods that use graphs to represent molecules. Considering the different possibilities for evaluating methods and generated molecules, this work proposes the use of hierarchical classification in the evaluation process. Using a hierarchical classifier previously trained on molecule datasets, the generated molecules are classified into a taxonomy. In this way, the relevance of the generated molecules to existing taxonomies can be verified. This work also proposes a measure of dissimilarity between two groups of molecules, the hierarchical distance, which takes into account the taxonomy of the molecules present in these groups to determine the dissimilarity between them. |
id |
SCAR_75f9739bcf4061afc6ee2714c019f82f |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/19103 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Silva, RodneyCerri, Ricardohttp://lattes.cnpq.br/6266519868438512http://lattes.cnpq.br/80415905431179122024-01-16T14:34:40Z2024-01-16T14:34:40Z2023-02-09SILVA, Rodney. Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/19103.https://repositorio.ufscar.br/handle/ufscar/19103One of the goals of Medicinal Chemistry is to discover new molecules with drug-like characteristics, which is challenging because the search space is discrete, unstructured, and enormous. In recent years, computation has been used as an auxiliary tool in chemical research, and one of the fields of computer science that has gained visibility and applied in various areas of knowledge in recent years is Machine Learning. The field of Machine Learning can be divided into several areas of study. In this research, two fields of Machine Learning are addressed: Constructive Machine Learning and Hierarchical Multi-label Classification. This work explores how Constructive Machine Learning can learn the intrinsic rules of molecule databases and generate instances with similar characteristics to these. The chosen Constructive Machine Learning methods for the study can be divided into two types, those that use the SMILES molecular representation and the methods that use graphs to represent molecules. Considering the different possibilities for evaluating methods and generated molecules, this work proposes the use of hierarchical classification in the evaluation process. Using a hierarchical classifier previously trained on molecule datasets, the generated molecules are classified into a taxonomy. In this way, the relevance of the generated molecules to existing taxonomies can be verified. This work also proposes a measure of dissimilarity between two groups of molecules, the hierarchical distance, which takes into account the taxonomy of the molecules present in these groups to determine the dissimilarity between them.Um dos objetivos da Química Medicinal é descobrir novas moléculas com características de fármacos, o que é desafiador, pois o espaço de busca é discreto, não estruturado e enorme. Nos últimos anos, a computação tem sido usada como ferramenta auxiliar na pesquisa química, e um dos campos da ciência da computação que ganhou visibilidade e foi aplicado em diversas áreas do conhecimento nos últimos anos é o Aprendizado de Máquina. O campo de Aprendizado de Máquina pode ser dividido em várias áreas de estudo. Nesta pesquisa, são abordados dois campos de Aprendizado de Máquina: Aprendizado de Máquina Construtivo e Classificação Hierárquica Multirrótulo. Este trabalho explora como o Aprendizado de Máquina Construtivo pode aprender as regras intrínsecas dos bancos de dados de moléculas e gerar instâncias com características semelhantes a essas. Os métodos de Aprendizado de Máquina Construtivo escolhidos para o estudo podem ser divididos em dois tipos: aqueles que usam a representação molecular SMILES e aqueles que usam grafos para representar moléculas. Considerando as diferentes possibilidades de avaliar os métodos e as moléculas geradas, este trabalho propõe o uso de classificação hierárquica no processo de avaliação. Usando um classificador hierárquico previamente treinado em conjuntos de dados de moléculas, as moléculas geradas são classificadas em uma taxonomia. Dessa forma, a relevância das moléculas geradas para as taxonomias existentes pode ser verificada. Este trabalho também propõe uma medida de dissimilaridade entre dois grupos de moléculas, a distância hierárquica, que leva em consideração a taxonomia das moléculas presentes nesses grupos para determinar a dissimilaridade entre eles.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)porUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessAprendizado de máquinaAprendizado de máquina construtivoClassificação hierárquicaCriação de drogasCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOAprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculasConstructive machine learning and hierarchical multi-label classification for molecules designinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDefesa_Mestrado_Rodney.pdfDefesa_Mestrado_Rodney.pdfapplication/pdf1633759https://repositorio.ufscar.br/bitstream/ufscar/19103/1/Defesa_Mestrado_Rodney.pdfbd960ef034202d131e2d6bc4a1996151MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8913https://repositorio.ufscar.br/bitstream/ufscar/19103/2/license_rdf3185b4de2190c2d366d1d324db01f8b8MD52TEXTDefesa_Mestrado_Rodney.pdf.txtDefesa_Mestrado_Rodney.pdf.txtExtracted texttext/plain101718https://repositorio.ufscar.br/bitstream/ufscar/19103/3/Defesa_Mestrado_Rodney.pdf.txtc71e704ea37d891d82fdf97762fe2158MD53ufscar/191032024-05-14 17:14:45.316oai:repositorio.ufscar.br:ufscar/19103Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222024-05-14T17:14:45Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas |
dc.title.alternative.eng.fl_str_mv |
Constructive machine learning and hierarchical multi-label classification for molecules design |
title |
Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas |
spellingShingle |
Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas Silva, Rodney Aprendizado de máquina Aprendizado de máquina construtivo Classificação hierárquica Criação de drogas CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
title_short |
Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas |
title_full |
Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas |
title_fullStr |
Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas |
title_full_unstemmed |
Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas |
title_sort |
Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas |
author |
Silva, Rodney |
author_facet |
Silva, Rodney |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/8041590543117912 |
dc.contributor.author.fl_str_mv |
Silva, Rodney |
dc.contributor.advisor1.fl_str_mv |
Cerri, Ricardo |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/6266519868438512 |
contributor_str_mv |
Cerri, Ricardo |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Aprendizado de máquina construtivo Classificação hierárquica Criação de drogas |
topic |
Aprendizado de máquina Aprendizado de máquina construtivo Classificação hierárquica Criação de drogas CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
description |
One of the goals of Medicinal Chemistry is to discover new molecules with drug-like characteristics, which is challenging because the search space is discrete, unstructured, and enormous. In recent years, computation has been used as an auxiliary tool in chemical research, and one of the fields of computer science that has gained visibility and applied in various areas of knowledge in recent years is Machine Learning. The field of Machine Learning can be divided into several areas of study. In this research, two fields of Machine Learning are addressed: Constructive Machine Learning and Hierarchical Multi-label Classification. This work explores how Constructive Machine Learning can learn the intrinsic rules of molecule databases and generate instances with similar characteristics to these. The chosen Constructive Machine Learning methods for the study can be divided into two types, those that use the SMILES molecular representation and the methods that use graphs to represent molecules. Considering the different possibilities for evaluating methods and generated molecules, this work proposes the use of hierarchical classification in the evaluation process. Using a hierarchical classifier previously trained on molecule datasets, the generated molecules are classified into a taxonomy. In this way, the relevance of the generated molecules to existing taxonomies can be verified. This work also proposes a measure of dissimilarity between two groups of molecules, the hierarchical distance, which takes into account the taxonomy of the molecules present in these groups to determine the dissimilarity between them. |
publishDate |
2023 |
dc.date.issued.fl_str_mv |
2023-02-09 |
dc.date.accessioned.fl_str_mv |
2024-01-16T14:34:40Z |
dc.date.available.fl_str_mv |
2024-01-16T14:34:40Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SILVA, Rodney. Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/19103. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/19103 |
identifier_str_mv |
SILVA, Rodney. Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/19103. |
url |
https://repositorio.ufscar.br/handle/ufscar/19103 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC |
dc.publisher.initials.fl_str_mv |
UFSCar |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/19103/1/Defesa_Mestrado_Rodney.pdf https://repositorio.ufscar.br/bitstream/ufscar/19103/2/license_rdf https://repositorio.ufscar.br/bitstream/ufscar/19103/3/Defesa_Mestrado_Rodney.pdf.txt |
bitstream.checksum.fl_str_mv |
bd960ef034202d131e2d6bc4a1996151 3185b4de2190c2d366d1d324db01f8b8 c71e704ea37d891d82fdf97762fe2158 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1813715671198990336 |