Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica

Detalhes bibliográficos
Autor(a) principal: Dantas, Juliana Arantes
Data de Publicação: 2023
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/18840
Resumo: The approach of statistical methods capable of accurately predicting the relationship between structure and reactivity represents a major impact on the development of reactions. Recently, machine learning tools have been guided and applied in synthesis design. In the context of the work described here, these methods provide rapid information and relevant estimates about the structure and respective activity of substrates that are summarized in structural descriptors that influence the desired activity. Here we list the main results obtained in the development and use of substrate parameterization in new methodologies. In the context of nucleopalladation reactions, we highlight Wacker-type reactions that employ carbonylation reactions of non-activated double bonds by CO capture in a palladium- catalyzed process. We present two new methodologies, one of them to obtain pyrazoline ester derivatives tolerant to different substitutions in strategic positions of the starting material as demonstrated by the scoping study. As well, a new methodology for obtaining pyrazolines with a ketone moiety using boronic acids which allowed access to structural diversity ketone derivatives not previously described guided by a virtual library of boronic acids. Analysis of the electronic and steric factors into the reactivity was fundamental for understanding the nucleophilicity necessary for boronic acids in the transmetalation step. In sequence, we report our efforts to integrate data science and computational chemistry tools to guide, predict and explain the reactivity of persistent radicals generated in the reduction of cyano-arenes in the electrophilic cross-coupling between cyano(hetero)arenes and alkyl halides. The selection of substrates was made from the construction of a virtual library of cyanoarenes via projection of the chemical space by UMAP based on the dimensionality reduction of DFT level physicochemical parameters, ensuring structural diversity in relation to the chemical space. A predictive univariate model could be generated by correlating an electronic parameter with yield.
id SCAR_259d30c11d21e224516c3beaa1dae507
oai_identifier_str oai:repositorio.ufscar.br:ufscar/18840
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Dantas, Juliana ArantesFerreira, Marco Antonio Barbosahttp://lattes.cnpq.br/6874055640224407https://lattes.cnpq.br/3791522544686206https://orcid.org/0000-0003-2473-4167https://orcid.org/0000-0002-4954-6691c8dc87e1-b2af-4ec9-a65f-62a67b205e132023-10-30T13:12:55Z2023-10-30T13:12:55Z2023-10-06DANTAS, Juliana Arantes. Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica. 2023. Tese (Doutorado em Química) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/18840.https://repositorio.ufscar.br/handle/ufscar/18840The approach of statistical methods capable of accurately predicting the relationship between structure and reactivity represents a major impact on the development of reactions. Recently, machine learning tools have been guided and applied in synthesis design. In the context of the work described here, these methods provide rapid information and relevant estimates about the structure and respective activity of substrates that are summarized in structural descriptors that influence the desired activity. Here we list the main results obtained in the development and use of substrate parameterization in new methodologies. In the context of nucleopalladation reactions, we highlight Wacker-type reactions that employ carbonylation reactions of non-activated double bonds by CO capture in a palladium- catalyzed process. We present two new methodologies, one of them to obtain pyrazoline ester derivatives tolerant to different substitutions in strategic positions of the starting material as demonstrated by the scoping study. As well, a new methodology for obtaining pyrazolines with a ketone moiety using boronic acids which allowed access to structural diversity ketone derivatives not previously described guided by a virtual library of boronic acids. Analysis of the electronic and steric factors into the reactivity was fundamental for understanding the nucleophilicity necessary for boronic acids in the transmetalation step. In sequence, we report our efforts to integrate data science and computational chemistry tools to guide, predict and explain the reactivity of persistent radicals generated in the reduction of cyano-arenes in the electrophilic cross-coupling between cyano(hetero)arenes and alkyl halides. The selection of substrates was made from the construction of a virtual library of cyanoarenes via projection of the chemical space by UMAP based on the dimensionality reduction of DFT level physicochemical parameters, ensuring structural diversity in relation to the chemical space. A predictive univariate model could be generated by correlating an electronic parameter with yield.A abordagem de métodos estatísticos capazes de prever com precisão a relação entre estrutura e a reatividade representa um grande impacto no desenvolvimento de reações. Recentemente, métodos de aprendizado de máquina têm sido designados e aplicados para o planejamento de caminhos sintéticos. No contexto dos trabalhos descritos, esses métodos fornecem informações rápidas e estimativas relevantes sobre a estrutura e respectiva atividade de substratos que são resumidamente identificadas em descritores estruturais que influenciam na alta reatividade. Nesse sentido, no presente trabalho apresentam-se os principais resultados obtidos no desenvolvimento e uso da parametrização de substratos na criação de novas metodologias. No contexto de reações de nucleopaladação, destacam-se as reações do tipo Wacker que empregam reações de carbonilação de ligações duplas não ativadas por captura de CO em um processo catalisado por paládio. Duas novas metodologias são apresentadas, uma delas para obter derivados pirazolina com uma porção éster tolerante a diferentes substituições em posições estratégicas do material de partida conforme demonstrado pelo estudo de escopo. Assim como, uma nova metodologia para obtenção de pirazolinas com uma porção cetona ao se utilizar ácidos borônicos permitindo o acesso a uma gama estrutural diversificada não descrita anteriormente para derivados cetona. Análises univariadas de multivariada da reatividade via métodos estatísticos dos fatores eletrônicos e estéricos foi fundamental para o entendimento da nucleofilicidade necessária para os ácidos borônicos na etapa de transmetalação. Em sequência, relata-se os esforços para integrar ferramentas de ciência de dados e química computacional para orientar, prever e explicar a reatividade dos radicais persistentes gerados na redução de ciano-arenos na metodologia desenvolvida para acoplamento cruzado eletrofílico entre ciano(hetero)arenos e haletos de alquila. A seleção de substratos foi feita a partir da construção de uma biblioteca virtual de cianoarenos via projeção do espaço químico a partir de técnicas de redução de dimensionalidade dos parâmetros físico-químicos a nível DFT, garantindo diversidade estrutural. Um modelo univariado preditivo pôde ser gerado correlacionando um parâmetro eletrônico com rendimento.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Processo nº 88882.332787/2019-01, Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)porUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Química - PPGQUFSCarAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessSíntese orgânicaCatálise por paládioRegressão linear univariada/multivariadaPCAUMAPPirazolinaCarbonilaçãoAcoplamento cruzado convencionalAcoplamento cruzado entre eletrófilosHaletos de alquila terciáriosCianopiridinaÁrvore de decisaoÁcido borônicoAprendizado de máquinaCiência de dadosMachine learningDecision treeCyanopyridineTertiary alkyl halidesPyrazolinesOrganic synthesisPalladium catalystMultivariate/univariate linear regressionCarbonylationCross couplingCross-electrophile couplingBoronic acidData scienceCIENCIAS EXATAS E DA TERRA::QUIMICA::QUIMICA ORGANICA::SINTESE ORGANICADesenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálicaDevelopment of new C-C and/or C-N coupling methodologies: merging data science and metal catalysisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis60060031144104-e78d-4438-831f-39dae3ba73cdreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALTese_Juliana_Arantes_Dantas.pdfTese_Juliana_Arantes_Dantas.pdfapplication/pdf35210357https://repositorio.ufscar.br/bitstream/ufscar/18840/4/Tese_Juliana_Arantes_Dantas.pdf6c819edc3d07fff080df8d33966c5a49MD54CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8913https://repositorio.ufscar.br/bitstream/ufscar/18840/5/license_rdf3185b4de2190c2d366d1d324db01f8b8MD55TEXTTese_Juliana_Arantes_Dantas.pdf.txtTese_Juliana_Arantes_Dantas.pdf.txtExtracted texttext/plain386511https://repositorio.ufscar.br/bitstream/ufscar/18840/6/Tese_Juliana_Arantes_Dantas.pdf.txt80adbb62ffd54c2545d1223968761e36MD56ufscar/188402024-05-14 17:18:52.612oai:repositorio.ufscar.br:ufscar/18840Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222024-05-14T17:18:52Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica
dc.title.alternative.eng.fl_str_mv Development of new C-C and/or C-N coupling methodologies: merging data science and metal catalysis
title Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica
spellingShingle Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica
Dantas, Juliana Arantes
Síntese orgânica
Catálise por paládio
Regressão linear univariada/multivariada
PCA
UMAP
Pirazolina
Carbonilação
Acoplamento cruzado convencional
Acoplamento cruzado entre eletrófilos
Haletos de alquila terciários
Cianopiridina
Árvore de decisao
Ácido borônico
Aprendizado de máquina
Ciência de dados
Machine learning
Decision tree
Cyanopyridine
Tertiary alkyl halides
Pyrazolines
Organic synthesis
Palladium catalyst
Multivariate/univariate linear regression
Carbonylation
Cross coupling
Cross-electrophile coupling
Boronic acid
Data science
CIENCIAS EXATAS E DA TERRA::QUIMICA::QUIMICA ORGANICA::SINTESE ORGANICA
title_short Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica
title_full Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica
title_fullStr Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica
title_full_unstemmed Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica
title_sort Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica
author Dantas, Juliana Arantes
author_facet Dantas, Juliana Arantes
author_role author
dc.contributor.authorlattes.por.fl_str_mv https://lattes.cnpq.br/3791522544686206
dc.contributor.authororcid.por.fl_str_mv https://orcid.org/0000-0003-2473-4167
dc.contributor.advisor1orcid.por.fl_str_mv https://orcid.org/0000-0002-4954-6691
dc.contributor.author.fl_str_mv Dantas, Juliana Arantes
dc.contributor.advisor1.fl_str_mv Ferreira, Marco Antonio Barbosa
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6874055640224407
dc.contributor.authorID.fl_str_mv c8dc87e1-b2af-4ec9-a65f-62a67b205e13
contributor_str_mv Ferreira, Marco Antonio Barbosa
dc.subject.por.fl_str_mv Síntese orgânica
Catálise por paládio
Regressão linear univariada/multivariada
PCA
UMAP
Pirazolina
Carbonilação
Acoplamento cruzado convencional
Acoplamento cruzado entre eletrófilos
Haletos de alquila terciários
Cianopiridina
Árvore de decisao
Ácido borônico
Aprendizado de máquina
Ciência de dados
topic Síntese orgânica
Catálise por paládio
Regressão linear univariada/multivariada
PCA
UMAP
Pirazolina
Carbonilação
Acoplamento cruzado convencional
Acoplamento cruzado entre eletrófilos
Haletos de alquila terciários
Cianopiridina
Árvore de decisao
Ácido borônico
Aprendizado de máquina
Ciência de dados
Machine learning
Decision tree
Cyanopyridine
Tertiary alkyl halides
Pyrazolines
Organic synthesis
Palladium catalyst
Multivariate/univariate linear regression
Carbonylation
Cross coupling
Cross-electrophile coupling
Boronic acid
Data science
CIENCIAS EXATAS E DA TERRA::QUIMICA::QUIMICA ORGANICA::SINTESE ORGANICA
dc.subject.eng.fl_str_mv Machine learning
Decision tree
Cyanopyridine
Tertiary alkyl halides
Pyrazolines
Organic synthesis
Palladium catalyst
Multivariate/univariate linear regression
Carbonylation
Cross coupling
Cross-electrophile coupling
Boronic acid
Data science
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::QUIMICA::QUIMICA ORGANICA::SINTESE ORGANICA
description The approach of statistical methods capable of accurately predicting the relationship between structure and reactivity represents a major impact on the development of reactions. Recently, machine learning tools have been guided and applied in synthesis design. In the context of the work described here, these methods provide rapid information and relevant estimates about the structure and respective activity of substrates that are summarized in structural descriptors that influence the desired activity. Here we list the main results obtained in the development and use of substrate parameterization in new methodologies. In the context of nucleopalladation reactions, we highlight Wacker-type reactions that employ carbonylation reactions of non-activated double bonds by CO capture in a palladium- catalyzed process. We present two new methodologies, one of them to obtain pyrazoline ester derivatives tolerant to different substitutions in strategic positions of the starting material as demonstrated by the scoping study. As well, a new methodology for obtaining pyrazolines with a ketone moiety using boronic acids which allowed access to structural diversity ketone derivatives not previously described guided by a virtual library of boronic acids. Analysis of the electronic and steric factors into the reactivity was fundamental for understanding the nucleophilicity necessary for boronic acids in the transmetalation step. In sequence, we report our efforts to integrate data science and computational chemistry tools to guide, predict and explain the reactivity of persistent radicals generated in the reduction of cyano-arenes in the electrophilic cross-coupling between cyano(hetero)arenes and alkyl halides. The selection of substrates was made from the construction of a virtual library of cyanoarenes via projection of the chemical space by UMAP based on the dimensionality reduction of DFT level physicochemical parameters, ensuring structural diversity in relation to the chemical space. A predictive univariate model could be generated by correlating an electronic parameter with yield.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-10-30T13:12:55Z
dc.date.available.fl_str_mv 2023-10-30T13:12:55Z
dc.date.issued.fl_str_mv 2023-10-06
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv DANTAS, Juliana Arantes. Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica. 2023. Tese (Doutorado em Química) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/18840.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/18840
identifier_str_mv DANTAS, Juliana Arantes. Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica. 2023. Tese (Doutorado em Química) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/18840.
url https://repositorio.ufscar.br/handle/ufscar/18840
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv 600
600
dc.relation.authority.fl_str_mv 31144104-e78d-4438-831f-39dae3ba73cd
dc.rights.driver.fl_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Química - PPGQ
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/18840/4/Tese_Juliana_Arantes_Dantas.pdf
https://repositorio.ufscar.br/bitstream/ufscar/18840/5/license_rdf
https://repositorio.ufscar.br/bitstream/ufscar/18840/6/Tese_Juliana_Arantes_Dantas.pdf.txt
bitstream.checksum.fl_str_mv 6c819edc3d07fff080df8d33966c5a49
3185b4de2190c2d366d1d324db01f8b8
80adbb62ffd54c2545d1223968761e36
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1813715671018635264