Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/18840 |
Resumo: | The approach of statistical methods capable of accurately predicting the relationship between structure and reactivity represents a major impact on the development of reactions. Recently, machine learning tools have been guided and applied in synthesis design. In the context of the work described here, these methods provide rapid information and relevant estimates about the structure and respective activity of substrates that are summarized in structural descriptors that influence the desired activity. Here we list the main results obtained in the development and use of substrate parameterization in new methodologies. In the context of nucleopalladation reactions, we highlight Wacker-type reactions that employ carbonylation reactions of non-activated double bonds by CO capture in a palladium- catalyzed process. We present two new methodologies, one of them to obtain pyrazoline ester derivatives tolerant to different substitutions in strategic positions of the starting material as demonstrated by the scoping study. As well, a new methodology for obtaining pyrazolines with a ketone moiety using boronic acids which allowed access to structural diversity ketone derivatives not previously described guided by a virtual library of boronic acids. Analysis of the electronic and steric factors into the reactivity was fundamental for understanding the nucleophilicity necessary for boronic acids in the transmetalation step. In sequence, we report our efforts to integrate data science and computational chemistry tools to guide, predict and explain the reactivity of persistent radicals generated in the reduction of cyano-arenes in the electrophilic cross-coupling between cyano(hetero)arenes and alkyl halides. The selection of substrates was made from the construction of a virtual library of cyanoarenes via projection of the chemical space by UMAP based on the dimensionality reduction of DFT level physicochemical parameters, ensuring structural diversity in relation to the chemical space. A predictive univariate model could be generated by correlating an electronic parameter with yield. |
id |
SCAR_259d30c11d21e224516c3beaa1dae507 |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/18840 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Dantas, Juliana ArantesFerreira, Marco Antonio Barbosahttp://lattes.cnpq.br/6874055640224407https://lattes.cnpq.br/3791522544686206https://orcid.org/0000-0003-2473-4167https://orcid.org/0000-0002-4954-6691c8dc87e1-b2af-4ec9-a65f-62a67b205e132023-10-30T13:12:55Z2023-10-30T13:12:55Z2023-10-06DANTAS, Juliana Arantes. Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica. 2023. Tese (Doutorado em Química) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/18840.https://repositorio.ufscar.br/handle/ufscar/18840The approach of statistical methods capable of accurately predicting the relationship between structure and reactivity represents a major impact on the development of reactions. Recently, machine learning tools have been guided and applied in synthesis design. In the context of the work described here, these methods provide rapid information and relevant estimates about the structure and respective activity of substrates that are summarized in structural descriptors that influence the desired activity. Here we list the main results obtained in the development and use of substrate parameterization in new methodologies. In the context of nucleopalladation reactions, we highlight Wacker-type reactions that employ carbonylation reactions of non-activated double bonds by CO capture in a palladium- catalyzed process. We present two new methodologies, one of them to obtain pyrazoline ester derivatives tolerant to different substitutions in strategic positions of the starting material as demonstrated by the scoping study. As well, a new methodology for obtaining pyrazolines with a ketone moiety using boronic acids which allowed access to structural diversity ketone derivatives not previously described guided by a virtual library of boronic acids. Analysis of the electronic and steric factors into the reactivity was fundamental for understanding the nucleophilicity necessary for boronic acids in the transmetalation step. In sequence, we report our efforts to integrate data science and computational chemistry tools to guide, predict and explain the reactivity of persistent radicals generated in the reduction of cyano-arenes in the electrophilic cross-coupling between cyano(hetero)arenes and alkyl halides. The selection of substrates was made from the construction of a virtual library of cyanoarenes via projection of the chemical space by UMAP based on the dimensionality reduction of DFT level physicochemical parameters, ensuring structural diversity in relation to the chemical space. A predictive univariate model could be generated by correlating an electronic parameter with yield.A abordagem de métodos estatísticos capazes de prever com precisão a relação entre estrutura e a reatividade representa um grande impacto no desenvolvimento de reações. Recentemente, métodos de aprendizado de máquina têm sido designados e aplicados para o planejamento de caminhos sintéticos. No contexto dos trabalhos descritos, esses métodos fornecem informações rápidas e estimativas relevantes sobre a estrutura e respectiva atividade de substratos que são resumidamente identificadas em descritores estruturais que influenciam na alta reatividade. Nesse sentido, no presente trabalho apresentam-se os principais resultados obtidos no desenvolvimento e uso da parametrização de substratos na criação de novas metodologias. No contexto de reações de nucleopaladação, destacam-se as reações do tipo Wacker que empregam reações de carbonilação de ligações duplas não ativadas por captura de CO em um processo catalisado por paládio. Duas novas metodologias são apresentadas, uma delas para obter derivados pirazolina com uma porção éster tolerante a diferentes substituições em posições estratégicas do material de partida conforme demonstrado pelo estudo de escopo. Assim como, uma nova metodologia para obtenção de pirazolinas com uma porção cetona ao se utilizar ácidos borônicos permitindo o acesso a uma gama estrutural diversificada não descrita anteriormente para derivados cetona. Análises univariadas de multivariada da reatividade via métodos estatísticos dos fatores eletrônicos e estéricos foi fundamental para o entendimento da nucleofilicidade necessária para os ácidos borônicos na etapa de transmetalação. Em sequência, relata-se os esforços para integrar ferramentas de ciência de dados e química computacional para orientar, prever e explicar a reatividade dos radicais persistentes gerados na redução de ciano-arenos na metodologia desenvolvida para acoplamento cruzado eletrofílico entre ciano(hetero)arenos e haletos de alquila. A seleção de substratos foi feita a partir da construção de uma biblioteca virtual de cianoarenos via projeção do espaço químico a partir de técnicas de redução de dimensionalidade dos parâmetros físico-químicos a nível DFT, garantindo diversidade estrutural. Um modelo univariado preditivo pôde ser gerado correlacionando um parâmetro eletrônico com rendimento.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Processo nº 88882.332787/2019-01, Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)porUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Química - PPGQUFSCarAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessSíntese orgânicaCatálise por paládioRegressão linear univariada/multivariadaPCAUMAPPirazolinaCarbonilaçãoAcoplamento cruzado convencionalAcoplamento cruzado entre eletrófilosHaletos de alquila terciáriosCianopiridinaÁrvore de decisaoÁcido borônicoAprendizado de máquinaCiência de dadosMachine learningDecision treeCyanopyridineTertiary alkyl halidesPyrazolinesOrganic synthesisPalladium catalystMultivariate/univariate linear regressionCarbonylationCross couplingCross-electrophile couplingBoronic acidData scienceCIENCIAS EXATAS E DA TERRA::QUIMICA::QUIMICA ORGANICA::SINTESE ORGANICADesenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálicaDevelopment of new C-C and/or C-N coupling methodologies: merging data science and metal catalysisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis60060031144104-e78d-4438-831f-39dae3ba73cdreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALTese_Juliana_Arantes_Dantas.pdfTese_Juliana_Arantes_Dantas.pdfapplication/pdf35210357https://repositorio.ufscar.br/bitstream/ufscar/18840/4/Tese_Juliana_Arantes_Dantas.pdf6c819edc3d07fff080df8d33966c5a49MD54CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8913https://repositorio.ufscar.br/bitstream/ufscar/18840/5/license_rdf3185b4de2190c2d366d1d324db01f8b8MD55TEXTTese_Juliana_Arantes_Dantas.pdf.txtTese_Juliana_Arantes_Dantas.pdf.txtExtracted texttext/plain386511https://repositorio.ufscar.br/bitstream/ufscar/18840/6/Tese_Juliana_Arantes_Dantas.pdf.txt80adbb62ffd54c2545d1223968761e36MD56ufscar/188402024-05-14 17:18:52.612oai:repositorio.ufscar.br:ufscar/18840Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222024-05-14T17:18:52Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica |
dc.title.alternative.eng.fl_str_mv |
Development of new C-C and/or C-N coupling methodologies: merging data science and metal catalysis |
title |
Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica |
spellingShingle |
Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica Dantas, Juliana Arantes Síntese orgânica Catálise por paládio Regressão linear univariada/multivariada PCA UMAP Pirazolina Carbonilação Acoplamento cruzado convencional Acoplamento cruzado entre eletrófilos Haletos de alquila terciários Cianopiridina Árvore de decisao Ácido borônico Aprendizado de máquina Ciência de dados Machine learning Decision tree Cyanopyridine Tertiary alkyl halides Pyrazolines Organic synthesis Palladium catalyst Multivariate/univariate linear regression Carbonylation Cross coupling Cross-electrophile coupling Boronic acid Data science CIENCIAS EXATAS E DA TERRA::QUIMICA::QUIMICA ORGANICA::SINTESE ORGANICA |
title_short |
Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica |
title_full |
Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica |
title_fullStr |
Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica |
title_full_unstemmed |
Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica |
title_sort |
Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica |
author |
Dantas, Juliana Arantes |
author_facet |
Dantas, Juliana Arantes |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
https://lattes.cnpq.br/3791522544686206 |
dc.contributor.authororcid.por.fl_str_mv |
https://orcid.org/0000-0003-2473-4167 |
dc.contributor.advisor1orcid.por.fl_str_mv |
https://orcid.org/0000-0002-4954-6691 |
dc.contributor.author.fl_str_mv |
Dantas, Juliana Arantes |
dc.contributor.advisor1.fl_str_mv |
Ferreira, Marco Antonio Barbosa |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/6874055640224407 |
dc.contributor.authorID.fl_str_mv |
c8dc87e1-b2af-4ec9-a65f-62a67b205e13 |
contributor_str_mv |
Ferreira, Marco Antonio Barbosa |
dc.subject.por.fl_str_mv |
Síntese orgânica Catálise por paládio Regressão linear univariada/multivariada PCA UMAP Pirazolina Carbonilação Acoplamento cruzado convencional Acoplamento cruzado entre eletrófilos Haletos de alquila terciários Cianopiridina Árvore de decisao Ácido borônico Aprendizado de máquina Ciência de dados |
topic |
Síntese orgânica Catálise por paládio Regressão linear univariada/multivariada PCA UMAP Pirazolina Carbonilação Acoplamento cruzado convencional Acoplamento cruzado entre eletrófilos Haletos de alquila terciários Cianopiridina Árvore de decisao Ácido borônico Aprendizado de máquina Ciência de dados Machine learning Decision tree Cyanopyridine Tertiary alkyl halides Pyrazolines Organic synthesis Palladium catalyst Multivariate/univariate linear regression Carbonylation Cross coupling Cross-electrophile coupling Boronic acid Data science CIENCIAS EXATAS E DA TERRA::QUIMICA::QUIMICA ORGANICA::SINTESE ORGANICA |
dc.subject.eng.fl_str_mv |
Machine learning Decision tree Cyanopyridine Tertiary alkyl halides Pyrazolines Organic synthesis Palladium catalyst Multivariate/univariate linear regression Carbonylation Cross coupling Cross-electrophile coupling Boronic acid Data science |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::QUIMICA::QUIMICA ORGANICA::SINTESE ORGANICA |
description |
The approach of statistical methods capable of accurately predicting the relationship between structure and reactivity represents a major impact on the development of reactions. Recently, machine learning tools have been guided and applied in synthesis design. In the context of the work described here, these methods provide rapid information and relevant estimates about the structure and respective activity of substrates that are summarized in structural descriptors that influence the desired activity. Here we list the main results obtained in the development and use of substrate parameterization in new methodologies. In the context of nucleopalladation reactions, we highlight Wacker-type reactions that employ carbonylation reactions of non-activated double bonds by CO capture in a palladium- catalyzed process. We present two new methodologies, one of them to obtain pyrazoline ester derivatives tolerant to different substitutions in strategic positions of the starting material as demonstrated by the scoping study. As well, a new methodology for obtaining pyrazolines with a ketone moiety using boronic acids which allowed access to structural diversity ketone derivatives not previously described guided by a virtual library of boronic acids. Analysis of the electronic and steric factors into the reactivity was fundamental for understanding the nucleophilicity necessary for boronic acids in the transmetalation step. In sequence, we report our efforts to integrate data science and computational chemistry tools to guide, predict and explain the reactivity of persistent radicals generated in the reduction of cyano-arenes in the electrophilic cross-coupling between cyano(hetero)arenes and alkyl halides. The selection of substrates was made from the construction of a virtual library of cyanoarenes via projection of the chemical space by UMAP based on the dimensionality reduction of DFT level physicochemical parameters, ensuring structural diversity in relation to the chemical space. A predictive univariate model could be generated by correlating an electronic parameter with yield. |
publishDate |
2023 |
dc.date.accessioned.fl_str_mv |
2023-10-30T13:12:55Z |
dc.date.available.fl_str_mv |
2023-10-30T13:12:55Z |
dc.date.issued.fl_str_mv |
2023-10-06 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
DANTAS, Juliana Arantes. Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica. 2023. Tese (Doutorado em Química) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/18840. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/18840 |
identifier_str_mv |
DANTAS, Juliana Arantes. Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica. 2023. Tese (Doutorado em Química) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/18840. |
url |
https://repositorio.ufscar.br/handle/ufscar/18840 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
600 600 |
dc.relation.authority.fl_str_mv |
31144104-e78d-4438-831f-39dae3ba73cd |
dc.rights.driver.fl_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Química - PPGQ |
dc.publisher.initials.fl_str_mv |
UFSCar |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/18840/4/Tese_Juliana_Arantes_Dantas.pdf https://repositorio.ufscar.br/bitstream/ufscar/18840/5/license_rdf https://repositorio.ufscar.br/bitstream/ufscar/18840/6/Tese_Juliana_Arantes_Dantas.pdf.txt |
bitstream.checksum.fl_str_mv |
6c819edc3d07fff080df8d33966c5a49 3185b4de2190c2d366d1d324db01f8b8 80adbb62ffd54c2545d1223968761e36 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1813715671018635264 |