Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia

Detalhes bibliográficos
Autor(a) principal: Bezerra, Rafael dos Santos
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/17/17153/tde-04102021-161934/
Resumo: Com a chegada de novas tecnologias de sequenciamento, como as de segunda e terceira geração, o tempo e custo das análises reduziram drasticamente enquanto a obtenção de dados aumentou significativamente. Desta maneira, ampliou-se a utilização dessas novas metodologias possibilitando diversas aplicações. Dentre essas aplicações podemos destacar a metagenômica. A metagenômica consiste na obtenção do material genético de todos os organismos presentes em uma única amostra, seja ela ambiental ou clínica. O viroma é uma área da metagenômica em que o foco são os vírus encontrados nestas amostras. Dentre as possíveis aplicações da análise do viroma está a identificação de vírus emergentes e re-emergentes com impacto na área de hemoterapia. Para isso aplicamos técnicas de identificação do viroma em bolsas de sangue com Doença Pós-Doação (DPD) relatada pelo doador (geralmente sintomas relacionados a infecção) febre, exantema, conjuntivite, dores retro orbitais, artralgia, mialgia, diarreia, vômitos, enjôo) e amostras de doações de sangue obtidas de doadores positivos para infecções rotineiramente triadas nos bancos de sangue da região norte (Macapá, Amapá) e sul do país (Santa Maria, Rio Grande do Sul). Para isso foi implementada uma pipeline bioinformática de alto rendimento para identificação de vírus emergentes e re- emergentes. A implementação foi realizada em BASH script, DOCKER (containers) e alguns PERL scripts desenvolvidos inhouse. Dentre os principais passos executados podemos citar o controle de qualidade das sequências com o software FastQC, limpeza das sequências de baixa qualidade e caudas poli-x com Trimmomatic e AfterQC, montagem dos genomas com o software SPAdes e finalmente classificação taxonômicas das sequências com Kraken2 e Diamond. As análises filodinâmicas dos vírus encontrados e com genoma recuperado foram feitas através dos softwares IQ-TREE e do pacote BEAST. Dentre nossos resultados das amostras com DPD de Ribeirão Preto podemos destacar o primeiro relato do vírus da Influenza A (H2N3) em amostras de plasma de doadores de sangue. Assim como também identificamos o vírus da Dengue e Parvovírus B19 (todos sem testagem obrigatória). Interessantemente em amostras provenientes da região norte do país encontramos o pouco conhecido Gemykibivírus humano-2, um vírus relacionado a quadros clínicos graves e coinfecções com HIV. Outro achado interessante nestas amostras foi o Merkell cell poliomavírus com genoma completo recuperado (o que pode indicar um estado viremico). No Brasil, até então não foram desenvolvidos estudos abrangentes sobre infecções emergentes com impacto na transfusão de sangue e a sua ameaça real para os processos hemoterápicos é subestimada e pouco conhecida. Porém há alguns desafios neste âmbito a serem superados, dentre eles podemos citar as análises bioinformáticas dos dados gerados, que demanda muitas vezes altos recursos computacionais e mão de obra especializada. Portanto, este estudo visa investigar o impacto das viroses emergentes e não suspeitas na área da hemoterapia utilizando sequenciamento de última geração e a implementação de um pipeline bioinformática eficiente para análise do viroma.
id USP_d9e16dc70ba205b7149d077ac59e9cdb
oai_identifier_str oai:teses.usp.br:tde-04102021-161934
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapiaApplication of bioinformatics methods to identify viral infections with impact on hemotherapyBioinformatics pipelineDoença pós-doaçãoDPDEmerging virusesHemoterapiaHemotherapyMetagenômicaMetagenomicsNGSPDDRPipeline bioinformáticaPostdonation disease reportsReemerging virusesSNGViromaViromaVírus emergentesVírus reemergentesCom a chegada de novas tecnologias de sequenciamento, como as de segunda e terceira geração, o tempo e custo das análises reduziram drasticamente enquanto a obtenção de dados aumentou significativamente. Desta maneira, ampliou-se a utilização dessas novas metodologias possibilitando diversas aplicações. Dentre essas aplicações podemos destacar a metagenômica. A metagenômica consiste na obtenção do material genético de todos os organismos presentes em uma única amostra, seja ela ambiental ou clínica. O viroma é uma área da metagenômica em que o foco são os vírus encontrados nestas amostras. Dentre as possíveis aplicações da análise do viroma está a identificação de vírus emergentes e re-emergentes com impacto na área de hemoterapia. Para isso aplicamos técnicas de identificação do viroma em bolsas de sangue com Doença Pós-Doação (DPD) relatada pelo doador (geralmente sintomas relacionados a infecção) febre, exantema, conjuntivite, dores retro orbitais, artralgia, mialgia, diarreia, vômitos, enjôo) e amostras de doações de sangue obtidas de doadores positivos para infecções rotineiramente triadas nos bancos de sangue da região norte (Macapá, Amapá) e sul do país (Santa Maria, Rio Grande do Sul). Para isso foi implementada uma pipeline bioinformática de alto rendimento para identificação de vírus emergentes e re- emergentes. A implementação foi realizada em BASH script, DOCKER (containers) e alguns PERL scripts desenvolvidos inhouse. Dentre os principais passos executados podemos citar o controle de qualidade das sequências com o software FastQC, limpeza das sequências de baixa qualidade e caudas poli-x com Trimmomatic e AfterQC, montagem dos genomas com o software SPAdes e finalmente classificação taxonômicas das sequências com Kraken2 e Diamond. As análises filodinâmicas dos vírus encontrados e com genoma recuperado foram feitas através dos softwares IQ-TREE e do pacote BEAST. Dentre nossos resultados das amostras com DPD de Ribeirão Preto podemos destacar o primeiro relato do vírus da Influenza A (H2N3) em amostras de plasma de doadores de sangue. Assim como também identificamos o vírus da Dengue e Parvovírus B19 (todos sem testagem obrigatória). Interessantemente em amostras provenientes da região norte do país encontramos o pouco conhecido Gemykibivírus humano-2, um vírus relacionado a quadros clínicos graves e coinfecções com HIV. Outro achado interessante nestas amostras foi o Merkell cell poliomavírus com genoma completo recuperado (o que pode indicar um estado viremico). No Brasil, até então não foram desenvolvidos estudos abrangentes sobre infecções emergentes com impacto na transfusão de sangue e a sua ameaça real para os processos hemoterápicos é subestimada e pouco conhecida. Porém há alguns desafios neste âmbito a serem superados, dentre eles podemos citar as análises bioinformáticas dos dados gerados, que demanda muitas vezes altos recursos computacionais e mão de obra especializada. Portanto, este estudo visa investigar o impacto das viroses emergentes e não suspeitas na área da hemoterapia utilizando sequenciamento de última geração e a implementação de um pipeline bioinformática eficiente para análise do viroma.With the introduction in the laboratory practice of new sequencing technologies, like second and third generation techniques, the time and cost of the sequencing has drastically reduced while the generated data has increased significantly. In this way, the field of application of these new techniques has expanded incliding analysis of the microbial communities of clinical and environmental samples known as metagenomics. Virome is an important area of metagenomics where the focus is concentrated on the viruses found in these samples. Among the possible applications of virome analysis is the identification of emerging and re-emerging viruses which can impact the area of hemotherapy. To investigate these agents, we applied virome techniques in blood units obtained from donors who related with Post-Donation Disease Reports (PDDR) (including symptoms like fever, rash, conjunctivitis, retro-orbital pain, arthralgia, myalgia, diarrhea, vomiting, and nausea among others). We also applied viral metagenomics to blood donations obtained from high-risk blood donors from Northern and Southern Brazil. To do this, a high-performance bioinformatics pipeline was implemented to identify emerging and re- emerging viruses. The implementation was carried out in BASH script, DOCKER (containers) and in-house developed PERL scripts. The main stages of the pipeline include quality control of the sequences with the FastQC software, cleaning of low-quality sequences and poly-x tails by Trimmomatic and AfterQC, genome assembly by SPAdes software and finally sequence taxonomy using Kraken2 and Diamond. The phylodynamic analyzes of the most important viruses found were performed using the IQ-TREE software and the BEAST package. Among our results from PDDR samples we can highlight the first report in the literature of the Influenza A virus (H2N3) in plasma samples from blood donors. We also identified the dengue virus and Parvovirus B19 (both not included in the route testing of the blood collection services). Interestingly, in samples from North Brazil, we identified in high-risk blood donors the scarcely studied studied Human Gemykibivirus-2, which has already been related to severe clinical conditions and HIV co-infections. Another interesting finding in these samples was the Merkell cell polyomavirus with high sequence numbers (which may indicate a viremic state). In Brazil, comprehensive studies on infections which can impact transfusion safety have not been performed and the real impact of the emerging viruses on the hemotherapy processes is underestimated and little known. However, some challenges in this area must be overcame, and among them we can mention the bioinformatics analysis of the generated data, which often requires high computational resources and specialized labor. Therefore, our study examines in extensive manner the impact of emerging viruses in the area of hemotherapy using the newest sequencing generation and implementing an efficient bioinformatics pipeline for virome analysis.Biblioteca Digitais de Teses e Dissertações da USPSlavov, Svetoslav NanevBezerra, Rafael dos Santos2021-07-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/17/17153/tde-04102021-161934/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2021-11-19T19:13:02Zoai:teses.usp.br:tde-04102021-161934Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212021-11-19T19:13:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia
Application of bioinformatics methods to identify viral infections with impact on hemotherapy
title Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia
spellingShingle Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia
Bezerra, Rafael dos Santos
Bioinformatics pipeline
Doença pós-doação
DPD
Emerging viruses
Hemoterapia
Hemotherapy
Metagenômica
Metagenomics
NGS
PDDR
Pipeline bioinformática
Postdonation disease reports
Reemerging viruses
SNG
Viroma
Viroma
Vírus emergentes
Vírus reemergentes
title_short Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia
title_full Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia
title_fullStr Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia
title_full_unstemmed Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia
title_sort Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia
author Bezerra, Rafael dos Santos
author_facet Bezerra, Rafael dos Santos
author_role author
dc.contributor.none.fl_str_mv Slavov, Svetoslav Nanev
dc.contributor.author.fl_str_mv Bezerra, Rafael dos Santos
dc.subject.por.fl_str_mv Bioinformatics pipeline
Doença pós-doação
DPD
Emerging viruses
Hemoterapia
Hemotherapy
Metagenômica
Metagenomics
NGS
PDDR
Pipeline bioinformática
Postdonation disease reports
Reemerging viruses
SNG
Viroma
Viroma
Vírus emergentes
Vírus reemergentes
topic Bioinformatics pipeline
Doença pós-doação
DPD
Emerging viruses
Hemoterapia
Hemotherapy
Metagenômica
Metagenomics
NGS
PDDR
Pipeline bioinformática
Postdonation disease reports
Reemerging viruses
SNG
Viroma
Viroma
Vírus emergentes
Vírus reemergentes
description Com a chegada de novas tecnologias de sequenciamento, como as de segunda e terceira geração, o tempo e custo das análises reduziram drasticamente enquanto a obtenção de dados aumentou significativamente. Desta maneira, ampliou-se a utilização dessas novas metodologias possibilitando diversas aplicações. Dentre essas aplicações podemos destacar a metagenômica. A metagenômica consiste na obtenção do material genético de todos os organismos presentes em uma única amostra, seja ela ambiental ou clínica. O viroma é uma área da metagenômica em que o foco são os vírus encontrados nestas amostras. Dentre as possíveis aplicações da análise do viroma está a identificação de vírus emergentes e re-emergentes com impacto na área de hemoterapia. Para isso aplicamos técnicas de identificação do viroma em bolsas de sangue com Doença Pós-Doação (DPD) relatada pelo doador (geralmente sintomas relacionados a infecção) febre, exantema, conjuntivite, dores retro orbitais, artralgia, mialgia, diarreia, vômitos, enjôo) e amostras de doações de sangue obtidas de doadores positivos para infecções rotineiramente triadas nos bancos de sangue da região norte (Macapá, Amapá) e sul do país (Santa Maria, Rio Grande do Sul). Para isso foi implementada uma pipeline bioinformática de alto rendimento para identificação de vírus emergentes e re- emergentes. A implementação foi realizada em BASH script, DOCKER (containers) e alguns PERL scripts desenvolvidos inhouse. Dentre os principais passos executados podemos citar o controle de qualidade das sequências com o software FastQC, limpeza das sequências de baixa qualidade e caudas poli-x com Trimmomatic e AfterQC, montagem dos genomas com o software SPAdes e finalmente classificação taxonômicas das sequências com Kraken2 e Diamond. As análises filodinâmicas dos vírus encontrados e com genoma recuperado foram feitas através dos softwares IQ-TREE e do pacote BEAST. Dentre nossos resultados das amostras com DPD de Ribeirão Preto podemos destacar o primeiro relato do vírus da Influenza A (H2N3) em amostras de plasma de doadores de sangue. Assim como também identificamos o vírus da Dengue e Parvovírus B19 (todos sem testagem obrigatória). Interessantemente em amostras provenientes da região norte do país encontramos o pouco conhecido Gemykibivírus humano-2, um vírus relacionado a quadros clínicos graves e coinfecções com HIV. Outro achado interessante nestas amostras foi o Merkell cell poliomavírus com genoma completo recuperado (o que pode indicar um estado viremico). No Brasil, até então não foram desenvolvidos estudos abrangentes sobre infecções emergentes com impacto na transfusão de sangue e a sua ameaça real para os processos hemoterápicos é subestimada e pouco conhecida. Porém há alguns desafios neste âmbito a serem superados, dentre eles podemos citar as análises bioinformáticas dos dados gerados, que demanda muitas vezes altos recursos computacionais e mão de obra especializada. Portanto, este estudo visa investigar o impacto das viroses emergentes e não suspeitas na área da hemoterapia utilizando sequenciamento de última geração e a implementação de um pipeline bioinformática eficiente para análise do viroma.
publishDate 2021
dc.date.none.fl_str_mv 2021-07-16
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/17/17153/tde-04102021-161934/
url https://www.teses.usp.br/teses/disponiveis/17/17153/tde-04102021-161934/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815256674400731136