Use este identificador para citar ou linkar para este item: https://locus.ufv.br//handle/123456789/341
Tipo: Tese
Título: Differential Gene Expression (DGE) by RNA sequencing analysis and development of software for integrating different DGE methods
Título(s) alternativo(s): Expressão Diferencial Gênica (EDG) por sequenciamento de RNA e o desenvolvimento de um sistema que integra esses métodos
Autor(es): Brustolini, Otávio José Bernardes
Primeiro Orientador: Fontes, Elizabeth Pacheco Batista
Primeiro coorientador: Ramos, Humberto Josué de Oliveira
Segundo coorientador: Fietto, Luciano Gomes
Primeiro avaliador: Fietto, Juliana Lopes Rangel
Segundo avaliador: Silva, Fabyano Fonseca e
Terceiro avaliador: Carvalho, Benilton de Sa
Resumo: Begomoviruses (whitefly-transmitted geminiviruses) cause severe diseases of high economic impact on a variety of agriculturally relevant crops in tropical and subtropical areas. Current climate changes are expected to alter more the whitefly distribution along the globe posing a major threat to agriculture worldwide. This is particularly true for the case of tomato plants which are inflicted by a complex population of emergent species of tomato-infecting begomoviruses. Here we uncovered a novel regulatory mechanism of plant cells to fight plant DNA virus infection. By mutating the immune receptor NIK, which is a target of the begomovirus protein NSP, we promoted the activation of an antiviral defense response in tomato, which was effective to confer tolerance to different species of begomoviruses. Our results also shed light on the mechanism underlying the NIK-mediated defense. A comparison of the gain-of- function mutant (T474D)-induced transcriptome with infected WT transcriptome using a combination of four different clustering methods and four different normalization factors provided by the edgeR package revealed that the T474D- induced transcriptome mimicked the infected transcriptome as they clustered together with high confidence and they differ from the normal NIK-induced expression profile. Furthermore, the elimination of the mock T474D DE genes from the raw of all treatments further indicates that the expression profile induced by the T474D mutant mimics greatly the response to the viral infection, as the mock- and infected-induced transcriptomes from each genotype clustered together with high significance. These results indicate that the viral infection was the trigger of the NIK-mediated antiviral response. Furthermore, we employed four different methods for DGE analysis and the enrichment GSEA method to statistically analyze the RNA-seq data, which revealed that ectopic expression of T474D causes a massive down-regulation of the translation-related genes and up-regulatiom of immune system-associated genes. The T474D-mediated down-regulation of translation-related genes was associated with suppression of global protein, decreased viral mRNA loading in viiactively translating polaysomes and enhanced tolerance against begomoviruses. Collectively our data indicate that the NIK-mediated antiviral signaling promotes a defense response by (i) suppressing global translation and (ii) up-regulating immune defense-related genes. The high-volume of RNA sequencing data provided by many high-throughput techniques like the next generation RNA sequencing technology (RNA-seq) is now within reach of any research laboratory and is quickly becoming established as a key research tool in any global gene expression experiments. In a RNA-seq workflow, the reads (short sequence generated by RNA-seq technology) are mapped (aligned) to a reference sequences data sets (transcriptome or genome), a counting table (number of reads per gene) can be set up and, then, a further downstream analysis can be executed to recover the biological meaning of the experiment. Actually, this protocol can be an arduous work for a person who is not an R experienced user. To find out which genes are statistically different in the expression profile among treatments and evaluate the biological meaning though annotation, many R scripts must be created and properly run. The variety of options for differential gene expression (DEG) methodology available on the R/Bioconductor makes this task even more troublesome. Our platform was designed to fill these gaps and make these iterations faster and easier. Yet, it reaches further expectations by allowing the combination of the p-values generated by the DGE methods: edgeR, DESeq2, baySeq and NBPSeq. Inspired on the meta analysis we used a combined p-value calculated by the Fisher's method, weighted Z-test, truncated product method, binomial test or a simple intersection (average or median) for helping the decision of the statistically significative DE genes based on these multiple DEG methods. To accomplish this goal, the friendly interface interacts with a low level R scripts to perform an RNA-Seq analysis without using directly a bunch of scripts. Indeed, by a few steps the analysis will be completely performed. A directory with the project name will be used to save all the generated files and store a SQLite database containing the DE genes with their expression values and annotation. As the program has the goal to be completely free and open to contributions, all the programs methods were designed to be a transparent system to the end user. This platform is completely free.
Abstract: Os begomovirus são geminivirus transmitidos pela mosca branca, e causam severos sintomas em cultivares com um grande impacto econômico na agricultura de regiões tropicais e subtropicais. Com as recentes mudanças climáticas é esperado uma forte alteração na distribuição da mosca branca ao redor do globo, tornando-a uma das mais sérias ameaças à agricultura. No tomateiro este fato ainda é mais preocupante, pois há uma complexa população de espécies emergentes de begomovirus que infectam estas plantas. Neste presente trabalho, nós propomos o estudo de um novo mecanismo regulatório presente em células vegetais que responde a infecção viral. Por meio da mutação no receptor imune NIK, o qual é alvo da proteína viral NSP, nós promovemos a ativação de um mecanismo de resposta antiviral que confere uma tolerância eficaz a diferentes espécies de begomovirus. Os nossos resultados também melhoraram o entendimento sobre o mecanismo de defesa intermediada pelo receptor NIK. Por meio de uma comparação usando quatro técnicas de agrupamentos hierárquico com quatro diferentes normalizadores presente no pacote edgeR, os perfis transcricionais do mutante T474D, que é o receptor NIK na sua forma ativa, com os das plantas infectas, mostraram que as plantas T474D mimetizaram o perfil das plantas infectadas, pois estes dois grupos se agruparam com um alto grau de confiabilidade, enquanto as plantas NIK induzidas e selvagens se diferenciaram em um grupo a parte. Além disso, a eliminação dos genes diferencialmente expressos (DE) do mutante T474D em todos os dados brutos dos tratamentos reforçaram que a resposta do mutante T474D mimetiza a planta com a infecção viral, pois os genótipos das plantas infectadas se agruparam com as selvagens também com um alto grau de confiabilidade. Portanto, estes resultados indicam que a infecção viral induziu a resposta antiviral mediada por NIK. Também foi empregado quatro diferentes métodos de expressão diferencial e um método ivde enriquecimento de grupos gênicos (GSEA) nos dados de RNA-seq. Estes revelaram que a expressão ectópica do mutante T474D causa uma massiva down regulação de genes relacionados a tradução e uma up regulação de genes associados ao sistema imune. A down regulação mediada por T474D dos genes relacionados a tradução foi associado a uma supressão global na produção de proteínas, diminuindo assim a tradução dos polissomos do mRNA viral, aumentando, então a tolerância a begomovirus. Coletivamente nossos dados indicam que a sinalização antiviral mediada por NIK promove a resposta de defesa pela (i) supressão global da tradução e (ii) up regulação dos genes relacionado ao sistema imune da planta. O grande volume de dados provenientes do sequenciamento de RNA (RNA-seq) por meio de técnicas que geram uma grande quantidade de dados tal como os vindos de tecnologias de sequenciadores de nova geração, já estão disponíveis para a maioria dos laboratórios de pesquisa, e portanto está rapidamente se tornando uma ferramenta chave nos experimentos de expressão gênica. Os dados de RNA- seq são trabalhados da seguinte forma: os fragmentos (pequenas sequencias geradas pela tecnologia atual de RNA-seq) são mapeadas (alinhadas) com sequencias de referencia que podem ser o genoma ou transcriptoma, então uma tabela de contagemcontendo o número de fragmentos por gene é gerada e posteriormente analisada com os métodos de expressão diferencial. Na verdade este protocolo pode ser um trabalho árduo para pessoas que não têm muita experiência no ambiente R. Para encontrar genes cuja a expressão estão estatisticamente diferentes entre os tratamentos, além de avaliar o significado biológico através da anotação, muitos scripts do R precisam ser criados e as análises serem rodadas de forma correta. A variedade de opções contidas nas metodologias para a expressão gênica diferencial do ambiente R/Bioconductor fazem a tarefa de analisar esses tipos de dados ainda mais complicada. Portanto, nós desenvolvemos uma plataforma que facilita esse tipo de análise, fazendo com que as interações entre o usuário e o ambiente seja rápida e amigável. Ainda este sistema permite a possibilidade de combinar diferentes p- valores usando técnicas inspiradas na meta análise. Os métodos de expressão diferencial disponíveis são: edgeR, DESeq2, baySeq e NBPSeq. De fato, por meio de poucos passos uma análise poderá ser completada. Um diretório contendo o projeto que são informações das análises e todos os arquivos gerados incluindo os scripts serão armazenados juntamente com um banco de vdados em SQLite contendo os genes diferencialmente expressos com seu valor de expressão e anotação. Este programa é livre e de código aberto, permitindo assim quaisquer contribuições. Está plataforma é completamente livre.
Palavras-chave: Tomato - Diseases and pests
Begomovirus
White fly
Gene expression
RNA-seq transcriptome
Tomate - Doenças e pragas
Begomovirus
Mosca Branca
Expressão gênica
RNA-seq transcriptoma
CNPq: CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR
Idioma: eng
País: BR
Editor: Universidade Federal de Viçosa
Sigla da Instituição: UFV
Departamento: Bioquímica e Biologia molecular de plantas; Bioquímica e Biologia molecular animal
Citação: BRUSTOLINI, Otávio José Bernardes. Expressão Diferencial Gênica (EDG) por sequenciamento de RNA e o desenvolvimento de um sistema que integra esses métodos. 2014. 84 f. Tese (Doutorado em Bioquímica e Biologia molecular de plantas; Bioquímica e Biologia molecular animal) - Universidade Federal de Viçosa, Viçosa, 2014.
Tipo de Acesso: Acesso Aberto
URI: http://locus.ufv.br/handle/123456789/341
Data do documento: 28-Fev-2014
Aparece nas coleções:Bioquímica Agrícola

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
texto completo.pdf3,89 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.