Use este identificador para citar ou linkar para este item: https://locus.ufv.br//handle/123456789/27942
Tipo: Dissertação
Título: Machine learning prediction of protein abundance by codon usage metrics
Predição da abundância de proteínas por métricas de uso de códons utilizando aprendizado de máquina
Autor(es): Ferreira, Maurício Alexander de Moura
Abstract: Proteins are responsible for most physiological processes in the cell, and their abundance provides crucial information for systems biology research. Protein abundance is determined by a number of factors, such as mRNA abundance, translation efficiency, protein turnover rate, and codon usage bias. New frameworks of genome-scale metabolic models have been recently developed to simulate phenotypes taking into account protein abundance data along with enzyme kinetics. However, these models still have the limitation of dataset availability, which impairs their reconstruction. This is due to limitations in absolute protein quantification methods, such as mass spectrometry. Moreover, absolute protein quantification has been mostly limited to model species, such as Escherichia coli and Saccharomyces cerevisiae, which hinders system biology endeavours in non-model species. Codon usage bias directly affects translation dynamics, which in turn affects protein levels, and many metrics for codon usage have been developed in order to clarify this phenomenon. In this study, it was evaluated the effect of codon usage bias of genes in protein abundance. Notably, many differences regarding codon usage patterns between genes coding for highly abundant proteins and genes coding for less abundant proteins were observed. Based on these differences, various codon metrics coupled with machine learning algorithms were applied to predict the absolute abundance of proteins used by S. cerevisiae. The machine learning models predicted protein abundances from codon usage metrics with remarkable accuracy. Upon integration of the predicted protein abundance in enzyme-constrained genome-scale metabolic models, the simulated phenotypes closely matched experimental data, which demonstrates that the built predictive models are valuable tools for systems metabolic engineering approaches Keywords: Codon usage bias. Metabolic modelling. Metabolic engineering.
Proteínas são as principais moléculas responsáveis por processos fisiológicos na célula, e o conhecimento de suas abundâncias é crucial para pesquisas em biologia sistêmica do metabolismo. A abundância de proteínas é determinada por uma série de fatores, como abundância de mRNA, eficiência da tradução, taxas de turnover de proteínas e viés no uso de códons. Recentemente, novas plataformas para simulação de fenótipos têm sido desenvolvidas, integrando dados de eficiência catalítica e abundância de proteína a modelos metabólicos em escala genômica. Entretanto, o uso destes modelos é dificultado pela indisponibilidade de dados de abundância de muitas proteínas, principalmente por limitações analíticas como espectrometria de massas. Além disso, muitos dos esforços em proteômica quantitativa têm sido focados em espécies-modelo, como Saccharomyces cerevisiae e Escherichia coli, o que limita abordagens sistêmicas em espécies não modelos. O viés no uso de códons é um fenômeno que afeta diretamente a dinâmica da tradução, o que impacta na quantidade de proteína presente na célula. Dessa forma, muitas métricas foram desenvolvidas para explicar matematicamente esse fenômeno. Neste trabalho, foram exploradas as diferenças no uso de códons entre sequências codificantes de proteínas de S. cerevisiae de alta e baixa abundância. Estes dados foram utilizados para o treinamento de algoritmos de aprendizado de máquina, com o intuito de gerar modelos capazes de predizer a abundância de proteínas. As abundâncias preditas foram então integradas em modelos metabólicos em escala genômica, e os fenótipos simulados apresentaram boa correspondência com valores experimentais. Isso demonstra que estes modelos preditivos são ferramentas valiosas para a biologia sistêmica do metabolismo e para a engenharia metabólica. Palavras-chave: Uso de códons. Modelagem metabólica. Engenharia metabólica.
Palavras-chave: Proteínas
Códons
Modelos matemáticos
Engenharia Metabólica
CNPq: Genética, fisiologia e ecologia de micro-organismos
Editor: Universidade Federal de Viçosa
Citação: FERREIRA, Maurício Alexander de Moura. Machine learning prediction of protein abundance by codon usage metrics. 2020. 70 f. Dissertação (Mestrado em Microbiologia Agrícola) - Universidade Federal de Viçosa, Viçosa. 2020.
Tipo de Acesso: Acesso Aberto
URI: https://locus.ufv.br//handle/123456789/27942
Data do documento: 27-Jul-2020
Aparece nas coleções:Microbiologia Agrícola

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
texto completo.pdftexto completo1,86 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.