Votre navigateur est trop ancien pour afficher correctement ce site. Ceci en est la version simplifiée.

 

 

Résumé

Au cours du processus cellulaire de traduction, la machinerie ribosomale synthétise une protéine au travers de la lecture successive des codons le long de l'ARN messager. À chaque codon lu, les ribosomes font appel aux ARN de transfert, chargés d'un acide aminé (l'unité de base des protéines). La complémentarité entre le codon de l'ARNm et l'anticodon de l'ARNt est évaluée, conduisant éventuellement à la polymérisation de l’acide aminé sur la protéine naissante. Il existe 64 codons associés classiquement à 20 acides aminés. Plusieurs codons, qualifiés de synonymes, peuvent donc être associés à un même acide aminé. Le biais d’usage des codons (CUB) désigne l'usage différentiel des codons synonymes à l’échelle d'un gène, d'une région génomique ou d'un génome. Le CUB peut être associé à des processus mutationnels, à l'origine de particularités locales de composition nucléotidique, mais aussi à des processus de sélection pour améliorer la dynamique de synthèse de protéines. L’influence de ces deux processus sur le CUB a été démontrée chez les procaryotes et chez certains eucaryotes. Cependant, il n’existe pas d’évidence forte d’une sélection agissant à l’échelle des gènes des Vertébrés, et plus précisément des mammifères. Considérons-nous donc le CUB dans ces espèces sous un angle correct ? Possédons-nous les outils nécessaires pour tirer de telles conclusions ? Pour répondre à ces questions, nous proposons ici une approche mathématique, informatique et analytique du CUB par le biais de l'analyse de paralogues et de virus humains.

Nous avons conçu un nouvel indice de mesure du CUB appelé COUSIN (COdon Usage Similarity INdex), qui quantifie la distance entre le CUB d’une séquence et celui d’une référence, et qui se démarque des autres indices existants par sa clarté dans l’interprétation des résultats. Cet indice est implémenté au sein d’un un outil éponyme (http://cousin.ird.fr). Dans un deuxième temps, nous avons effectué une étude de l’histoire évolutive et du CUB des gènes paralogues de Vertébrés Polypyrimidine Tract-Binding Protein (PTBP) dont l’expression tissu-spécifique pourrait être associée aux différences dans leur CUB. Nous montrons que les paralogues PTBP1 semblent soumis à un biais mutationnel vers un enrichissement en GC, alors que le CUB des PTBP2 pourrait refléter une sélection traductionnelle vers l’utilisation de codons rares dans le génome. Nous interprétons que l’évolution du CUB des PTBPs est compatible avec un scénario de sous-fonctionnalisation des paralogues par expression différentielle pendant le développement des Vertébrés. Finalement, nous avons étudié le CUB chez des virus humains au travers des polyomavirus humains (PyVs). Du fait de leur mode de vie obligatoirement parasite de la machinerie de traduction, le CUB des virus pourrait impacter la présentation clinique de l’infection. Notre choix des PyVs humains vient précisément de leur diversité génotypique ainsi que de leur multiplicité de manifestations cliniques. Les infections par PyVs humains sont fortement prévalentes et asymptomatiques mais, dans un contexte d’immunosuppression, elles peuvent provoquer des symptômes tissulaires importants et parfois mortels. Le Polyomavirus BK (BKPyV) est notamment connu pour provoquer des néphropathies chez des patients récipients d’une greffe de reins. Pour préparer l'analyse de données longitudinales de virémie, de virurie et génétiques sur des patients récipients d'une greffe de reins, nous avons construit deux pipelines permettant une analyse du génome des PyVs et de leur génotype. Afin de mieux comprendre la dynamique évolutive de BKPyV dans le cadre des néphropathies, nous avons analysé l’évolution et le CUB des PyVs dans le contexte de la relation hôte-parasite.

Les résultats proposés au sein de cette thèse enrichissent les bases pour l’étude du CUB chez les Vertébrés, et alimentent le débat sur les approches tissu-spécifiques au travers de l'expression différentielle des gènes et du tropisme des virus.

Abstract

During the cellular translation process, the ribosomal machinery synthesizes a protein through the successive reading of codons along the messenger RNA. With each codon read, the ribosomes call upon the transfer RNAs, which are loaded with an amino acid (the basic unit of proteins). The complementarity between the codon on the mRNA and the anticodon on the tRNA is evaluated, eventually leading to the polymerization of the amino acid onto the nascent protein. There are 64 codons classically associated with 20 amino acids. Several codons, qualified as synonyms, can thus be associated with the same amino acid. Codon use bias (CUB) refers to the differential use of synonymous codons at the gene, genomic region or genome scale. CUB can be associated with mutational processes, at the origin of local peculiarities of nucleotide composition, but also with selection processes improving the protein synthesis dynamics. The influence of these two processes on CUB has been demonstrated in prokaryotes and in some eukaryotes. However, there is no strong evidence of selection acting at the Vertebrate gene level, and more specifically in mammals. Do we consider the CUB in these species from a correct angle? Do we have the necessary tools to draw such conclusions? To answer these questions, we propose a mathematical, computational and analytical approach to CUB through the analysis of vertebrate paralogs and human viruses.

We have designed a new CUB index called COUSIN (COdon Usage Similarity INdex), which quantifies the distance between the CUB of a sequence and that of a reference, and which stands out from other existing indices by its clarity in the interpretation of results. This index is implemented within an eponymous tool (http://cousin.ird.fr). In a second step, we performed a study of the evolutionary history and CUB of the Vertebrates paralogous genes Polypyrimidine Tract-Binding Protein (PTBP) whose tissue-specific expression could be associated with differences in their CUB. We show that PTBP1 paralogs appear to be mutagenically biased towards GC enrichment, while the CUB of PTBP2 paralogs may reflect a translational selection towards the use of rare codons in the genome. We interpret that the evolution of the CUB of PTBPs is compatible with a scenario of paralog sub-functionalization by differential expression during vertebrate development. Finally, we studied CUB in human viruses through human polyomaviruses (PyVs). Due to their obligate parasitism on the cellular protein synthesis machinery, the CUB of viruses could impact the clinical presentation of the infection. Our choice of human PyVs comes precisely from their genotypic diversity as well as their multiplicity of clinical manifestations. Infections with human PyVs are highly prevalent and asymptomatic but, in a context of immunosuppression, they can cause heavy and sometimes fatal tissue symptoms. Polyomavirus BK (BKPyV) is known to cause nephropathy in kidney transplant recipients. To prepare the analysis of longitudinal viremia, viruria and genetic data on kidney transplant patients, we have built two pipelines performing an analysis of the PyV genomes, and in particular of their genotype. In order to better understand the evolutionary dynamics of BKPyV in kidney disease, we have analyzed the evolution and CUB of PyVs in the context of the host-parasite relationship.

Retour