IMGT Web resources |
Here you are: IMGT Web resources > IMGT Education > Tutorials |
Les mécanismes généraux de la transcription par lARN polymérase II
Vanessa BRES
UPR CNRS 1142, Institut de Génétique Humaine
141 rue de la Cardonille 34396 Montpellier Cedex 5
SOMMAIRE
Le contrôle de lexpression des gènes se fait en partie au niveau de la transcription. Des signaux physiologiques, générés à lextérieur de la cellule sont traduits jusquau noyau via de complexes interactions biochimiques. Ces signaux traduits peuvent amplifier ou atténuer lexpression des gènes en modifiant, notamment, les interactions des facteurs de transcription à leur cible. Il existe 3 classes de gènes définis par le type denzyme ARN polymérase dépendante de lADN qui les transcrit. LARN polymérase I ou ARNPI catalyse la transcription des gènes ribosomaux, lARNPII permet la transcription des gènes codant pour des protéines et lARNPIII transcrit essentiellement les gènes codant pour les tRNAs (revue dans (Zawel and Reinberg, 1995)).
La transcription des gènes de classe II est contrôlée aux différentes étapes que sont linitiation, le démarrage, lélongation et la terminaison de la transcription. Ces étapes sont régulées par des complexes protéiques et des facteurs cellulaires qui interviennent pour moduler et/ou modifier post-traductionnellement la chromatine et les facteurs de transcription.
Les gènes de classe II sont encadrés classiquement par 2 régions flanquantes (5 et 3) qui contiennent les éléments régulateurs. Ils sont constitués dexons, partie codante et dintrons, ADN non-codant. Le promoteur est localisé dans la partie 5 flanquante et comprend 2 parties (Figure 1) :
Le promoteur fait partie des éléments essentiels qui permettent la régulation transcriptionnelle de lexpression du gène quil précède. Aussi, il est important de bien définir sa structure et sa composition pour comprendre les mécanismes de régulation des gènes de classe II.
Les facteurs spécifiques de transcription se fixent traditionnellement dans la partie la plus en 5 du promoteur. Cette partie est constituée par des séquences spécifiques où vont interagir différents facteurs pour réguler positivement ou négativement lexpression du gène cible.
Les facteurs généraux de transcription se fixent, quant à eux, dans la région promotrice précédant directement le +1 de la transcription entre les nucléotides +1 à 110. Cette partie comprend des séquences spécifiques. Le coeur du promoteur est défini par 2 éléments génétiques : la boîte TATA, localisée 25 nucléotides en amont du +1 de la transcription et/ou un élément initiateur appelé INR (Smale and Baltimore, 1989) (revue dans (Novina and Roy, 1996)). Plus récemment Kadonaga et coll. ont identifié chez Drosophila megalonaster un nouveau site, différent de la boîte TATA, qui permettait la fixation des facteurs généraux de transcription. Ce site a été appelé DPE pour "downstream core promoter element" (Burke and Kadonaga, 1996).
Ainsi, lorganisation du promoteur et plus précisément celle du cur sont des éléments essentiels qui vont permettre via linteraction de tels ou tels facteurs, la régulation transcriptionnelle de lexpression des gènes codant pour les protéines.
B) Régulation de la transcription des gènes dépendants de lARNPII
La transcription dun gène cest-à-dire la synthèse dun ARN messager à partir dune séquence dADN fait appel à un processus en 5 étapes.
La pré-initiation est une des étapes déterminantes dans le processus transcriptionnel au cours de laquelle une multitude de facteurs cellulaires vont intervenir pour finalement agir en synergie et placer le promoteur dans une configuration active. Cette étape est spécifique du promoteur, elle est contrôlée notamment en ce qui concerne le recrutement des facteurs de transcription et des co-activateurs, la machinerie basale étant sollicitée pour activer tous les promoteurs possédant une boîte TATA.
La machinerie basale de transcription comprend un ensemble de protéines, ou complexes protéiques, qui est traditionnellement représentée par lARNPII et les facteurs généraux de transcription ou GTFs (general transcription factors) comprenant les complexes TFIIA, TFIIB, TFIID, TFIIE, TFIIF et TFIIH (revue dans (Woychik and Hampsey, 2002)). Certains de ces facteurs interviennent dans linitiation comme TFIID, mais dautres interviennent plus tardivement.
LARNPII catalyse la synthèse des ARN messagers mais elle nest pas capable dinitier la transcription au niveau du promoteur ou de répondre aux protéines régulatrices de la transcription en absence dautres facteurs (Weil et al., 1979). Ce complexe multi-protéique est constitué par 12 sous-unités chez les eucaryotes dont 5 sont extrêmement conservés parmi les organismes phylogénétiquement différents. LARNPII de levure dont la structure cristallographique a été obtenue par Cramer et coll. (Figure 2) sert de référence pour toutes les formes dARNPII (Cramer et al., 2001). Les sous-unités sont arrangées selon une structure générale composée par 5 sous-unités. Deux larges sous-unités, Rpb1 et Rbp2 constituent la masse centrale de lenzyme et sont opposées lune à lautre par des charges positives. Ces 2 parties sont ancrées dans 2 petites sous-unités Rpb3 et Rpb11 qui sont impliquées dans lassemblage de lARNPII. Enfin Rbp6 interviendrait dans la stabilisation de la large sous-unité. Fonctionnellement, Rpb3 possède un domaine liant le zinc et des substitutions dans cette région entraîneraient un défaut dans lactivation transcriptionnelle suggérant lexistence dinteraction entre cette région et des protéines activatrices (Tan et al., 2000). Quant à Rbp4 et 7 qui ne sont pas représentées sur la structure (Figure 2), des données récentes suggèrent quelles formeraient un hétérodimère (Todone et al., 2001) (revue dans (Cramer, 2002)).
La grande sous-unité de lARNPII possède un domaine carboxy-terminal appelé CTD constitué par une répétition heptapeptidique dont la séquence consensus est Tyr1-Ser2-Pro3-Thr4-Ser5-Pro6-Ser7. Chez lhomme, il existe 52 répétitions de cet heptapeptide. Le CTD est spécifique de lARNPII et joue un rôle clef dans la régulation des étapes de post-initiation de la transcription et dans la coordination des évènements permettant en simultané la transcription et la maturation des ARN messagers. Des kinases et des phosphatases régulent le niveau de phosphorylation du CTD.
Le complexe unique ADN / protéine formé par la protéine liant la boîte TATA appelé TBP (TATA-box binding protein) sert de plate-forme à lassemblage de la machinerie transcriptionelle. TFIID est constitué par TBP, sous-unité principale, et 12 TAFs (TBP-associated factors), protéines extrêmement conservées depuis la levure jusquà lhomme (Burley and Roeder, 1996; Lee and Young, 1998). Lanalyse cristallographique de TBP seule a permis de révéler une structure pseudo-symétrique de la protéine avec une face concave qui contacterait lADN et une surface convexe probablement destinée à linteraction avec les TAFs (revue dans (Albright and Tjian, 2000)). Il existe un important débat autour de la fonction des TAFs dans la transcription. En effet, des études initiées chez la levure suggèrent que tous les TAFs ne soient pas requis dans la transcription générale par lARNPII (Burley and Roeder, 1996; Lee and Young, 1998). En accord avec ces résultats, Oelgeschlager et coll. ont montré que TBP seule était capable dactiver la transcription dans un système GAL4-VP16 en absence de TFIID (Oelgeschlager et al., 1998), impliquant lexistence de co-activateurs redondants ou alternatifs pour ce facteur de transcription chimérique. Mais de façon générale, les études in vitro suggèrent que les TAFs contribuent à réguler la transcription à différents niveaux. Tout dabord, ils permettraient détablir un lien entre les co-activateurs et la machinerie basale. Ensuite, ils stabiliseraient le complexe TFIID au niveau du cur du promoteur en augmentant linteraction entre TBP et la boîte TATA. Finalement, dans le cas de TAFII250, qui possède une activité histone acétyltransférase, ce type de protéine pourrait modifier des protéines voisines par acétylation et potentialiser leur activité modulatrice (revue dans (Albright and Tjian, 2000)).
Dautres complexes que TFIID sont recrutés au niveau du promoteur. TFIIA, complexe constitué de 3 sous-unités, interagit directement avec TBP et les séquences en amont de la boîte TATA (Geiger et al., 1996; Tan et al., 1996). Sa fonction essentielle est de stabiliser la liaison de TBP à la boîte TATA ce qui peut-être potentiellement important notamment pour lactivation basale de certains promoteurs dont la boîte TATA est faible. Tout comme TFIIA, TFIIB, protéine de 35 KDa, interagit directement avec TBP. Elle lie également des séquences localisées en amont et en aval de la boîte TATA (Nikolov et al., 1995). Son rôle est essentiel puisquelle participe au recrutement du complexe TFIIF/ARNPII au niveau du site de démarrage de la transcription tout en stabilisant linteraction entre TBP et LADN (Kim et al., 1994). Les données obtenues en analyse structurale montrent quil existe des complexes ADN/TBP/TFIIB et ADN/TBP/TFIIA. TFIIA et TFIIB ne lient pas TBP au même endroit et nétablissent pas de contact direct entre elles, ce qui est en accord avec la fonction de TFIIB dans le recrutement de lARNPII alors que TFIIA permettrait la dissociation de co-facteurs négatifs qui préviendraient la liaison de TFIIB au complexe dinitiation (revue dans (Kaiser and Meisterernst, 1996)). Un des rôles essentiels de TFIIF est damener lARNPII au niveau du promoteur via TFIIB. Par cette spécificité dinteraction, TFIIF permettrait aussi de réduire la liaison de lARNPII à des sites non spécifiques (Zawel and Reinberg, 1993). TFIIE interagit directement avec lARNPII et permet surtout le recrutement de TFIIH au niveau du promoteur qui intervient essentiellement au cours des étapes de démarrage et délongation de la transcription (Tableau 1) (Figure 3) (revue dans (Roeder, 1996)).
La mise en place de ce puzzle sopère séquentiellement pour permettre le démarrage de la transcription.
B-1-2) Les facteurs de transcription
Il existe plus de 2000 facteurs de transcription qui sont codés par le génome humain. Ces protéines possèdent 2 domaines caractéristiques :
Dans certain cas, ces 2 domaines sont portés par des protéines différentes qui vont agir en synergie pour contrôler lexpression du gène. De façon générale, ces facteurs se fixent au niveau des éléments régulateurs spécifiques du promoteur localisés entre les nucléotides 400 et 100 mais certains dentre eux peuvent exercer leurs effets sur des distances plus importantes, jusquà 30 kb.
Il existe plusieurs catégories de structures protéiques capables de lier lADN présentes dans les facteurs de transcription. Les plus fréquentes sont les motifs en doigts de zinc, les homéodomaines ou HD et les domaines riches en acides aminés basiques (revue dans (Mitchell and Tjian, 1989)) (Figure 4). Les motifs en doigts de zinc ont initialement été identifiés au niveau de TFIIIA, facteur liant la région contrôlant lexpression du gène de lARN 5S (Miller et al., 1985). Ce type de structure est présent dans la protéine Sp1 (Kadonaga et al., 1987) qui permet dactiver la transcription en se liant à des régions riches en GC. En outre, les récepteurs aux hormones stéroïdes, une autre famille de facteurs de transcription possèdent ce type de structure pour interagir avec lADN (Freedman et al., 1988) . Les protéines contenant des motifs HD reconnaissent généralement des structures ADN riches en bases AT (Fainsod et al., 1986). Enfin, les domaines riches en acides aminés basiques sont capables de former des structures en hélice compatibles pour établir des liaisons avec lADN. Certains facteurs de transcription tels que CREB, Jun et Fos sont capables de se lier à lADN sous une forme dimère. La présence de domaines "leucine zipper" permet cette dimérisation et les régions basiques adjacentes favorisent linteraction entre le facteur de transcription et lADN (revue dans (Mitchell and Tjian, 1989)).
Bien que ces trois types de structures soient généralement celles identifiées pour permettre la liaison du facteur de transcription à sa cible, il en existe également dautres, des facteurs comme AP-2 ou SRF (the serum response factor) ne contenant pas ces types de domaine (Norman et al., 1988; Williams et al., 1988).
Les domaines dactivation des facteurs de transcription sont généralement des parties (1 ou plusieurs) de la protéine qui sont enrichies par un type dacide aminé. Il a été ainsi défini les protéines ayant des domaines dactivation riches en acides aminés acides comme lacide aspartique, riches en glutamine ou en proline. Ces régions facilitent généralement des interactions avec des co-facteurs et sont parfois la cible de modifications post-traductionnelles de type phosphorylation ou acétylation qui permettent lactivation du facteur en question ou bien des co-facteurs associés (revue dans (Brivanlou and Darnell, 2002; Mitchell and Tjian, 1989)).
Les facteurs de transcription sont donc des régulateurs essentiels et spécifiques du processus dexpression des gènes en fonction des besoins de la cellule (revue dans (Brivanlou and Darnell, 2002)). Ils sont recrutés directement au niveau de séquences dADN spécifiques localisées en amont du promoteur et interagissent avec des co-régulateurs pour permettre lactivation ou la répression de la transcription.
B-1-3) Les co-activateurs et le complexe Médiateur
Alors que lARNPII et les GTFs sont suffisants pour activer la transcription dans un système reconstitué, des facteurs supplémentaires sont requis pour permettre lexpression des gènes en réponse à des activateurs. Cest à partir de ces observations que lexistence des co-activateurs a été découverte, au début des années 90. Ces facteurs, dont lidentification a été essentiellement fondée sur leur capacité à interagir avec des facteurs de transcription, peuvent être classés en 2 catégories :
Etant donné limportance et la multifonctionalité de la seconde catégories de co-activateurs, un chapitre complet leur sera consacré.
Les co-activateurs de la première catégorie sont des médiateurs regroupés sous la forme de complexes modulateurs qui permettent de transmettre des informations positives ou négatives du facteur de transcription à la machinerie basale (revue dans (Hampsey and Reinberg, 1999; Myers and Kornberg, 2000)). Ces complexes médiateurs ne sont pas capables de lier directement des séquences ADN spécifiques, par contre, des analyses génétiques ont montré quils interagissent directement avec lARNPII. Le complexe médiateur stimule aussi la transcription basale et régule lactivité kinase CDK7 présente dans le complexe TFIIH, suggérant quil pourrait agir par lintermédiaire du CTD de lARNPII (Akoulitchev et al., 2000). Cependant, il a très récemment été montré que cette interaction nest pas requise pour lactivité co-activatrice du complexe in vitro et in vivo (Bhoite et al., 2001; Park et al., 2001) chez la levure et la drosophile.
Le complexe médiateur a initialement été identifié chez la levure et il est composé chez lhomme par un ensemble de 25 protéines. Sa structure tridimensionnelle édifiée par Dotson et coll. révèle une structure en ellipse dont la conformation change en présence de lARNPII ou du CTD (Dotson et al., 2000). Plus récemment, 2 types de complexes : le complexe ARC-L (activator-recruited cofactor) et le complexe CRSP (cofactors required for Sp1 activation) ont été isolés à partir du complexe ARC. Des expériences de transcription in vitro décrites par Taatjes et coll. révèlent que seul le complexe CRSP est actif et leurs analyses en microscopie électronique montrent que ce complexe est capable dadopter 3 structures différentes en fonction de son interaction avec des activateurs (Taatjes et al., 2002). En outre, il existe dautres complexes médiateurs dont certaines sous-unités sont homologues à celles du complexe médiateur de levure (polypeptides Srb et Med) et dont le rôle dans la transcription peut être négatif comme cest le cas pour le complexe NAT (negative regulator of activated transcription) (Sun et al., 1998) ou positif avec le complexe SMCC (Srb/Med-containing cofactor complex) (Gu et al., 1999).
Lintroduction dun complexe médiateur, qui fait le lien entre lactivateur et la machinerie basale, dans le processus de régulation de la transcription est un concept assez récent (Figure 5). Son rôle commence à être bien défini mais les mécanismes restent encore inconnus. Dans les prochaines années, des études devraient permettre de comprendre limportance de ce type de complexes dans la régulation transcriptionnelle de lexpression des gènes.
B-2) Le démarrage de la transcription ou initiation
Le démarrage de la transcription consiste en lavancée de lARNPII au-delà dune quinzaine de nucléotides, libérant ainsi le promoteur doù son nom de "promotor clearance". Outre dinitier la synthèse des ARN messagers, elle permet aussi la formation dun nouveau complexe dinitiation qui va pouvoir prendre place au niveau du promoteur. Ce mécanisme permet aussi doptimiser le niveau transcriptionnel. En effet, de plus en plus de données suggèrent que lefficacité de linitiation de lARNPII nest pas uniquement gouvernée par lefficacité dactivation du complexe de transcription mais aussi par lefficacité de la polymérase à quitter le promoteur (revue dans (Conaway et al., 2000)).
Certains GTFs ont été impliqués dont TFIIE, TFIIF et TFIIH. TFIIF serait capable de diminuer la fréquence des transcriptions abortives et une coopération entre TFIIE et TFIIH permettrait de supprimer les arrêts précoces de lARNPII (revue dans (Dvir et al., 2001)). LATP aussi semble nécessaire. Tout dabord, TFIIH, complexe de 9 polypeptides, possède 2 activités enzymatiques dépendantes de lATP : une activité ADN hélicase (Schaeffer et al., 1993) et une activité kinase dépendante des cyclines (Fisher and Morgan, 1994). Ensuite la transcription par lARNPII nécessite lhydrolyse des liaisons b-g de lATP (Bunick et al., 1982) et cette hydrolyse de lATP est requise pour la formation dun complexe ouvert nécessaire au démarrage de la transcription (revue dans (Dvir et al., 2001)) qui ferait intervenir lactivité hélicase de TFIIH (Dvir et al., 1997; Kugel and Goodrich, 1998; Kumar et al., 1998). Enfin lactivité kinase CDK7 contenue dans le complexe TFIIH permettrait de phosphoryler le CTD de lARNPII engagée, guidant le processus vers létape de lélongation.
Les données actuelles permettent de définir cette étape en 2 parties : une première qui consiste en lactivation du complexe de transcription et lautre en la libération du promoteur, ce qui correspond à lavancée de lARNPII et de certains co-facteurs associés, dans la chromatine. Ce mécanisme fait intervenir directement le complexe TFIIH et lATP.
B-3) Lélongation : les complexes de régulations
Lélongation est la dernière étape du processus transcriptionnel dont je parlerai. Lobtention par Cramer et coll. de la structure cristallographique de lARNPII au cours de lélongation et des analyses biochimiques ont permis des avancées majeures dans la compréhension de ce processus qui met en jeu des complexes protéiques qui agissent positivement ou négativement (revue dans (Conaway et al., 2000)). La transition de lARNPII du stade initiation au stade élongation saccompagne de lhyperphosphorylation du CTD (revue dans (Dahmus, 1996)). La phosphorylation du CTD peut-être bloquée par lutilisation dun inhibiteur des protéines kinases comme le 5,6-dichloro-1-b-D-ribofuranosyl-benzimidazole (DRB) qui arrête lélongation de lARNPII in vitro et in vivo (Chodosh et al., 1989; Marshall and Price, 1992). Lutilisation de cet inhibiteur sur culture cellulaire entraîne un inhibition de plus de 95% sur la synthèse des ARNs messagers matures (Sehgal et al., 1976) ce qui a permis de mettre en évidence que lactivation de lélongation est prise en charge par un complexe sensible au DRB qui doit être capable de contre-carrer leffet dun complexe inhibiteur (Marshall and Price, 1992). Par la suite, 3 complexes délongation ont été identifiés dont 1 positif appelé P-TEFb (positive-transcription elongation factor b) (revue dans (Price, 2000)) et 2 négatifs : NELF (negative elongation factor complex) (Yamaguchi et al., 1999) et DSIF (DRB-sensitivity inducing factor) (Wada et al., 1998).
B-3-1) Le complexe positif délongation de la transcription
Il existe plusieurs facteurs qui interviennent dans lélongation tels que les membres de la famille SII, les complexes ELL et les "Elongin". Ces facteurs agissent essentiellement en permettant la suppression des pauses de lARNPII (revue dans (Conaway et al., 2000)).
Je ne les développerai pas mais parlerai uniquement du complexe P-TEFb qui permet une élongation processive de la transcription. La purification du complexe P-TEFb, à partir dextraits nucléaires de Drosophile, par Marshall et Price en 1995 a permis lidentification de 2 sous-unités (Marshall and Price, 1995). Peu après, il a été montré que P-TEFb possédait une activité kinase capable de phosphoryler le CTD déjà partiellement phosphorylé (Marshall et al., 1996). Cette activité kinase contenue dans une protéine de 43 KDa, initialement appelée PITALRE (Grana et al., 1994), a ensuite été renommée CDK9 (cyclin-dependant kinase 9) lorsque son partenaire a été identifié comme étant une protéine dépendante du cycle de 87 KDa (Peng et al., 1998). La sous-unité cycline a été appelée cyclineT à cause de son implication dans la transcription. CDK9 peut aussi être associée à dautres cyclines (10 à 20 %) dont cyclineT2a , cyclineT2b et cyclineK (Fu et al., 1999; Peng et al., 1998) mais dans tous les cas, la cycline box est requise pour lactivité du complexe (Peng et al., 1998). Toutefois, est-ce que ces cyclineTs sont les seules partenaires de CDK9 ? Probablement non, puisque des expériences dimmunoprécipitation de CDK9 et des marquages à largent ont révélé que des protéines de 87, 105, 133, 140 et 207 KDa sont associées à CDK9. A ce jour, seule la protéine de 87 KDa a été identifiée mais lidentité des autres reste encore inconnue. En même temps, cyclineT1 a été clonée par lintermédiaire de son association avec Tat, facteur de transcription de VIH-1 (Wei et al., 1998) sur lequel je reviendrai plus longuement dans la partie II. Aussi, lutilisation du promoteur du VIH-1 a permis des avancées majeures dans la compréhension du rôle de P-TEFb dans lélongation.
De façon générale, la fonction du complexe P-TEFb mettrait en jeu les deux sous unités connues. Aussi, le rôle des autres protéines associées au complexe reste totalement obscur, lassociation entre CDK9 et cyclineT étant suffisante à lactivité du complexe. De même lexistence de rôles distincts pour les trois cyclineTs ne serait pas exactement connu, lassociation dune des trois cyclines à CDK9 permettant dactiver la transcription. Toutefois, on pourrait penser que la nature de la cycline serait déterminante pour permettre une spécificité daction du complexe P-TEFb, puisque par exemple, la cyclineT1 interagit spécifiquement avec Tat (Wimmer et al., 1999). Fonctionnellement, alors que la cyclineT1 participerait par lintermédiaire de sa capacité à interagir avec des facteurs de transcription au recrutement du complexe au niveau du promoteur, CDK9, par son activité kinase phosphorylerait le CTD de lARNPII permettant ainsi dempêcher larrêt de lélongation (revue dans (Conaway et al., 2000)). En outre il semble exister des subtilités dans le mécanismes de régulations puisque CDK9 est capable aussi de sautophosphoryler dans sa partie C-terminale et de phosphoryler la cyclineT1 entre les acides aminés 303-728 ce qui entraîne des modulations dans la capacité de P-TEFb à interagir avec ses partenaires (Garber et al., 2000). En outre, plus récemment Kiernan et coll. ont montré que CDK9 est ubiquitinée et dégradée par le protéasome par lintermédiaire de cyclineT1. Ainsi, linhibition de lexpression de p45skp2, composant de la voie de dégradation, par lIFN-g permet de stabiliser lexpression de CDK9 au niveau des promoteurs dépendants du complexe P-TEFb, entraînant une augmentation de la transcription comme dans le cas du promoteur du complexe majeur dhistocompatibilité de classe II (Kiernan et al., 2001). Enfin, Nguyen et coll. ont montré récemment que P-TEFb était séquestré dans des complexes contenant des ARN 7SK. La dissociation du complexe entre les ARNs 7SK et CDK9 permettrait dactiver son activité kinase suggérant une régulation étroite de la transcription par cette interaction. En outre il semblerait que la dégradation in vivo de 7SK augmenterait lactivation du promoteur du VIH-1 (Nguyen et al., 2001; Yang et al., 2001). Finalement, P-TEFb établit des interaction avec TAT-SF1 et des composants de la machinerie dépissage comme les U-snRNPs (spliceosomal U small nuclear ribonucleoproteins) suggérant que ces facteurs pourraient aussi être impliqués dans lélongation de la transcription (Fong and Zhou, 2001) ou bien que P-TEFb pourrait jouer un rôle aussi dans les étapes dépissage des ARNs.
En conclusion, lensemble des données bibliographiques montre que P-TEFb joue un rôle important dans le processus délongation de lARNPII. Son rôle au niveau de promoteur comme celui du VIH-1 est maintenant bien établi et de nouvelles données portent à croire à une régulation étroite du complexe au sein de la cellule faisant intervenir de nouvelles régulations et relations.
B-3-2) Les complexes négatifs délongation de la transcription
Le premier complexe identifié comme ayant un effet inhibiteur sur lélongation est le complexe DSIF (Wada et al., 1998). Sa purification, à partir dextraits nucléaires de cellules HeLa est basée sur sa capacité à induire la sensibilité au DRB doù son nom. Ce complexe est constitué par 2 sous-unités de 160 et 14 KDa qui sont des homologues de facteurs de transcription présents chez la levure : Spt5 et Spt4 (Wada et al., 1998). Les composants du complexe DSIF interagissent directement avec lARNPII (Hartzog et al., 1998; Wada et al., 1998). Alors que les premières études ne permettaient pas de comprendre la fonction de DSIF en absence de DRB, une étude plus récente faite avec lutilisation de mutants dominants négatifs de la sous-unités p160, a montré clairement quin vivo la fonction de DSIF est dinhiber la transcription (Yamaguchi et al., 1999).
Le complexe NELF quant à lui agirait en synergie avec le complexe DSIF pour inhiber la transcription. Ce complexe a aussi été isolé grâce à sa sensibilité au DRB par Yamaguchi et coll.. NELF est un complexe multi-protéique de ~300 KDa constitué par 5 protéines dont une possède un domaine riche en arginine/acide aspartique (RD) et un domaine de liaison à lARN. Il interagit avec DSIF et les formes hypophosphorylées du CTD de lARNPII (Yamaguchi et al., 1999). Enfin une étude très récente montre que NELF interagit avec le complexe ARNPII/DSIF préformé et se lie à lARN in vitro. Lutilisation dun mutant où la région requise pour la liaison ARN est supprimée entraîne une absence dinhibition sur la transcription (Yamaguchi et al., 2002). Ainsi, NELF provoque la pause de lARNPII en se liant à un complexe préformé entre lARNPII et DSIF ainsi quaux produits ARNs nouvellement synthétisés. Les complexes négatifs interviendraient donc en synergie pour permettre la pause de lARNPII, effet qui serait neutralisé par la phosphorylation du CTD grâce à lactivité kinase CDK9 du complexe P-TEFb.
Lensemble des études faites sur les différentes étapes de la transcription montre que ce processus est étroitement régulé par des complexes protéiques généraux et spécifiques du promoteur qui interviennent séquentiellement pour permettre la synthèse des ARNs messagers. Ce mécanisme, extrêmement complexe, est non seulement régulé étape par étape mais dautres facteurs interviennent aussi au niveau de la chromatine qui structurellement joue un rôle important dans la transcription.
C) Rôle de la chromatine dans la transcription
Dans le noyau, le génome eucaryote est une structure hétérogène où les régions actives et inactives de la chromatine définissent des territoires distincts. Lorsque les gènes sont silencieux, généralement, le niveau de condensation de la chromatine est plus important et sétend dans des régions dADN regroupées en forme transcriptionnellement inactive et définies comme lhétérochromatine. L'hétérochromatine est répliquée tardivement en phase S, contient peu de gènes, et est capable de réprimer la transcription de gènes adjacents. Leuchromatine apparaît moins dense que les chromosomes mitotiques et contient les gènes actifs. Plusieurs évidences suggèrent que la localisation sub-nucléaire de certains gènes peut contribuer à l'établissement ou au maintien d'états particuliers de leur chromatine (revue dans (Francastel et al., 2000)).
La chromatine est constituée par lADN chromosomal qui est compacté autour dune structure appelée nucléosome. Chaque nucléosome contient un tétramère (H3-H4) et 2 dimères (H2A-H2B) positionnés de part et dautre du tétramère, ce qui forme un octamère dhistones autour duquel 146 paires de base dADN sont enroulées (Figure 6) (Luger et al., 1997).
Les parties amino-terminales des histones, qui contiennent de 16 à 44 acides aminés sont impliquées dans la genèse des états structuraux de la chromatine. Elles peuvent interagir avec dautres histones (Lenfant et al., 1996; Luger et al., 1997) ou des protéines chromosomales non-histones comme HMG-14 qui interagit avec la partie amino-terminale de lhistone H3 (Trieschmann et al., 1998). Enfin, cette partie des histones peut être modifiée post-traductionnellement par acétylation, phosphorylation, méthylation, ubiquitination, glycosylation et ADP-ribosylation (revue dans (Spencer and Davie, 1999)) affectant ainsi leur charge et leurs fonctions. De plus en plus de données montrent quil existe une corrélation entre les états dacétylation des histones et lactivité transcriptionnelle. Ainsi la chromatine et les complexes co-activateurs qui interviennent dans son remodelage et qui modifient les histones sont importants pour réguler le processus transcriptionnel. Enfin, devant la multitude des modifications des histones, des études récentes suggèrent quil existerait un code spécifique appelé "histone code" impliqué dans la régulation des gènes (revue dans (Berger, 2002)).
C-2) Les complexes de remodelage de la chromatine
Lenroulement de lADN autour des nucléosomes et lassemblage de la chromatine créent une structure compacte plutôt défavorable à linteraction des facteurs généraux de transcription comme TFIID à leur séquence cible au niveau du promoteur. Aussi, un des rôles des co-activateurs transcriptionnels, spécifiques dun gène donné, est de modifier au niveau du promoteur létat de compaction et le remodelage de la chromatine. Cette modification de la chromatine fait intervenir des enzymes ou complexes enzymatiques qui sont recrutés par les activateurs et facilitent lassemblage du complexe de pré-initiation. Deux types denzyme capable de remodeler la chromatine peuvent être recrutés par des facteurs de transcription. La première catégorie dépendante de lATP, permet de dissocier les interactions entre lADN et les histones. Les modifications qui sont catalysées par ce type denzyme sont non-covalentes. Ce sont les homologues du complexe SWI/SNF initialement identifié chez la levure. La seconde catégorie est quant à elle constituée par des protéines possédant une activité histone acétyltransférase. La fonction essentielle de ces protéines est de modifier de manière covalente leur substrat par ajout dun groupement acétyl sur les lysines ce qui, au niveau des histones, pourrait se traduire par une perturbation des interactions histones/ADN. Ces co-activateurs via leur recrutement par des facteurs de transcription sont extrêmement importants pour le processus de transcription.
C-2-1) Les complexes dépendants de lATP
Tous les complexes de remodelage de la chromatine, dépendants de lATP, contiennent une sous-unité ATPase homologue à la super famille des protéines SNF2 de levure. Ces complexes ont été classés en 3 groupes qui chez lhomme sont:
Les complexes de remodelage dépendants de lATP altèrent la structure de la chromatine en changeant la localisation et la conformation des nucléosomes, contribuant à fluidifier la chromatine (revue dans (Kingston and Narlikar, 1999)).
La purification du complexe SWI/SNF, à partir de cellules humaines, par Wang et coll. a permis de découvrir lexistence de 2 complexes multi-protéiques (8 à 15 sous-unités) dapproximativement 2 MDa (Wang et al., 1996; Wang et al., 1996) qui diffèrent par la nature des ATPases présentes : BRG1 et hBRM. Ces 2 ATPases sont toutefois homologues à plus de 70% et ainsi quà SNF2. Elles sont associées à des protéines appelées BAFs (BRG1-associated factors) dont une, p47 est lhomologue humain de SNF5 (hSNF5/INI1/BAF47). La présence de ces complexes semble dépendre du type cellulaire et dans certain cas où ni BRG1, ni hBRM, la présence de hSNF5/INI1 seule peut être détectée.
Le cur actif du complexe SWI/SNF est défini par BAF155, BAF170, hBRM ou BRG1. La partie fonctionnelle du complexe réside dans lactivité ATPase et il semble que BRG1 seule ou hBRM seule soient suffisantes pour déstabiliser les nucléosomes. La présence des autres sous-unités comme INI1, BAF155 et BAF170 potentialise lefficacité de la déstabilisation induite par BRG1 (Phelan et al., 1999) dans un système reconstitué. Lajout dATP est nécessaire pour initier la réaction mais le déplacement du complexe ADN/nucléosome sous une forme activée persiste lorsque lATP ou le complexe SWI/SNF sont enlevés. Une autre question importante est de savoir comment le complexe SWI/SNF est recruté au niveau du promoteur? En effet, il semble exister une spécificité puisque chez la levure par exemple, seulement 6% de tous les gènes ont leur expression contrôlée par ySWI/SNF (Sudarsanam et al., 2000). Apparemment il existerait des activateurs transcriptionnels capables dinteragir avec des composants du complexe SWI/SNF (Armstrong et al., 1998; Fryer and Archer, 1998; Kowenz-Leutz and Leutz, 1999; Lee et al., 1999) permettant son recrutement au niveau du promoteur. En outre, différentes études ont suggéré que le complexe SWI/SNF pourrait être recruté au niveau du promoteur via la machinerie générale de transcription, certaines sous-unités du complexe dont BAF47 ayant été co-purifiées avec lARNPII (Cho et al., 1998; Neish et al., 1998; Wilson et al., 1996) (revue dans (Peterson and Workman, 2000; Sudarsanam and Winston, 2000)).
Pour conclure, les données actuelles suggèrent que le complexe SWI/SNF permette dactiver la transcription en modifiant la structure de la chromatine. Des études futures devraient permettre de comprendre comment il est recruté au niveau du promoteur et si les co-activateurs impliqués participent à sa spécificité daction.
C-2-1-2) Le complexe RSF (remodeling and spacing factor)
Le complexe RSF a initialement été isolé et caractérisé par Reinberg et coll. (LeRoy et al., 1998). Il est constitué par un hétérodimère de 2 polypeptides de 325 et 135 KDa. La purification du complexe par HPLC (high-performance liquid chromatography) a permis de révéler que la petite sous-unité était lhomologue humain de la protéine ISWI de drosophile et un nouveau membre de la super famille des protéines SNF2. Cette protéine a été appelée hSNF2h. Lutilisation dun système de transcription in vitro où lADN est dans un contexte chromatinien leur a permis de montrer que RSF est requis pour activer linitiation de la transcription, en présence dATP et spécifiquement du promoteur. En revanche RSF nest pas suffisant pour lélongation. En outre, ils ont montré que RSF possédait une activité despacement des nucléosomes (nucleosome-spacing activity) similaire à celle des facteurs ACF et CHRAC de drosophile (LeRoy et al., 1998).
Peu détudes postérieures ont été faites sur la forme humaine du complexe RSF, aussi de nombreuses investigations seraient nécessaires pour affirmer son rôle dans le remodelage de la chromatine requise pour la transcription, notamment in vivo.
C-2-1-3) Le complexe NURD/NuRD/NRD (nucleosome remodeling and deacetylase complex)
Le complexe NRD (ou NuRD) possède 2 activités enzymatiques qui peuvent cibler les histones. Lactivité de remodelage de la chromatine dépendante de lATP et les activités déacétylases qui ont pour la première fois été proposées pour être couplées, en tout cas chez le Xénope, par Wade et coll. (Wade et al., 1998). Lidentification du complexe humain et sa purification ont permis de déterminer la présence de 2 histones déacétylases ou HDACs : HDAC1 et HDAC2, et 2 protéines liant les histones RbAp46/48. De part la présence des HDACs, le complexe NuRD a été pressenti pour avoir un effet négatif sur la transcription, la déacétylation des histones étant associées à une répression. Ce complexe quaternaire (HDAC1/HDAC2/RbAp46/48) est également présent dans un autre complexe appelé Sin3 qui aurait aussi un rôle transcriptionnel répressif (revue dans (Knoepfler and Eisenman, 1999)). Lactivité ATPase du complexe NuRD réside dans les protéines CHD3/4 homologues de Mi-2 de Xénope et appartenant à la super famille des protéines SNF2. Cette activité est requise pour la fonction déacétylase du complexe (revue dans (Tyler and Kadonaga, 1999)). Limplication dun tel complexe et de ses 2 activités enzymatiques, dirigées vers les histones, dans la régulation de lactivité transcriptionnelle permet de souligner limportance de la chromatine et de leffet de sa structure sur la transcription.
Lensemble des données actuelles porte à croire que les complexes de remodelage de la chromatine jouent un rôle important dans la régulation transcriptionnelle du processus dexpression de certains gènes. Leur fonction essentielle est, en présence dATP, de rendre plus accessible les régions ADN importantes pour la transcription (revue dans (Vignali et al., 2000)). Les études sont encore récentes et les expériences futures devraient permettre délucider notamment le mécanisme daction et de recrutement de ces complexes au niveau des promoteurs.
C-2-2) Les histones acétyltransférases
Lhyperacétylation des lysines des parties amino-terminales des histones est un phénomène qui est étroitement corrélé avec lactivation de la transcription (Figure 8).
Cette modification post-traductionnelle est engendrée par des activités histones acétyltransférases (HATs) qui permettent le transfert dun groupe acétyl sur des lysines spécifiques modifiant ainsi la charge présente (Figure 10). Plusieurs mécanismes ont été proposés pour expliquer comment lacétylation des histones pouvait faciliter la transcription. Tout dabord, des analyses in vitro ont montré que lacétylation des histones permettait aux facteurs de transcription daccéder plus facilement à lADN. Des expériences réalisées avec des enzymes de restriction le suggèrent également. Une des possibilités est que la réduction de la charge positive sur la partie acétylée de lhistone entraîne une stabilité plus faible dinteraction avec lADN. Ensuite, il semble que lacétylation des histones diminue la compaction des nucléosomes en détruisant les interactions entre les nucléosomes qui se font par lintermédiaire de la queue des histones. Enfin, la spécificité dacétylation de certaines lysines pourraient permettre le recrutement de co-facteurs additionnels intervenant dans lactivation de la transcription, notamment ceux possédant un bromo-domaine, lacétylation créant un site spécifique dinteraction pour ce type de motif (revue dans (Narlikar et al., 2002)). De façon particulièrement intéressante, la lysine 12 de lhistone H4, chez la levure, est préférentiellement acétylée au niveau de lhétéchromatine transcriptionnellement silencieuse (Braunstein et al., 1996) et Rpd3, une histone déacétylase, a pour effet de contrebalancer ce signal (De Rubertis et al., 1996; Vannier et al., 1996). Ces observations sont étonnantes et contrastent avec la corrélation usuelle de lier lacétylation des histones à lactivation de la transcription. Une des explications possibles de ce paradoxe est que la forme acétylée de la lysine 12 de lhistone H4 soit reconnue par une protéine qui soit impliquée dans la genèse de lhétérochromatine. Au cours de lactivation de la transcription, la partie dADN modifiée par acétylation nest pas clairement déterminée. En effet, est-ce que ces activités enzymatiques modifient un seul nucléosome ou est-ce que la structure de la chromatine est perturbée sur une large distance? Il est possible que la chromatine soit modifiée au fur et à mesure de lavancée de la machinerie transcriptionnelle au cours de la transcription et il est aussi envisageable que sur une distance donnée, la chromatine soit déstabilisée permettant ensuite la transcription.
La plupart des histones acétyltransférases ont initialement été décrites comme des co-activateurs transcriptionnels de natures diverses. En effet, TAFII250 est une sous-unité du complexe TFIID et possède une activité HAT (Mizzen et al., 1996) ; p300/CBP, initialement décrit comme co-activateur transcriptionel, a ensuite été caractérisé par son activité HAT (Bannister and Kouzarides, 1996; Ogryzko et al., 1996) . La protéine PCAF (p300/CBP associated factor) possède également ce type dactivité et peut interagir avec p300 (Yang et al., 1996) mais aussi avec ACTR et SRC-1 (Chen et al., 1997; Spencer et al., 1997) dautres protéines HATs, impliqués dans la régulation de récepteurs nucléaires répondant aux hormones, pour former un complexe multi-HATs. Enfin Gcn5 a été la première HAT identifiée (Brownell et al., 1996), elle est présente chez tous les eucaryotes (revue dans (Struhl, 1998)).
Les HATs sont généralement associées à des complexes qui ont été définis en 2 groupes : les HATs de type A sont nucléaires et responsables de lacétylation des histones nucléosomales lors de lactivation de la transcription alors que les HATs de type B sont cytoplasmiques et participeraient à lacétylation des histones nouvellement synthétisées avant lassemblage de la chromatine pendant la réplication de lADN (Kuo and Allis, 1998).
Plusieurs familles de protéines HATs de type A ont été identifiées :
C-2-2-1) La super famille des GNAT
Le premier membre de cette famille à avoir était identifié est Gcn5, présente depuis la levure jusquà lhomme. Cette protéine se caractérise par la présence dun domaine HAT et dun bromo-domaine. PCAF, dorigine humaine et murine a, quant à elle, été clonée par homologie à Gcn5 et possède les mêmes domaines caractéristiques. Ces 2 protéines sont capables dinteragir avec p300/CBP et acétylent préférentiellement lhistone H3 et plus faiblement lhistone H4. De nombreuses études ont montré leur implication dans la transcription in vivo et in vitro et plus particulièrement limportance du domaine HAT de ces protéines. Toutefois, le bromo-domaine semble également requis notamment pour permettre les interactions protéines/protéines et probablement le recrutement de ces facteurs au niveau du promoteur. Enfin des études plus récentes ont montré que PCAF comme hGcn5 étaient capables dacétyler des protéines non-histones impliquées aussi dans la transcription comme la protéine virale Tat, p53, myoD ou TFIIE et TFIIF. Bien que PCAF et hGcn5 semblent extrêmement similaires, elles sont exprimées de façon différentielle dans certains tissus. Aussi, des études postérieures devraient permettre de déterminer si leur fonction est redondante ou distincte (revue dans (Narlikar et al., 2002; Sterner and Berger, 2000)).
Actuellement, 4 protéines humaines de cette famille sont connues. La première, Tip60 a été identifiée par double hybride comme interagissant avec la protéine Tat. Cette interaction inhiberait lactivité HAT de Tip60 entraînant la répression du gène codant pour une dismutase dépendante de magnésium suggérant que Tip60, dans des conditions normales, soit capable dactiver des gènes probablement via lacétylation des histones. MOZ et MORF sont 2 autres protéines de la famille MYST qui interviennent aussi dans des pathologies de type leucémie mais leur rôle dans la transcription demeure encore incertain. Concernant HBO1, son activité HAT na été démontrée quin vitro et sa fonction demeure encore obscure. Toutefois, lensemble des protéines de cette famille semble acétyler préférentiellement lhistone H4, ce qui a été montré notamment pour Tip60 et MORF mais aussi pour des protéines dorigine non-humaine (revue dans (Sterner and Berger, 2000)) suggérant un rôle des protéines de la famille MYST dans lactivation de la transcription.
p300 et CBP sont souvent considérées comme une seule entité car elles sont structurellement et fonctionnellement homologues. Ces 2 protéines sont des co-activateurs de la transcription. Elles sont capables dactiver lexpression spécifique de certains gènes en interagissant avec des co-facteurs comme CREB, c-Fos, c-Jun et c-Myc mais aussi dautres protéines HATs comme PCAF et les co-activateurs des récepteurs nucléaires. Structurellement p300/CBP possède 4 domaines dinteraction, un bromo-domaine et un domaine HAT. Contrairement à dautres HATs, elle acétyle les 4 histones avec peu de spécificité aussi bien dans un contexte de nucléosome que dhistones libres. Enfin, tout comme PCAF, p300/CBP est capable aussi dacétyler des protéines non-histones dorigines diverses. Cette protéine atypique a son activité HAT qui est régulée par des partenaires avec lesquels elle interagit, ce qui concorde avec sa fonction de co-activateur général dans la transcription (revue dans (Sterner and Berger, 2000)).
C-2-2-4) Les co-activateurs des récepteurs nucléaires
Les 2 principaux membres de cette famille sont SRC-1 et ACTR. Ces protéines se caractérisent par un domaine HAT localisé dans la partie carboxy-terminale de la protéine et un domaine de liaison aux récepteurs. Par ailleurs, un troisième membre putatif appelé TIF2 a été identifié mais son activité HAT na pas été démontrée. Ces 3 protéines interagissent avec p300/CBP et deux avec PCAF. De plus, récemment Tip60 a été montrée comme co-activateur de ces récepteurs aux hormones suggérant un rôle important de lacétylation dans la régulation de la transcription en réponse aux hormones (revue dans (Sterner and Berger, 2000)).
TAFII250 est une sous-unité de TFIID qui joue un rôle important dans lassemblage du complexe de pré-initiation. Cette protéine possède un domaine HAT et un bromo-domaine dont la présence nest pas requise pour lactivité HAT. Son rôle dans la transcription interviendrait essentiellement au niveau de linitiation puisquil a été suggéré que TAFII250 acétylerait les histones présentes au niveau de la boîte TATA permettant ainsi à TPB de se fixer. Toutefois même au niveau des gènes dont la région régulatrice est dépourvue de boîte TATA, lactivité HAT de TAFII250 serait requise pour la transcription. Enfin, la spécificité du mécanisme demeure encore inconnue (revue dans (Sterner and Berger, 2000)).
Il est maintenant bien établi que ces activités HATs sont regroupées sous la forme de complexe. Lenvironnement de la protéine portant lactivité HAT semble important puisque pour PCAF par exemple, lorsquelle est associée à son complexe, contenant 20 polypeptides, le niveau dacétylation est plus important (Ogryzko et al., 1998) ce qui peut-être dû aussi à la présence dactivités HATs supplémentaires associées au complexe mais non identifiées. Alors que de nombreuses protéines associées à TBP (TAFs) sont présentes dans le complexe, suggérant un lien direct avec la transcription, la protéine p300/CBP na pas été trouvée associée au complexe PCAF suggérant un rôle distinct de cette protéine. En outre, la purification du complexe Tip60 a aussi permis de montrer que les protéines du complexe étaient des éléments importants pour lactivité HAT puisque alors que Tip60 recombinant est capable dacétyler uniquement des histones libres, le complexe Tip60 acétyle les histones dans le contexte de nucléosome, donc dans des conditions de substrat natif. De plus, la purification du complexe Tip60 a permis, notamment, lidentification de nouvelles fonctions avec limplication de Tip60 dans la réparation de lADN (Ikura et al., 2000). Enfin ces complexes HATs possèdent des sous-unités communes comme TRRAP, protéine régulatrice de la famille des protéines ATM requise pour la transcription de certains gènes oncogènes et la régulation de facteurs de transcription comme p53 (Ard et al., 2002).
Les HATs et les complexes responsables du remodelage de la chromatine participent de façon évidente et en synergie à lactivation de la transcription. Il existe vraisemblablement des spécificités daction déterminées par les partenaires avec lesquels la protéine active interagit. Les années futures devraient permettre de déterminer plus spécialement quelles sont ces spécificités et à quel moment ces protéines interviennent. Enfin, il semble exister une corrélation entre le recrutement des facteurs de transcription capables dinteragir avec lADN et laugmentation de lassociation des HATs au niveau du promoteur indiquant lexistence de modifications sous la forme de cascades. En fait la modification des histones affecte directement la chromatine mais ces modifications présentes en des endroits spécifiques peuvent favoriser linteraction dautres protéines. Aussi, lhypothèse du "code histone" a émergé pour essayer de comprendre ces observations.
C-3) La notion du "code histone"
La notion du "code histone" est un concept récent qui permettrait de comprendre comment lensemble des modifications de la chromatine contribue à la régulation de lexpression des gènes. En effet, lacétylation nest pas la seule modification post-traductionnelle des histones impliquée dans la régulation transcriptionnelle et il semblerait que ces modifications de la chromatine sopèrent selon un certain ordre déterminant ainsi le "code histone".
Les différents et plus fréquents types de modification des histones sont (Figure 9) :
Il existerait une combinaison de modifications qui entraînerait lactivation ou la répression de lexpression de gènes. Par exemple, la phosphorylation de la sérine 10 permettrait lacétylation de la lysine 14 de lhistone H3 permettant lactivation des gènes. Une autre combinaison activatrice a été décrite : la méthylation de larginine 3 potentialiserait lacétylation, par p300, de la lysine 8 et 12 de lhistone H4 entraînant une facilitation de lactivation de la transcription par les récepteurs nucléaires aux hormones. En revanche, il a été décrit quune déacétylation de la lysine 14 de lhistone H3 précédant la méthylation de la lysine 9 aurait une effet inhibiteur sur la transcription (revue dans (Berger, 2002)). Enfin très récemment il a été montré par Allis et coll. que, chez la levure, Rad6, une enzyme permettant le transfert de lubiquitine, servait de médiateur à la méthylation de la lysine 4 de lhistone H3 en permettant lubiquitination de la lysine 123 de lhistone H2B. Lutilisation de mutants a permis de vérifier que ce schéma était unidirectionnel et de montrer limportance de ces modifications dans la répression de la transcription (Sun and Allis, 2002).
Des études restent à faire pour déterminer une ou des séquence(s) de modifications spécifiques aboutissant à lactivation ou la répression de la transcription et/ou si ces modifications sont spécifiques du gène et/ou du promoteur. En outre, de même que pour les facteurs de remodelage de la chromatine du type complexe SWI/SNF et HAT, il semble important darriver à déterminer par quel type de facteur et comment les enzymes de modifications sont recrutées au niveau du promoteur et quelles sont leurs spécificités.
Il est maintenant clairement admis que la chromatine est un élément essentiel dans la régulation de la transcription et ne peut-être considérée comme le simple support porteur de linformation génétique. Sa structure est étroitement régulée et modulée au cours de la transcription. Lensemble des modifications post-traductionnelles existantes est utilisé pour permettre la régulation structurale mais aussi le recrutement de nouveaux facteurs qui vont agir en synergie pour conduire la cellule à exprimer/réprimer certains gènes.
D) Régulation des facteurs de transcription par modifications post-traductionnelles
Comme mentionné précédemment, les modifications post-traductionnelles naffectent pas que les histones mais ont été décrites également au niveau des protéines non-histones et plus particulièrement pour les facteurs de transcription.
Depuis quelques années, de nombreuses études biochimiques ont montré que les facteurs de transcription eux-mêmes étaient modifiés post-traductionnellement par phosphorylation, acétylation, méthylation, ubiquitination, ADP-ribosylation etc Comme pour les histones, ces modifications ont lieu sur certains résidus, elles sont catalysées par des enzymes spécifiques, souvent les mêmes que pour les histones et elles sont réversibles. Lexemple le plus décrit dans la littérature est p53, facteur de transcription suppresseur de tumeurs, dont lactivité est régulée par phosphorylation, acétylation et ubiquitination. En effet de telles modifications entraînent souvent de nouveaux sites de liaison pour dautres facteurs régulateurs qui vont agir soit en modifiant directement la stabilité de la protéine, soit en régulant lactivité dautres facteurs associés ou en modulant les interactions entre le facteur de transcription et ses partenaires, comme cest le cas pour p53. Enfin les données concernant p53 suggèrent quil existerait un réseau de régulation entre ces différentes modifications, la phosphorylation dans la partie N-terminale permettant linteraction avec des HATs qui acétyleraient la partie C-terminale de la protéine (revue dans (Meek, 1999)).
La phosphorylation est de loin la modification la plus étudiée, mais parmi lensemble des modifications étant impliquées dans la transcription, 2 suscitent actuellement beaucoup dintérêt et apparaissent comme des éléments régulateurs de la transcription à part entière. Il sagit de lacétylation qui initialement étaient associée à la modification des histones et lubiquitination. Cette dernière, connue depuis longtemps, était auparavant considérée uniquement comme un marqueur de dégradation des protéines par le protéasome. Cependant depuis environ 3 ans, différentes études suggèrent que lubiquitination pourrait être aussi un moyen pour le substrat de réguler son efficacité daction, notamment pour les facteurs de transcription (revue dans (Conaway et al., 2002; Thomas and Tyers, 2000)).
D-2-1) Mécanismes et enzymes associées
Lacétylation est le transfert dun groupement acétyl (CH3-CO-) depuis lacétyl-Coenzyme A vers un groupe e-amine de certaine lysine (Figure 10).
Cette réaction est catalysée par des enzymes possédant un domaine HAT, comme décrit précédemment. Il ne semble pas exister de spécificité de substrat pour ces enzymes qui semblent capables dacétyler des protéines histones ou non-histones indifféremment. En revanche, il a été montré que certains facteurs de transcription, notamment dorigine virale, pouvaient moduler la spécificité daction des HATs sur les protéines histones ou non-histones (Chan et al., 2001; Col et al., 2002; Li et al., 1999).
D-2-2) Substrats et fonction de lacétylation
La plupart des substrats dacétylation identifiés sont des facteurs impliqués dans la régulation de la transcription. Sont inclus entre autre p53, E2F1, la sous-unité b du complexe TFIIE, TFIIF (revue dans (Kouzarides, 2000)) et la protéine trans-activatrice Tat dorigine virale (Col et al., 2001; Deng et al., 2000; Kiernan et al., 1999; Ott et al., 1999). En outre dautres protéines non impliquées dans la transcription comme limportine a, protéine de la famille des facteurs dimport nucléaire (Bannister et al., 2000) et même des protéines cytoplasmiques comme la tubuline (L'Hernault and Rosenbaum, 1985) sont aussi modifiées par acétylation. Enfin certaines HATs elle-mêmes sont capables de sauto-acétyler comme PCAF mais ce nest pas une généralité, hGcn5 nétant pas modifiée par acétylation (Herrera et al., 1997).
Concernant les facteurs de transcription, le site dacétylation est souvent localisé à proximité du site de liaison à lADN, permettant ainsi lors de lacétylation de la protéine une augmentation de laffinité du facteur pour lADN. En effet, lacétylation de p53 par p300 augmente considérablement laffinité du facteur de transcription pour lADN (Gu and Roeder, 1997). Ces résultats ont par la suite été confirmés par Sakaguchi et coll. qui ont également montré par des analyses de liaisons entre la séquence de fixation de p53 et p53, préalablement incubé ou pas avec des formes recombinantes de PCAF et/ou p300, une augmentation de laffinité de p53 pour son site de liaison suggérant ainsi que les formes acétylées de p53 sont plus affines pour lADN que p53 non modifié (Sakaguchi et al., 1998). Toutefois ces résultats ont été controversés par Espinosa et Emerson qui ont montré que lacétylation de p53 par p300 stimulait sa capacité de liaison à de courts oligonucléotides contenant le site de liaison de p53 au niveau du promoteur de p21, par contre aucun effet na été observé lorsquun plus grand fragment dADN a été utilisé (Espinosa and Emerson, 2001). Enfin des analyses faites avec des mutants de p53 au niveau des cibles dacétylation par ChIP ont montré que les mutants liés aussi bien le promoteur de p21 que p53 sauvage (Barlev et al., 2001) suggérant ainsi que lacétylation de p53 na pas deffet particulier sur la capacité de p53 à se lier à lADN (revue dans (Prives and Manley, 2001)). Des résultats plus clairs ont été obtenus pour c-myb qui est acétylé in vitro et in vivo par p300. Lacétylation est corrélée à une augmentation de la liaison de c-myb à lADN in vitro et la transfection de p300 entraîne une augmentation de lactivation de la transcription dépendante de c-myb à partir de 2 promoteurs in vivo (Tomita et al., 2000). Dans ce dernier exemple, il est impossible de savoir si leffet observé dépend de lactivité de p300 sur c-myb, la chromatine ou les deux. Des données contradictoires ont aussi été obtenues concernant le facteur de transcription majeur de la lignée hématopoïétique : GATA-1. Alors que Boyes et coll. avaient initialement montré que la forme de GATA-1 acétylée in vitro liait mieux lADN (Boyes et al., 1998), Hung et coll. ont par la suite souligné que la présence dacétyl-CoA ne modifiait pas laffinité du facteur de transcription à sa cible suggérant que les formes acétylées de GATA-1 nétaient pas plus affines pour lADN (Hung et al., 1999). Cette différence de résultats peut-être due, comme cela est décrit pour p53 ci-dessus, à lutilisation de techniques différentes.
En outre, lacétylation peut aussi moduler les interactions protéines/protéines. Il existe plusieurs exemples dans la littérature dont celui du HMGI(Y). Les travaux effectués par Thanos et coll. montrent que lacétylation de HMGI(Y) par PCAF au niveau de la lysine 71 augmente laffinité de HMGI(Y) avec ses activateurs ATF2, p50 et p65 permettant une stabilisation de lenhanceosome et lactivation de la transcription. En revanche lacétylation par p300 au niveau de la lysine 65 déstabilise lenhanceosome. Par contre cette acétylation est diminuée quand la lysine 71 est acétylée. Les auteurs proposent que lacétylation par p300 serait en étroite corrélation avec la déacétylation de la lysine 71 et donc la déstabilisation de lenhanceosome, suggérant ainsi que la transcription du gène de linterféron-b dépendrait de lordre dacétylation de HMGI(Y) (Munshi et al., 2001; Munshi et al., 1998).
De telles modifications créent aussi de nouveaux sites de reconnaissance et de liaison et plus particulièrement dans le cas de lacétylation, qui permet aux protéines possédant un bromo-domaine dinteragir avec la partie acétylée de la protéine (Mujtaba et al., 2002; Zeng and Zhou, 2002) (revue dans (Nakatani, 2002)).
Enfin lacétylation semble aussi avoir un effet sur la stabilité des protéines. En effet, des analyses par Western Blot ont montré quen présence de PCAF mais pas de PCAF ayant le domaine HAT tronqué, E2F1 est plus exprimée, suggérant quin vivo la forme acétylée de E2F1 ait une demi-vie plus longue que la forme non-acétylée. Ces résultats ont été appuyés par des analyses en marquage/chasse montrant que la demi-vie initiale dE2F1, définie à moins de 3 heures, devenait supérieure à 6 heures en présence de PCAF. Par contre, lutilisation dun mutant dE2F1, où les lysines cibles sont mutées en arginines, na pas sa demi-vie changée par la présence de PCAF en comparaison à la forme sauvage dE2F1 suggérant bien que lacétylation par PCAF de ce facteur de transcription influencerait sa stabilité (Martinez-Balbas et al., 2000). Toutefois, il est difficile de savoir si leffet observé est direct ou résulte du recrutement ou de la dissociation de facteurs impliqués dans la dégradation de la protéine (revue dans (Kouzarides, 2000; Sterner and Berger, 2000)).
Compte tenu du nombre important de facteurs acétylés dorigine non-histone, il semble quil serait peut-être temps dôter le préfixe histone. Dailleurs, en fonction du substrat, ces enzymes sont appelées HATs lorsquil sagit dhistones et de FATs (factor acétyltransferase) pour les autres protéines. Il existe maintenant de nombreuses évidences qui montrent clairement que lacétylation est une modification post-traductionnelle extrêmement importante dans la régulation transcriptionnelle de lexpression des gènes et dans dautres processus cellulaires.
D-3-1) Mécanismes et enzymes associées
Lubiquitine est une petite protéine de 76 acides aminés extrêmement conservée qui a initialement été découverte comme une étiquette macromoléculaire qui sattache de façon covalente à certaines protéines les marquant ainsi pour quelles soient reconnues et dégradées par le protéasome (revue dans (Pickart, 2001)). Une chaîne de molécules dubiquitine est conjuguée à des lysines spécifiques de la protéine cible par lintermédiaire dune cascade multi-enzymatique. La première étape consiste en la liaison de la partie carboxy-terminale de lubiquitine à un site actif de cystéine de lenzyme E1 à travers une liaison thioester. Cette enzyme E1 catalyse lactivation et la liaison en présence dATP. La seconde étape fait intervenir une autre enzyme appelée E2 qui permet le transfert de lubiquitine de E1 sur E2 et/ou sur le substrat. Enfin une ubiquitine-ligase ou E3 pourrait permettre soit le rapprochement du substrat, soit la liaison covalente de lubiquitine sur le groupe e-amine de certaines lysines des substrats (Figure 11). La protéine ubiquitinée peut être modifiée par lajout de plusieurs groupes dubiquitine créant ainsi une chaîne de longueur variable. Lajout de 4 protéines dubiquitine permettrait la formation dune structure qui serait reconnue par le protéasome. (revue dans (Pickart, 2001)).
Les 2 principales familles de facteurs E3 identifiés sont : les E3s de la famille des protéines avec un domaine HECT ( homologous to E6-AP carboxy terminus) et celles des protéines avec un domaine RING (really interesting new gene).
Les protéines de la famille HECT ont été identifiées à partir détudes sur la dégradation conditionnelle de p53. Quand les cellules sont infectées par une forme oncogénique du papillomavirus humain (HPV), p53 est dégradée sélectivement par le protéasome, en fonction du produit du gène E6 du virus et dune protéine cellulaire associée dont lensemble sappelle E6/E6-AP. Cette protéine comporte dans sa partie carboxy-terminale un domaine HECT avec une cystéine extrêmement conservée qui est requise pour lubiquitination car elle sert de support pour la formation de la liaison thioester avec lubiquitine. En revanche la partie amino-terminale qui intervient pour linteraction avec le substrat est spécifique de chaque protéine. Il existerait apparemment un certain nombre potentiel de protéines HECTs, la plupart de ces enzymes ne serait pas encore caractérisée.
Le domaine RING est caractérisé par un enchaînement spécifique dhistidine et de cystéine permettant de coordonner 2 atomes de zinc (Figure 12).
Il semblerait exister un grand nombre de protéines possédant ce type de domaine. Cependant, sil est vrai que toutes les E3s qui nont pas de domaine HECT ont un domaine RING ou un domaine RING dégénéré, toutes les protéines RING ne sont pas connues pour être des E3s. Ces protéines peuvent agir seule ou sous la forme dun complexe multiprotéique.
D-3-1-2-1) Les protéines RING non-complexées
Les 2 protéines possédant un domaine RING et capables dagir sous une forme monomérique les plus décrites dans la littérature sont c-Cbl et MDM2, encore appelée Hdm2 pour la forme humaine. La première est responsable de lubiquitination des récepteurs aux protéines kinases EGF (epidermal growth factor) et PDGF (platelet-derived growth factor) et MDM2 a initialement été identifié pour réguler le niveau cellulaire de p53 (Haupt et al., 1997; Honda et al., 1997; Kubbutat et al., 1997). Des mutations dans le domaine RING de ces enzymes entraînent une absence dactivité sur leur substrat. Par ailleurs elles sont capables de sauto-ubiquitiner et elles sont également post-traductionnellement modifiées notamment par phosphorylation et sumoylation ce qui régule leur activité et leur capacité dinteraction à leur cible. Concernant MDM2 qui régule le facteur de transcription p53, de plus en plus de substrats ont été identifiés incluant Tip60 (Legube et al., 2002), facteur associé à la protéine virale Tat. En outre MDM2 interagit avec de nombreuses protéines cellulaires et notamment des facteurs impliqués dans la transcription comme TAFII250, p300, Sp1 (revue dans (Daujat et al., 2001)) suggérant un rôle important dans ce processus bien que les mécanismes exacts ne soient par encore parfaitement connus. Enfin, de façon surprenante, alors que MDM2 interagit avec E2F1 (Martin et al., 1995) et quE2F1 est ubiquitiné et dégradée (Campanero and Flemington, 1997), il na jamais été montré que MDM2 était responsable de lubiquitination dE2F1. Ces données laissent penser quil pourrait exister une importante spécificité daction qui ne serait pas seulement déterminée par sa capacité dinteraction.
D-3-1-2-2) Les protéines RING complexées
Certaines des protéines RING, clairement identifiées comme des E3s, agissent en association avec dautres partenaires. Trois types de complexes, de nature différente, ont été identifiés.
La spécificité des complexes SCF est déterminée par la nature de la protéine F-box dont il plusieurs formes. Les F-box, de nature humaine, les plus étudiées sont : hCdc4, Skp2 et b-TrCP. Il semblerait que le substrat doit être phosphorylé pour être reconnu par la protéine F-box. La protéine F-box se lie à lenzyme E2 via une interaction avec Skp1 lui-même lié à la culline 1 qui sont des composants invariants du complexe (Figure 13).
Le complexe APC est surtout impliqué dans lubiquitination des facteurs du cycle cellulaire permettant le passage des cellules de la métaphase à lanaphase. Ce complexe est constitué par 11 sous-unités chez lhomme mais leurs rôles ne sont pas très bien caractérisés. Deux types de signal de destruction ont été déterminés au niveau des différents substrats : la D-box et la KEN-box définissant ainsi la spécificité daction du complexe.
Enfin, le complexe VBC est quant à lui au point de vue structurel extrêmement similaire au complexe SCF (Figure 13). La spécificité de reconnaissance du substrat est déterminée par une famille de protéines supresseurs de la signalisation des cytokines ou protéines SOCS-box encore appelés VHL. La liaison à lenzyme E2 se fait par lintermédiaire des Elongin B et C qui interagissent avec la culline 2.
En conclusion, il existe plusieurs protéines capables dubiquitination ce qui pourrait créer une spécificité daction. Par ailleurs, les analyses de banque de données suggèrent quil existe encore des centaines de protéines possédant un des domaines actifs mais dont le rôle na pas encore été identifié. Ainsi, même si lon sait déjà quà chacune ubiquitine-ligase nest pas associé un seul substrat comme cest le cas pour MDM2 ou b-TrCP, on peut penser quil existe toutefois une certaine spécificité qui pourrait être déterminer par la catégorie du substrat (facteur de transcription, protéines du cycle cellulaire ect ) ou par létat du substrat (phosphorylé, sumoylé ect ).
D-3-2) Substrats et fonctions de lubiquitination
Lubiquitination est traditionnellement associée à la dégradation des protéines et de nombreuses autres études soulignent ou suggèrent également son rôle dans dautres fonctions telles que lendocytose, le remodelage de la chromatine ou encore la réparation de lADN (revue dans (Marx, 2002)). La découverte de substrats impliqués dans la transcription à inciter des recherches plus approfondies quant au rôle de lubiquitination dans le contrôle transcriptionnel de lexpression des gènes. Généralement, les facteurs de transcription sont des protéines instables, ce qui nest pas contradictoire avec leur activité puisquune certaine instabilité pourrait permettre un contrôle plus étroit de leur renouvellement en fonction de létat cellulaire ou plus simplement, ce mécanisme suicide pourrait être utilisé pour atténuer le signal transcriptionnel après lactivation (revue dans (Thomas and Tyers, 2000)). Dans certains cas, lubiquitination permet dactiver les facteurs de transcription par lactivité protéolytique comme cela a été décrit pour NF-kB (Palombella et al., 1994). En outre, chez la levure, il a été montré que lubiquitination pouvait être importante pour la transcription mais indépendamment de lactivité protéolytique. En effet, en absence de Met30, une protéine F-box, le facteur de transcription chimérique LexA-VP16, composé par la fusion du domaine de liaison à lADN de LexA et le domaine dactivation de VP16, nest non seulement plus capable dêtre ubiquitiné mais aussi dactiver la transcription suggérant que lubiquitination est requise pour lactivité transcriptionnelle de la chimère (Salghetti et al., 2001). Une expérience de ChIP montre pourtant quen absence de Met30, le facteur LexA-VP16 interagit efficacement avec le promoteur. En accord avec leur interprétation, la fusion dune molécule dubiquitine à LexA-VP16 permet de rétablir son activité en absence de Met30 sans pour autant affecter la demi-vie du facteur de transcription suggérant que lubiquitination de LexA-VP16 par Met30 ne soit pas un signal pour sa destruction mais une modification requise pour sa fonction en tant quactivateur. Toutefois, dans leur système, Met30 entraîne la dégradation de LexA-VP16 ce qui suggère que la destruction de lactivateur par le protéasome soit une conséquence naturelle de lubiquitination. Aussi, lubiquitination lierait lactivité des facteurs de transcription à leur destruction. Les formes non-ubiquitinées des activateurs seraient donc stables et inactives et leur ubiquitination permettrait lactivation et la destruction. Dailleurs, une étude faite par la même équipe, sur plusieurs facteurs de transcription instables, révèle que la région ubiquitinée correspond à celle qui est requise pour lactivation de la transcription (Salghetti et al., 2000) et cette idée avait déjà été proposée ultérieurement par Molinari et coll. qui suggéraient un couplage fonctionnel entre activation et dégradation (Molinari et al., 1999). Ces observations sont édifiées sur le système expérimental de fusion dun domaine dactivation transcriptionnelle à GAL4. Ces constructions sont transfectées dans des cellules qui expriment stablement un gène rapporteur sous le contrôle dun promoteur contenant 5 sites de liaisons à GAL4. De façon systématique, ils observent une parfaite corrélation inverse entre la capacité dactivation de leur chimère et leur niveau dexpression cellulaire, quantifié par Werstern Blot. En revanche, ils montrent que la quantité dARN est inchangée dun activateur à lautre confirmant ainsi que les différents niveaux dexpression ne sont pas dus à un défaut de synthèse. Des analyses en marquage/chasse montrent bien que les chimères les plus efficaces sont les plus vites dégradées, par contre elles sont stabilisées par lutilisation dinhibiteurs spécifiques du protéasome suggérant une étroite corrélation entre lactivation de la transcription et la dégradation de lactivateur par la voie de lubiquitine/protéasome. En outre, par des expériences de liaison à lADN, ils montrent que lactivateur le plus efficace lie mieux lADN mais ce uniquement en présence dinhibiteur de protéasome, le niveau de la protéine dans les cellules non traitées étant inférieur au seuil de détection. Ces résultats suggèrent donc que le complexe formé par lactivateur et lADN est reconnu et dégradé par le protéasome plus efficacement quun activateur qui ne se lie pas peut-être parce que la formation dun complexe crée un structure instable. Bien que cette étude napporte pas la preuve que lubiquitination des facteurs de transcription est essentielle à leur activation, elle suggère que leur dégradation par le protéasome est corrélée à leur activité. Cependant, à ce jour, il na jamais été montré que les formes ubiquitinées des facteurs de transcription étaient recrutées au niveau du promoteur ni que ces facteurs étaient capables de recruter les composants de la machinerie cellulaire dubiquitination. Toutefois le complexe du protéasome et plus particulièrement la sous-unité 19S est capable dactiver lélongation de la transcription par lARNPII in vitro et des analyses de ChIP ont montré que le complexe était présent au niveau dun promoteur activé (revue dans (Conaway et al., 2002)). Lensemble de ces observations suggère que le signal initiant lubiquitination des facteurs de transcription provienne de la machinerie de transcription de lARNPII et que les E3s responsables de lubiquination pourraient être des composants de la machinerie transcriptionnelle.
Limplication de lubiquitination dans la régulation de la transcription par lARNPII fait actuellement lobjet dintensives recherches. Lubiquitine ne serait pas seule à intervenir mais lensemble des complexes et les différents aspects de ce processus seraient impliqués. Enfin les investigations futures devraient permettre déclaircir le rôle de lubiquitine dans lactivation et la destruction des facteurs de transcription, rôle qui pourrait être fondamental voir un mécanisme général des processus dactivation et de répression de la transcription par lARNPII.
Lensemble des modifications post-traductionnelles des facteurs de transcription est un élément important de la régulation transcriptionnelle. En effet, grand nombre dentre eux sont acétylés permettant essentiellement de moduler leur interaction protéine/protéine. La phosphorylation aussi est une modification importante, elle semble étroitement corrélée avec lubiquitination, certains substrats devant être phosphorylés pour être reconnus par lE3. Lensemble des résultats suggère que comme pour les histones il existe un code qui permettrait de réguler lactivité des facteurs de transcription. Des données manquent pour laffirmer clairement et établir un mécanisme général mais la dynamique des modifications, les multiples interactions entre les enzymes impliquées suggèrent quil doit exister une certaine hiérarchie afin dobtenir un message parfaitement clair permettant un contrôle et une activité optimale de la transcription.
La transcription est un mécanisme extrêmement régulé et complexe. Le nombre de facteurs intervenant dans ce processus est considérable. Les différentes études réalisées ont permis de comprendre certains processus de façon plus ou moins complète. La régulation est effectuée à chaque étape et fait intervenir des complexes protéiques pour le contrôle des étapes dinitiation et délongation, pour remodeler la chromatine et enfin pour moduler lactivité des facteurs de transcription.
E) Références bibliographiques
Ce chapitre est issu de la THESE de Doctorat de
Vanessa Bres, 25 Novembre 2002, Université Montpellier II
"Etude des modifications post-traductionnelles de la protéine TAT du virus de l'immunodéficience humaine
de type-1 : rôle dans la régulation de son activité transcriptionnelle"
Directeur de Thèse : Monsef Benkirane, IGH, UPR CNRS 1142
© Copyright Université Montpellier II 2002
Created: 06/01/2003
Last updated: Friday, 22-Sep-2023 18:16:14 CEST
Author: Vanessa Bres
bres@salk.edu
Editors: Chantal Ginestoux and Marie-Paule Lefranc