Monsieur l’Administrateur,
Mes chers Collègues et Confrères,
Mes amis, my friends, agapimeni mou fili,
La création d’une chaire d’Épigénétique et mémoire cellulaire inaugure pour le Collège de France comme pour moi une aventure nouvelle. Je me sens d’abord
hautement honorée d’en avoir été jugée digne et je remercie tous les professeurs de m’accueillir aujourd’hui au sein de leur prestigieuse assemblée. Il m’importe en particulier d’exprimer ma
gratitude à Christine Petit, qui m’a accordé sa confiance et son soutien constant. Je dois également dire ma très sincère reconnaissance à Pierre Corvol, qui a défendu la création de cette
chaire, et à Alain Prochiantz pour ses conseils, son aide et son amitié. J’aurai l’occasion de citer beaucoup de mes maîtres et proches collègues au cours de cette leçon.
Mais je voudrais encore remercier plus particulièrement Vincent Colot d’avoir été ma source d’inspiration et mon soutien constants tout au long du chemin
complexe que j’ai parcouru et qui m’amène aujourd’hui devant vous.
« Épigénétique et mémoire cellulaire » : comme nous le verrons dans un instant, cet intitulé désigne un champ d’investigation nouveau et très riche du domaine de la biologie,
qui touche aussi bien le développement des organismes et les variations normales ou pathologiques de celui-ci, notamment en lien avec l’environnement, que l’hérédité et l’évolution. Cette
nouvelle chaire se situe donc à l’intersection des différentes disciplines que sont la génétique, la biologie du développement, l’écologie et l’évolution.
Avant de décrire ce nouveau champ de recherche, commençons par rappeler la découverte au milieu du siècle dernier de cette réalité extraordinaire :
les gènes sont portés par la molécule d’ADN et par celle-ci seulement. Ils forment des unités d’information inscrites dans la séquence des quatre nucléotides A, T, G et C qui composent l’ADN.
Cette information détermine, « code » les protéines, qui sont des molécules essentielles pour assurer les fonctions nécessaires à la vie.
La structure de l’ADN en deux brins complémentaires porte en elle la clé de l’extrême fidélité avec laquelle l’information génétique est transmise au
travers des divisions cellulaires. C’est ainsi que la myriade de cellules composant le corps humain possèdent toutes la même séquence de 3 milliards de nucléotides, à quelques très rares
variations près. Se pose alors la question de ce qui distingue, pour ne s’arrêter qu’à deux exemples, un lymphocyte d’un neurone.
La réponse est loin d’être parfaitement connue, mais nous savons, depuis l’avènement de la biologie moléculaire, que la régulation de l’expression
génétique, autrement dit la régulation de la transcription des gènes en ARN messagers, ainsi que la traduction de ces derniers en protéines, est au cœur de la différenciation cellulaire. La
question revient alors à se demander comment, au sein d’une cellule, seuls certains gènes sont exprimés, et par quels mécanismes la cellule établit ce choix. En conserve-t-elle éventuellement
la mémoire alors que les conditions ayant présidé à celui-ci ont disparu, parfois depuis des temps très longs ; ou bien encore le transmet-elle de façon clonale au travers de multiples
divisions cellulaires ? À quoi s’ajoute cette question tout aussi importante : comment le processus de différenciation peut-il s’inverser ? En effet, la fécondation, par
exemple, met en jeu deux cellules très différenciées – le spermatozoïde et l’ovule – et produit presque immédiatement une cellule totipotente, le zygote, à partir duquel un
enchaînement vertigineux de divisions et différenciations cellulaires est déclenché pour former le nouvel individu. À ces reprogrammations nécessaires à la vie répondent celles qui sont
potentiellement porteuses de mort, comme dans le cancer, et contre lesquelles nous sommes encore le plus souvent démunis. D’autre part, les travaux du Japonais Shinya Yamanaka, que le comité
Nobel vient d’honorer, montrent qu’il est possible de « reprogrammer » des cellules différenciées en cellules souches pluripotentes, et cela en jouant sur l’expression de seulement
quatre gènes ! Cette reprogrammation forcée, qui ouvre un fantastique potentiel thérapeutique – celui de la médecine régénérative –, reste néanmoins peu efficace car elle
requiert de très nombreuses divisions cellulaires pour s’établir, ce qui fait que le processus va rarement jusqu’à son terme. Pourquoi ? Quels sont les freins ?
Les réponses à cet ensemble de questions sont à trouver dans l’organisation du génome au sein du noyau de nos cellules, lequel génome, comme chez tous
les organismes eucaryotes, est associé à une myriade de protéines et de molécules d’ARN. Cette structure nucléoprotéique complexe, appelée chromatine, Emil Heitz l’a décrite en 1928
comme existant sous deux états, l’hétérochromatine, ou chromatine condensée, pauvre en gènes et l’euchromatine, ou chromatine décondensée, riche en gènes (Heitz, 1928).
Malgré cette distinction, la chromatine a été longtemps perçue essentiellement comme une structure d’empaquetage du génome dans l’espace confiné du noyau. Il est vrai que chez l’homme, l’ADN
du génome mesure au total près de 2 mètres de long, alors que le noyau ne fait que 10 microns de diamètre. Or, nous savons maintenant que la chromatine joue un rôle déterminant dans
la modulation de l’accessibilité à l’information génétique et la mémorisation des états d’expression des gènes à travers les divisions cellulaires.
Intéressons-nous maintenant au mot épigénétique. L’adjectif comme le nom sont d’usage récent. Le premier apparaît semble-t-il au xixe siècle, très certainement en référence à l’épigénèse, que je définirai dans un instant. L’origine du second est quant à elle
précisément identifiée et remonte à 1942.
Conrad Hal Waddington, scientifique et philosophe britannique, est le premier à formuler de façon explicite la nécessité d’établir les liens de causalité
entre génotype et phénotype pour appréhender les processus du développement. En d’autres termes, il importe à ses yeux de rapprocher la génétique – la science de l’hérédité des
caractères, science créée à la redécouverte des travaux de Gregor Mendel à l’aube du xxe siècle –, de l’épigénèse – la
théorie du développement par élaboration progressive des formes. Cette théorie fut formulée initialement par Aristote, quatre siècles avant notre ère, en opposition à celle de la
préformation. Mais elle ne fut validée expérimentalement que bien des siècles plus tard, aux xviiie et xixe siècles, notamment grâce aux progrès en microscopie qui permirent enfin d’observer l’intérieur de l’œuf et les divisions cellulaires.
Dans un court article, Waddington propose donc de fusionner les termes épigénèse et génétique pour désigner de ce nouveau nom l’étude des mécanismes par lesquels les gènes
déterminent les caractères (Waddington, 1942).
Que savions-nous en 1942 de l’action des gènes ? Rien, ou presque, mais cela n’empêcha pas Waddington d’émettre l’hypothèse que le développement embryonnaire mobilise des réseaux
changeants d’interactions entre gènes, et à cet égard il peut-être considéré comme l’un des pionniers de la biologie systémique. Avec un certain talent d’artiste, il illustre ses concepts par
des croquis : son dessin du « paysage épigénétique », métaphore du rôle de la régulation des gènes dans le développement, est resté célèbre dans le milieu de la biologie
(Waddington, 1957). Waddington publie énormément sur le sujet, à partir de ses observations du développement embryonnaire et de ses analyses génétiques chez les oiseaux, la mouche ou d’autres
espèces. Il observe et décrit aussi les conséquences de changements environnementaux ou génétiques sur le développement. Je reviendrai à de multiples reprises dans mes cours des prochaines
années sur les travaux et la pensée de Waddington, dont l’importance reste à mes yeux essentielle et insuffisamment reconnue.
Au début des années 1950, plusieurs découvertes majeures ouvrent la voie à l’analyse moléculaire des relations causales entre génotype et phénotype
– l’approche prônée donc par Waddington. C’est notamment, comme je l’ai déjà mentionné, la révélation que les gènes sont portés par la molécule d’ADN, puis l’élucidation de la structure
en double hélice de l’ADN, qui marquent l’avènement de la biologie moléculaire dans les années 1960. Une étape conceptuelle essentielle est franchie avec les travaux de François Jacob et
Jacques Monod sur la bactérie Escherichia coli et le phage lambda, dans le laboratoire d’André Lwoff, à l’Institut Pasteur.
Ils proposent pour la première fois un modèle de régulation de l’expression des gènes, par interaction d’une région spécifique de l’ADN située à
proximité avec une molécule régulatrice, ARN ou protéine (Jacob et Monod, 1961). Jacob et Monod suggèrent qu’un tel modèle puisse expliquer l’expression différentielle des gènes au cours du
développement. Comment ? En 1934 déjà, le généticien Thomas Hunt Morgan avait émis l’idée de l’existence de « différentes batteries de gènes entrant en action les unes après les
autres au fur et à mesure du développement de l’embryon » (Morgan, 1934). À la fin des années 1940 et au début des années 1950, Barbara McClintock, propose, à partir de ses
observations sur le maïs, que l’activité des gènes est régulée au cours du développement par des « éléments de contrôle », qu’elle nomme également transposons parce qu’ils
sont capables de se déplacer le long du génome. Elle défend l’idée selon laquelle la mobilisation des transposons, dont nous savons dorénavant qu’ils sont, avec leur reliques, la composante
majoritaire du génome du maïs, de l’homme et de beaucoup d’autres organismes eucaryotes, fait partie intégrante du mécanisme de régulation de l’expression génétique. Si cette dernière
hypothèse s’est révélée fausse, quoique pas tout à fait, comme des travaux récents sur le cerveau le suggèrent, ce que dit Barbara McClintock des « éléments de contrôle » dont elle
vient en réalité de révéler l’existence est d’une justesse inouïe (McClintock, 1951) : « Nous savons maintenant que ces éléments de contrôle peuvent modifier l’activité des gènes de
nombreuses façons différentes. Ils peuvent décider de la période où le gène sera actif dans le développement d’un tissu. Mais ils peuvent aussi déterminer dans quelles cellules ce gène sera
actif. »
Sur la base de ces différents travaux, Roy J. Britten et Eric H. Davidson proposent en 1969 un modèle théorique de la régulation des gènes en réseaux. Selon ce modèle, des gènes de
régulation codent des facteurs qui, par diverses combinaisons, activent de façon concertée plusieurs ensembles de gènes non contigus, lors de la différenciation cellulaire (Britten et
Davidson, 1969).
Durant cette période, l’embryologie expérimentale progresse elle-même à grand pas. Parmi les nombreuses avancées majeures, je citerai les travaux de
Robert Briggs et Thomas King (Briggs et King, 1952) et ceux de John Gurdon (Gurdon, 1962), qui lui valurent d’être honoré cette année par le comité Nobel au côté de Shinya Yamanaka. Ces
chercheurs démontrent, par une série d’expériences qui feront date, qu’il est possible de transplanter, dans des ovocytes énucléés de grenouille, des noyaux de cellules différenciés et
d’obtenir de la sorte le développement de nouvelles grenouilles. Ces résultats prouvent que le matériel génétique est préservé lors de la différenciation cellulaire et que le développement
embryonnaire résulte de changements de l’expression du génome plutôt que de son contenu.
Sur un tout autre plan, je citerai également les travaux pionniers de Nicole Le Douarin, qui fut titulaire de la chaire d’Embryologie cellulaire et moléculaire du Collège de France. Elle
a mis au point le système de chimères caille-poulet, tour de force expérimental qui permet pour la première fois de suivre le destin de cellules précises au cours du développement, et
notamment des cellules de la crête neurale, structure transitoire de l’embryon des Vertébrés. Avec son équipe, elle a montré que ces cellules migrent pour donner naissance à une grande
diversité de types cellulaires chez l’adulte.
Cependant, et malgré les nombreuses avancées tant en biologie moléculaire qu’en embryologie expérimentale, les liens entre l’activité des gènes et le
développement restaient désespérément nébuleux. De fait, ces deux disciplines se développaient en parallèle, sans véritable dialogue. L’épigénétique piétinait et rares étaient les chercheurs
qui utilisaient ce terme. Peut-être à juste titre, à l’époque : les relations causales entre génotype et phénotype n’ont commencé à être véritablement élucidés qu’au début des
années 1980, avec notamment l’identification par Christiane Nüsslein-Volhard et Eric Wieschaus d’une série de mutants affectant la viabilité de l’embryon de la drosophile. Ces travaux
faisaient suite à ceux du généticien Edward Lewis qui, des années 1940 à 1980, réalisa l’analyse génétique systématique de mutants homéotiques, nommés ainsi parce qu’ils provoquent la
substitution d’un organe par un autre chez la mouche adulte. Deux exemples frappants sont les mutants Antennapedia, chez lequel les antennes sont remplacées par des pattes, et
Ultrabithorax, qui possède une seconde paire d’ailes en lieu et place des haltères. Nüsslein-Volhard et Wieschaus, en se focalisant sur l’étude des étapes précoces du développement
de la mouche, abordaient directement et pour la première fois la logique des gènes contrôlant l’embryogénèse. Ces travaux marquent la naissance de la génétique du développement et sont
rapidement suivis par la découverte que nombre des gènes identifiés chez la drosophile sont conservés chez les Vertébrés et assurent des fonctions semblables. C’est l’émergence d’une autre
discipline extrêmement féconde, la génétique évolutive du développement, l’Evo-Devo.
Au tournant des années 1980-1990, le terme épigénétique vit une renaissance tout comme il acquiert un nouveau sens. Cette évolution
sémantique fait suite à la prise de conscience que certains changements dans l’expression des gènes sont transmis au travers des divisions cellulaires, voire des générations dans certains
cas, et cela sans que la séquence d’ADN soit elle-même changée. Ainsi, dès 1971, Eduardo Scarano faisait valoir que ce sont des processus de modification plutôt que de mutation de la séquence
d’ADN qui expliquent cette transmission stable d’états particuliers d’activité des gènes (Scarano, 1971). De telles modifications ont été mises en évidence peu après, comme notamment la
méthylation d’une des quatre bases de l’ADN – la cytosine. De plus, il apparaît très vite que cette méthylation est transmise au fil des divisions cellulaires et, fait notable, qu’elle
est souvent associée à une répression stable de l’activité des gènes. En l’occurrence, c’est le généticien australien Robin Holliday qui propose en 1994 de redéfinir l’épigénétique comme
l’étude des changements d’expression des gènes transmissibles au travers des divisions cellulaires, voire des générations, sans changement de la séquence de l’ADN (Holliday, 1994).
On en est donc venu à l’idée que des modifications dites « épigénétiques » constituent des signaux régulateurs héritables, qui s’ajoutent à
l’information portée par la séquence de l’ADN. Ce concept rencontre alors un succès rapide. De fait, il offrait également une explication bienvenue à plusieurs observations disparates, qui
depuis des années laissaient les scientifiques perplexes car elles ne suivaient pas les lois classiques de la génétique mendélienne. Les exemples de cette « hérédité hétérodoxe » ne
manquaient pas.
Citons pour commencer les bigarrures chez les végétaux. Barbara McClintock avait montré que certaines d’entre elles étaient liées à l’état d’activité des
éléments transposables qu’elle venait d’identifier. Elle parle alors de « changements de phase », qui modifient la fréquence avec laquelle les transposons bougent, ainsi que les
patrons spatio-temporels d’expression des gènes situés dans le voisinage de ces éléments mobiles. Souvent régulés au cours du développement, les changements de phase sont transmis de façon
clonale et peuvent également être hérités sur plusieurs générations. Nous savons dorénavant, grâce notamment aux travaux de Nina Fedoroff et Rob Martienssen, qu’ils correspondent au passage
d’un état méthylé des cytosines des transposons incriminés à un état non-méthylé, et vice versa.
Autre exemple, chez les mammifères cette fois : l’inactivation du chromosome X. En 1961, Mary Lyon, spécialiste de la génétique de la souris, fait cette étonnante observation :
les femelles de mammifères qui portent deux chromosomes X présentent des phénotypes insolites « en mosaïque » de la couleur de leur pelage – contrairement aux mâles, qui
sont porteurs d’un seul chromosome X et d’un chromosome Y. Un siècle plus tôt, Charles Darwin avait déjà noté cet étrange phénomène dans son ouvrage De l’origine des
espèces (1859) : « Quoi de plus singulier, écrit-il, que la relation qui existe, chez les chats, entre […] le sexe femelle et la coloration tricolore [écaille de
tortue] ».
D’où viennent ces phénotypes en mosaïque propres aux femelles de mammifères ? Mary Lyon propose qu’ils résultent de l’inactivation aléatoire de l’un des deux chromosomes X dans
chacune des cellules de l’embryon précoce suivie de la transmission stable, autrement dit la mémorisation de cet état silencieux au cours des divisions cellulaires successives. Dès lors que
les deux chromosomes X portent des formes différentes d’un même gène, contrôlant par exemple la couleur du pelage, l’inactivation aléatoire de l’un ou l’autre de ces deux chromosomes et
l’expansion clonale des cellules qui s’ensuit résultent chez l’individu adulte en une juxtaposition de plages cellulaires, chacune de phénotype distinct. Mary Lyon émet aussi l’hypothèse,
confirmée depuis, que la « chromatine sexuelle » identifiée par le cytologiste Barr dans le noyau des cellules femelles correspond au X inactif (Lyon, 1961).
En 1975, Art Riggs propose que l’inactivation du X et sa transmission stable au travers des divisions cellulaires repose sur la méthylation de l’ADN
(Riggs, 1975). Cette hypothèse est validée par l’observation que les régions régulatrices situées à proximité des gènes sont en effet méthylées sur le X inactif. D’autres chercheurs
découvrent par la suite que cette méthylation est fidèlement réapposée après réplication de l’ADN, à l’aide d’enzymes spécifiques, les ADN méthyltransférases dites de
« maintenance ». Mieux : ces activités enzymatiques peuvent être bloquées par des drogues et il se produit alors une réactivation de certains des gènes portés par le
chromosome X inactif.
Second exemple d’hérédité inattendue chez les mammifères : l’« empreinte parentale ». En 1986, deux embryologistes, Davor Solter et Azim
Surani, réalisent chacun des expériences pionnières de transplantation nucléaire dans les ovocytes de souris avec l’objectif d’obtenir des embryons porteurs de deux génomes d’origine
maternelle – des gynogénotes – ou de deux génomes d’origine paternelle – des androgénotes (McGrath et Solter, 1984 ; Surani et al., 1984). Dans les deux cas, ils
observent une létalité embryonnaire précoce, et cela alors même que les génomes maternel et paternel portent la même information génétique. Là encore, il est rapidement établi que la
méthylation de l’ADN joue un rôle essentiel dans la non-équivalence fonctionnelle des génomes d’origine maternelle et paternelle. Cette méthylation différentielle est établie dans la lignée
germinale des parents et transmise à leur progéniture, qui la maintient.
Ces deux exemples frappants illustrent un autre point essentiel des processus de mémorisation épigénétique en lien avec le développement. En effet, l’inactivation du X ainsi que l’empreinte
parentale sont effacées à chaque génération. Cette reprogrammation, ou tabula rasa, est indispensable pour que puisse démarrer un nouveau cycle de vie.
Si la méthylation de l’ADN a été le premier mécanisme moléculaire associé à la nouvelle définition de l’épigénétique proposée par Robin Holliday, un
autre système de transmission stable d’états différentiels d’activité des gènes commençait à être révélé chez la mouche du vinaigre, qui ne méthyle pas son ADN. Il repose sur deux groupes de
protéines régulatrices, Polycomb et Trithorax, appelés ainsi en lien avec les phénotypes aberrants observés dans les embryons mutés pour les gènes correspondants. Les approches génétiques
puis moléculaires ont montré que ces deux groupes de protéines agissent de façon antagoniste sur la chromatine pour assurer, non pas l’établissement des patrons d’expression des gènes
homéotiques le long de l’axe antéro-postérieur de la mouche dans les tout premiers stades du développement embryonnaire, mais le maintien de ces patrons jusque chez l’adulte. En d’autres
termes, les complexes formés par les protéines des groupes Polycomb et Trithorax servent à « mémoriser » des états d’activité des gènes au travers des divisions cellulaires. De
façon remarquable, ces complexes protéiques sont en grande partie conservés chez la plupart des organismes multicellulaires, y compris les plantes qui ont évolué à partir de cellules uniques
indépendamment des animaux. Ainsi, ce mode de régulation épigénétique serait à l’origine même de la multi-cellularité.
C’est en 1990 que je rejoignais comme post-doctorante l’équipe de Philip Avner à l’Institut Pasteur, généticien éminent de la souris qui, avec Jean-Louis
Mandel, titulaire de la chaire de Génétique humaine, venait d’identifier l’homologue murin du gène responsable de la myopathie de Duchenne. Philip Avner était également fasciné par le
processus d’inactivation du chromosome X. En tant que généticien, l’intéressait tout particulièrement le fait que l’initiation de ce processus soit contrôlée par une région précise du
chromosome. Cette région, appelée « centre d’inactivation », avait été identifiée génétiquement dès les années 1960 chez la souris et l’homme au moyen de translocations et
délétions touchant le chromosome X. Ces travaux établirent en particulier que le centre d’inactivation fonctionne sur les portions de chromosomes autres que le X présents dans les
translocations et qu’il faut deux centres d’inactivation dans le noyau des cellules pour déclencher le processus. Par ailleurs, au milieu des années 1980, Martin Evans et ses collègues
isolaient les premières cellules souches embryonnaires.
Sohaila Rastan, ancienne élève de Mary Lyon, montrait ensuite que la différenciation des cellules ES femelles induisait l’inactivation de l’un de leur
deux chromosomes X (Rastan et Robertson, 1985). Cette découverte ouvrait donc la possibilité d’étudier ce processus in vitro plutôt qu’in vivo, ce qui était un avantage
considérable car l’inactivation aléatoire de l’un des deux X a lieu au moment de l’implantation de l’embryon – le stade le plus difficile d’accès pour des expérimentations.
C’est sur la base de ces différentes avancées que Philip Avner me proposa d’utiliser les cellules souches embryonnaires pour tenter d’identifier par des
approches de transgénèse la région du chromosome X responsable de l’initiation de l’inactivation. Spécifiquement, nous voulions déterminer si l’insertion des transgènes sur d’autres
chromosomes que le X pouvait conduire à leur inactivation et s’il était possible de « leurrer » des cellules ES mâles, c’est-à-dire d’inactiver le seul chromosome X qu’elles
possèdent. En d’autres termes, nous voulions savoir si des transgènes pouvaient fonctionner comme des centres d’inactivation ectopiques.
29Le défi tenait dans la taille de la région candidate : plusieurs millions de nucléotides, ce qui revenait à chercher une aiguille dans une botte de
foin. Mais la chance voulut que l’aiguille fût trouvée avant que la botte ne soit complètement désintégrée ! En effet, quelques mois à peine après mon arrivée à l’Institut Pasteur, un
gène très inhabituel fut découvert tout à fait fortuitement par Huntington Willard et Andrea Ballabio sur le chromosome X de l’homme, dans la région même du centre d’inactivation (Brown
et al., 1991).
Ce gène fut nommé Xist (pour X-inactive specific transcript) en raison de son expression exclusivement à partir du X inactif et de son caractère non-codant. Les équipes de
Philip Avner et Sohaila Rastan isolèrent peu après l’homologue murin.
Outre son profil d’expression inattendu, Xist présentait une autre propriété remarquable : son ARN semblait « décorer » le
chromosome X inactif, ce qui suggérait un rôle-clé du gène Xist et de son transcrit dans le processus d’inactivation. Dès lors, je décidai de focaliser mes recherches sur ce
gène. Des expériences de délétion de Xist réalisées par d’autres équipes établirent qu’il est nécessaire à l’inactivation du chromosome X sur lequel il est porté. Je choisis
pour ma part de déterminer s’il est suffisant. Pour cela, j’insérai dans le génome de cellules ES et de souris des transgènes contenant Xist ainsi que de grandes régions situées de
part et d’autre du gène. Je montrai que malgré leur grande taille (plusieurs centaines de kilobases), ces transgènes ne parvenaient pas à déclencher correctement le processus d’inactivation
et qu’ils ne contenaient donc pas l’ensemble des informations requises pour le centre d’inactivation ou pour la régulation du gène Xist. Ce résultat négatif, que Philip Avner
défendit avec force à mes côtés, se heurta à une résistance de la communauté scientifique. Il allait à l’encontre du dogme selon lequel Xist suffisait à induire l’inactivation du
X ! Il m’obligea donc à explorer de nouvelles hypothèses.
Je trouvai l’inspiration dans une série de travaux publiés dans les années 1990 notamment par John Sedat, Steven Henikoff et Amanda Fischer, qui montraient comment le contexte
chromatinien dans lequel se trouvent les gènes et la position de ceux-ci dans le noyau pouvaient influencer de façon significative leur expression. Ainsi, il devenait de plus en plus évident
que le génome n’est pas une simple séquence linéaire d’informations empaquetées d’une façon aléatoire dans le noyau. Une telle réalisation était particulièrement pertinente dans le contexte
de l’inactivation du chromosome X, puisque ce processus implique le traitement différentiel dans un même noyau de deux chromosomes identiques en séquence.
De fait, Comings avait déjà proposé en 1968 que le confinement d’un des deux chromosomes X à la périphérie du noyau pouvait expliquer le traitement différentiel des deux homologues
(Comings, 1968). Il s’inspirait en cela du modèle du « réplicon bactérien » de François Jacob, Sydney Brenner et François Cuzin, découvert en 1963, dans lequel la réplication du
chromosome bactérien est initiée en un site spécifique – le « réplicateur » – attaché à un endroit précis de la membrane cellulaire.
Sur la base de ces considérations, je souhaitais pour ma part explorer la possibilité que le centre d’inactivation possède, à distance du gène
Xist, des séquences impliquées dans la formation de structures chromatiniennes particulières ou dans le confinement du locus en un endroit spécifique du noyau. La microscopie et les
approches de biologie cellulaire avaient accompli de formidables progrès dans les années 1990. Avec une précision sans précédent, il était désormais possible à l’aide de sondes
fluorescentes de visualiser l’expression et la position des gènes dans le noyau. Afin d’appliquer ces nouvelles méthodes à l’inactivation du X, je décidai d’effectuer une année
sabbatique, entre 2000 et 2001, au Cold Spring Harbor Laboratory, près de New York, dans le laboratoire de David Spector, qui est l’un des grands spécialistes de l’étude de
l’organisation nucléaire. J’ai eu la chance d’arriver dans ce haut lieu de la biologie moléculaire à un tournant des recherches en épigénétique.
Il y a eu d’abord les travaux de Rob Martienssen et ses collègues, au Cold Spring Harbor Laboratory justement, qui venaient de découvrir l’importance de la liaison entre la chromatine et de
petites molécules d’ARN – un processus nommé « interférence ARN » – dans la formation et la stabilité de l’hétérochromatine (2002). Découverte majeure s’il en est, puisque
cette interaction entre petits ARNs et chromatine s’est révélée constituer un élément-clé de la reprogrammation du génome lors de la fécondation chez la plupart des espèces.
Il y a eu ensuite la possibilité d’utiliser des anticorps extraordinairement spécifiques qui permettaient de reconnaître tout un jeu de modifications
chimiques subtiles des histones, les composants protéiques majeurs de la chromatine. Cette approche marqua en l’occurrence un tournant dans la mesure où elle permettait l’identification de
différents états de la chromatine et révélait combien celle-ci était riche d’informations potentielles. C’est effectivement en 2000 que l’hypothèse d’un « code des histones »,
analogue au code génétique, était proposée indépendamment par David Allis (Strahl et Allis, 2000) et Bryan Turner (Turner, 2002). Selon ces chercheurs, des combinaisons d’histones modifiées
forment des signaux qui recrutent des facteurs spécifiques. En se liant à la chromatine, ces facteurs modulent l’activité des gènes et d’autres fonctions du génome. En outre, ces histones
modifiées pourraient constituer des « marques épigénétiques », transmettant des changements de caractères héritables – une hypothèse aujourd’hui toujours en débat !
Ainsi, ce séjour au Cold Spring Harbor Laboratory me permit de montrer, en collaboration avec David Allis, que les chromosomes X actif et inactif se distinguaient par plusieurs
modifications d’histones, ce qui laissait effectivement entrevoir la possibilité d’une mémoire épigénétique reposant non seulement sur des méthylations de l’ADN, mais aussi sur des
modifications chimiques des histones et d’autres protéines qui leur sont associées. Aujourd’hui encore, les chercheurs sont en quête des protéines « écrivaines », qui établissent
ces modifications chimiques des histones, et des protéines « lectrices », qui se lient aux histones modifiées. En 2001 au demeurant, des chercheurs découvrent déjà que les protéines
du groupe Polycomb forment un système de protéines écrivaines/lectrices qui contribue au maintien de l’état silencieux du chromosome X (Wang et al., 2001).
38Notons que cette nouvelle ère marquée par l’exploration de la chromatine dans ses variations intimes a conduit à un nouvel usage du terme
épigénétique. C’est Adrian Bird qui, en 2007, formalise ce second changement sémantique depuis Waddington : l’épigénétique peut être considérée comme l’étude des
« adaptations structurales des régions chromosomiques qui permettent d’enregistrer, de marquer ou de perpétuer des états modifiés d’activité des gènes » (Bird, 2007). Cette
définition va donc au delà du concept, plus strict, d’un changement héritable des fonctions des gènes proposé par Holliday.
***
Armée des outils et approches que j’avais développés à Cold Spring Harbor, je monte en 2001 ma propre équipe à l’Institut Curie à Paris pour continuer l’exploration du processus
d’inactivation du chromosome X. L’Institut Curie offrait un environnement idéal pour cette nouvelle étape. En effet, je rejoignais l’unité Dynamique nucléaire et plasticité du génome
dirigée par Geneviève Almouzni, certainement l’une des plus grandes spécialistes de l’étude de la chromatine. Je voudrais dire ici combien Geneviève Almouzni m’a apporté, et la remercier pour
son énergie communicative comme pour son soutien indéfectible. Grâce à la direction visionnaire de Daniel Louvard, directeur de la section Recherche, l’Institut Curie offrait aussi l’un des
rares lieux en France où biologie, chimie, physique et médecine étaient réunies avec autant de réussite.
Mon arrivée à l’Institut Curie a coïncidé avec le développement des techniques de microscopie permettant d’explorer à l’échelle de la cellule unique l’activité des gènes en relation avec
l’état de la chromatine et le positionnement nucléaire.
Grâce à ces techniques, nous pouvions dorénavant suivre les différentes étapes de l’inactivation du X avec une formidable précision, et cela dans des
cellules vivantes. Dès lors, nous pouvions décrypter les mécanismes responsables du traitement différentiel des deux chromosomes X dans le même noyau et analyser la dynamique des
changements chromatiniens sur différentes échelles de temps : au cours du cycle cellulaire, de l’embryogénèse et tout au long de la vie d’un individu, et tant dans des situations
normales et pathologiques, comme le cancer, que chez la souris et d’autres espèces.
Notre premier objectif était de déterminer si la localisation nucléaire du centre d’inactivation jouait un rôle quelconque dans sa fonction. Nous avons
montré tout d’abord que les deux centres d’inactivation sont situés à proximité de l’enveloppe nucléaire, ce qui allait à l’encontre de l’hypothèse émise par Comings d’une localisation
différentielle.
Cependant, nos résultats indiquaient aussi que, juste avant l’inactivation d’un des chromosomes X, les deux centres se rapprochent brièvement l’un de l’autre – une observation
totalement nouvelle car rien d’équivalent n’avait jamais été décrit auparavant.
Nous avons aussi entrepris une collaboration particulièrement heureuse avec le groupe de Job Dekker aux États-Unis, qui venait de développer le
chromosome conformation capture, une technique permettant d’observer de façon quantifiable les interactions à longue distance se produisant au sein d’un chromosome. C’est ainsi que
nous avons pu montrer que le centre d’inactivation était organisé en une succession de domaines d’interactions, contigus les uns aux autres, et chacun couvrant plusieurs centaines de milliers
de nucléotides. De façon notable, l’étendue du domaine d’interaction contenant Xist indiquait que des éléments de contrôle de ce gène étaient situés à très longue distance de
celui-ci. Ce résultat fournissait enfin l’explication moléculaire à l’absence de fonction de nos transgènes contenant Xist : il manquait à tous une partie du domaine
d’interaction ! De façon plus générale, cette étude montre que l’organisation des chromosomes en une succession de domaines d’interaction pourrait sous-tendre une part importante de la
régulation des gènes.
Le rôle de l’insaisissable molécule d’ARN produite par le gène Xist nous intriguait beaucoup aussi. Toujours grâce à nos approches de
microscopie, nous avons pu montrer que dans les toutes premières phases de l’inactivation du X, l’ARN Xist crée dans le noyau un « compartiment » dans lequel se retrouvent
les gènes du chromosome X dès le moment de leur inactivation. En analysant attentivement ce compartiment, nous avons découvert qu’il était principalement constitué d’ADN répété, et
notamment d’une classe de transposons particuliers, les rétroéléments L1. Or, Mary Lyon avait proposé en 1998 que ces séquences L1 permettent à l’inactivation de se propager le long
du chromosome X (Lyon, 1998). Nos études confortent cette hypothèse et suggèrent également que les éléments L1 « aident » les gènes du chromosome X à entrer dans le
compartiment silencieux, favorisant ainsi leur inactivation. Nos observations sont donc une nouvelle illustration des travaux visionnaires de Barbara McClintock sur le rôle des transposons
dans la régulation de l’activité des gènes.
L’examen attentif des différentes étapes de l’inactivation du X dans les embryons précoces nous a par ailleurs réservé plusieurs surprises de taille. Chez la souris, nous avons découvert,
avec d’autres, une dynamique totalement inattendue : l’inactivation est très précoce et soumise à l’empreinte parentale, puisqu’elle concerne exclusivement le chromosome X d’origine
paternelle. Si dans les tissus extra-embryonnaires, cette inactivation perdure, ce n’est pas le cas dans la masse interne cellulaire, qui donnera l’embryon proprement dit. De fait, le
X paternel est réactivé et s’ensuit immédiatement l’inactivation, cette fois-ci aléatoire, de l’un ou l’autre des deux chromosomes X.
Ce processus extraordinairement dynamique donnait un premier aperçu des événements de reprogrammation concernant tout le génome, aux stades précoces de l’embryogenèse. Ces stades sont
l’équivalent des cellules souches embryonnaires ou des cellules souches induites pluripotentes – les fameuses cellules iPS que j’ai déjà mentionnées. Ces résultats révélaient aussi pour
la première fois la plasticité des processus épigénétiques eux-mêmes au cours du développement.
Nous nous sommes évidemment demandé quelle pouvait être la « raison d’être » d’une telle dynamique, qui voit l’inactivation établie une
première fois, puis effacée, avant d’être établie à nouveau quelques divisions cellulaires plus tard. Suivant le précepte de Theodosius Dobzhansky, ce grand théoricien de la génétique
évolutive pour qui « rien en biologie ne fait sens sauf à la lumière de l’Évolution », nous avons entrepris une étude comparative de l’inactivation du chromosome X entre la
souris, le lapin et l’homme.
Ce travail révéla des différences marquées de tempo entre ces trois espèces, notamment une induction plus tardive et non soumise à l’empreinte parentale chez le lapin et l’homme, ainsi qu’une
absence de réactivation dans la masse interne cellulaire. Pourquoi tant de diversité ? Les souris ont une particularité : dans cette espèce, le génome de l’embryon est activé très
tôt – dès le stade d’une ou deux cellules. Le développement de la souris est aussi très rapide, comparé à celui des autres mammifères. Cette rapidité pourrait donc imposer des
dispositifs très précis de régulation génique, comme l’empreinte parentale et un besoin de reprogrammation, avant d’entamer le développement de l’embryon proprement dit à partir de la masse
interne.
Une fois établie dans l’embryon, l’inactivation est en tout cas remarquablement stable à l’échelle du chromosome. D’où vient cette stabilité ?
Probablement de l’accumulation de différentes « couches » épigénétiques : la méthylation de l’ADN, les protéines du groupe Polycomb, la compartimentation nucléaire et bien
d’autres encore qui, ensemble, assurent un véritable « verrouillage » de l’inactivation. Mais il arrive que l’inactivation du X montre des failles. Nos travaux, effectués en
collaboration avec le Docteur Anne Salomon de l’Institut Curie, indiquent que certains cancers du sein sont associés à une instabilité de l’inactivation du X.
D’autres interrogations restent en suspens, et notamment celles concernant la réactivation du chromosome X inactivé dans la lignée germinale.
Comment s’opère cette réversion ? Toutes les marques épigénétiques disparaissent-elles passivement, lors de la réplication de l’ADN ? Ou bien sont-elles effacées sous l’action
d’enzymes spécifiques remodelant la chromatine ?
52J’aurais aimé pouvoir présenter d’autres travaux réalisés par les membres de mon équipe, mais le temps me manque. Permettez-moi néanmoins de prendre un
instant pour leur dire ma profonde gratitude. La science que nous faisons est par essence un travail d’équipe et j’ai l’immense privilège d’être entourée au quotidien par des chercheurs
brillants. Pour n’en citer que quelques-uns : Julie Chaumeil, Sandrine Augio et Elphège Nora – mes premiers étudiants, qui m’ont tant appris ; Ikuhiro Okamoto, Osamu Masui et
Jen Chow – mes premiers post-doctorants, et des moteurs formidables de mon laboratoire ; Macha Guggiari, Patricia Diabangouaya et Christel Picard – les piliers de l’équipe.
Pour conclure sur l’inactivation du X, je voudrais aborder en quelques mots la question essentielle du rôle de ce processus chez les mammifères.
En effet, des processus analogues sont observés chez de très nombreuses autres espèces, comme la drosophile, qui cette fois double l’expression des gènes portés par le chromosome X chez
le mâle, ou encore le nématode, qui réduit de moitié l’expression des gènes sur chacun des deux chromosomes X chez l’hermaphrodite. Or, l’ensemble de ces observations suggère le rôle
essentiel de ces processus dans la compensation de dose des chromosomes X entre mâles et femelles. De fait, nous savons que des déséquilibres de doses peuvent avoir des conséquences
graves, comme l’illustre de façon dramatique la trisomie 21 chez l’homme.
Cette compensation de dose donne matière à réflexion. Le chromosome X porte plus de 1000 gènes alors que le chromosome 21 n’en contient
qu’environ 250. Pour quels gènes la compensation est-elle indispensable, l’est-elle à tous les stades du développement, et dans quelles cellules ? Certains gènes, à l’évidence, doivent
impérativement être « réduits au silence ». C’est le cas du gène Mecp2 par exemple. Chez les femelles, son absence conduit au syndrome de Rett, un type d’autisme sévère. Chez les
mâles, son absence est létale au stade embryonnaire alors que sa duplication entraîne des retards mentaux sévères. Pour d’autres gènes, cependant, la dose ne semble pas avoir cette importance
critique. Selon les espèces de mammifères, jusqu’à 15 % des gènes liés au chromosome X peuvent ainsi échapper à l’inactivation. Enfin, pour certains gènes, une double dose confère
un avantage capital. C’est le cas du gène Atrx, qui échappe à l’inactivation peut-être précisément parce qu’il code une protéine intervenant dans le remodelage de la chromatine, et que ce
remodelage à son tour participerait à l’inactivation du X dans certains lignages cellulaires.
Tous ces travaux en attestent : le chromosome X n’est pas une entité homogène soumise à des lois univoques. Au contraire, il compose comme les autres chromosomes une assemblée
disparate de gènes, chacun doté d’un rôle précis et d’une expression spécifique au cours du développement et selon les lignages cellulaires. Ainsi, les femelles de mammifères ne sont pas
seulement des mosaïques quant à l’expression respective de leurs deux chromosomes X, mais aussi quant au patron d’expression de nombreux gènes liés à l’X ! Cela leur confère-t-il un
avantage par rapport aux mâles qui n’ont qu’un seul X ? À l’évidence, les mâles présentent une vulnérabilité immédiate à toute mutation d’un gène lié à l’X. Les travaux de Jean-Louis
Mandel, sur le syndrome de l’X fragile et d’autres maladies « liées à l’X », en sont une illustration frappante. Mais au delà, le répertoire élargi de phénotypes cellulaires que
donnent les gènes liés à l’X, chez les femelles, leur procure-t-il un avantage quelconque ? Une telle question est en soi neutre, mais je ne peux résister au plaisir un brin provocateur
de conseiller la lecture du poème de Rudyard Kipling, The Female of the Species.
***
Il est maintenant temps de conclure. Rappelons que l’intitulé de cette chaire est double et comporte l’expression « mémoire cellulaire ». En effet, la notion de maintien d’un état
cellulaire vaut tant au travers des divisions cellulaires qu’au fil du temps. Par ailleurs, cette mémoire cellulaire concerne aussi bien l’activité des gènes que le repliement des protéines
ou la structure cellulaire. Mais où en sommes-nous aujourd’hui avec l’épigénétique ?
58Depuis une dizaine d’années, l’épigénétique exerce une fascination croissante sur le public. Le séquençage du génome humain complet, au début des
années 2000, a joué un rôle catalyseur. Cet exploit a marqué pour l’humanité une étape aussi excitante que terrifiante, en ce qu’il nous confronte à la réalité, et peut-être à la
fatalité de notre patrimoine génétique. Il ouvre la possibilité que tous nos caractères – nos forces, nos faiblesses, nos prédispositions à des maladies – soient lus dans le livre
de notre génome, avec toutes les questions éthiques et philosophiques que cela soulève. L’épigénétique crée au fond l’espoir que nous sommes « plus » que la séquence de nos gènes.
Cette idée est sans doute à l’origine de la formidable explosion d’intérêt que suscite ce champ d’étude, dans les médias et le grand public. Pouvons-nous échapper à la fatalité de notre
destin génétique ? Ce que nous mangeons, l’air que nous respirons, et même les émotions que nous éprouvons, peuvent-ils influencer non seulement l’expression de nos gènes, mais aussi
celle de nos enfants et de nos petits-enfants ?
Il est certain que notre environnement modifie l’expression de nos gènes, et qu’il peut parfois conduire à des changements stables de nos caractères
– et même dans certains cas à l’apparition de maladies. Mais dans quelle mesure ces changements peuvent-ils être transmis d’une génération à l’autre ? C’est une autre affaire. Ces
dernières années, on a découvert l’existence d’une hérédité de certains caractères, qui n’est pas fondée sur des changements de la séquence de l’ADN. Transmise au fil des générations, cette
hérédité semble avoir une importance particulière dans le règne végétal, et a été proposée comme une explication possible de l’hérédité manquante dans les études de génétique d’association
pangénomiques (les GWAS) chez l’homme, qui ont explosé ces derniers temps. Des projets ont même déjà été lancés visant à identifier à l’échelle du génome cette éventuelle composante
épigénétique de la susceptibilité à diverses maladies.
Mais quelle est l’importance du rôle de l’environnement dans cette hérédité épigénétique ? Cette question est loin d’être résolue, malgré les effets d’annonce, qui ont conduit à un
étonnant regain d’intérêt pour la thèse de Lamarck de l’héritabilité des caractères acquis. Autrement dit, c’est l’idée selon laquelle des caractères « bénéfiques » acquis durant la
vie de l’individu, sous l’effet de changements de l’environnement, peuvent être transmis aux générations suivantes. L’interrogation ultime est celle de l’importance des processus
épigénétiques dans l’Évolution. « L’hérédité n’est rien d’autre qu’une mémoire de l’environnement », estimait Luther Burbank. Dès lors, quelle est la place, dans les processus
évolutifs, des changements épigénétiques sporadiques ou induits par l’environnement qui sont transmis sur plusieurs générations ? La communauté scientifique reste très partagée et une
question centrale demeure : les états épigénétiques sont-ils transmis sur un nombre suffisant de générations pour donner prise à la sélection naturelle ?
La « popularité » de l’épigénétique, liée à l’intérêt croissant que lui portent les médias, n’est pas sans danger. Elle mélange les données scientifiques avérées aux informations
les plus fantaisistes. Cette confusion est très préjudiciable aux progrès des connaissances. Fort heureusement, les recherches dans ce domaine progressent à un rythme saisissant. Elles
devraient permettre de clarifier ces notions dans les années à venir.
Cette chaire me confère la responsabilité de communiquer de façon claire et précise sur les recherches et les concepts qui fondent ce champ scientifique
émergent. Cela, tout en montrant les espoirs et les craintes que peuvent susciter ces études. Le défi est d’autant plus grand que, comme nous l’avons vu, le sens du terme
épigénétique ne cesse d’évoluer.