METHODES DE CRIBLAGE DE MOLECULES MODULATRICES DE L'EXPRESSION DE GENES, LIGNEES CELLULAIRES, PREPARATION ET UTILISATIONS.
La présente invention concerne des compositions et méthodes de criblage, permettant l'identification de molécules capables de moduler l'expression de gènes. Elle concerne également des outils, kits, compositions, vecteurs, lignées cellulaires et constructions génétiques, pour la mise en œuvre de telles méthodes et leurs utilisations dans le domaine de la santé humaine ou animale, notamment pour prévenir ou traiter les pathologies entraînant une dérégulation de l'expression génétique telles que les cancers, ou en recherche expérimentale par exemple. Les méthodes de l'invention reposent plus particulièrement sur l'utilisation d'un double système de sélection, conférant une meilleure sensibilité et sélectivité. Elles comprennent avantageusement (i) la mise en contact d'un composé test avec au moins deux unités de sélection comprenant chacune au moins un gène de sélection distinct placé sous le contrôle d'un promoteur et d'éléments d'initiation de la traduction, dans des conditions permettant l'expression desdits gènes de sélection, et (ii) la détermination de la capacité du composé test à moduler l'expression des gènes de sélection.
La possibilité d'identifier des composés agissant sur l'expression des protéines offre de nombreuses applications, dans les domaines thérapeutiques, agricoles, de recherche, etc.. Actuellement, la plupart des stratégies développées dans ce but visent à identifier des composés modulant l'activité biologique d'une protéine ou son expression en général. Toutefois, ces stratégies ne présentent pas toujours une spécificité et une fiabilité suffisantes pour permettre la sélection de composés d'intérêt. La présente invention s'intéresse plus particulièrement à des mécanismes précis impliqués dans le processus global d'expression de gènes, qui confèrent aux technologies et compositions développées une meilleure fiabilité et prédictibilité. En particulier, l'invention décrit des outils et méthodes adaptés à l'identification de composés modulant la transcription et/ou l'initiation de la traduction.
Les termes "expression des gènes" et "expression génique" renvoient plus particulièrement ici aux mécanismes suivants : (i) la transcription, (ii) la maturation des ARN pré-messagers, (iii) l'export des ARNm vers le cytoplasme et (iv) la traduction des ARNm.
La transcription permet à la séquence nucléotidique d'un gène d'être copiée sous forme d'un brin d'ARN (ARN pré-messager). Chez les eucaryotes, cette étape est effectuée dans le noyau par les ARN polymérases. Le signal d'initiation de la transcription est contenu dans le promoteur proximal du gène. Dans cette région est localisée la boîte TATA, présente dans presque tous les gènes, ainsi que les boîtes CCAAT et GC dans un moins grande fréquence. L'initiation de la transcription nécessite le recrutement d'un complexe multiprotéique dans la région promotrice. Ce complexe est, notamment, formé de facteurs transcriptionnels (TF), parmi lesquels seul TFIID se fixe sur la boîte TATA. TFIIA stabilise le complexe alors que TFUD-ADN, TFIIB et TFIIE assurent la liaison avec TARN polymérase. Enfin TFIIF possède une activité hélicase permettant de dénaturer la double hélice de l'ADN au niveau du site
d'initiation de la transcription. Outre le promoteur proximal, des séquences distales régulent la transcription. Ces éléments cis-régulateurs, plus ou moins éloignés (en amont ou même en aval) du site d'initiation de la transcription, fixent des facteurs "trans-régulateurs". Parmi ces séquences régulatrices, on distingue les "enhancers" ou "activateurs" ainsi que les "silencers" ou "séquences extinctrices".
L'ARNm eucaryote mature se distingue des ARNm procary otes et de certains ARNm viraux par des modifications post-transcriptionnelles particulières à ses extrémités 5' et 3'. L'ARNm est «coiffé» à son extrémité 5' et présente une séquence polyadénylée à son extrémité 3'. La coiffe est nécessaire à l'épissage des ARN pré-messagers, facilite l'export nucléocytoplasmique des ARNm matures, augmente leur stabilité et, enfin, améliore l'efficacité de la traduction en interagissant spécifiquement avec certains facteurs d'initiation. La séquence poly A est impliquée dans l'export nucléocytoplamsique des ARNm matures et dans le contrôle de la stabilité des ARNm dans le cytoplasme. En outre, elle serait également indispensable à la traduction efficace des ARNm.
Une autre étape de la maturation des ARNm consiste en l'élimination constitutif ou alternatif des séquences intervenantes (ou introns) et à "rabouter" les exons. Cette opération complexe, appelée épissage, requiert la participation de nombreux facteurs cellulaires.
En général, les ARNm eucaryotes ne comportent qu'une seule phase de lecture (cistron ou ORF pour «Open Reading Frame») délimitée en 5' par un codon d'initiation de la traduction (généralement AUG) et en 3' par un codon d'arrêt de la traduction ou codon stop (UAG, UGA ou UAA). Ils peuvent cependant parfois contenir plusieurs phases de lecture (uORF pour «upstream ORF»). La région située entre la coiffe et la phase de lecture principale est appelée région 5' non traduite (5'UTR pour «5'-Untranslated Région»). Dans la majorité des cas, le site d'initiation de la traduction est le codon AUG le plus proche de l'extrémité 5' de l'ARNm.
La traduction des ARNm requiert la participation d'organites spécialisés : les ribosomes. Elle se déroule en trois phases successives : (1) l'initiation de la traduction, phase durant laquelle un ribosome compétent pour la traduction se constitue sur un ARNm, (2) l'élongation qui constitue la phase de synthèse de la protéine et (3) la terminaison qui marque la fin de la synthèse protéique avec la dissociation du ribosome.
L'initiation de la traduction a pour but de positionner correctement un ribosome sur un ARNm de façon à ce que le déclenchement de la synthèse protéique s'opère sur le bon codon d'initiation. On distingue plusieurs mécanismes d'initiation de la traduction parmi lesquels le «balayage» des ribosomes, le mécanisme d'entrée directe des ribosomes (mécanisme IRES- dépendant), le mécanisme de «shunt», encore appelé «transfert du ribosome», ainsi que les mécanismes hybrides impliquant au moins deux des mécanismes précédemment cités.
Le modèle d'initiation par balayage des ribosomes requiert la participation de nombreux facteurs d'initiation appelés elFs (eukaryotic Initiation Factor) et comprend quatre étapes : (1)
l'association de l'ARNt initiateur (Met-tRNA) et des facteurs d'initiations elFlA, eIF3, eIF5 et eIF2 avec la petite sous-unité ribosomale 40S pour former le complexe de pré-initiation 43S ; (2) la formation du complexe de pré-initiation 43 S ; (3) la fixation du complexe 43 S à PARNm ; (4) le balayage du complexe de pré-initiation et la fixation de la grande sous-unité ribosomale. Ce mécanisme postule que les ribosomes doivent dérouler les structures secondaires de l'ARNm pour permettre leur migration.
Le mécanisme de transfert du ribosome permet le déplacement de ce dernier en aval d'une structure secondaire sans que cette dernière n'ait apparemment été déroulée. Les ribosomes effectuent un «saut» le long de la séquence de l'ARNm. Il faut entendre par «sites donneurs et accepteurs de shunt», les régions minimales de l'ARNm capables de diriger les étapes initiales et finales du mécanisme du «shunt».
Le mécanisme «d'entrée directe» des ribosomes est un mécanisme alternatif qui requiert la présence d'un élément structural particulier de l'ARNm (un «IRES» : «Internai Ribosomal Entry Segment»). Ce mécanisme ne fait pas intervenir la reconnaissance de la coiffe par le facteur eIF4F et permet néanmoins l'initiation de la traduction. L'élément IRES est formé de domaines très structurés de l'ARN qui, en association avec des protéines cellulaires, dirigent les ribosomes sur un codon d'initiation spécifique. Ce mécanisme gouverne la synthèse d'un certain nombre de protéines cellulaires, en particulier pendant la division cellulaire et dans certaines conditions de stress cellulaire (modifications de l'environnement de la cellule tels que des changements de température, des variations des taux de O et CO2, l'appauvrissement en nutriments et en facteurs de croissance, la présence de molécules toxiques).
Le brevet US 6,171,821 Bl décrit une méthode de criblage de molécules capables de moduler le mécanisme alternatif d'initiation de la traduction via la séquence IRES du gène XI AP et prévoit une méthode de normalisation des résultats. La demande de brevet WO 99/61613 décrit quant à elle une méthode de criblage de composés capables de moduler l'interaction entre un facteur d'initiation de la traduction IRES-dépendant et un ligand, sans toutefois chercher à cibler le mécanisme général de traduction IRES-dépendant. Il existe donc un réel besoin de disposer d'outils et de méthodes permettant d'identifier de manière simple et fiable des composés permettant de moduler de manière ciblée l'expression de gènes, et notamment les mécanismes d'initiation de la traduction, qui soient utilisables dans le cadre de la préparation de médicaments destinés au traitement de pathologies, notamment de pathologies liées à une dérégulation traductionnelle, telles que les cancers.
La présente invention décrit à présent une nouvelle approche pour l'identification, la sélection, la caractérisation ou l'optimisation de composés capables de moduler de manière ciblée l'expression de gènes. La présente invention décrit en particulier de nouvelles méthodes pour l'identification, la sélection, la caractérisation ou l'optimisation ex vivo ou in vitro, de composés capables de moduler de manière ciblée, i.e. stimuler ou inhiber, l'initiation de la traduction ou la transcription. La présente invention décrit en outre de nouvelles lignées cellulaires et compositions pour le criblage de tels composés. Les méthodes selon l'invention
sont basées sur la mise en place d'une double sélection particulièrement avantageuse qui permet d'accroître la spécificité desdits composés.
Les méthodes de criblage selon l'invention permettent plus particulièrement l'identification de composés capables de moduler, de manière ciblée, l'efficacité ou l'exécution d'un ou plusieurs mécanismes d'initiation de la traduction tels que le «balayage» des ribosomes, le mécanisme d'entrée directe des ribosomes (mécanisme IRES-dépendant), le mécanisme de «shunt» (encore appelé «transfert du ribosome») ou un mécanisme hybride impliquant au moins deux des mécanismes précédemment cités. Un autre objet particulier de l'invention réside dans une méthode de criblage de molécules agissant de manière ciblée sur l'activité transcriptionnelle d'un promoteur.
L'action «de manière ciblée» des composés criblés par les méthodes de l'invention indique que ces composés ont une action principale sur une étape ou un mécanisme déterminé du processus d'expression, qui garantit leur plus grande spécificité. Ainsi, les méthodes de l'invention permettent un criblage de molécules agissant de manière ciblée (spécifique ou principale) sur les mécanismes d'initiation de la traduction, et n'agissant pas (ou pas directement ou principalement) sur d'autres mécanismes, tels que la transcription, l'épissage, l'export des ARNm, etc. De la même manière, les méthodes de l'invention adaptées au criblage de composés agissant de manière ciblée sur les mécanismes de transcription fournissent des composés n'ayant pas d'activité directe ou principale sur d'autres étapes du processus d'expression.
Ainsi, il est possible, en adaptant les éléments mis en œuvre, de cibler certains mécanismes de l'expression des gènes et de fournir des molécules ayant un profil biologique mieux défini et plus adapté à une utilisation thérapeutique. La haute sélectivité du système de criblage de l'invention permet en outre de tester un grand nombre de composés et d'éviter l'analyse fastidieuse d'un grand nombre de «faux positifs». Les lignées cellulaires et méthodes selon l'invention offrent à présent aux biologistes et aux industriels de nouvelles solutions pour l'identification de tels composés, fondées sur des méthodes rapides, sensibles et automatisables.
Un premier objet de l'invention réside plus particulièrement dans des méthodes de criblage permettant l'identification de composés modulant de manière ciblée l'expression de gènes comprenant (i) la mise en contact d'un composé test avec au moins deux unités de sélection comprenant chacune au moins un gène de sélection distinct placé sous le contrôle d'un promoteur et d'éléments d'initiation de la traduction, dans des conditions permettant l'expression desdits gènes de sélection, et (ii) la détermination de la capacité du composé test à moduler l'expression desdits gènes de sélection.
Un autre objet de l'invention réside dans une méthode de criblage permettant l'identification de composés modulant de manière ciblée le mécanisme d'initiation de la traduction, caractérisée en ce qu'elle comprend : (i) la mise en contact d'un composé test avec au moins deux unités de sélection comprenant chacune au moins un gène de sélection distinct placé sous
le contrôle d'un promoteur (de préférence distinct) et d'éléments d'initiation de la traduction, dans des conditions permettant l'expression desdits gènes de sélection, et (ii) la détermination de la capacité du composé test à moduler l'expression desdits gènes de sélection.
Un autre objet de l'invention réside dans une méthode de criblage permettant l'identification de composés modulant de manière ciblée la transcription de gènes, caractérisée en ce qu'elle comprend : (i) la mise en contact d'un composé test avec au moins deux unités de sélection comprenant chacune au moins un gène de sélection distinct placé sous le contrôle d'un promoteur et d'éléments d'initiation de la traduction (de préférence distincts), dans des conditions permettant l'expression desdits gènes de sélection, et (ii) la détermination de la capacité du composé test à moduler l'expression desdits gènes de sélection.
Un autre objet de l'invention réside dans une méthode selon l'invention dans laquelle les séquences IRES sont choisies parmi les séquences IRES des gènes ODC, c-myc, c-sis, FGF-2, PDGF-2, IGF-2, VEGF, apaf-1, XIAP, eIF4G, EMCV, HCV ou encore toute IRES fonctionnelle dans le système utilisé. L'utilisation de séquences IRES d'origines virales (HCV, EMCV...) permettra l'identification de composés modulateurs de ces éléments viraux et sera par conséquent particulièrement utile pour la mise au point d'agents antiviraux
Un autre objet de l'invention concerne une cellule comprenant au moins deux unités de sélection comprenant chacune au moins un gène de sélection distinct placé sous le contrôle d'un promoteur et d'éléments d'initiation de la traduction, ainsi qu'une population cellulaire caractérisée en ce que une partie au moins des cellules qui la constituent comprenne au moins deux unités de sélection telles que définies ci-dessus. Les cellules sont typiquement des cellules recombinantes modifiées par insertion simultanée ou séquentielle des unités de sélection.
Un autre objet de l'invention réside dans un kit pour la mise en œuvre de méthodes de criblage caractérisé en ce qu'il comprend une population (e.g., une lignée) cellulaire telle que définie ci-dessus.
L'invention concerne également l'utilisation d'un composé obtenu grâce à une méthode de criblage selon l'invention pour la préparation d'un médicament destiné au traitement d'une pathologie entraînant l'expression anormale d'une protéine, et en particulier du cancer.
Comme il sera décrit plus en détails dans la suite du texte, l'invention peut être mise en œuvre dans différents systèmes (cellulaires ou acellulaires), avec différents types de constructions, gènes de sélection et éléments régulateurs afin de cibler l'activité principale des composés criblés. L'invention est utilisable en recherche, criblage industriel, thérapie, modélisation moléculaire, etc.
Systèmes de sélection/criblage
Comme indiqué, l'invention repose notamment sur l'utilisation d'un double système de sélection, permettant d'améliorer l'efficacité des procédés. Le procédé fait appel, de manière générale, à l'utilisation de deux unités de sélection comprenant chacune au moins : un gène de sélection distinct, c'est-à-dire différent d'une unité à l'autre, placé sous le contrôle d'un promoteur et d'éléments d'initiation de la traduction.
Les unités de sélection sont donc des molécules d'acides nucléiques comprenant un ensemble de régions fonctionnelles, conduisant dans des conditions adaptées à l'expression du gène de sélection. Les unités de sélection sont typiquement de l'ADN ou de l'ARN, préférentiellement de l'ADN double-brin.
Le terme «gène de sélection» au sens de l'invention désigne ainsi toute région d'acide nucléique codant un produit protéique qui peut être mis en évidence. Dans ce contexte, le terme «gène de sélection» désigne uniquement la région codante.
Chaque unité de sélection comprend au moins un gène de sélection placé sous le contrôle d'un promoteur et d'éléments d'initiation de la traduction.
Les éléments d'initiation de la traduction sont compris dans une région nucléique non traduite, typiquement localisée en 5' du gène de sélection. Cette dernière peut contenir un ou plusieurs IRES et/ou des éléments impliqués dans les mécanismes de shunt. Néanmoins, d'autres régions de l'ARNm (la région 3' non traduite et la région codante par exemple) peuvent contenir des éléments impliqués dans le contrôle de l'initiation de la traduction. Les éléments d'initiation de la traduction comprennent de préférence une région non traduite (5'UTR) comprenant, de préférence, un ou plusieurs éléments IRES et/ou des éléments impliqués dans le mécanisme de transfert du ribosome, par exemple des sites donneur et accepteur de shunt. Pour le criblage de composés agissant de manière ciblée (ou spécifiquement) sur l'initiation de la traduction d'un ARNm particulier ou sur un même mode d'initiation de la traduction (mécanisme d'entrée directe, shunt ou balayage par exemple), les éléments d'initiation de la traduction de chacune des unités de sélection sont de préférence identiques, et correspondent par exemple à la région 5' non traduite dudit ARNm. Les éléments d'initiation de la traduction de chacune des unités de sélection peuvent également être différents, selon un autre mode préféré, adapté plus particulièrement au criblage de composés modulant le mécanisme général d'un ou de plusieurs modes d'initiation de la traduction ou le mécanisme de la transcription.
Les séquences IRES sont choisies préférentiellement parmi les séquences IRES des gènes ODC (Pyronnet, S., L. Pradayrol, et N. Sonnenberg N. A cell cycle-dependent internai ribosome entry site. Molecular cell; 2000; (5) 607-616), c-myc (Stoneley M, Paulin FE, Le Quesne JP, Chappell SA, Willis AE.; c-myc 5' untranslated région contains an internai ribosome entry segment; Oncogene; 1998, Jan 22; 16(3):423-8), c-sis (Bernstein J, Sella O, Le SY, Elroy-Stein O. PDGF2/c-sis mRNA leader contains a differentiation-linked internai
ribosomal entry site (D-IRES. J Biol. Chem. 1997, Apr 4; 272(14):9356-62), FGF-2 (Vagner, S., M.C. Gensac, A. Maret, F. Bayard, F. Amalric, H. Prats, et A.C. Prats. Alternative translation of human fibroblast growth factor 2 mRNA occurs by internai entry of ribosomes. Mol. Cell. Biol. 1995, (15):35-44), PDGF-2 (Bernstein J., Sella O., Le SY, Elroy-Stein O.; PDGF2/c-sis mRNA leader contains a differentiation-linked internai ribosomal entry site (D- IRES. J Biol. Chem. 1997, Apr 4; 272(14):9356-62), IGF-2 (Henk Teerink, Harry O. Voorma, Adri A. M. Thomas. The human insulin-like growth factor II leader 1 contains an internai ribosomal entry site. Biochimica et Biophysica Acta. 1995, 403-408), VEGF (Akiri G, Nahari D, Finkelstein Y, Le S Y, Elroy-Stein O, Levi BZ. Régulation of vascular endothelial growth factor (VEGF) expression is mediated by internai initiation of translation and alternative initiation of transcription. Oncogene. 1998 Jul 16;17(2):227-36), apaf-1 (Coldwell MJ, Mitchell SA, Stoneley M, MacFarlane M, Willis. Initiation of Apaf-1 translation by internai ribosome entry. Oncogene. 2000 Feb 17;19(7):899-905), XIAP (Holcik M, Korneluk RG. Functionnal characterization of the X-linked inhibitor of apoptosis (XIAP) internai ribosome entry site élément: rôle of La autoantigen in XIAP translation. Mol. Cell. Biol. 2000 Jul;20(13):4648-57), eIF4G (Gan W, LaCelle M, Rhoads RE. Functionnal characterization of the internai ribosome entry site of eIF4G mRNA. J Biol Chem. 1998 Feb 27 ;273(9) :5006- 12), EMCV (Jang SK, Krausslich HG, Nicklin MJ, Duke GM, Palmenberg AC, Wimmer E. A segment of the 5' nontranslated région of encephalomyocarditis virus RNA directs internai entry of ribosomes during in vitro translation. J. Virol.. 1988 Aug ;62(8) :2636-43), HCV (Pelletiet J. et Sonnenberg N. Internai initiation of translation of eukaryotic mRNA directed by a séquence derived from poliovirus RNA. Nature. 1988. (334) :320-43) mais aussi PV, HRV, FMDV, HAV, TEV, BVDV, CSFV, MLV, HaMSV, HTLV, RevA, SIV, TGEV, RhPV, Bip, AMLl, NRF ou encore toute IRES fonctionnelle dans le système cellulaire utilisé, si un système cellulaire est utilisé.
Tout autre élément d'initiation de la traduction (du type «shunt» ou balayage, par exemple) peut être choisi et incorporé à une unité de sélection selon l'invention par des techniques connues de l'homme du métier. Ces éléments peuvent correspondre à la région 5' non traduite de n'importe quel ARNm pour lequel on veut produire des modulateurs spécifiques du mécanisme d'initiation de la traduction.
Les promoteurs des unités de sélection contrôlant l'expression des gènes de sélection peuvent être identiques ou différents d'une unité à l'autre. Lorsque deux promoteurs différents sont utilisés, cela favorise le criblage de composés agissant de manière ciblée sur les mécanismes d'initiation de la traduction, en particulier lorsque ces éléments sont identiques au sein des deux unités. Lorsque deux promoteurs identiques sont utilisés, cela favorise le criblage de composés agissant de manière ciblée sur les mécanismes de transcription, en particulier lorsque les éléments d'initiation de la traduction sont différents d'une unité à l'autre.
Différents types de promoteurs peuvent être utilisés pour la mise en œuvre de l'invention. Il peut s'agir de promoteurs forts ou faibles, ubiquitaires ou spécifiques de tissus, constitutifs ou régulés. On peut citer les promoteurs viraux, cellulaires (par exemple de gènes domestiques),
bactériens, etc., de manière générale tout promoteur transcriptionnel fonctionnel dans le système cellulaire ou acellulaire utilisé. On peut citer à titre d'exemples spécifiques de promoteurs viraux les promoteurs CMV, SV40, LTR, TK, etc., comme exemple de promoteurs de gènes domestiques, les promoteurs des gènes β-actine, PGK, apolipoprotéine, albumine et Ubiquitine C, et comme exemple de promoteurs bactériens les promoteurs pLac, pTrp, etc.
Chaque unité de sélection utilisée dans le cadre d'une méthode de criblage selon l'invention, comprend, de préférence, au moins un gène de sélection, les gènes de sélection étant, de préférence, différents d'une unité de sélection à l'autre.
Le gène de sélection peut être, de manière générale, tout gène dont l'expression peut être détectée, observée ou mesurée, par toute technique connue (auxotrophie, fluorescence, luminescence, résistance, etc.). Tout gène connu de l'homme du métier dont l'activité ou la présence dans des extraits biologiques est (facilement) mesurable peut, d'une manière générale, être utilisé comme gène de sélection pour la mise en œuvre du procédé de criblage selon l'invention.
Selon un premier mode particulier de réalisation de l'invention, le gène de sélection est un gène de sélection négative. Parmi les gènes de sélection négative sont préférés les gènes codant pour une thymidine kinase (notamment la thymidine kinase du virus de l'herpès humaine (HSV-TK)), la cytosine déaminase d'E. coli (CodA), l'hypoxanthine phosphoribosyl transférase (gpt), la nitroréductase d'E. coli (NTR), etc.. Il existe pour ces enzymes une multitude de mutants ayant des substrats différents susceptibles d'être utilisés pour leurs propriétés particulières.
Selon un autre mode particulier de réalisation de l'invention, le gène de sélection est un gène de sélection positive. Parmi les gènes de sélection positive, on peut citer à titre d'exemples préférés les gènes hygro (de résistance à l'hygromycine), néo (de résistance à la néomycine), phleo (de résistance à la phléomycine), puro (de résistance à la puromycine) et bla (de résistance à la blasticidine).
Selon un troisième mode particulier de réalisation de l'invention, le gène de sélection est un gène rapporteur. Il peut s'agir, par exemple, du gène codant pour la luciférase (plus particulièrement pour la luciférase de luciole ou pour celle de Renilla), pour la phosphatase alcaline sécrétée, pour la galactosidase, pour la lactamase, pour la Chloramphenicol acetyl transférase (CAT), pour l'hormone de croissance humaine (hGH), pour la β-glucuronidase (Gluc) ou pour la Green fluorescent protein (GFP) et ses variants ou dérivés (ΕGFP, ΕCFP, ΕBFP), etc.
Un objet préféré de l'invention concerne une méthode selon l'invention dans laquelle les gènes de sélection sont des gènes de sélection négative, choisis de préférence parmi le gène de la thymidine kinase du virus de l'herpès humain (HSV-TK), le gène de la cytosine déaminase
d'E. coli (CodA), le gène de l'hypoxanthine phosphoribosyl transférase (HPRT), le gène de la xanthine-guanine phosphoribosyl transférase (gpt) et le gène de la nitroréductase d'E. coli (NTR), de préférence TK ou CodA, et/ou des gènes rapporteurs, choisis de préférence parmi GFP, ΕGFP, ΕCFP et ΕBFP, et/ou des gènes de sélection positive, choisis de préférence parmi les gènes hygro, néo, phleo, puro et bla.
Par ailleurs, dans un mode de réalisation particulier, une, plusieurs ou chacune des unités de sélection comporte plusieurs gènes de sélection, de préférence plusieurs gènes de sélection appartenant à une catégorie différente telle que définie ci-dessus, typiquement un gène de sélection négative et un gène de sélection positive. Un autre objet préféré de l'invention concerne une méthode dans laquelle chaque unité de sélection comporte un gène de sélection positive et un gène de sélection négative.
L'utilisation de telles unités de sélection permet d'une part d'améliorer l'efficacité de la méthode et d'autre part de faciliter l'établissement (et notamment la sélection) in vitro ou ex vivo de cellules (e.g. d'une lignée stable) contenant les unités). Pour ce faire, le second gène de sélection (ou l'un au moins des deux) est avantageusement un gène de sélection positive, choisi de préférence parmi hygro, néo, phleo, puro et bla. Les deux gènes de sélection présents dans chaque unité sont différents l'un de l'autre. En outre, préférentiellement, les gènes de sélection présents sur une unité sont distincts (i.e., différents) des gènes de sélection présents sur une autre unité utilisée de manière concomitante. Dans un autre mode de réalisation, il est possible d'utiliser un gène de sélection ayant à la fois des propriétés de gène de sélection positive et négative.
Le gène de sélection positive permettant l'établissement d'une lignée stable peut être «fusionné» avec le ou les gènes de sélection (négatif, rapporteur et/ou positif) présents au sein de chaque unité de sélection. A titre d'exemples de telles fusions on peut citer notamment les combinaisons ou fusions TK-bla, TK-hygro, TK-neo, TK-puro, CodA-hygro, CodA-neo, CodA-puro, CodA-bla, neo-HPRT, hygro-NTR, puro-gtp, ou tout autre combinaison fonctionnelle, notamment les gènes de fusion bla-TK, hygro-TK, neo-TK, etc.. Le gène de sélection positive permettant l'établissement d'une lignée stable peut également être présent sur un autre cadre de lecture (distinct de celui des gènes de sélection négatif, rapporteur et/ou positif) et fonctionner par réinitiation, ou encore être porté par une autre unité transcriptionnelle .
Le promoteur (P), les éléments d'initiation de la traduction (5'UTR) avec ou sans IRES et/ou sites donneur et accepteur de shunt, le ou les gènes de sélection (S) éventuellement fusionnés ou reliés par réinitiation, sont agencés de manière fonctionnelle dans l'unité de sélection, c'est- à-dire de sorte que le promoteur contrôle l'expression desdits gènes et que leur expression puisse être modulée par un composé test. Les unités de sélection selon l'invention comprennent en outre, de préférence, une séquence poly A de terminaison de la transcription précédée d'une région 3'-UTR. Généralement, ces régions sont donc disposées dans l'ordre suivant, dans l'orientation 5'->3' : (P)-(5'UTR)-(S)-(3'UTR)-(polyA). Lorsque l'unité
comporte plusieurs gènes de sélection, par exemple un gène de sélection négative (S-), un gène de sélection positive (S+) ou un gène ayant plusieurs propriétés de sélection à la fois positive et négative (S-/+), ces régions sont avantageusement disposées dans l'ordre suivant, dans l'orientation 5*->3' : (P)-(5'UTR)-(S-)-(S+)-(3'UTR)-(polyA). Il est entendu que tout autre agencement fonctionnel peut être envisagé par l'homme du métier sans départir de la présente invention.
Typiquement, chaque unité de sélection est comprise dans un vecteur propre (c'est-à-dire que chaque unité est comprise dans une vecteur distinct ou différent). Il peut s'agir de tout vecteur adapté au système utilisé, tel qu'un plasmide, virus, phage, episome, chromosome artificiel, etc. On peut citer à titre d'exemple des vecteurs plasmidiques, tels que les plasmides bactériens pQE70, pDIO, phagescript, ρsiX174, p.BluescriptSK, ρNH46A; pKK233-3, ρRIT5; pSV2CAT, pSG; pSVK3, pBPV, pMSG et pSVL, disponibles dans le commerce, le bactériophage PI (Sternberg N.L. (1992;1994)), un adénovirus humain de type2 ou 5 ou d'origine animale (WO94/28152, WO97/00326, WO95/00655), et des rétrovirus (MLV, FLV, etc.). Le vecteur est de préférence un plasmide (c'est-à-dire typiquement une molécule circulaire, de préférence à base d'ADN double-brin), qui peut être linéarisé. Les unités de sélection peuvent être introduites dans la cellule par transfection ou transduction virale, et se répliquer sous forme autonome ou s'intégrer dans le génome de la cellule hôte, par exemple par recombinaison homologue.
Selon un autre mode de réalisation de l'invention, les gènes de sélection des unités de sélection sont portés par un vecteur unique, de préférence un plasmide, et, tout en étant placés sous le contrôle d'éléments IRES et/ou sites donneur et accepteur de shunt identiques ou différents, sont liés fonctionnellement par ces derniers.
Un objet particulier de l'invention concerne l'utilisation, dans le cadre d'une méthode de criblage permettant l'identification de composés modulant le mécanisme d'initiation de la traduction, d'au moins deux unités de sélection comprenant chacune des éléments d'initiation de la traduction identiques et au moins un gène de sélection, le ou les gènes de sélection de chaque unité de sélection étant placés sous le contrôle du même promoteur.
Un objet préféré de l'invention concerne ainsi une méthode de criblage dans laquelle chaque unité de sélection ou vecteur comprend un promoteur différent, un gène de sélection différent, une région 5' UTR située entre ledit promoteur et ledit gène de sélection au sein de l'unité de sélection et ladite région 5'UTR étant identique ou différente d'un vecteur ou d'une unité à l'autre. Préférentiellement, chaque unité de sélection est comprise dans un vecteur distinct.
Un autre objet préféré concerne une méthode de criblage dans laquelle chaque unité de sélection ou vecteur comprend un promoteur différent contrôlant l'expression d'une unité bicistronique composée d'un gène de sélection positive, d'un élément de type IRES et/ou shunt et d'un gène de sélection négative, ledit élément IRES étant identique ou différent d'un vecteur ou d'une unité à l'autre. Préférentiellement, chaque unité de sélection est comprise dans un vecteur distinct.
Un objet préféré de l'invention concerne une méthode de criblage dans laquelle les unités de sélection, situées au sein d'un même vecteur, comprennent des gènes de sélection différents et sont placées sous le contrôle d'un promoteur commun et d'éléments IRES identiques ou différents.
Selon un mode de réalisation préféré de l'invention, les unités de sélection telles que décrites précédemment (ou le ou les vecteurs les contenant), sont par ailleurs contenues dans une cellule permettant l'expression des gènes de sélection. Le composé test ou un précurseur de celui-ci peut alors être mis en contact avec la cellule.
A cet égard, l'invention est également relative à une cellule comprenant au moins deux unités de sélection comprenant chacune au moins un gène de sélection distinct placé sous le contrôle d'un promoteur et d'éléments d'initiation de la traduction. L'invention est également relative à une cellule comprenant au moins un vecteur tel que défini ci-avant. L'invention est également relative à une population de cellules dont les cellules (ou une partie d'entre-elles) comprennent au moins deux unités de sélection ou au moins un vecteur tels que définis ci-avant. Les éléments d'initiation de la traduction peuvent comprendre une région non traduite (5'UTR) comprenant de préférence un ou plusieurs éléments IRES et/ou des éléments impliqués dans le mécanisme de transfert du ribosome. Selon un mode préféré de réalisation de l'invention, les éléments d'initiation de la traduction des unités de sélection sont identiques. Selon un autre mode préféré, les promoteurs des unités de sélection sont différents. Les gènes de sélection utilisés sont de préférence des gènes de sélection négative, choisis préférentiellement parmi Tk, HPRT, NTR, gpt et CodA et/ou des gènes rapporteurs, choisis de préférence parmi EGFP, ECFP, EBFP, et/ou des gènes de sélection positive, choisis de préférence parmi les gènes hygro, néo, phleo, puro et bla. Les séquences IRES sont quant à elles choisies de préférence parmi les séquences IRES des gènes ODC, c-myc, c-sis, FGF-2, PDGF-2, IGF-2, VEGF, apaf- 1, XIAP, eIF4G, EMCV, HCV ou encore toute IRES fonctionnelle dans le système cellulaire ou acellulaire utilisé. Chaque unité de sélection peut être comprise dans un vecteur, de préférence, dans un plasmide.
Les populations cellulaires selon l'invention sont préférentiellement composées de cellules eucaryotes, notamment humaines, de préférence immortalisées. Elles peuvent être préparées par toute technique connue de l'homme du métier, notamment par électroporation, infection, précipitation au phosphate de calcium, utilisation d'agents facilitant la transfection (e.g., liposomes, lipides cationiques, peptides, polymères, etc.).
Selon un autre mode de réalisation de l'invention, les unités de sélection sont mises en contact avec le composé test, dans un système acellulaire, en présence des enzymes et réactifs permettant la transcription et/ou la traduction in vitro. De tels systèmes sont commercialisés par des fournisseurs tel que Promega (lysat de réticulocytes (RRL) ou système TNT ). Il est entendu que dans le cas particulier de l'introduction dans un système acellulaire d'unités de sélection sous forme d'ARN, la présence des enzymes et réactifs permettant la transcription in vitro n'est pas requise.
Mise en contact des composés avec au moins deux unités de sélection selon l'invention
Les méthodes de criblage selon l'invention prévoient une étape ex vivo ou in vitro de mise en contact du composé test avec au moins deux unités de sélection selon l'invention, dans des conditions particulières qui permettent de déterminer l'expression desdits gènes de sélection et d'obtenir ainsi une information concernant l'effet du composé test. Classiquement, l'effet du composé test est comparé au niveau d'expression des gènes de sélection, déterminé en l'absence dudit composé, ou dans une situation de référence.
De manière préférée, le composé test peut être mis en contact avec des cellules hôtes dans lesquelles des unités de sélection selon l'invention ont été introduites, via des vecteurs plasmidiques, par exemple. Ces cellules, dans un mode préféré de l'invention, peuvent être des cellules eucaryotes, par exemple des levures, des cellules de mammifères et notamment des cellules humaines (hépatocytes, fibroblastes, cellules endothéliales, musculaires, etc.). De manière encore plus préférée, ces cellules peuvent être des cellules humaines immortalisées. Il peut également s'agir de populations, de cultures primaires ou de lignées établies (cellules Hela par exemple).
L'invention concerne donc une méthode de criblage dans laquelle les composés tests sont préférentiellement mis en contact avec une cellule issue d'une population ou d'une lignée de cellules eucaryotes, notamment humaines, de préférence immortalisées, comprenant les unités de sélection.
Un autre objet de la présente invention concerne une population ou une lignée cellulaire dont les cellules constitutives comprennent au moins deux unités de sélection comprenant chacune au moins un gène de sélection distinct placé sous le contrôle d'un promoteur et d'éléments d'initiation de la traduction. Ces derniers comprennent de préférence une région non traduite (5'UTR) pouvant comprendre un ou plusieurs éléments IRES et/ou des éléments impliqués dans le mécanisme de transfert du ribosome, par exemple des sites donneur et accepteur de shunt, et sont de préférence identiques. Le ou les gènes de sélection de chaque unité de sélection sont de préférence différents et sont placés sous le contrôle de promoteurs de préférence différents également.
Les composés peuvent être mis au contact des unités de sélection ou des cellules les contenant à différents moments, selon leur(s) effet(s), leur concentration, la nature des cellules et l'appréciation technique. Le contact peut être effectué sur tout support approprié et notamment sur une plaque, dans un tube ou une flasque. Généralement, la mise en contact est réalisée dans une plaque multipuits ce qui permet de conduire, en parallèle, des essais nombreux et variés. Parmi les supports typiques on trouve des plaques de microtitration et plus particulièrement des plaques 96 ou 384 puits (ou plus), faciles à manipuler et sur lesquels la révélation peut être obtenue grâce à une stimulation classique. Selon le support et la nature du composé test, des quantités variables de cellules peuvent être utilisées lors de la mise en œuvre des méthodes décrites. De manière classique, 103 à 106 cellules sont mises en contact avec un type de
composé test, dans un milieu de culture approprié, et de manière préférentielle entre 10 et 105 cellules. A titre d'exemples, dans une plaque de 96 puits, 104 à 105 cellules peuvent être incubées dans chaque puit avec une quantité voulue d'un composé test. Dans une plaque à 384 puits, moins de 105 cellules et typiquement entre 103 et 5xl 04 cellules sont généralement incubées dans chaque puit avec le composé test. La quantité (ou la concentration) de composé test peut être ajustée par l'utilisateur selon le type de composé (sa toxicité, sa capacité de pénétration cellulaire, etc.), le nombre de cellules, la longueur de la période d'incubation, etc. Généralement, les cellules sont exposées à des quantités de composés test qui varient de lnM à ImM. Il est bien sûr possible de tester d'autres concentrations sans dévier de la présente invention. Chaque composé peut, de plus, être testé, en parallèle, à différentes concentrations.
Un autre objet de l'invention concerne ainsi une méthode de criblage qui comprend la mise en contact, en parallèle, de plusieurs composés tests avec les unités de sélection.
Différents adjuvants et/ou vecteurs et/ou produits facilitant la pénétration des composés dans les cellules tels que des liposomes, des lipides cationiques ou des polymères peuvent, en outre, être utilisés, si nécessaire.
Le contact est maintenu environ une semaine, généralement entre 5 et 72 heures, voire entre 12 et 48 heures. En effet, les cellules et les divers réactifs doivent, de préférence, rester en contact suffisamment longtemps pour permettre la synthèse de novo du produit d'expression des gènes de sélection. De manière préférée, l'incubation dure environ 36 heures.
Détermination de l'expression des gènes de sélection
La méthode de sélection, d'identification et de caractérisation de composés capables de moduler un mécanisme d'expression de gènes prévoit une étape de détermination de l'expression des gènes de sélection. Cette détermination peut être obtenue à l'aide de techniques variées dont la nature dépend du type de gène utilisé. La mesure peut, par exemple, correspondre à une densité optique ou à une émission fluorescente dans le cas d'une utilisation comme gène de sélection du gène rapporteur codant pour la β-galactosidase ou la luciférase. Il peut s'agir d'une révélation de l'expression desdits gènes à l'aide d'un substrat adapté. La présence du produit du gène rapporteur (ou du produit d'hydrolyse du substrat) peut être déterminée par des méthodes classiques connues de l'homme du métier (fluorescence, D.O., luminescence, FRET (voir WO 0037077), SPA, biopuces, méthodes immunologiques, etc.). La mesure de l'hydrolyse implique essentiellement une mesure (ou la détermination de la quantité relative) du produit d'hydrolyse contenu dans chaque échantillon réactionnel. Cette mesure peut être réalisée grâce à différentes techniques connues de l'homme du métier, incluant la détection d'une fluorescence, d'une radioactivité, d'une couleur, d'une activité enzymatique, d'un immun complexe antigène-anticorps, etc. De manière préférée, le produit d'hydrolyse est détecté et quantifié grâce à une technique de détection de fluorescence. Des fluorochromes variés peuvent ainsi être utilisés et contrôlés sur des échantillons de cellules. Généralement, on détermine l'activité d'un composé test dans une cellule et cet effet est comparé au niveau
d'activité en l'absence de composé test ou à une valeur moyenne déterminée en l'absence de tout composé test.
Comme indiqué précédemment, ces méthodes permettent le criblage, rapide et en parallèle, de nombreux composés test sur une ou plusieurs populations cellulaires (cellules eucaryotes, cellules de mammifère, cellules humaines, etc.). Ces méthodes sont prédictives, automatisables et adaptées à la sélection, l'identification et la caractérisation desdits composés.
Composés test
La présente invention peut être appliquée à tout type de composé test. Ainsi, le composé test peut être tout produit qui se présente sous une forme isolée ou en mélange avec d'autres produits. Le composé peut être défini en termes de structure et/ou de composition ou ne pas être défini. Le composé peut, par exemple, être un produit isolé et structurellement défini, un produit isolé de structure indéfinie, un mélange de produits connus et caractérisés ou une composition indéfinie comprenant un ou plusieurs produits.
De telles compositions indéfinies peuvent être des composés de nature, structure et origine variées, notamment des composés biologiques, des composés chimiques, synthétiques, etc., capables de moduler la traduction. Il peut s'agir par exemple, d'échantillons de tissus, de fluides biologiques, de surnageants cellulaires, de préparations végétales, etc. Les composés test peuvent être des produits inorganiques ou organiques, un composé chimique ou biologique et notamment un polypeptide (ou une protéine ou un peptide), un acide nucléique, un lipide, un polysaccharide, un cofacteur ou tout mélange ou dérivé de ces derniers. Le composé peut être d'origine naturelle ou synthétique et inclure une banque combinatoire, une chimiothèque, un clone ou une banque d' ADNc ou de fragments de ces derniers, une banque de protéines ou de peptides aléatoires contraints ou libres, etc.
Pour réaliser une méthode de criblage selon l'invention, le composé test est choisi préférentiellement parmi un peptide, un polypeptide, un glucide, un lipide, un acide nucléique, une molécule chimique ou synthétique, un extrait végétal ou une banque combinatoire.
La présente invention est particulièrement adaptée à la sélection, l'identification ou la caractérisation d'un nombre important de composés. Ce criblage simple et efficace peut être accompli en un laps de temps très court. Les méthodes décrites peuvent, en particulier, être partiellement automatisées, autorisant ainsi le criblage efficace et simultané de composés divers et nombreux, soit sous forme de mélange soit sous forme séparée. Les composés sélectionnés sont ensuite étudiés pour confirmer leurs propriétés biologiques.
Utilisation des composés sélectionnés
Les composés identifiés selon l'invention présentent des propriétés avantageuses pour une utilisation thérapeutique, notamment dans le domaine des pathologies entraînant l'expression
anormale d'une protéine telle qu'une dérégulation traductionnelle, par exemple le cancer. Une application possible de l'invention est de permettre l'identification d'une substance thérapeutique susceptible de moduler le mécanisme d'initiation de la traduction au sein, par exemple, des cellules cancéreuses.
La sélection de composés présentant par exemple une activité modulatrice du mécanisme IRES-dépendant peut être utilisée pour concevoir de nouveaux types de molécules utilisables dans le cadre du traitement de certains cancers. En effet de nombreux proto-oncogènes ont une traduction dirigée par un IRES. Certaines mutations dans la région 5' non traduite de ces proto-oncogènes s'avèrent être directement liées à une dérégulation traductionnelle et au phénotype de cancérisation. Il semble par ailleurs que les IRES soient plus actifs dans les cellules cancéreuses ou en division que dans les cellules différenciées.
L'invention inclut ainsi l'utilisation de tout composé (ou dérivés desdits composés) sélectionné, identifié ou caractérisé selon l'une des méthodes précédemment décrites, dans le cadre de la présente invention, comme cible de recherches expérimentales ou pour la préparation d'un médicament destiné au traitement d'une pathologie entraînant l'expression anormale d'une protéine (notamment une dérégulation traductionnelle), et en particulier du cancer, mais également des maladies neurodégénératives, auto-immunes, cardiovasculaires, de la sténose, etc.
Kit
L'invention concerne également tout kit utilisable pour la mise en œuvre de méthodes de criblage telles que décrites ci-avant comprenant par exemple des vecteurs, lignée(s) cellulaire(s), compositions selon l'invention, plaques de dosages et/ou réactifs pour la détection de l'expression des gènes.
La faisabilité, la réalisation et d'autres avantages de l'invention sont illustrés plus en détails dans les exemples qui suivent, qui doivent être considérés comme illustratifs et non limitatifs.
LEGENDE DES FIGURES
Figure 1 : Unités de sélection pour cibler un mode d'initiation de la traduction particulier Le promoteur (P), le ou les gènes de sélection négatives (S-) et/ou positive (S+), fusionnés ou reliés par réinitiation, les éléments d'initiation de la traduction (5'UTR, IRES, sites donneurs (D) et accepteurs (A) de shunt, 3'UTR, éventuellement région codante) sont agencés de manière fonctionnelle dans l'unité de sélection, c'est à dire de sorte que le promoteur contrôle l'expression desdits gènes et que leur expression soit modulée par le composé test. Figure 2: Variations possibles des unités de sélection pour de cibler le mode "IRES" Figure 3 : Variation possibles des unités de sélection pour cibler le mode "SHUNT" Figure 4 : Unités de sélection pour cibler la traduction dirigée par une région 5'UTR particulière (5'UTR1)
Figure 5 : Variations possibles des unités de sélection pour de cibler la traduction dirigées par
IRES particulière (IRES 1)
Figure 6 : Conditions de tri cellulaire des cellules Hela, Hela-24C/54A et Hela-54A
Le protocole C correspond au tri suivant la fenêtre M2 et le protocole D correspond au tri suivant la fenêtre Ml (voir example 5).
EXEMPLES
Exemple 1 : Méthode de criblage de composés modulant le mécanisme d'initiation de la traduction IRES-dépendant, issus d'une banque de peptides aléatoires, à l'aide de gènes de sélection négative.
Dans un premier temps, la lignée cellulaire contenant les deux gènes de sélection négative doit être réalisée. La lignée Hela ou d'autres cellules humaines de préférence immortalisées peuvent être utilisées. Les séquences IRES sont choisies parmi ODC, c-myc, c-sis, FGF-2, PDGF-2, IGF-2, VEGF, apaf-1, XIAP, eIF4G, EMCV, HCV ou encore tout IRES fonctionnel dans le système cellulaire utilisé. Parmi les gènes de sélection négative sont préférés les gènes TK et CodA. Il existe pour ces deux enzymes une multitude de mutants ayant des substrats différents susceptibles d'être utilisés pour leurs propriétés particulières. Typiquement, les deux gènes suicides sont codés par deux plasmides qui contiennent par ailleurs tous les éléments nécessaires pour leur expression dans les cellules eucaryotes à savoir un promoteur (CMV, SV40, β-actine, PGK, promoteur issu d'un gène domestique, etc.), un signal de polyadénylation, etc.
Dans un second temps, les plasmides codant pour les peptides issus d'une banque de peptides aléatoires (plasmides BPA) sont introduits dans la lignée cellulaire décrite précédemment. Différentes techniques de biologie moléculaire peuvent être utilisées pour l'introduction de ces plasmides dans les cellules eucaryotes (transfection, transduction, etc.). Cette étape est idéalement réalisée par transduction virale (utilisation de vecteurs rétro viraux ou adéno viraux). Le gène concerné peut coder pour une protéine provenant de différentes origines (banque d'ADNc procary ote ou eucaryote). Typiquement, le plasmide BPA code pour un peptide aléatoire libre (de 5 à 30 aa) ou inclus au sein d'une protéine présentatrice (peptide contraint ; de 5 à 20 aa) telle qu'une version inactive de la nucléase du staphylocoque, la boucle du site actif de la thioredoxine d'E.co/ , les toxines de scorpion ou encore l'inhibiteur de l'alpha- amylase (Tendamistat). Le plasmide BPA dispose de préférence d'un gène de sélection positive pour permettre une expression stable à terme et ainsi faciliter son sous-clonage. La protéine présentatrice peut-être elle-même fusionnée à un marqueur de sélection positive (neo, hygro, puro, blasticidine, etc.).
Enfin, la lignée cellulaire est soumise à la double sélection négative par activation des deux programmes suicides (typiquement par apport dans le milieu de culture cellulaire de «pro- drug» de type Gancyclovir, Acyclovir, 5Fluoro-cytosine, etc.). Les cellules exprimant un peptide capable d'inhiber le mécanisme d'initiation de la traduction IRES-dépendant, et par
conséquent capable de diminuer conjointement l'expression des deux programmes de suicide (gène de sélection négative), survivent. Ces cellules sont ensuite cultivées et les peptides aléatoires caractérisés. Cette méthode est basée sur le système de sélection double de l'invention qui permet d'accroître la spécificité des peptides sélectionnés. En effet, ne seront pas sélectionnés les peptides aléatoires pouvant interférer avec des étapes non ciblées de l'expression de l'un des deux gènes de sélection (la transcription, l'épissage, l'export des ARNm, etc.). De façon similaire ne seront pas sélectionnés les peptides pouvant interférer avec l'un des deux processus biochimiques impliqués dans le programme de suicide cellulaire. Ainsi, la haute sélectivité de ce système de criblage permet, en utilisant un grand nombre de cellules, de pouvoir tester un grand nombre de peptides aléatoires et d'éviter l'analyse fastidieuse d'un grand nombre de «faux positifs».
A l'issue de la sélection négative, les clones résistants obtenus sont amplifiés et soumis à différentes analyses (étude du profil «cycle cellulaire» par FACS pour déterminer la proportion de cellules dans chaque phase du cycle). La région du plasmide codant pour le peptide aléatoire est ensuite clonée après amplification par PCR. Finalement, les peptides isolés sont étudiés pour confirmer leurs propriétés biologiques.
Exemple 2 : Construction d'unités de sélection modulables
Cet exemple décrit la composition et la construction de vecteurs de clonage permettant, selon les objectifs du criblage envisagé, le transfert dans un type cellulaire donné d'unités de sélection uniques. Chacune des unités de sélection est déterminée par une combinaison unique des éléments génétiques suivants : (i) un promoteur, (ii) une région 5' non traduite (5'UTR), (iii) une séquence codant pour une protéine bi-fonctionnelle (protéine de fusion), (iv) une région 3' non traduite (3'UTR) et (V) une séquence de polyadénylation (polyA). Par ailleurs, ces unités de sélection sont aisément modulables. En effet, elles contiennent des sites de restriction enzymatique uniques facilitant la substitution de leurs éléments génétiques.
Choix des éléments génétiques :
Les promoteurs ont été choisis parmi les séquences promotrices des gènes de la phospho- glycérate kinase humaine (PGK), de l'ubiquitine C humaine (Ubc), du promoteur de la chaine lourde du gène de la ferritine (Fer) et du virus SV40 (SV40). Les régions 5' UTR ont été choisies parmi celles de l'ARNm cMYC P2 (IRES cMYC) et de l'ARNm ApaFl (IRES ApaFl). Il peut aussi s'agir d'une séquence synthétique (arbitrairement appelée SX). Les séquences codant pour les protéines bi-fonctionnelles ont été choisies parmi celles des protéines fusions puromycine-thymidine kinase du virus de l'herpès humain (PAC-TK), hygromycine-cytosine déaminase à'E.Coli (Hygro-CODA) et hygromycine-GFP (Hygro- GFP). En outre, certaines de ces protéines disposent d'une courte séquence C-terminale (3X- Flag) (Stratagen). Les régions 3' UTR ont été choisies parmi deux fragments synthétiques arbitrairement appelés SY et SW. Les séquences de polyadénylation ont été choisies parmi celles du gène de l'hormone de croissance bovine (BGH) et du virus simian 40 (SV40). Les
unités de sélection peuvent être représentées schématiquement dans le sens 5'->3' de la manière suivante :
Vecteur Promoteur 5' UTR protéine fusion 3'UTR polyA pl4 Ubc SX Hygro-CODA-3X Flag SY BGH pl5 Ubc SX PAC-TK-3X Flag SY BGH pl7 PGK SX Hygro-CODA-3X Flag SY BGH pl8 PGK SX PAC-TK-3X Flag SY BGH pl9 SV40 SX Hygro-CODA-3X Flag SY BGH p20 SV40 SX PAC-TK-3X Flag SY BGH p24 PGK IRES cMyc Hygro-CODA-3X Flag SY BGH p25 Ubc IRES cMyc PAC-TK-3X Flag SY BGH p26 SV40 IRES cMyc PAC-TK-3X Flag SY BGH p24 PGK IRES cMyc Hygro-GFP SY BGH p51 PGK IRES ApaFl PAC-TK-3X Flag SY BGH p54 Fer IRES cMyc Hygro-GFP SY BGH p56 Fer IRES ApaFl Hygro-GFP SY BGH p82 SV40 IRES cMyc PAC-TK-3X Flag SX SV40
Déta ils de la construction des vecteurs :
Le vecteur pi a été généré par digestion enzymatique du vecteur pUB6/V5His A (Invitrogen) par PvuII puis, circularisation du fragment de 3662 pb. Ce vecteur contient dans le sens 5'->3' : le promoteur Ubc, une région 5' UTR contenant un intron, un site de clonage multiple, la région 3 'UTR S Y, la séquence de polyadénylation du gène de l'hormone de croissance bovine (BGH), l'origine de réplication bactérienne pMBl ori et le gène de résistance à l'ampicilline.
Le vecteur p2 a été généré par l'insertion de la séquence fusion PAC-TK entre les sites de restriction Not I et Xho I du vecteur pi. La séquence fusion PAC-TK a été purifiée après digestion du vecteur pCMV-PAC-TK (Karreman C. A new set of positive/négative selectable markers for mammalian cells. Gène. 1998. Sep 18; 218(1-2): 57-61) par les enzymes de restriction Not I et Xho I.
Le vecteur p3 a été généré par l'insertion de la séquence fusion Hygro-CODA entre les sites de restriction Not I et Xho I du vecteur i. La séquence codante Hygro-CODA a été purifiée après digestion du vecteur pCMV-Hygro-CODA TK (Karreman C. A new set of positive/négative selectable markers for mammalian cells. Gène. 1998. Sep 18; 218(1-2): 57- 61) par les enzymes de restriction Not I et Xho I.
Le vecteur p8 a été généré par l'insertion de la séquence fusion CODA-3Xflag entre les sites de restriction NgoM I et Xho I du vecteur p3. La séquence fusion CODA-3Xflag a été générée par la technique de PCR fusion en utilisant les vecteurs pCMV-Hygro-CODA et p3XFLAG-CMV10 (Sigma) comme matrice.
Le vecteur plO a été généré par insertion de la séquence fusion TK-3Xflag entre les sites de restriction PshA I et Xho I du vecteur p2. La séquence fusion TK-3Xflag a été générée
par la technique de PCR fusion en utilisant les vecteurs pCMV-PAC-TK et p3XFLAG- CMV10 (Sigma) comme matrice.
Le vecteur pl4 a été généré par insertion du promoteur Ubc entre les sites de restriction Bgl II et Hind III du vecteur p8. Le promoteur Ubc a été obtenu par la technique de PCR en utilisant le vecteur pUB6/V5-HIS A (invitrogen) comme matrice.
Le vecteur pl5 a été généré par insertion du promoteur Ubc entre les sites de restriction Bgl II et Hind III du vecteur plO.
Le vecteur pl7 a été généré par insertion du promoteur PGK entre les sites de restriction Bgl II et Hind III du vecteur p8. Le promoteur PGK a été obtenu par la technique de PCR en utilisant de l'ADN génomique de cellule humaine Hela comme matrice.
Le vecteur pl8 a été généré par insertion du promoteur PGK entre les sites de restriction Bgl II et Hind III du vecteur plO.
Le vecteur pl9 a été généré par insertion du promoteur SV40 entre les sites de restriction Bgl II et Hind III du vecteur p8. Le promoteur SV40 a été purifié après digestion du vecteur pGFR-p(R) (Packard) par les enzymes de restriction Hind III et Bgl IL
Le vecteur p20 a été généré par insertion du promoteur SV40 entre les sites de restriction Bgl II et Hind III du vecteur plO.
Le vecteur p24 a été généré par insertion entre les sites de restriction Hind III et pShA I du vecteur pl7 d'une séquence fusion entre TIRES cMYC et des 38 premiers nucléotides de la séquence codante de l'hygromycine (Hygro). Le fragment cMYC-Hygro a été généré par la technique de PCR fusion en utilisant les vecteurs pCMV-Hygro-CODA et pIRESYS l lbis (construit par C. Deffaud) comme matrice.
Le vecteur p25 a été généré par l'introduction entre les sites de restriction Hind III et BstE II du vecteur pl5 d'une séquence fusion entre TIRES cMYC et des 138 premiers nucléotides de la séquence codante de la puromycine (PAC). Le fragment cMYC-PAC a été généré par la technique de PCR fusion en utilisant les vecteurs pCMV-PAC-TK et pIRESYS 1 Ibis (construit par C. Deffaud) comme matrice.
Le vecteur p26 a été généré par insertion entre les sites de restriction Hind III et BstE II du vecteur p20 de la séquence fusion cMyc-PAC générée et décrite pour le plasmide p24.
Le vecteur p28 a été généré par insertion de la séquence codante de la GFP entre les sites de restriction BstE II et Xba I du vecteur p24. Le fragment d'ADNc de la GFP a été obtenu par la technique de PCR en utilisant le vecteur pEGCF-Cl (Clonetech) comme matrice.
Le vecteur p54 a été généré par insertion du promoteur Ferritine (Fer) entre les sites de restriction Bgl II et Hind III du vecteur p28. Le promoteur Ferritine a été généré par PCR en utilisant le vecteur pORF 1 (Cayla) comme matrice.
Le vecteur p51 a été généré par insertion entre les sites de restriction Hind III et pShA I du vecteur pl8 d'une séquence fusion entre TIRES Apaf-1 et des 38 premiers nucléotides de la séquence codante de la puromycine (PAC). Le fragment Apaf-1-PAC a été généré par la technique de PCR fusion en utilisant les vecteurs (pRAF) et pCMV-PAC-TK comme matrice.
Le vecteur p56 a été généré par insertion entre les sites de restriction Hind III et pShA I du vecteur p54 d'une séquence fusion entre TIRES Apaf-1 et des 138 premiers nucléotides de la séquence codante de l'hygromycine (Hygro). Le fragment Apaf-1 -Hygro a été généré par la
technique de PCR fusion en utilisant les vecteurs (pRAF) et pCMV-Hygro-CODA comme matrice.
Le vecteur p82 a été généré par insertion entre les sites de restriction Xho I et Sph I du vecteur p26 d'un fragment contenant la séquence 3 'UTR synthétique SW et la séquence de polyadénylation du virus SV40. Ce fragment d'ADN a été obtenu par la technique de PCR en utilisant les vecteurs pGFR-p(R) (Packard) pour matrice.
Exemple 3 : Système cellulaire pour le criblage de composés modulateurs du promoteur viral SV40
Pour sélectionner de façon ciblée des molécules modulatrices (activatrices ou inhibitrices) de l'activité transcriptionnelle du promoteur SV40, un système de sélection à été développé à partir de la lignée cellulaire humaine Hela et des vecteurs pl9 et p82.
pl9 : SV40 SX Hygro-CODA SY BGH p82 : SV40 cMyc PAC-TK SW SV40
Les cellules Hela ont été transfectées avec les vecteurs pl9 et p82 puis, maintenues en culture pendant 15 jours en présence d'hygromycine (200μg/ml) et de puromycine (2 μg/ml). Plusieurs clones cellulaires issus de cette sélection (clones Hela- 19/82) présentent les caractéristiques requises à la réalisation d'un criblage cellulaire de molécules modulatrices du promoteur SV40.
Dans le cas particulier d'un criblage de molécules inhibitrices du promoteur SV40, les cellules Hela-19/82 seront mises en contact avec une pluralité de composés test, et incubées en présence de GCV et de 5FC. Seules les molécules capables d'inhiber l'activité transcriptionnelle du promoteur SV40 diminueront conjointement l'expression des deux gènes de suicide et procureront ainsi aux cellules Hela-19/82 une viabilité accrue.
Dans le cas du criblage de molécules activatrices du promoteur SV40, les cellules Hela-19/82 seront mis en contact avec une pluralité de composés test, et préférentiellement incubées en présence de puromycine et hygromycine à des concentrations toxiques. Seules les molécules capables d'augmenter l'activité transcriptionnelle du promoteur SV40 stimuleront conjointement l'expression des deux gènes de résistance et permettront ainsi d'accroître la viabilité des cellules.
Exemple 4 ; Système cellulaire pour le criblage de composés modulateurs du mécanisme d'entrée directe des ribosomes dirigé par TIRES cMYC.
La protéine cMyc est un facteur de transcription impliqué dans de nombreux processus cellulaires extrêmement variés tels que la prolifération, la différentiation, Tapoptose ou la transformation. L'expression de cMYC est régulée à différents niveaux et notamment au niveau traductionnel par un site d'entrée direct des ribosomes (IRES). Certaines formes de
cancer impliquent des dérégulations traductionnelles de l'ARNm c-myc. Par conséquent, LIRES cMYC constitue une cible potentielle pour le traitement de ces pathologies. Afin de sélectionner de façon ciblée des molécules modulatrices (activatrices ou inhibitrices) de TIRES cMYC, un système de sélection à été développé à partir de la lignée cellulaire humaine Hela et des vecteurs p25 et p54.
: Ubc cMyc PAC-TK SX BGH
: Fer cMyc Hygro-GFP SX BGH
Dans un premier temps, des cellules Hela ont été transfectées par le vecteur p24 puis maintenues en culture pendant 2 semaines en présence de puromycine (2μg/ml). Plusieurs clones cellulaires issus de cette sélection ont été sélectionnés sur la base de la fonctionnalité du gène TK (suicide cellulaire en présence de GCV, typiquement de 1 à 20 μg/ml pendant une semaine). Enfin, l'ADN génomique de ces clones a été analysé par PCR pour vérifier l'intégrité de la région promotrice et de TIRES du vecteur p24 intégré.
Dans un second temps, des cellules de l'un des clones stables précédemment obtenus (clone Hela-24C) ont été transfectées par le vecteur p54, puis maintenues en culture pendant 3 semaines en présence d'hygromycine (200 μg/ml). Les clones cellulaires issus de cette deuxième sélection ont ensuite été sélectionnés sur la base de la fonctionnalité du gène GFP (analyse par FACS). Enfin, TADN génomique de ces clones a été analysé par PCR pour vérifier l'intégrité de la région promotrice et de TIRES du vecteur p54 intégré. Les clones cellulaires ainsi obtenus possèdent les caractéristiques requises à la réalisation d'un criblage de molécules inliibitrices de TIRES cMYC. Un de ces clones, le clone Hela-24C/54A a été analysé de façon plus approfondie, les résultats obtenus étant présentés dans l'exemple 5.
Exemple 5 : Caractéristiques avantageuses de la lignée Hela-24C/54A
Le criblage cellulaire de molécules aléatoires est un outil extrêmement puissant pour valider de nouvelles cibles cellulaires et identifier des molécules d'intérêt thérapeutique. Néanmoins, les différents éléments impliqués dans de tels criblages doivent avoir les caractéristiques nécessaires et optimales pour offrir les meilleures chances de succès.
Dans le cadre de la mise en place d'un criblage cellulaire de molécules inhibitrices de TIRES cMYC, les caractéristiques avantageuses de la lignée Hela-24C/54A (voir exemple 3), ont été évaluées plus en détails.
De façon plus général, l'efficacité globale d'un criblage dépend de plusieurs paramètres, dont principalement (i) la nature de la banque de molécules utilisées, (ii) la taille de la banque et (ϋi) l'efficacité intrinsèque du système de sélection.
Dans le cas de la lignée Hela-24C/54A, comme pour toute autre lignée cellulaire destinée au un criblage de banques moléculaires, l'efficacité intrinsèque du système de détection est la résultante de deux paramètres : (i) la fuite du système et (ii) la sélectivité du système.
1- La "fuite" du système
Par fuite du système, on entend le pourcentage de cellules qui vont réagir positivement au cours du criblage et ce malgré l'intervention d'une quelconque molécule effectrice. Il peut s'agir soit (i) de variation d'expression et/ou mutation et/ou délétion des gènes de sélection (au sens large du mot gène : éléments régulateurs et/ou partie codante) et/ou (ii) d'un artefact expérimental inhérent à la lignée cellulaire utilisée. Dans tous les cas, il en résultera une perte de sélectivité du système, qui conduira inévitablement à l'émergence de "faux positifs". Afin de pallier à ce problème, la solution divulguée dans cette présente invention consiste à utiliser des lignées cellulaires contenant plusieurs systèmes de sélection (ou filtres) croisés.
Pour vérifier la validité de cette approche, la fuite du système de la lignée Hela-24C/54A a été comparée à des systèmes contenant un filtre unique. Les 3 lignées cellulaires utilisées pour cette étude sont les suivantes :
Les cellules Hela-24C contenant uniquement un seul système de sélection issu du vecteur p24
(filtre 1)
Les cellules Hela-24C/54A contenant deux systèmes de sélection croisés et issus des vecteurs p54 et p24 (filtre 1 et 2).
Les cellules Hela-54A contenant uniquement un seul système de sélection issu vecteur p54
(filtre 2).
Les cellules Hela-24C et Hela-24C/54A ont été décrites dans l'exemple précédent. Les cellules Hela-54A dérivent d'un clone cellulaire Hela-24C/54A résistant au suicide par le GCV, dont T analyse de TADN génomique par PCR a révélé une délétion du système de sélection 1.
3 protocoles de criblage ont été appliqués sur ces 3 lignées cellulaires :
Criblage simple sur l'unité de sélection #24 : 20 000 cellules sont trypsinées, ensemencées dans une boite de 10cm de diamètres, puis après adhésion au support, incubées en présence de 1 μg/ml de GCV (protocole A) ou 0,25 μg/ml de GCV (protocole B) pendant 48 heures. Les cellules sont ensuite maintenues en culture dans du milieu sans GCV et les clones résistants dénombrés au bout de 6 jours.
Criblage simple sur l'unité de sélection #54: 20 000 cellules sont trypsinées, puis triées au FACS selon deux protocoles (protocoles C et D ; voir figure 6) pour sélectionner les cellules dont la fluorescence est diminuée. Les cellules sont alors ensemencées dans une boite de 10cm de diamètres. Les cellules sont maintenues en culture et les clones résistants dénombrés au bout de 6 jours.
Criblage double sur les unités de sélection #24 et #25 : 20 000 cellules sont trypsinées, puis triées au FACS pour sélectionner les cellules dont la fluorescence est diminuée. Les cellules sont alors ensemencées dans une boite de 10cm de diamètres et, après adhésion au support, incubées en présence de 1 μg/ml de GCV ou 0,25 μg/ml de GCV pendant 48 heures. Les cellules sont ensuite maintenues en culture dans du milieu sans GCV et les clones résistants dénombrés au bout de 6 jours.
Le tableau 1 résume les résultats obtenus en "pourcentage de fuite" (Nombre de clones obtenus /Nombre de cellules de départ x 100)
TABLEAU 1 : "Fuite du système" utilisant les lignées Hela-24C, Hela 54A et Hela-24C/54A
Les résultats obtenus montrent clairement que la fuite du système est minimale dans le cas de l'utilisation de la lignée cellulaire Hela-24C/54A à laquelle est appliquée une double sélection.
Par ailleurs, il est important de noter que l'introduction ou l'élimination d'une seconde unité de sélection n'affecte pas la fuite du système d'une première unité de sélection. Ceci montre que les deux unités de sélection de la lignée cellulaire Hela-24C/54A ont un mode de fonctionnement quasi indépendant.
2- La sélectivité du système
L'utilisation de la lignée Hela-24C/54A permet d'effectuer un criblage basé sur un système de double filtrage. Compte tenu du fonctionnement quasi indépendant (cf fuite du système) des deux unités de sélection de la lignée cellulaire Hela-24C/54A, le processus de criblage est rationnellement très ciblé sur TIRES cMYC. Par comparaison, un système qui ne posséderait qu'un seul et unique filtre (p54 par exemple), ne pourrait éliminer des molécules dont l'action serait de baisser l'activité transcriptionnelle du promoteur Ubc ou d'inhiber la fluorescence de la protéine Hygro-GFP. Ainsi, un tel système disposerait d'une moins bonne sélectivité que le système constitué de la lignée Hela-24C/54A.
Conclusion : La lignée Hela-24C/54A présente, de par une fuite du système limitée et une meilleure sélectivité, des caractéristiques avantageuses dont ne disposent aucun des systèmes cellulaires ne contenant qu'une seule des deux unités de sélection de la lignée Hela-24C/54A.
Exemple 6 : Système cellulaire pour le criblage de composés modulateurs du mécanisme d'entrée directe des ribosomes gouverné par TIRES Apaf-1.
La protéine Apaf-1 est un facteur impliqué dans le processus de mort cellulaire par apoptose. L'expression d'Apaf-1 est traductionnellement régulée par un site d'entrée direct des ribosomes (IRES). L'IRES Apaf-1 constitue ainsi une cible potentielle pour modifier la sensibilité des cellules à Tapoptose. Pour sélectionner de façon ciblée des molécules modulatrices (activatrices ou inhibitrices) de TIRES Apaf-1, un système de sélection à été développé à partir de la lignée cellulaire humaine Hela et des vecteurs p51 et p56.
p51 : PGK IRES ApaFl PAC-TK-3X Flag S Y BGH p56 : Fer IRES ApaFl Hygro-GFP S Y BGH
Les cellules Hela ont été transfectées avec les vecteurs p51 et p56 puis maintenues en culture en présence d'hygromycine (200μg/ml) et de puromycine (2 μg/ml) pendant 15 jours. Les clones cellulaires issus de cette sélection (clones Hela-51/56) disposent des caractéristiques exigées pour la réalisation d'un criblage cellulaire de molécules modulatrices de TIRES Apaf- 1. Par criblage cellulaire on entend qu'une pluralité de composés test peuvent être mis en présence d'une pluralité de cellules Hela-51/56, lesquelles disposent de la capacité de désigner, de part leur viabilité et l'intensité de leur fluorescence, de la présence de molécules effectrices possédant une activité modulatrice de TIRES Apaf-1.
Exemple 7 : Système cellulaire pour le criblage de composés modulateurs des IRES cMyc et Apaf-1.
Cette exemple décrit un système de criblage cellulaire orienté vers la sélection de molécules modulatrices à la fois de TIRES cMyc et de TIRES Apaf-1. Ainsi, les cibles potentielles de ce criblage correspondent à tout élément cellulaire requis pour le fonctionnement de ces deux IRES. Un système cellulaire contenant 2 unités de sélection a été développé. La première unité de sélection est constituée du vecteur p82. La seconde unité est constituée du vecteur p56.
p82 : Ubc cMyc PAC-TK SW SV40 p56 : Fer Apaf-1 Hygro-GFP SX BGH
Les cellules Hela ont été transfectées avec les vecteurs p82 et p56 puis maintenues en culture en présence d'hygromycine (200μg/ml) et de puromycine (2 μg/ml) pendant 18 jours. Les clones cellulaires issus de cette sélection (clones Hela-82/56) disposent des caractéristiques désirées pour la réalisation d'un criblage cellulaire de molécules modulatrices de TIRES cMyc et Apaf-1. Par criblage cellulaire on entend qu'une pluralité de composés test peuvent être mis en présence d'une pluralité de cellules Hela-82/56, lesquelles disposent de la capacité de désigner, de part leur viabilité et l'intensité de leur fluorescence, de la présence de molécules effectrices possédant une activité modulatrice des IRES cMYC et Apaf-1.