具体实施方式
本文公开了靶向TCR基因的锌指核酸酶(ZFN)和TALEN (TCR-ZFN和TCR-TALEN)。这些核酸酶有效地例如在TCR编码区 中预先确定的位点处导致双链断裂(DSB)。在编码TCR基因的基因中 ZFN或者TALEN介导的位点特异性双链断裂(DSB)的导入可导致人 类细胞(包括人类T细胞)中的内源TCR复合物的特异性和永久的 断裂。这些细胞可通过选择CD3(-)细胞,然后在IL7和IL15上培养 细胞而从细胞池中选取。此外,本文公开了用于以所选择的TCR转 基因,经由随机整合或者定向靶向整合取代内源TCR基因的方法和 组合物。
概要
除非另有说明,否则本方法的实践,以及本文公开的组合物的制 备与应用采用本领域技术范围内的分子生物学、生物化学、染色质结 构和分析、计算化学、细胞培养、重组DNA和相关领域中的常规技 术。这些技术在文献中已有充分描述。参见,例如,Sambrook等人,MOLECULAR CLONING:A LABORATORY MANUAL,第二版, Cold Spring HarborLaboratory Press,1989和第三版,2001;Ausubel 等人,URRENT PROTOCOLS IN MOLECULARBIOLOGY,John Wiley&Sons,New York,1987及其定期更新;METHODS IN ENZYMOLOGY系列丛书,Academic Press,San Diego;Wolffe, CHROMATIN STRUCTURE AND FUNCTION,第三版,Academic Press,San Diego,1998;METHODS IN ENZYMOLOGY,第304卷, “Chromatin”(P.M.Wassarman和A.P.Wolffe编辑),Academic Press, San Diego,1999;以及METHODS INMOLECULAR BIOLOGY,第 119卷,“Chromatin Protocols”(P.B.Becker编辑),HumanaPress, Totowa,1999。
定义
术语“核酸”、“多核苷酸”和“低聚核苷酸”是可互换使用的,并且 是指脱氧核糖核苷酸或核糖核甘酸聚合物,可以是直链或环状构型 的,且是单链或双链形式的。出于本公开内容的目的,这些术语不构 成对聚合物长度的限制。术语可涵盖天然核苷酸的已知类似物,以及 在碱基、糖和/或磷酸部分中被修饰的核苷酸(例如,硫代磷酸主链)。 一般说来,特定核苷酸的类似物具有相同的碱基配对特异性;即A 的类似物将与T进行碱基配对。
术语“多肽”、“肽”和“蛋白质”是可互换使用用于指氨基酸残基的 聚合物。该术语还适用于其中一个或多个氨基酸是相应的天然存在的 化学类似物或者经修饰衍生物的氨基酸聚合物。
“结合”是指大分子之间(例如,蛋白质和核酸之间)的序列特异 性、非共价相互作用。不要求结合相互作用的所有组分都是序列特异 性(例如,与DNA主链中的磷酸残基接触),只要相互作用整体上 是序列特异性即可。此类相互作用一般特征为10-6M-1或者更低的电 离常数(Kd)。“亲合力”是指结合强度;增大的结合亲合力与降低的Kd有关。
“结合蛋白”是能够非共价地结合到另一分子的蛋白。结合蛋白能 够结合到例如DNA分子(DNA结合蛋白)、RNA分子(RNA结合 蛋白)和/或蛋白分子(蛋白结合蛋白)。在蛋白结合蛋白的情况下, 蛋白结合蛋白可结合到其自身(以形成同源二聚体、同源三聚体等)和/或蛋白结合蛋白可结合到一个或多个不同蛋白的一个或多个分 子。结合蛋白可具有一种以上类型的结合活性。例如,锌指蛋白具有 DNA结合、RNA结合和蛋白结合活性。
“锌指DNA结合蛋白”(或者结合域)是蛋白质或者较大蛋白质 中的域,其经由一个或多个锌指以序列特异性方式结合DNA,锌指 是其结构经由锌离子的配位作用而稳定化的结合域中的氨基酸序列 区域。术语锌指DNA结合蛋白往往缩写为锌指蛋白或者ZFP。
“TALE DNA-结合域”或者“TALE”是包括一个或多个TALE重复 域/单位的多肽。重复域是在TALE结合到其同源靶DNA序列中所涉 及的。单一“重复单元”(也被称为“重复”)通常是33-35个氨基酸长, 并且表现出与天然存在的TALE蛋白质中的其它TALE重复序列的至少一些序列同源性。TALEN优选地包括C端和/或N端截断(例如, C帽和/或N帽)。参见,例如美国专利号8,586,526,在此通过引用 整体并入。
锌指结合域和TALE结合域可“经工程化”以结合到预定的核苷酸 序列,例如经由天然存在的锌指或者TALE蛋白的识别螺旋区域的工 程化(改变一个或多个氨基酸)。因此,工程化DNA结合蛋白(锌 指或者TALE)是非天然存在的。工程化DNA结合蛋白的方法的非 限制性实例是设计和选择。经设计的DNA结合蛋白是非天然存在的, 经设计的DNA结合蛋白的设计/组合物结果主要是根据合理性准则。 设计的合理性准则包括取代规则和计算机算法的应用,计算机算法用 于处理存储现有ZFP和/或TALE设计和结合数据的数据库中的信息。参见,例如美国专利号8,586,526;6,140,081;6,453,242;和6,534,261; 以及参见WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536 和WO 03/016496。
“被选择的”锌指蛋白或者TALE是在自然界中不存在的蛋白质, 蛋白质的产生主要来源于经验过程,诸如噬菌体展示技术、相互作用 陷阱或者杂交体选择。参见例如U.S.8,586,526;U.S.5,789,538;US 5,925,523;US 6,007,988;US 6,013,453;US 6,200,759;WO 95/19431; WO 96/06166;WO 98/53057;WO 98/54311;WO 00/27878;WO 01/60970;WO 01/88197;WO 02/099084。
术语“序列”是指任何长度的核苷酸序列,该序列可为DNA或者 RNA;可为直链的、环状的或者支链的并且可为单链或者双链的。术 语“供体序列”是指插入到基因组中的核苷酸序列。供体序列可为任何 长度,例如在2个和10,000个核苷酸长度之间(或者范围之间或者 高于该范围的任何整数值),优选地在约100个和1,000个核苷酸长 度之间(或该范围之间的任何整数),更优选地在约200个和500个 核苷酸长度之间。
“同源但不同一的序列”是指第一序列与第二序列共享一定程度 的序列同一性,但是第一序列的序列并不与第二序列的序列同一。例 如,包括突变基因的野生型序列的多核苷酸与突变基因的序列是同源 但不同一的。在某些实施方案中,两个序列之间的同源性程度足以允 许利用正常的细胞机理进行它们之间的同源重组。两个同源但不同一 的序列可为任意长度,并且它们的非同源程度可低至单一核苷酸(例 如,对于通过靶向同源重组来校正基因组点突变来说)或者高至10kb 或者更高(例如,对于将基因插入染色体中预定异常位点来说)。对 包含同源但不同一序列的两个多核苷酸不要求为相同长度。例如,可使用20和10,000个之间的核苷酸或核苷酸对的外源多核苷酸(即, 供体多核苷酸)。
用于确定核酸和氨基酸序列同一性的技术是本领域中已知的。通 常,此类技术包括确定某基因mRNA的核苷酸序列和/或确定由其编 码的氨基酸序列,并将这些序列与第二核苷酸或氨基酸序列比较。也 可以此方式确定并比较基因组序列。一般说来,同一性分别是指两条 多核苷酸或多肽序列的核苷酸与核苷酸或氨基酸与氨基酸的确切对 应性。可通过测定两个或多个序列(多核苷酸或氨基酸)的同一性百 分比来比较这些序列。无论是核酸还是氨基酸序列,两个序列的同一 性百分比是两个比对序列之间的确切匹配数目除以较短序列的长度 并将结果乘以100。核酸序列的近似比对由Smith和Waterman, Advances in Applied Mathematics,2:482-489(1981)的局部同源算法 提供。该算法可通过使用Dayhoff,Atlas of Protein Sequences and Structure),Μ.O.Dayhoff编,增刊第5版,3:353-358,National Biomedical Research Foundation,Washington,D.C.,USA开发和通过Gribskov,Nucl.Acids Res.14(6):6745-6763(1986)归一化的评分矩阵 应用于氨基酸序列。测定序列同一性百分比的本算法的示例性实施由 威斯康星州麦迪逊的遗传计算机公司(Genetics Computer Group, Madison,WI)在“BestFit”应用中提供。该方法的默认参数在 WisconsinSequence Analysis Package Program Manual,第8版(1995) (购自威斯康星州麦迪逊的遗传计算机公司)中描述。本公开内容中 建立同一性百分比的优选方法是使用由John F.Collins和Shane S. Sturrok开发,由爱丁堡大学版权所有,并由加州芒廷维尤的智慧遗传 公司(IntelliGenetics,Inc.,Mountain View,CA)分销的MPSRCH程序 包。这套程序包可使用Smith-Waterman算法,其中评分表使用默认 参数(例如,空位开放罚12分、空位延伸罚1分,以及一个空位罚 6分)。产生“匹配”值的数据反映了序列同一性。计算序列之间同一性 百分比或类似性百分比的其它合适程序一般是本领域已知的,例如另 一比对程序是BLAST,使用默认参数。例如,BLASTN和BLASTP 可以使用以下默认参数:遗传密码=标准;过滤器=无;链=两条;阈 值=60;预期值=10;矩阵=BL0SUM62;描述=50个序列;分选标准= 高评分;数据库=非冗余,GenBank+EMBL+DDBJ+PDB+GenBank CDS翻译+Swiss蛋白+Spupdate+PIR。这些程序的细节可在以下互联 网网址上找到:http://www.ncbi.nlm.gov/cgi-bin/BLAST。考虑本文 所述的序列,所需的序列同一性程度的范围为约80%到100%以及其 中任何整数值。通常,序列之间的同一性百分比为至少70-75%,优 选地80-82%,更优选地85-90%,甚至更优选地92%,更加优选地 95%,以及最优选地98%的序列同一性。
或者,多核苷酸之间的序列相似性程度可以通过多核苷酸在允许 同源区域间形成稳定双链体的条件下杂交,然后用单链特异性核酸酶 消化并确定消化后片段的大小来确定。当按上述方法确定得到两个核 酸或两个多核苷酸序列在分子的限定长度上表现至少约70%-75%, 优选地80%-82%,更优选地85%-90%,甚至更优选地92%,更加优 选地95%,以及最优选地98%的序列同一性时,序列彼此间基本同 源。如本文所用,基本同源也指序列与特定的DNA或多肽序列显示 完全的同一性。基本同源的DNA序列可在Southern杂交实验中识别, 例如,以在对特定系统限定的严格条件下。本领域技术人员能限定适 当的杂交条件。参见例如,Sambrook等人,同上;Nucleic Acid Hybridization:A Practical Approach,B.D.Hames和S.J.Higgins编, (1985)Oxford;Washington,DC;IRL Press)。
可以如下确定两个核酸片段的选择性杂交。两个核酸分子之间的 序列同一性程度影响这两个分子之间杂交事件的效率和强度。部分同 一的核酸序列将至少部分抑制与靶分子完全同一的序列的杂交。可使 用本领域熟知的杂交测定(例如,Southern(DNA)印迹,Northern(RNA) 印迹,溶液杂交等,参见Sambrook等人,Molecular Cloning:ALaboratory Manual,第二版,(1989)Cold Spring Harbor,N.Y.)评价对 完全同一序列的杂交抑制。可使用不同程度的选择性,例如,使用从 低到高严格性的不同条件,进行此类测定。如果应用低严格性条件, 可使用甚至缺乏部分程度序列同一性的辅助探针(例如,与靶分子具 有小于约30%序列同一性的探针)评价不存在非特异性结合,以使得 在不存在非特异性结合事件时,辅助探针将不会与靶标杂交。
当利用基于杂交的检测系统时,选择与参考核酸序列互补的核酸 探针,然后通过选择合适条件,探针和参考序列彼此选择性杂交或结 合以形成双链分子。能在适当严格杂交条件下选择性与参考序列杂交 的核酸分子通常在能检测长度至少约10-14核苷酸的靶核酸序列的条 件下杂交,靶核酸序列与所选的核酸探针的序列具有至少约70%的序 列同一性。严格杂交条件通常能检测长度至少约10-14核苷酸的靶核 酸序列,靶核酸序列与所选的核酸探针的序列具有大于约90-95%的 序列同一性。用于探针/参考序列杂交的杂交条件可由本领域已知方 法确定,其中探针和参考序列具有特定程度的序列同一性(参见例如, Nucleic Acid Hybridization:A Practical Approach,B.D.Hames和S.J. Higgins编,(1985)Oxford;Washington,DC;IRL Press)。
杂交条件是本领域技术人员熟知的。杂交严格性是指杂交条件不 利于包含错配核苷酸的杂交体形成的的程度,同时较高严格性与错配 杂交体的较低耐受性相关。影响杂交严格性的因素是本领域技术人员 熟知的,其包括但不限于温度、pH、离子强度和有机溶剂如例如甲 酰胺和二甲亚砜的浓度。如本领域技术人员已知的,杂交严格性随温 度升高、离子强度降低和溶剂浓度降低而增加。
关于杂交的严谨性条件,本领域熟知的许多等价条件可以用于通 过改变例如下列因素来建立特定严谨性:序列的长度和特性、不同序 列的碱基组成、盐和其它杂交液组分的浓度、杂交液中存在或不存在 封闭剂(例如,硫酸葡聚糖和聚乙二醇)、杂交反应温度和时间参数、 以及改变洗涤条件。根据本领域的标准方法选择一组特定的杂交条件 (参见,例如,Sambrook等人,Molecular Cloning:A Laboratory Manual,第二版,(1989)ColdSpring Harbor,N.Y.)。
“重组”是指两个多核苷酸之间交换遗传信息的过程。出于本公开 的目的,“同源重组(HR)”是指发生这种交换的特定形式,例如在修复 细胞内双链断裂期间发生。该过程要求核苷酸序列同源性,使用“供 体”分子作为模板修复“靶”分子(即,经历双链断裂的分子),且该过 程也称作“非交叉基因转化”或“短道基因转化”,因为其导致遗传信息 从供体向靶标转移。不希望受限于任何特定理论,此类转移可以涉及 断裂的靶标与供体间形成的异源双链DNA的错配校正,和/或采用供 体再合成将成为部分靶的遗传信息的“合成依赖性链退火”,和/或相 关过程。此类特定HR通常导致靶分子的序列改变,而使得供体多核 苷酸的部分或全部序列被并入靶多核苷酸。
“切割”是指DNA分子共价主链的断裂。切割可以由多种方法启 动,该方法包括但不限于磷酸二酯键的酶促或化学水解。单链切割和 双链切割都可行,并且双链切割可以是两次不同的单链切割事件的结 果。DNA切割可导致产生钝端或交错末端。在某些实施方案中,将 融合多肽用于靶向双链DNA切割。
“切割半域”是能与第二多肽(两者同一或不同)连接形成具有切 割活性(优选双链切割活性)的复合物的多肽序列。术语“第一和第 二切割半域”;“+和-切割半域”和“右和左切割半域”可互换使用以指二 聚化的成对切割半域。
“工程化切割半域”是已经被修饰以便与另一切割半域(例如,另 一工程化切割半域)形成专性杂二聚体的切割半域。还参见,美国专 利号7,888,121;7,914,796;8,034,598;8,623,618和美国专利公开号 2011/0201055,这些专利在此通过引用整体并入。
术语“序列”是指任何长度的核苷酸序列,核苷酸序列可为DNA 或者RNA;可为直链,环状或支链的,以及可为单链或双链。术语“供 体序列”是指插入基因组中的核苷酸序列。供体序列可为任何长度, 例如在2和10,000个核苷酸长度之间(或者该范围间或超过该范围 的任何整数值),优选地在约100和1,000个核苷酸长度之间(或其 间的任何整数),更优选地在约200和500个核苷酸长度之间。
“染色质”是包含细胞基因组的核蛋白结构。细胞染色质包含核酸 和蛋白,核酸主要为DNA,蛋白包括组蛋白和非组蛋白染色体蛋白。 大部分真核细胞染色质以核小体形式存在,其中核小体核心包含与八 聚体关联的约150个碱基对的DNA,八聚体包含组蛋白H2A、H2B、 H3和H4各两份;以及在核小体核心之间延伸的接头DNA(长度根 据生物体而各有不同)。组蛋白H1分子通常与接头DNA关联。出于 本公开内容的目的,术语“染色质”意在涵盖所有类型的细胞核蛋白, 包括原核的与真核的。细胞染色质包括染色体和附加体的染色质。
“染色体”是包含细胞的全部或部分基因组的染色质复合物。细胞 的基因组通常以其核型为特征,该核型是包含细胞基因组的全部染色 体的集合。细胞的基因组可包含一个或多个染色体。
“附加体”是复制的核酸、核蛋白复合物或其它包含并非细胞染色 体核型部分的核酸的结构。附加体的实例包括质粒和某些病毒基因 组。
“可进入区”是细胞染色质中的位点,其中核酸中存在的靶位点可 被识别靶位点的外源分子结合。不希望受任何具体理论的限制,据信 可进入区是不包装在核小体结构中的区域。可进入区的不同结构往往 可通过其对化学和酶性探针如核酸酶的敏感度来检测。
“靶位点”或“靶序列”是限定结合分子将结合的核酸部分的核酸 序列,前提是存在结合的充分条件。例如,序列5’-GAATTC-3’是Eco RI限制性内切核酸酶的靶位点。
“安全港基因座”是基因组中可用于整合外源核酸的位置。将外源 核酸添加到这些安全港基因座中不会通过单独添加DNA而对宿主细 胞生长造成任何显著的影响。安全港基因的非限制性实例包括例如 CCR5基因、CXCR4基因、PPP1R12C(也被称为AAVS1)基因、白蛋白基因或者Rosa基因。参见例如,美国专利号7,951,925和 8,110,379;美国公开号201000218264;20100291048;20120017290; 20110265198;20130137104;20130122591;20130177983和 20130177960。
“外源”分子是通常不存在于细胞内的分子,但可通过一种或多种 遗传、生化或其它方法导入细胞。“通常存在于细胞内”是对于细胞的 具体发育阶段和环境条件而确定的。因此,例如,仅在肌肉的胚胎发 育期间存在的分子对于成体肌肉细胞是外源分子。类似地,通过热激 诱导的分子对于未热激细胞是外源分子。外源分子可包含例如功能失 常的内源分子的功能性形式或者正常功能的内源分子的功能失常形 式。
除了别的以外,外源分子可以是小分子或大分子等,小分子如由 组合化学方法所产生,大分子如蛋白质、核酸、碳水化合物、脂质、 糖蛋白、脂蛋白、多糖、上述分子的任何经修饰衍生物,或者是包含 一个或多个上述分子的任何复合物。核酸包括DNA和RNA,可以是单链或双链,可以是直链、支链或环状;且可以是任意长度。核酸包 括那些能形成双链体以及形成三链体的核酸。参见例如,美国专利号 5,176,996和5,422,251。蛋白质包括但不限于DNA结合蛋白、转录 因子、染色质重塑因子、甲基化DNA结合蛋白、聚合酶、甲基化酶、 去甲基化酶、乙酰基转移酶、脱乙酰基酶、激酶、磷酸酶、整合酶、 重组酶、连接酶、拓扑异构酶、促旋酶和解旋酶。
外源分子可以是与内源分子同一类型的分子,例如外源蛋白或核 酸。例如,外源核酸可包含感染性病毒基因组、导入细胞内的质粒或 附加体,或包含通常不存在于细胞内的染色体。本领域技术人员已知 将外源分子导入细胞内的方法,包括但不限于脂质介导的转移(即脂 质体,包括中性和阳离子脂质)、电穿孔、直接注射、细胞融合、粒 子轰击、磷酸钙共沉淀、DEAE-葡聚糖介导的转移和病毒载体介导的 转移。
相比之下,“内源”分子是通常存在于特定环境条件下特定发育阶 段的特定细胞中的分子。例如,内源核酸可包含染色体,线粒体、叶 绿体或其它细胞器的基因组,或天然存在的附加体核酸。其它内源分 子可包括蛋白质,例如转录因子和酶。
“融合”分子是其中两个或更多个亚单位分子相连(优选共价相 连)的分子。该亚单位分子可以是同一化学类型的分子,或可以是不 同化学类型的分子。第一类融合分子的实例包括但不限于融合蛋白 (例如,ZFP或者TALE DNA-结合域与切割域之间的融合体)和融合 核酸(例如,编码前述融合蛋白的核酸)。第二类融合分子的实例包 括但不限于:形成三链体的核酸与多肽之间的融合体,以及小沟结合 子与核酸之间的融合体。
细胞内融合蛋白的表达可由向细胞递送融合蛋白或通过向细胞 递送编码融合蛋白的多核苷酸引起,其中该多核苷酸被转录,且转录 物经翻译产生该融合蛋白。细胞内蛋白的表达中也可涉及反式剪接、 多肽切割和多肽连接。向细胞递送多核苷酸和多肽的方法在本公开内 容中另有描述。
出于本公开内容的目的,“基因”包括编码基因产物(见前文)的 DNA区域,以及调节基因产物生成的所有DNA区域,不论这类调节 序列是否毗邻编码和/或转录序列。因此,基因包括但未必限于:启 动子序列,终止子,翻译调节序列如核糖体结合位点和内部核糖体进 入位点、增强子、沉默子、隔离子、边界元件、复制起点、基质附着 位点和基因座控制区。
“基因表达”是指基因所含信息转化成基因产物。基因产物可以是 基因的直接转录产物(例如,mRNA、tRNA、rRNA、反义RNA、核 酶、结构RNA、或任何其它类型的RNA)或由mRNA翻译产生的蛋 白。基因产物还包括经过修饰的RNA和经过修饰的蛋白,RNA修饰 过程如加帽、聚腺苷酸化、甲基化和编辑,蛋白修饰过程如甲基化、 乙酰化、磷酸化、泛素化、ADP-核糖基化、十四烷基化和糖基化。
基因表达的“调整”指基因活性的改变。表达的调整可包括但不限 于基因激活和基因抑制。调整还可以是完全的,即其中基因表达被完 全钝化或者被激活到野生型水平或更高的水平;或者调节是部分的, 其中基因表达被部分地减少,或者被部分地激活到野生型水平的一部 分。
“真核”细胞包括但不限于真菌细胞(如酵母)、植物细胞、动物细 胞、哺乳动物细胞和人细胞(如T细胞)。
“受关注区域”是需要结合外源分子的细胞染色质的任意区域,例 如,基因,或者基因内的非编码序列,或与基因毗邻的非编码序列。 结合可以是用于靶向DNA切割和/或靶向重组的目的。例如,受关注 区域可存在于染色体、附加体、细胞器(例如,线粒体、叶绿体)基 因组或感染性病毒基因组。例如,受关注区域可以在基因的编码区内, 在转录的非编码区如前导序列、尾随序列或内含子内,或在编码区上 游或下游的非转录区内。受关注区域可以是小到单个核苷酸对长度或 大到2,000个核苷酸对长度,或任意整数值的核苷酸对长度。
当两个或多个组分(例如序列元件)并置,且该组分排列成组分 都可正常发挥作用并允许组分中至少一种能介导至少一种其它组分 发挥作用时,术语“操作性连接(operative linkage)”和“操作性相连 (operatively linked)”(或“操作性相连(operably linked)”)互换使用。例 如,若转录调节序列控制编码序列应答一种或多种转录调节因子存在 或缺失时的转录水平,则转录调节序列如启动子与编码序列操作性连接。转录调节序列通常与编码序列顺式操作性连接,但不需要与其直 接毗邻。例如,尽管并非毗连,但增强子仍是与编码序列操作性连接 的转录调节序列。
对于融合多肽,术语“操作性相连”可指各组分在与其它组分的连 接中所发挥的功能与其在未相连时的功能相同。例如,对于其中DNA 结合域(ZFP,TALE)与切割域(例如,核酸内切酶域诸如FokI, 大范围核酸酶域等)融合的融合多肽,若在融合多肽中DNA结合域部分能结合其靶位点和/或其结合位点,而切割(核酸酶)域能切割 靶位点附近的DNA,则DNA结合域与切割域操作性连接。核酸酶域 还可表现DNA结合能力(例如,融合到ZFP或者TALE域的核酸酶 还可结合到DNA)。类似地,对于其中DNA结合域与激活或者抑制 域融合的融合多肽,若在融合多肽中DNA结合域部分能结合其靶位 点和/或其结合位点,而激活域能上调基因表达或者抑制域能下调基 因表达,则DNA结合域与激活或者抑制域操作性连接。
蛋白、多肽或核酸的“功能性片段”是序列与全长蛋白、多肽或核 酸不同一但保留全长蛋白、多肽或核酸的相同功能的蛋白、多肽或核 酸。功能片段可具有比相应的天然分子更多、更少或相同数量的残基, 和/或可含有一个或多个氨基酸或核苷酸置换。确定核酸功能(例如, 编码功能、与另一核酸杂交的能力)的方法是本领域中熟知的。类似 地,确定蛋白质功能的方法也是熟知。例如,可确定多肽的DNA结 合功能,例如通过滤膜结合、电泳迁移率改变或免疫沉淀测定。DNA 切割可通过凝胶电泳测定。参见Ausubel等人,同上。可确定蛋白与 另一蛋白相互作用的能力,例如,通过免疫共沉淀、双杂交测定或互 补分析,既可以是遗传的也可以是生化的。参见例如,Fields等人, (1989)Nature,340:245-246;美国专利号5,585,245和PCT WO 98/44350。
“载体”能转移基因序列到靶细胞。通常,“载体构建体”、“表达 载体”、和“基因转移载体”指能指导受关注基因表达和能转移基因序 列到靶细胞的任何核酸构建体。因此,该术语包括克隆、和表达工具, 以及整合载体。
核酸酶
本文描述可用于钝化TCR基因的核酸酶(例如,ZFN或者TALE 核酸酶)。核酸酶可为天然存在的或者可为DNA结合域和切割域的 嵌合体。显而易见的是,在嵌合体中,组成的DNA结合域和切割域 可都为天然存在的,可都为非天然存在的,或者其中一个可为天然存在的而另一个可为非天然存在的。
因此,在本文公开的方法中可使用任何核酸酶。例如,天然存在 的归巢内切核酸酶和大范围核酸酶具有非常长的识别序列,在统计基 础上,这些识别序列的一些可能存在于人类大小的基因组中。示例性 归巢内切核酸酶包括I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、 I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII。它们的识别序列是已知的。还参见美国专利号5,420,032;美国专利 号6,833,252;Belfort等人(1997)Nucleic Acids Res.,25:3379–3388; Dujon等人(1989)Gene,82:115–118;Perler等人(1994)Nucleic Acids Res.,22:1125-1127;Jasin(1996)Trends Genet.,12:224–228;Gimble 等人(1996)J.Mol.Biol.,263:163–180;Argast等人(1998)J.Mol.Biol.,280:345–353,以及新英格兰生物实验室目录。
还已经报道了归巢内切核酸酶和大范围核酸酶的特异性可被工 程化以结合到非天然的靶位点。参见,例如Chevalier等人(2002)Molec. Cell,10:895-905;Epinat等人(2003)NucleicAcids Res.,31:2952-2962; Ashworth等人(2006)Nature,441:656-659;Paques等人(2007)Current Gene Therapy,7:49-66。可在作为整体的核酸酶环境中改变归巢内 切核酸酶和大范围核酸酶的DNA结合域(即,以使得核酸酶包含相 关切割域),或者DNA结合域可融合到异源DNA结合域(例如,锌 指蛋白或者TALE)或者异源切割域。来源于大范围核酸酶的DNA 结合域还可表现出DNA结合活性。
在某些实施方案中,核酸酶包含锌指DNA结合域和限制性内切 核酸酶域,核酸酶也被称为锌指核酸酶(ZFN)。
在其它实施方案中,核酸酶包括工程化TALE DNA-结合域和核 酸酶域(例如,内切核酸酶和/或大范围核酸酶域),核酸酶也被称为 TALEN。已经公开了用于工程化这些TALEN蛋白质以与使用者选择 的靶序列进行稳健的、位点特异性相互作用的方法和组合物(参见美 国专利号8,586,526)。在一些实施方案中,TALEN包含内切核酸酶 (例如,FokI)切割域或者切割半域。在其它实施方案中,TALE核 酸酶是兆TAL。这些兆TAL核酸酶是包含TALEDNA-结合域和大范 围核酸酶切割域的融合蛋白。大范围核酸酶切割域作为单体具有活性的,并且不需要二聚化来获得活性。(参见Boissel等人,(2013)Nucl Acid Res:1-13,doi:10.1093/nar/gkt1224)。此外,核酸酶域还可表 现出DNA结合功能。
在其它实施方案中,核酸酶包括紧密的TALEN(cTALEN)。这些 TALEN是将TALEDNA-结合域连接到TevI核酸酶域的单链融合蛋 白。融合蛋白可用作被TALE区域局限的切割酶,或者可造成双链断 裂,取决于TALE DNA-结合域相对于TevI核酸酶域的位置(参见Beurdeley等人(2013)Nat Comm:1-8DOI:10.1038/ncomms2782)。 任何TALEN可与另外的TALEN(例如,具有一个或多个兆TAL的 一个或多个TALEN(cTALEN或者FokI-TALEN))结合使用。
因此,任何具有唯一靶位点的天然存在或者工程化的核酸酶可用 于本文描述的方法。
A.DNA结合域
本文描述的核酸酶通常包含DNA结合域和切割域。本发明实践 可用任何DNA结合域,包括但不限于锌指DNA结合域、TALE DNA- 结合域,或者来自大范围核酸酶的DNA结合域。
在某些实施方案中,采用工程化以用于结合到所选择的序列的锌 指结合域。参见,例如,Beerli等人(2002)Nature Biotechnol.,20: 135-141;Pabo等人(2001)Ann.Rev.Biochem.,70:313-340;Isalan 等人(2001)Nature Biotechnol.,19:656-660;Segal等人(2001)Curr. Opin.Biotechnol.,12:632-637;Choo等人(2000)Curr.Opin.Struct. Biol.,10:411-416。类似地,TALE DNA-结合域可工程化以用于结 合到所选择的序列。参见,例如8,586,526。与天然存在的锌指或者 TALE蛋白相比,工程化的锌指或者TALE DNA-结合域可具有新的 结合特异性。工程化方法包括但不限于合理设计与各种选择类型。合 理设计包括例如使用包含三体(或四体)核苷酸序列和个别锌指氨基 酸序列的数据库,其中各三体或四体核苷酸序列与一种或多种结合该 特定三体或四体序列的锌指氨基酸序列相关联。参见,例如共同拥有 的的美国专利8,586,526;6,453,242和6,534,261,在此通过引入整体 并入。
示例性选择方法包括噬菌体展示和双杂交系统,公开于美国专利 5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466; 6,200,759和6,242,568;以及WO98/37186;WO 98/53057;WO 00/27878;WO 01/88197和GB 2,338,237。锌指结合域结合特异性的 增强已经在例如共同拥有的WO 02/077227中有所描述。
在其它实施方案中,DNA结合域包括TALE DNA-结合域(参见, 共同拥有的美国专利号8,586,526,在此通过引入整体并入)。TALE DNA-结合域包含一个或多个TALE“重复单元”。单一“重复单元”(也 被称为重复)通常是33-35个氨基酸长度,其中结合到DNA核苷酸涉及"重复单元"中的12位和/或13位(被称为高变双残基区或者 “RVD”)。“非典型”RVD是在自然界中罕见存在或者从不存在的RVD 序列(12位和13位),例如在天然存在的TALE蛋白中小于5%,优 选地在天然存在的TALE蛋白中小于2%,以及甚至更优选地在天然 存在的TALE蛋白中小于1%。非典型的RVD可为非天然存在的。 TALE DNA-结合域优选地包含C-帽序列和任选地N-帽序列。“帽”序 列优选地是在全长TALE蛋白中存在的多肽的片段(截断),例如对 天然存在的TALE蛋白中侧接TALE重复域的C端区域和/或N端区 域的任何截断。C-帽可为例如相较于野生型C端TALE蛋白(野生型 C端TALE蛋白编号为起始于C-20)的截断,该截断包括但不限于, C-19、C-18、C-17、C-16、C-15、C-14、C-13、C-12、C-11、C-10、 C-9、C-8、C-7、C-6、C-5、C-4、C-3、C-2、C-1,递增到C+1,以 及然后递增到C+2、C+3等,朝向多肽(例如,C+63,多肽从C-20 延伸到C+63,为83个氨基酸长度)的C端。
此外,如在这些和其它参考文献中所公开的,锌指域和/或多指 锌指蛋白或者TALE可使用任何合适的接头序列连接在一起,包括例 如长度为5个或更多个氨基酸的接头。还参见美国专利号6,479,626; 6,903,185;以及7,153,949来了解长度为6个或更多个氨基酸的示例 性接头序列。本文所述的蛋白可包括该蛋白的个别锌指之间的合适接 头的任意组合。此外,锌指结合域结合特异性的增强已经在例如美国 专利号6,794,136中有所描述。
靶位点的选择;ZFP或者TALE,以及融合蛋白(和编码融合蛋 白的多核苷酸)的设计与构建方法是本领域中的技术人员已知的并且 在美国专利号6,140,081;5,789,538;6,453,242;6,534,261;5,925,523; 6,007,988;6,013,453;6,200,759;WO 95/19431;WO 96/06166;WO 98/53057;WO 98/54311;WO 00/27878;WO 01/60970;WO 01/88197; WO 02/099084;WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536和WO 03/016496中详细描述,这些专利的公开内容通过 引用整体并入用于所有目的。
此外,如在这些和其它参考文献中所公开的,锌指域和/或多指 锌指蛋白可使用任何合适的接头序列连接在一起,包括例如长度为5 个或更多个氨基酸的接头。还参见美国专利号6,479,626;6,903,185; 以及7,153,949来了解长度为6个或更多个氨基酸的示例性接头序列。 本文所述的蛋白可包括该蛋白的个别锌指之间的合适接头的任何组 合。
或者,DNA结合域可衍生于核酸酶。例如,已知归巢内切核酸 酶和大范围核酸酶的识别序列如I-SceI、I-CeuI、PI-PspI、PI-Sce、 I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、 I-TevII和I-TevIII。还参见美国专利号5,420,032;美国专利号 6,833,252;Belfort等人(1997)Nucleic Acids Res.,25:3379-3388;Dujon 等人(1989)Gene,82:115-118;Perler等人(1994)Nucleic Acids Res., 22:1125-1127;Jasin(1996)Trends Genet.,12:224-228;Gimble等 人(1996)J.Mol.Biol.,263:163-180;Argastet等人(1998)J.Mol.Biol., 280:345-353,以及新英格兰生物实验室目录。此外,可将归巢内切 核酸酶和大范围核酸酶的DNA结合特异性经工程化以结合到非天然 的靶位点。参见,例如Chevalier等人(2002)Molec.Cell,10:895-905; Epinat等人(2003)NucleicAcids Res.,31:2952-2962;Ashworth等人 (2006)Nature,441:656-659;等人(2007)Current Gene Therapy,7:49-66;美国专利公开号20070117128。
在某些实施方案中,DNA结合域是工程化锌指蛋白,锌指蛋白 通常包含至少一个锌指,但是也可包含多个锌指(例如,2、3、4、5、 6个或更多个锌指)。ZFP经常包含至少三个锌指。某些ZFP包含四 个、五个或者六个锌指。包含三个锌指的ZFP通常识别包含9个或 者10个核苷酸的靶位点;包含四个锌指的ZFP通常识别包含12个 或者14个核苷酸的靶位点;而具有六个锌指的ZFP能够识别包含18 个到21个核苷酸的靶位点。ZFP还可为包含一个或多个调节域的融 合蛋白,其中这些调节域可为转录激活域或者转录抑制域。
在其它实施方案中,DNA结合域包括天然存在的或者经工程化 的(非天然存在的)TAL效应DNA结合域。参见,例如美国专利号 8,586,526,在此通过引用整体并入。已知黄单胞菌属(genus Xanthomonas)的植物病原菌在重要农作物中导致很多疾病。黄单胞菌 属的病原性取决于保守的III型分泌(T3S)系统,该系统向植物细胞 内注入超过25种不同的效应蛋白。这些注入的蛋白中,有模拟植物 转录激活物并操纵植物转录组的转录激活样效应(TALE)(参见Kay 等人(2007)Science,318:648-651和美国专利公开号20110239315)。 这些蛋白含有DNA结合域和转录激活域。最为充分表征的TALE之 一是来自野油菜黄单胞菌辣椒斑点病致病变种(Xanthomonas campestgris pv.Vesicatoria)的AvrBs3(参见Bonas等人(1989)Mol Gen Genet,218:127-136和WO2010079430)。TALE含有串联重复的集 中化域,每一重复含有约34个氨基酸,它们是这些蛋白的DNA结 合特异性的关键。此外,它们含有核定位序列和酸性转录激活域(综 述参见Schornack S等人(2006)J Plant Physiol,163(3):256-272)。此 外,在致植物病细菌烟草青枯菌(Ralstonia solanacearum)中,已发现烟草青枯菌生物变型(biovar)1菌株GMI1000和生物变型4菌株 RS1000中称为brg11和hpxl7的两个基因与黄单胞菌属(Xanthomonas) 的AvrBs3家族同源(参见Heuer等人(2007)Appl and Envir Micro, 73(13):4379-4384)。这些基因在核苷酸序列方面彼此98.9%同一, 但区别为hpxl7重复域中的1,575bp缺失。但是,两种基因产物与黄 单胞菌属的AvrBs3家族蛋白的序列同一性都低于40%。本文描述的 锌指核酸酶结合在TCR基因中。表5和表6(参见实施例4)描述了 已经工程化而结合到人类TCR基因中的核苷酸序列的大量锌指结合域。每一行描述了单独的锌指DNA结合域。在第一列中示出了每一 域的DNA靶序列(DNA靶位点以大写字母指示;未接触的核苷酸以 小写字母指示),以及第二到第五列示出该蛋白中每一锌指(F1到F4 或者F5或者F6)的识别区域的氨基酸序列(根据螺旋的起点,氨基 酸-1到+6)。在第一列中还提供了每一蛋白的标识号。
还描述结合到TCR基因中的TALEN。表14(参见实施例10) 描述了已经工程化而结合到人类TCR基因中的核苷酸序列的 TALEN。每一行描述具有包含RVD的域的标识号的单独的TALE DNA-结合蛋白。在第一列中示出每一域的DNA靶序列(DNA靶位 点以大写字母指示;未接触的核苷酸以小写字母指示)。在第一列中 还提供每一蛋白的标识号。
如下所述,在某些实施方案中,如表5和表6中所示的四指或五 指结合域,或者如表14中所示的TALE DNA-结合域被融合到切割半 域,诸如例如IIs型限制性内切核酸酶(诸如FokI)的切割域。一对 此类锌指或者TALE/核酸酶半域融合被用于靶向切割,如例如在美国 专利号8,586,526和美国公开号20050064474中所公开的。
对于靶向切割,结合位点的近边可以通过5个或更多核苷酸对来 分开,并且每一融合蛋白质可结合至DNA靶标的相反链。
此外,来自这些天然存在的或者工程化核酸酶的域还可被分离并 且以不同组合使用。例如,来自天然存在的或者工程化归巢内切核酸 酶或者大范围核酸酶的DNA结合域可融合到异源切割域或者半域 (例如,来自另一种归巢内切核酸酶、大范围核酸酶或者TypeIIS内 切核酸酶)。这些融合蛋白还可与如上所述的锌指核酸酶结合使用。
本文描述的核酸酶可靶向到任何TCR基因组序列中的任何序 列。
B.切割域
核酸酶可包含异源DNA结合和切割域(例如,锌指核酸酶; TALEN、大范围核酸酶DNA结合域和异源切割域),或者可选地天 然存在的核酸酶的DNA结合域可被改变而结合到所选定的靶位点 (例如,大范围核酸酶已经被工程化而结合到与同源结合位点不同的 位点的)。在某些实施方案中,核酸酶是大范围核酸酶(归巢内切核 酸酶)。天然存在的大范围核酸酶识别15-40碱基对的切割位点并且 通常分为四个家族:LAGLIDADG家族、GIY-YIG家族、His-Cyst 盒家族与HNH家族。示例性归巢内切核酸酶包括I-SceI、I-CeuI、 PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、 I-CreI、I-TevI、I-TevII和I-TevIII。它们的识别序列是已知的。还参见 美国专利号5,420,032;美国专利号6,833,252;Belfort等人(1997) Nucleic Acids Res.,25:3379-3388;Dujon等人(1989)Gene,82:115-118;Perler等人(1994)Nucleic Acids Res.,22:1125-1127; Jasin(1996)TrendsGenet.,12:224-228;Gimble等人(1996)J.Mol. Biol.,263:163-180;Argastet等人(1998)J.Mol.Biol.,280:345-353, 以及新英格兰生物实验室目录。
来自天然存在的大范围核酸酶的DNA结合域,主要是来自 LAGLIDADG家族的DNA结合域,已在植物、酵母、果蝇、哺乳动 物细胞和小鼠中用于促进位点特异基因组修饰,但该方法局限于修饰 保留大范围核酸酶识别序列的同源基因(Monet等人(1999),Biochem.Biophysics.Res.Common.,255:88-93)或已经导入识别序列预先工 程化的基因组(Route等人(1994),Mol.Cell.Biol.,14:8096-106; Chilton等人(2003),Plant Physiology.,133:956-65;Puchta等人(1996), Proc.Natl.Acad.Sci.USA,93:5055-60;Rong等人(2002),Genes Dev., 16:1568-81;Gouble等人(2006),J.Gene Med.,8(5):616-622)。因此,已尝试工程化大范围核酸酶使其在医学或生物技术相关位点呈现 新型结合特异性(Porteus等人(2005),Nat.Biotechnol.,23:967-73; Sussman等人(2004),J.Mol.Biol.,342:31-41;Epinat等人(2003), Nucleic Acids Res.,31:2952-62;Chevalier等人(2002)Molec.Cell, 10:895-905;Ashworth等人(2006)Nature,441:656-659;等人(2007)Current Gene Therapy,7:49-66;美国专利公开号 20070117128;20060206949;20060153826;20060078552;和 20040002092)。此外,天然存在或工程化来自大范围核酸酶的DNA 结合域也已和来自异源核酸酶(例如,FokI)的切割域操作性连接。
在其它实施方案中,核酸酶是锌指核酸酶(ZFN)。ZFN包含已 经经工程化而结合到所选基因中的靶位点的锌指蛋白,以及切割域或 者切割半域。
如上所述,锌指结合域可经工程化而结合到所选择的序列。参见 例如,Beerli等人(2002)Nature Biotechnol.,20:135-141;Pabo等 人(2001)Ann.Rev.Biochem.,70:313-340;Isalan等人(2001)Nature Biotechnol.,19:656-660;Segal等人(2001)Curr.Opin.Biotechnol., 12:632-637;Choo等人(2000)Curr.Opin.Struct.Biol.,10:411-416。 相较于天然存在的锌指蛋白,工程化锌指结合域可具有新型的结合特 异性。工程化方法包括但不限于合理设计与各种选择类型。合理设计 包括例如利用包含三体(或四体)核苷酸序列和个别锌指氨基酸序列 的数据库,其中各三体或四体核苷酸序列与一种或多种结合该特定三 体或四体序列的锌指氨基酸序列相关联。参见,例如美国专利 6,453,242和6,534,261,在此通过引用整体并入。
示例性选择方法包括噬菌体展示和双杂交系统,公开于美国专利 5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466; 6,200,759和6,242,568;以及WO98/37186;WO 98/53057;WO 00/27878;WO 01/88197和GB 2,338,237。此外,锌指结合域结合特 异性的增强已经在例如美国专利号6,794,136中有所描述。
靶位点的选择;ZFN,以及融合蛋白(和编码融合蛋白的多核苷 酸)的设计与构建方法是本领域中的技术人员已知的并且在美国专利 号7,888,121和8,409,861中详细描述,在此通过引用整体并入。
此外,如在这些和其它参考文献中所公开的,锌指域和/或多指 锌指蛋白可使用任何合适的接头序列连接在一起,包括例如长度为5 个或更多个氨基酸的接头。例如参见美国专利号6,479,626;6,903,185; 以及7,153,949来了解长度为6个或更多个氨基酸的示例性接头序列。 本文所述的蛋白可包括该蛋白的个别锌指之间的合适接头的任何组 合。
在一些实施方案中,核酸酶是工程化TALEN。已经公开用于工 程化这些蛋白质以与使用者选择的靶序列进行稳健的、位点特异性相 互作用的方法和组合物(参见美国专利号8,586,526)。
核酸酶如ZFN、TALEN和/或大范围核酸酶还包含核酸酶(切割 域,切割半域)。如上所述,切割域可以与DNA结合域是异源的, 例如锌指或者TALE DNA-结合域和来自核酸酶的切割域或大范围核 酸酶DNA结合域,以及来自另一不同的核酸酶的切割域。异源切割 域可获自任何内切核酸酶或外切核酸酶。可衍生出切割域的示例性内 切核酸酶,包括但不限于限制性内切核酸酶和归巢内切核酸酶。参见 例如,马萨诸塞州贝弗利(Beverly,MA)的NEB公司的2002-2003产 品目录;和Belfort等人(1997)Nucleic Acids Res.,25:3379-3388。已 知切割DNA的其它酶(例如,S1核酸酶;绿豆核酸酶;胰DNA酶 I;微球菌核酸酶;酵母HO内切核酸酶;还参见Linn等人编,Nucleases, Cold Spring Harbor Laboratory Press,1993)。可将这些酶的一种或多种 (或其功能性片段)用作切割域和切割半域的来源。
类似地,需要二聚化才具有切割活性的切割半域可衍生自任何核 酸酶或其部分,如上所述。一般说来,如果融合蛋白包含切割半域, 则切割需要两个融合蛋白。或者,可使用包含两个切割半域的单个蛋 白。这两个切割半域可衍生于相同内切核酸酶(或其功能性片段), 或各切割半域可衍生自不同的内切核酸酶(或其功能性片段)。此外, 优选地将两种融合蛋白的靶位点相对彼此排列,从而这两种融合蛋白 与其各自相应的靶位点的结合将切割半域放置为能使切割半域形成 功能性切割域(例如,通过二聚化)的彼此空间定位。因此,在某些 实施方案中,这些靶位点的近边是用5-8个核苷酸或者用15-18个核 苷酸分离的。然而,两个靶位点间可间插有任何整数数量的核苷酸或 核苷酸对(例如,2至50个核苷酸对或更多)。一般说来,切割位点 位于靶位点之间。
可将一种或多种这些酶(或其功能性片段)用作切割域和切割半 域的来源。类似地,需要二聚化才具有切割活性的切割半域可衍生自 任何核酸酶或其部分,如上所述。一般说来,如果融合蛋白包含切割 半域,则切割需要两个融合蛋白。或者,可使用包含两个切割半域的 单个蛋白。这两个切割半域可衍生自相同内切核酸酶(或其功能性片 段),或各切割半域可衍生自不同的内切核酸酶(或其功能性片段)。 此外,优选地将两种融合蛋白的靶位点相对彼此排列,从而这两种融 合蛋白与其各自相应的靶位点的结合将切割半域放置为能使切割半 域形成功能性切割域(例如,通过二聚化)的彼此空间定位。因此, 在某些实施方案中,这些靶位点的近边是用5-8个核苷酸或者用15-18 个核苷酸分离的。然而,两个靶位点间可间插有任何整数数量的核苷 酸或核苷酸对(例如,2至50个核苷酸对或更多)。一般说来,切割 位点位于靶位点之间。
限制性内切核酸酶(限制性酶)存在于许多物种,并且能够序列 特异性结合DNA(在识别位点处),并在结合位点处或其附近切割 DNA。某些限制性酶(例如,IIS型)在从远离识别位点的位点处切 割DNA并且具有可分离的结合与切割域。例如,IIS型酶FokI催化DNA的双链切割,在一条链上距其识别位点9个核苷酸处切割,而 在另一条链上距其识别位点13个核苷酸处切割。参见例如,美国专 利5,356,802;5,436,150和5,487,994;以及Li等人(1992)Proc.Natl. Acad.Sci.USA,89:4275-4279;Li等人(1993)Proc.Natl.Acad.Sci.USA,90:2764-2768;Kim等人(1994a)Proc.Natl.Acad.Sci.USA, 91:883-887;Kim等人(1994b)J.Biol.Chem.,269:31,978-31,982。 因此,在一个实施方案中,融合蛋白包含来自至少一种IIS型限制性 酶的切割域(或切割半域)和一个或多个经或未经工程化的锌指结合 域。
FokI是示例性IIS型限制性酶,其切割域可与结合域分离。该特 定的酶为二聚体时有活性。Bitinaite等人(1998)Proc.Natl.Acad.Sci. USA,95:10,570-10,575。因此,出于本发明内容的目的,所公开的 融合蛋白中所用的FokI酶的部分被视为切割半域。因此,对于使用 锌指-FokI融合体的靶向双链切割和/或靶向细胞序列置换,可使用各 自包含某FokI切割半域的两种融合蛋白来重建催化活性的切割域。 或者,也可使用含有锌指结合域和两个FokI切割半域的单一多肽分 子。使用锌指-FokI融合体进行靶向切割和靶向序列改变的参数在本 发明内容中另行提供。
切割域或切割半域可以是保留切割活性或保留多聚化(例如,二 聚化)能力以形成功能性切割域的蛋白的任何部分。
示例性IIS型限制性酶在美国专利公开号20070134796中有所描 述,在此通过引用整体并入。其它的限制性酶还含有可分离的结合与 切割域,并且这些酶在本公开内容中也有所设想。参见例如,Roberts 等人(2003)Nucleic Acids Res.,31:418-420。
在某些实施方案中,切割域包含一个或多个工程化切割半域(也 称作二聚化域突变体),其将同源二聚作用降至最小或阻止同源二聚 作用,例如,如美国专利号7,888,121;8,409,861;以及美国专利公 开号20080131962中所描述,所有该专利的公开内容在此通过引用整 体并入。在FokI的446、447、479、483、484、486、487、490、491、 496、498、499、500、531、534、537和538位的氨基酸残基都是影 响FokI切割半域二聚化的靶标。
形成专性杂二聚体的示例性工程化FokI切割半域包括以下一对: 第一切割半域包括FokI的490和538位氨基酸残基处的突变,和第 二切割半域包括486和499氨基酸残基处的突变。
因此,在某些实施方案中,490位的突变将Glu(E)替换为Lys(K); 538位的突变将Iso(I)替换为Lys(K);486位的突变将Gln(Q)替换为 Glu(E);而499位的突变将Iso(I)替换为Lys(K)。具体地,制备本文 所述工程化切割半域是通过在一个切割半域的490位突变(E→K)和 538位突变(I→K)来产生名为“E490K:I538K”的工程化切割半域, 并通过另一切割半域的486位突变(Q→E)和499位突变(I→L)来产生 名为“Q486E:I499L”的工程化切割半域。本文所述的工程化切割半 域是专性杂二聚体突变体,其异常切割降至最低或被消除。参见例如 美国专利号7,888,121,其公开内容通过引用整体并入用于所有目的。
本文所述的工程化切割半域是使用任何合适的方法制备的,例如 如美国专利号7,888,121中所描述的通过野生型切割半域(Fok I)的 定点突变。
本文所述的工程化切割半域可为专性杂二聚体突变体,其异常切 割降至最低或被消除。参见例如,WO 07/139898的实施例1。在某 些实施方案中,工程化切割半域包含在486、499和496位(根据野 生型FokI编号)的突变,比如以下突变:将野生型486位的Gln(Q)残基替换为Glu(E)残基,野生型499位的Iso(I)残基替换为Leu(L)残 基,以及野生型496位的Asn(N)残基替换为Asp(D)或Glu(E)残基 (还分别称作“ELD”和“ELE”域)。在其它实施方案中,工程化切割半 域包括在490、538和537位(根据野生型FokI编号)的突变,比如以 下突变:将野生型490位的Glu(E)残基替换为Lys(K)残基,野生型 538位的Iso(I)残基替换为Lys(K)残基,以及野生型537位的His(H) 残基替换为Lys(K)或Arg(R)残基(还分别称作“KKK”和“KKR”域)。 在其它实施方案中,工程化切割半域包括在490和537位(根据野生 型FokI编号)的突变,比如以下突变:将野生型490位的Glu(E)残 基替换为Lys(K)残基,野生型537位的His(H)残基替换为Lys(K) 或Arg(R)残基(还分别称作“KIK”和“KIR”域)。本文所述的工程化切 割半域可用任何合适的方法制备,例如通过如美国专利号7,888,121; 和美国专利公开号20080131962;以及20110201055所描述的定点诱 变野生型切割半域(FokI)来制备。
或者,核酸酶可使用所谓的“分裂酶(split-enzyme)”的技术(参 见例如,美国专利公开号20090068164)在核酸靶位点处体内组装。 这类分裂酶的组分可在单独的表达构建体上表达,或者可以连接于个 别的组分相互分开的某一开放读框中,例如,组分由自切割2A肽或 IRES序列分开。组分可以是个别的锌指结合域或大范围核酸酶核酸 结合域的域。
或者,可使用被称为“Sharkey”的FokI核酸酶域变体(参见Guo 等人,(2010)J.Mol.Biol.doi:10.1016/j.jmb.2010.04.060)。
可使用本领域已知的方法容易地设计核酸酶表达构建体。参见例 如,美国专利号7,888,121和8,409,861,以及美国专利公开号 20030232410;20050208489;20050026157;20060063231;和 20070134796。在某些实施方案中,核酸酶的表达可以在可诱导的启 动子的控制下,例如,半乳糖激酶启动子在棉子糖和/或半乳糖的存 在下被活化(解除抑制)而在葡萄糖存在下被抑制。特别地,半乳糖 激酶启动子在碳源连续改变时(例如,从葡萄糖到棉子糖到半乳糖) 被诱导并且表达核酸酶。可诱导启动子的其它非限制性实例包括 CUP1、MET15、PHO5,以及tet反应启动子。
CRISPR(成簇规律间隔短回文重复序列/Cas(CRISPR关联的) 核酸酶系统是近来基于可用于基因组工程学的细菌系统的工程化核 酸酶系统。核酸酶系统是基于许多细菌和古生菌(archea)的部分适应 性免疫反应。当病毒或者质粒侵入细菌时,侵入物的DNA片段通过 ‘免疫反应’而转变为CRISPR RNA(crRNA)。此crRNA然后经由部分 互补的区域而与另一类型的RNA(被称为tracrRNA)关联,从而将 Cas9核酸酶导向靶DNA(被称为“前间区序列(protospacer)”)中与 crRNA同源的区域。Cas9切割DNA以在由crRNA转录本中含有的 20个核苷酸的导向序列规定的位点处双链断裂(DSB)产生平端。Cas9 需要crRNA和tracrRNA两者以用于位点特异性DNA识别和切割。 此系统现已经工程化,而使得crRNA和tracrRNA可结合成一个分子 (“单导向RNA”),以及单导向RNA的crRNA等效部分可经工程化 以导向Cas9核酸酶来靶向任何所需的序列(参见Jinek等人(2012) Science,337:第816-821页;Jinek等人(2013),eLife,2:e00471; 以及David Segal(2013)eLife,2:e00563)。因此,CRISPR/Cas系统 可经工程化以在基因组中所需的靶标处引起DSB,以及DSB的修复 可受到修复抑制剂使用的影响而导致错误倾向修复增强。
A.靶位点
如上文详细描述的,ZFN和TALEN中的DNA域可经工程化而 结合到基因座中任何所选的序列。相较于天然存在的DNA结合域, 工程化DNA结合域可具有新型的结合特异性。工程化方法包括但不 限于合理设计与各种选择类型。合理设计包括例如利用包含三体(或四体)核苷酸序列和个别(例如,锌指)氨基酸序列的数据库,其中 各三体或四体核苷酸序列与结合该特定三体或四体序列的DNA结合 域的一种或多种氨基酸序列相关联。参见,例如美国专利8,586,526; 6,453,242和6,534,261,在此通过引用整体并入。还可进行TAL效应 域的合理设计。参见,例如美国专利号8,586,526。
适用于DNA结合域的示例性选择方法包括噬菌体展示和双杂交 系统,公开于美国专利5,789,538;5,925,523;6,007,988;6,013,453; 6,410,248;6,140,466;6,200,759和6,242,568;以及WO 98/37186; WO 98/53057;WO 00/27878;和WO 01/88197。
靶位点的选择;核酸酶,以及融合蛋白(和编码融合蛋白的多核 苷酸)的设计与构建方法是本领域中的技术人员已知的并且在美国专 利号7,888,121和8,409,861中详细描述,在此通过引用整体并入。
此外,如在这些和其它参考文献中所公开的,DNA结合域(例 如,多指锌指蛋白)可使用任何合适的接头序列连接在一起,包括例 如长度为5个或更多个氨基酸的接头。例如参见美国专利号 6,479,626;6,903,185;以及7,153,949来了解长度为6个或更多个氨 基酸的示例性接头序列。本文所述的蛋白可包括该蛋白的个别DNA 结合域之间的合适接头的任何组合。还参见,美国专利号8,586,526。
另外,单导向RNA可通过本领域熟知的用于产生特异RNA序 列的方法经工程化以结合到基因组中所选择的靶标。这些单导向 RNA被设计成将Cas9导向到任何选定的靶位点。
供体
如上所述,还可进行外源序列(也被称为“供体序列”或“供体”) 的插入,以例如用于校正突变基因或者用于增加野生型基因的表达。 将容易显而易见的是供体序列通常与其所位于的基因组序列并非同 一的。供体序列可包含侧接于两个同源区域的非同源序列,以允许在 受关注位置处进行有效HDR。另外,供体序列可包含含有与细胞染 色质中受关注区域并非同源的序列的载体分子。供体分子可包含若干 与细胞染色质同源的不连续区域。例如,对于通常在受关注区域中不 存在的序列的靶向插入,序列可存在于供体核酸分子中并且侧接于受 关注区域中的序列同源的多个区域。或者,供体分子可通过非同源的 端连接(NHEJ)机制而被整合到经切割的靶基因座中。参见例如,美国 专利公开号20110207221和20130326645。
供体多核苷酸可为DNA或者RNA,单链或者双链,以及可被以 直链或环状形式导入细胞中。参见例如,美国专利公开号 20100047805;20110281361;以及20110207221。如果以直链形式导 入,则可通过本领域中的技术人员已知的方法来保护供体序列的末端 (例如,防止被外切核酸降解)。例如,可将一个或多个双脱氧核苷 酸残基添加到直链分子的3’端和/或将自补的低聚核苷酸连接到一个 或者两个末端。参见例如,Chang等人(1987)Proc.Natl.Acad.Sci. USA,84:4959-4963;Nehls等人(1996)Science,272:886-889。用 于保护外源多核苷酸不被降解的其它方法包括但不限于添加端氨基, 以及使用经修饰的核苷酸间连接,如例如硫代磷酸、氨基磷酸酯和邻 甲基核糖或者脱氧核糖残基。
可将多核苷酸作为具有附加序列的载体分子的组成部分而导入 细胞中,附加序列为如例如复制起点、启动子和编码抗生素抗性的基 因。而且,供体多核苷酸可作为裸核酸导入,作为与药剂如脂质体或 者泊洛沙姆复合的核酸导入,或者可用病毒(例如,腺病毒、AAV、 疱疹病毒、逆转录病毒、慢病毒,以及整合酶缺陷的慢病毒(IDLV)) 递送。
一般插入供体以使得在整合位点处由内源启动子驱动供体的表 达,即供体插入到驱动内源基因表达的启动子(例如,AAVS1、CCR5、 白蛋白、HPRT等)。然而,将显而易见的是,供体可包含启动子和/ 或增强子,例如组成型启动子或者可诱导的启动子或者组织特异性启 动子。
可将供体分子插入内源基因中,以使得所有、一些或者没有内源 基因被表达。例如,可将如本文所述的转基因插入内源基因座,以使 得一些(连接到转基因的N端和/或C端)或者没有内源序列例如作 为与转基因的融合体而被表达。在其它实施方案中,将转基因(例如, 有或者没有如编码内源基因的附加编码序列)整合到任何内源基因座 例如安全港基因座中。
当内源序列(内源的转基因或者作为转基因的组成部分)与转基 因一起表达时,内源序列可为全长序列(野生型或者突变型)或者部 分序列。优选地内源序列是功能性的。这些全长或者部分序列的功能 的非限制性实例包括用转基因(例如,治疗基因)表达的多肽的血清 半衰期延长和/或充当载体。
另外,虽然不要求表达,但是外源序列也可包含转录或者翻译调 节序列,例如启动子、增强子、隔离子、内部核糖体进入位点、编码 2A肽和/或多腺苷酸化信号的序列。
递送
可用任何合适的手段将本文描述的组合物(例如,ZFP、TALE、 CRISPR/Cas)、编码组合物的多核苷酸、任何供体多核苷酸递送到包 含TCR基因的靶细胞中。用于递送包含DNA结合域的组合物的方法 在例如美国专利号6,453,242;6,503,717;6,534,261;6,599,692;6,607,882;6,689,558;6,824,978;6,933,113;6,979,539;7,013,219; 以及7,163,824中有所描述,这些公开内容在此通过引用整体并入。
还可使用包含编码锌指、TALE或者CRISPR/Cas蛋白中的一种 或多种的序列的载体来递送如本文所描述的锌指、TALE或者 CRISPR/Cas蛋白。也可类似地递送编码供体的多核苷酸。可使用任 意载体系统,包括但不限于质粒载体、逆转录病毒载体、慢病毒载体、 腺病毒载体、痘病毒载体;疱疹病毒载体以及腺相关病毒载体等。还 参见美国专利号6,534,261;6,607,882;6,824,978;6,933,113;6,979,539; 7,013,219;和7,163,824,在此通过引用整体并入。另外,将显而易 见的是,这些载体中的任一个可包含一种或多种锌指蛋白编码序列、 一种或多种CRISPR/Cas编码序列或者一种或多种TALE编码序列。 因此,当将一种或多种核酸酶或者核酸酶系统和/或供体导入细胞时, 核酸酶或者核酸酶系统和/或供体可在相同载体上携带或者在不同载 体上携带。当使用多个载体时,每一载体可包含编码一种或多种ZFP、 TALE、CRISPR/Cas系统和/或供体的序列。
可以使用传统的基于病毒和非病毒的基因转移方法来将编码工 程化ZFP、TALE、CRISPR/Cas和/或供体的核酸导入细胞(例如, 哺乳动物细胞)和靶组织中。此类方法还可用来体外施用编码ZFP、 TALE、CRISPR/Cas和/或供体的核酸于细胞中。在某些实施方案中,编码ZFP、TALE、CRISPR/Cas和/或供体的核酸可以施用于体内或 离体基因治疗用途。非病毒载体递送系统包括DNA质粒、裸核酸, 以及与递送工具(诸如,脂质体或者泊洛沙姆)复合的核酸。病毒载 体递送系统包括DNA病毒和RNA病毒,这两种病毒在递送到细胞 后具有附加体或整合的基因组。关于基因治疗方法的概述参见 Anderson,Science,256:808-813(1992);Nabel&Felgner,TIBTECH, 11:211-217(1993);Mitani&Caskey,TIBTECH,11:162-166(1993); Dillon,TIBTECH,11:167-175(1993);Miller,Nature,357: 455-460(1992);Van Brunt,Biotechnology,6(10):1149-1154(1988); Vigne,Restorative Neurologyand Neuroscience,8:35-36(1995);Kremer &Perricaudet,British Medical Bulletin,51(1):31-44(1995);Haddada 等人,in Current Topics in Microbiology andImmunology,Doerfler和 编(1995);以及Yu等人,Gene Therapy,1:13-26(1994)。
核酸的非病毒递送方法包括电穿孔、脂转染、微注射、基因枪、 病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸共轭物、裸 DNA、mRNA、人工病毒颗粒以及介质增强DNA摄取。使用例如 Sonitron2000系统(Rich-Mar)的声孔效应也可以用于核酸递送。在优 选实施方案中,一种或多种核酸是作为mRNA递送的。使用加帽的 mRNA来增加翻译效率和/或mRNA稳定性也是优选的。ARCA(抗- 反向帽类似物)帽或者其变体是尤其优选的。参见美国专利US7074596和US8153773,该专利在此以引用方式并入。
其它示例性的核酸递送系统包括由Biosystems公司(德 国科隆(Cologne,Germany))、Maxcyte公司(马里兰罗克威尔(Rockville, Maryland))、BTXMolecular Delivery Systems公司(马萨诸塞州霍利 斯顿(Holliston,MA))以及CopernicusTherapeutics公司(参见例如 US6008336)提供的那些。脂转染描述于例如US5,049,386、US 4,946,787;以及US 4,897,355)中,并且脂转染试剂市场上有售(例 如,TransfectamTM、LipofectinTM和LipofectamineTM RNAiMAX)。适 用于多核苷酸有效受体识别脂转染的阳离子和中性脂质包括 Felgner,WO 91/17424、WO 91/16024中描述的那些。递送可以是到 细胞(离体施用)或靶组织(体内施用)。
脂质:核酸复合物,包括靶向的脂质体如免疫脂质复合物的制备 是本领域中的技术人员熟知的(参见,例如Crystal,Science,第270: 404-410(1995);Blaese等人,CancerGene Ther.,2:291-297(1995); Behr等人,Bioconjugate Chem.,5:382-389(1994);Remy等人, Bioconjugate Chem.,5:647-654(1994);Gao等人,Gene Therapy,2: 710-722(1995);Ahmad等人,Cancer Res.,52:4817-4820(1992); 美国专利号4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、 4,501,728、4,774,085、4,837,028以及4,946,787)。
其它的递送方法包括使用将待递送的核酸包装至EnGeneIC递送 工具(EDV)中。这些EDV使用双特异性抗体特异性地向靶组织递送, 其中该抗体的一个臂具有对于靶组织具有特异性,并且另一个臂具有 对于EDV的特异性。抗体将EDV带入靶细胞表面,然后通过胞吞作 用将EDV带入细胞中。一旦在细胞中,就将释放内含物(参见 MacDiarmid等人(2009)Nature Biotechnology,27(7):第643页)。
使用基于RNA病毒或者DNA病毒的系统来递送编码工程化 ZFP、TALE和/或供体的核酸利用将病毒靶向到人体中的特异细胞并 且将病毒有效负载运输到细胞核中的高度进化过程。可将病毒载体直 接施用于患者(体内),或者病毒可用于体外处理细胞,然后将经修 饰的细胞施用于患者(离体)。用于递送ZFP的传统的基于病毒的系 统包括但不限于用于基因转移的逆转录病毒载体、慢病毒载体、腺病 毒载体、腺相关病毒载体、牛痘载体和单纯性疱疹病毒载体。可能用 逆转录病毒、慢病毒和腺相关病毒基因转移方法整合入宿主基因组, 这常常导致插入的转基因的长期表达。另外,在许多不同细胞类型和 靶组织中已经观测到高转导效率。
可通过引入外来的包膜蛋白、扩展靶细胞的潜在靶群体来改变逆 转录病毒向性(tropism)。慢病毒载体是能够转导或感染非分裂细胞的 逆转录病毒载体,并且一般产生高病毒效价。逆转录病毒基因转移系 统的选择取决于靶组织。逆转录病毒载体由顺式作用长端重复组成, 其包装容量高达6-10kb的外来序列。最小的顺式作用LTR足以复制 和包装载体,然后用LTR将治疗基因整合入靶细胞,以提供永久的 转基因表达。广泛采用的逆转录病毒载体包括基于鼠白血病病毒 (MuLV)、长臂猿白血病病毒(GaLV)、猿免疫缺陷病毒(SIV)、人体免 疫缺陷病毒(HIV),以及其组合的那些载体(参见例如Buchscher等人,J.Virol.,66:2731-2739(1992);Johann等人,J.Virol.,66: 1635-1640(1992);Sommerfelt等人,Virol.,176:58-59(1990);Wilson 等人,J.Virol.,63:2374-2378(1989);Miller等人,J.Virol.,65: 2220-2224(1991);PCT/US94/05700)。在优选瞬时表达的应用中,可 采用基于腺病毒的系统。基于腺病毒的载体能够在许多细胞类型中非 常高效地转导,并且不需要细胞分裂。已经用这种载体获得了高效价 和高水平表达。可在相对简单的系统中大量产生此类载体。腺相关病 毒(“AAV”)载体也用于以靶核酸转导细胞,例如在体外产生核酸和肽, 以及用于体内和离体基因治疗方法(参见例如West等人,Virology, 160:38-47(1987);美国专利No.4,797,368;WO 93/24641;Kotin, Human GeneTherapy,5:793-801(1994);Muzyczka,J.Clin.Invest., 94:1351(1994)。许多公开,包括美国专利号5,173,414;Tratschin等 人,Mol.Cell.Biol.,5:3251-3260(1985);Tratschin等人,Mol.Cell.Biol., 4:2072-2081(1984);Hermonat和Muzyczka,PNAS,81: 6466-6470(1984);和Samulski等人,J.Virol.,63:03822-3828(1989) 中描述了重组AAV载体的构建。
在临床试验中,目前至少有六种病毒载体方式可用于基因转移, 它们利用的方法涉及用插入辅助细胞系的基因补充缺陷载体,以产生 转导物质。
pLASN和MFG-S是已经用于临床试验的逆转录病毒载体的实例 (Dunbar等人,Blood,85:3048-305(1995);Kohn等人,Nat.Med., 1:1017-102(1995);Malech等人,PNAS,94:22 12133-12138(1997))。 PA317/pLASN是用于基因治疗试验的第一种治疗载体。(Blaese等人, Science,270:475-480(1995))。在MFG-S包装载体中观察到的转导 效率为50%或更高。(Ellem等人,Immunol Immunother.,44(1): 10-20(1997);Dranoff等人,Hum.GeneTher.,1:111-2(1997)。
本文描述的适用于导入多核苷酸的载体还包括非整合的慢病毒 载体(IDLV)。参见例如,Ory等人(1996)Proc.Natl.Acad.Sci.USA, 93:11382-11388;Dull等人(1998)J.Virol.,72:8463-8471;Zufferyet 等人(1998)J.Virol.,72:9873-9880;Follenzi等人(2000)Nature Genetics,25:217-222;美国专利公开号20090117617。
重组腺相关病毒载体(rAAV)是有希望的可选的基因递送系统,它 基于缺陷型和非致病性细小病毒腺相关型病毒。所有载体都来源于仅 保留侧接于转基因表达盒的AAV145bp末端反向重复的质粒。由于 整合入转导细胞的基因组中,有效的基因转移和稳定的转基因递送是 这种载体系统的关键特征。(Wagner等人,Lancet,351:9117 1702-3(1998);Kearns等人,Gene Ther.,9:748-55(1996))。还可根 据本发明使用其它AAV血清型,包括AAV1、AAV3、AAV4、AAV5、 AAV6和AAV8、AAV8.2、AAV9和AAV rh10,以及假病毒AAV, 诸如AAV2/8、AAV2/5以及AAV2/6。
在某些实施方案中,载体是慢病毒载体。如本文所用的慢病毒载 体是包含来源于慢病毒的至少一个组成部分的载体。慢病毒的详细列 表可在Coffin等人(1997)“Retroviruses”Cold Spring Harbour Laboratory Press,JM Coffin、SM Hughes、HEVarmus编,第758-763)中找到。 慢病毒载体一般可用本领域中熟知的方法产生。参见例如美国专利号 5,994,136;6,165,782;和6,428,953。优选地,慢病毒载体是整合酶 缺陷的慢病毒载体(IDLV)。参见例如美国专利公开2009/0117617。 IDLV可如所描述的,例如使用包含天然慢病毒整合酶基因中的一个 或多个突变的慢病毒载体来产生,例如如在Leavitt等人(1996)J. Virol.,70(2):721-728;Philippe等人(2006)Proc.Natl Acad.Sci USA, 103(47):17684-17689;以及WO 06/010834中所公开的。在某些实 施方案中,IDLV是包含整合酶蛋白的64位处的突变的HIV慢病毒 载体(D64V),如在Leavitt等人(1996)J.Virol.,70(2):721-728中所 描述的。
在某些实施方案中,载体是腺病毒载体。可用于本申请案中的 Ad载体的非限制性实例包括重组Ad载体(诸如E1缺失的)、有条 件复制能力Ad载体(诸如,溶瘤细胞的)和/或来源于人类或者非人 类血清型的复制型Ad载体(例如,Ad5、Ad11、Ad35,或者猪腺病 毒-3);和/或嵌合的Ad载体(诸如Ad5/F35),或者趋性改变的Ad 载体,趋性改变的Ad载体具有工程化纤维(例如,节结或者轴)蛋 白(诸如,节结蛋白的HI环中的肽插入物)。“无病毒基因的”Ad载 体也是可用的,例如其中已经去除所有腺病毒基因以减少免疫原性和 增加DNA有效负载的大小的Ad载体。这允许例如同时递送编码ZFN 的序列和供体序列。此类“无病毒基因的”载体在供体序列包括待经由 靶向整合来整合的大型转基因时尤其有用。
可产生高效价的复制缺陷型重组腺病毒载体(Ad),它们容易感染 许多不同细胞类型。将大部分腺病毒载体工程化,以使转基因替代Ad E1a、E1b和/或E3基因;随后在反式提供一种或多种缺失的基因 功能的细胞中增殖复制缺陷型载体。例如,人293细胞提供E1功能。 Ad载体可体内转导多种组织类型,包括非分裂、分化细胞,如肝、 肾和肌肉中存在的那些细胞。常规Ad载体具有大容纳量。临床试验 中使用Ad载体的一个实例包括用肌肉内注射进行抗肿瘤免疫的多核 苷酸治疗(Sterman等人,Hum.Gene Ther.,7:1083-1089(1998))。
使用包装细胞形成能够感染宿主细胞的病毒颗粒。这种细胞包括 293细胞、ψ2细胞或PA317细胞,293细胞能包装腺病毒,PA317细 胞能包装逆转录病毒。通常用将核酸载体包装到病毒颗粒中的生产细 胞系来产生用于基因治疗的病毒载体。载体通常含有用于包装和随后 整合入宿主(如果可行)所需的最小病毒序列,其它病毒序列被编码待 表达蛋白的表达盒所替代。包装细胞系反式提供丧失的病毒功能。例 如,用于基因治疗的AAV载体通常仅具有来自AAV基因组的、包装 和整合入宿主基因组所必需的端反向重复(ITR)序列。将病毒DNA包 装到含有辅助质粒的细胞系中,该辅助质粒编码其它AAV基因,即 rep和cap,但没有ITR序列。也用腺病毒作为辅助者感染该细胞系。 辅助病毒促进AAV载体的复制和来自辅助质粒的AAV基因的表达。 由于缺少ITR序列,不能大量包装辅助质粒。可通过(例如)热处理降 低腺病毒污染,腺病毒对热处理的敏感性高于AAV。另外,可使用 杆状病毒系统以临床规模产生AAV(参见美国专利号U.S. 7,479,554)。
在临床试验中使用腺病毒载体进行基因转移的其它实例包括 Rosenecker等人,Infection,24:1 5-10(1996);Welsh等人,Hum.Gene Ther.,2:205-18(1995);Alvarez等人,Hum.Gene Ther.,5:597-613 (1997);Topf等人,Gene Ther.,5:507-513(1998)。
在某些实施方案中,Ad载体是嵌合的腺病毒载体,包含来自两 种或更多种不同的腺病毒基因组的序列。例如,Ad载体可为Ad5/F35 载体。Ad5/F35是通过用来自B亚族腺病毒(诸如,例如Ad35)的 相应纤维蛋白质基因替代Ad5的一个或多个纤维蛋白基因(节结, 轴、尾部、五邻体)而创建的。Ad5/F35载体和此载体的特性在例如 Ni等人,(2005)“Evaluationof biodistribution and safety of adenovirus vectors containing group B fibersafter intravenous injection into baboons,”Hum Gene Ther,16:664-677;Nilsson等人(2004) “Functionally distinct subpopulations of cord blood CD34+cells aretransduced by adenoviral vectors with serotype 5or 35tropism,”Mol Ther,9:377-388;Nilsson等人(2004)“Development of an adenoviral vector system withadenovirus serotype 35tropism;efficient transient gene transfer into primarymalignant hematopoietic cells,”J Gene Med, 6:631-641;Schroers等人(2004)“Genetransfer into human T lymphocytes and natural killer cells by Ad5/F35chimericadenoviral vectors,”Exp Hematol,32:536-546;Seshidhar等人(2003) “Developmentof adenovirus serotype 35as a gene transfer vector,” Virology,311:384-393;Shayakhmetov等人(2000)“Efficient gene transfer into human CD34(+)cells by aretargeted adenovirus vector,”J Virol,74:2567-2583;以及Sova等人(2004),“Atumor-targeted and conditionally replicating oncolytic adenovirus vectorexpressing TRAIL for treatment of liver metastases,”Mol Ther,9:496-509中有所描述。 如上所述,ZFN和编码这些ZFN的多核苷酸可被递送到任何靶细胞。 一般来说,为了钝化基因CCR-5,细胞是免疫细胞,例如淋巴细胞(B 细胞,T细胞如T辅助细胞(TH)和T细胞毒性细胞(TC),裸细胞如自 然杀伤(NK)细胞);单核细胞(大单核细胞、巨噬细胞);粒细胞(粒 性白细胞、中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞);肥大细胞; 和/或树突状细胞(郎格罕氏细胞、间质树突状细胞、指突状树突细 胞、外周血树突细胞)。巨噬细胞、B淋巴细胞和树突状细胞是TH细 胞激活中所涉及的示例性抗原递呈细胞。在某些实施方案中,靶细胞 是TH细胞,特征为CD4在细胞表面上的表达。靶细胞还可为造血干 细胞,造血干细胞可产生任何免疫细胞。
在许多基因治疗应用中,需要以高度特异性将基因治疗载体递送 至特定组织类型。因此,可修饰病毒载体,使其通过表达配体而具有 对给定细胞类型的特异性,该配体与病毒外表面上的病毒外壳蛋白形 成为融合蛋白。选择配体,使其对已知存在于受关注细胞类型上的受 体具有亲合力。例如Han等人,Proc.Natl.Acad.Sci.USA,92: 9747-9751(1995)报道,可修饰莫洛尼鼠白血病病毒以表达融合于gp70 的人调蛋白,并且该重组病毒能感染表达人表皮生长因子受体的某些 人乳腺癌细胞。这个原理可延用于其它病毒-靶细胞对,其中靶细胞 表达一种受体,而病毒表达包含该细胞表面受体的配体的融合蛋白。 例如,可工程化丝状噬菌体,以呈现对基本上任何所选细胞受体都具 有特异性结合亲合力的抗体片段(如FAB或Fv)。虽然上述描述主 要应用于病毒载体,但同样的原理也可应用于非病毒载体。可工程化 此类载体,使其含有有利于特靶向细胞摄取的特异性摄取序列。
可通过给予单个患者,一般是通过全身给药(例如,静脉内、腹 膜内、肌内、皮下或颅内输注)或局部应用来体内递送基因治疗载体, 如下所述。或者,可将载体离体递送至细胞中,例如,从单个患者体 内取出细胞(例如,淋巴细胞、骨髓吸取物、组织活检)或通用供体 造血干细胞,然后,通常在选择并入载体的细胞后将细胞再植入患者。
本领域技术人员熟知用于诊断、研究或基因治疗的离体细胞转染 (如通过将转染细胞再输注到宿主生物体中)。在一个优选实施方案 中,从受试者生物体中分离细胞,用ZFP核酸(基因或cDNA)转染, 再输注回受试者生物体(例如,患者)内。本领域技术人员熟知适用 于离体转染的各种细胞类型(参见例如Freshney等人,Culture of Animal Cells,AManual of Basic Technique(第3版,1994)),其中引 用的参考文献是关于如何分离和培养患者细胞的论述)。
合适的细胞包括但不限于真核和原核细胞和/或细胞系。此类细 胞或者从此类细胞产生的细胞系的非限制性实例包括COS、CHO(例 如,CHO-S、CHO-K1、CHO-DG44、CHO-DUXB11、CHO-DUKX、CHOK1SV)、VERO、MDCK、WI38、V79、B14AF28-G3、BHK、 HaK、NS0、SP2/0-Ag14、HeLa、HEK293(例如,HEK293-F、 HEK293-H、HEK293-T),以及perC6细胞,以及昆虫细胞诸如草地 贪夜蛾(Spodoptera fugiperda)(Sf),或真菌细胞诸如酵母属(Saccharomyces)、毕赤酵母属(Pichia)和裂殖酵母属 (Schizosaccharomyces)。在某些实施方案中,细胞系是CHO-K1、 MDCK或HEK293细胞系。另外,可分离和离体使用原代细胞,以在用核酸酶(例如,ZFN或者TALEN)或者核酸酶系统(例如, CRISPR/Cas)进行处理之后将细胞再导入待治疗的受试者体内。合 适的原代细胞包括外周血单核细胞(PBMC),以及其它的血细胞亚群, 诸如但不限于T淋巴细胞,如CD4+T细胞或者CD8+T细胞。合适 的细胞还包括干细胞,诸如,举例来说,胚胎干细胞、诱导性多能干 细胞、造血干细胞(CD34+)、神经干细胞和间充质干细胞。
在一个实施方案中,干细胞用于离体细胞转染和基因治疗的方 法。采用干细胞的优点是它们可在体外分化为其它细胞类型,或者可 被导入哺乳动物(诸如细胞供体)中,随后可移入骨髓中。使用细胞 因子如GM-CSF、IFN-γ和TNF-α使CD34+细胞体外分化为临床上重 要的免疫细胞类型的方法是已知的(参见Inaba等人,J.Exp.Med., 176:1693-1702(1992))。
用已知方法分离用于转导和分化的干细胞。例如,用结合不需要 的细胞,如CD4+和CD8+(T细胞)、CD45+(泛B细胞(panB cell))、 GR-1(粒细胞)和Iad(分化的抗原递呈细胞)的抗体淘选骨髓细胞,从而 从骨髓细胞中分离干细胞(参见Inaba等人,J.Exp.Med.,176: 1693-1702(1992))。
在一些实施方案中还可使用已经修饰的干细胞。例如,已经对凋 亡具有抗性的干细胞可被用作治疗性组合物,其中干细胞还包含本发 明的ZFP、TALE、CRISPR/Cas系统和/或供体。对凋亡的抗性可例 如通过以下方式发生:使用BAX-的核酸酶或者BAK-特异性核酸酶(参见,美国专利公开号2010/0003756)敲除干细胞中的BAX和/ 或BAK,或者干细胞再用例如半胱天冬酶-6特异性ZFN敲除半胱天 冬酶中断裂的BAX和/或BAK。或者,还可通过使用半胱天冬酶抑 制剂如Z-VAD-FMK(苄氧羰基-缬氨酰-丙氨酰-天冬氨酰[邻甲基]-氟 甲基酮)来实现对凋亡的抗性。
也可向生物体直接施用含有治疗性ZFP、TALE、CRISPR/Cas系 统和/或供体核酸的载体(例如,逆转录病毒、腺病毒、脂质体等)以 体内转导细胞。或者,可施用裸DNA或者mRNA。可通过常用于将 分子导入成与血液或组织细胞最终接触的任何途径施用,包括但不限 于注射、输注、局部施用和电穿孔。施用此类核酸的合适方法可用并 且为本领域中的技术人员熟知,并且,虽然可使用一种以上的途径施 用特定组合物,但是一种特定途径往往可提供比另一种途径更直接且 更有效的反应。
例如,在美国专利号5,928,638中公开了将DNA导入造血干细 胞中的方法。将转基因导入造血干细胞(例如,CD34+细胞)中有用的 载体包括35型腺病毒。
将转基因导入免疫细胞(例如,T细胞)中的合适载体包括非整合 慢病毒载体。参见,例如,Ory等人(1996)Proc.Natl.Acad.Sci.USA, 93:11382-11388;Dull等人(1998)J.Virol.,72:8463-8471;Zuffery 等人(1998)J.Virol.,72:9873-9880;Follenzi等人(2000)Nature Genetics,25:217-222。
医药学上可接受的载体是部分地由施用的特定组合物,以及用于 施用组合物的特定方法所确定的。因此,如下所述,存在多种多样的 可用医药组合物的合适制剂(参见例如,Remington’s Pharmaceutical Sciences,第17版,1989)。
应用
所公开的方法和组合物可用于钝化TCR基因组序列。如上所述, 钝化包括部分或者完全抑制细胞(例如,T淋巴细胞)中内源TCRα 和/或β基因的表达。TCR基因的钝化可通过例如以下方式来实现: 通过单一切割事件;通过切割后进行非同源末端连接;通过在两个位 点处切割后连接,以便使两个切割位点之间的序列缺失;通过将错义 或者无义密码子靶向重组到编码区域中;通过将不相关的序列(即, “填充物”序列)或者另一受关注编码序列靶向重组到基因或者基因的 调节区域,以便使基因或者调节区域断裂;或者通过将剪接受体序列 靶向重组到内含子中以造成转录本的错误剪接。内源TCR基因的钝 化还可通过靶向重组一个或多个特异于受关注肿瘤抗原/MHC复合 物的TCR基因来实现。
存在各种用于核酸酶介导的TCR基因钝化(敲除或敲减)的应 用。例如,本文描述的方法和组合物允许细胞系的生成和/或修饰(用 于治疗和非治疗用途)。一个或多个内源TCR基因的钝化可与编码高 亲合力TCR或者抗已知靶标的嵌合抗原受体(CARS,参见Cartellieri 等人(2010)J Biomed and Biotech,第2010卷,文章编号956304)的 基因的插入相结合,以及生成的转基因细胞(或者具有相同特性的这 些细胞的子代)可用作细胞治疗剂。或者,可使用递送供体核酸上编 码TCR特异核酸酶和高亲合力TCR的基因的病毒载体,在体内进行 T细胞的重新靶向。不论哪种情况,都可使用本发明的材料和方法来 治疗癌症。体外修饰细胞还可用于模型研究或者用于筛选以找到还可 与TCR修饰协同作用的其它类型的治疗剂。可治疗任何类型的癌症, 包括但不限于肺癌、胰腺癌、肝癌、骨癌、乳腺癌、结直肠癌、白血 病、卵巢癌、淋巴瘤、脑癌等。可用本发明的技术治疗的其它疾病包 括真菌、细菌和病毒感染,以及身免疫性疾病和/或移植物抗宿主病 (GvHD)。
此外,本文描述的方法和组合物可用于生成模式生物体和细胞 系,包括在任何给定的生物体中生成稳定的敲除细胞。虽然 ZFN/TALEN/CRISPR/Cas系统提供在细胞系或者模式生物体中敲除 任何给定基因的能力,但是在不存在选择标记的情况下,这些事件是非常罕见的。因此,本文所描述的方法显著升高了靶基因断裂率,该 方法可用于生成具有新特性的细胞系。此方法包括用于产生生物样仓 鼠(CHO)细胞系的细胞系或者用于产生若干AAV血清型样人类 HEK 293细胞或者昆虫细胞样Sf9或者Sf21的细胞系。
本发明的方法和组合物还可用于产生转基因生物体。转基因动物 可包括开发用于疾病模型的那些转基因动物,以及具有所需性状的动 物。可使用本发明的方法和组合物处理胚胎,以开发转基因动物。在 一些实施方案中,合适的胚胎可包括来自小型哺乳动物(例如,啮齿 动物,兔子等)、同伴动物、家畜和灵长类动物的胚胎。啮齿动物的 非限制性实例可包括小鼠、大鼠、仓鼠、沙鼠和豚鼠。同伴动物的非 限制性实例可包括猫、狗、兔子、刺猬,以及雪貂。家畜的非限制性 实例可包括马、山羊、绵羊、猪、骆驼、羊驼,以及牛。灵长类动物 的非限制性实例可包括卷尾猴属、黑猩猩、狐猴、猕猴、绒猴、金丝 猴、蜘蛛猿、松鼠猴,以及长尾黑颌猴。在其它实施方案中,合适的 胚胎可包括来自鱼、爬行动物、两栖动物或者禽类的胚胎。或者,合 适的胚胎可为昆虫胚胎,例如果蝇胚胎或者蚊虫胚胎。