CN109593757B - 一种探针及其适用于高通量测序的对目标区域进行富集的方法 - Google Patents
一种探针及其适用于高通量测序的对目标区域进行富集的方法 Download PDFInfo
- Publication number
- CN109593757B CN109593757B CN201710918635.3A CN201710918635A CN109593757B CN 109593757 B CN109593757 B CN 109593757B CN 201710918635 A CN201710918635 A CN 201710918635A CN 109593757 B CN109593757 B CN 109593757B
- Authority
- CN
- China
- Prior art keywords
- sequence
- probe
- illumina
- template
- product
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000000523 sample Substances 0.000 title claims abstract description 108
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000012165 high-throughput sequencing Methods 0.000 title claims abstract description 11
- 238000012163 sequencing technique Methods 0.000 claims abstract description 49
- 238000006243 chemical reaction Methods 0.000 claims description 42
- 108020004414 DNA Proteins 0.000 claims description 40
- 230000000295 complement effect Effects 0.000 claims description 33
- 125000000446 sulfanediyl group Chemical group *S* 0.000 claims description 29
- 238000006366 phosphorylation reaction Methods 0.000 claims description 26
- 230000026731 phosphorylation Effects 0.000 claims description 25
- 238000011534 incubation Methods 0.000 claims description 22
- 238000011144 upstream manufacturing Methods 0.000 claims description 22
- 238000012408 PCR amplification Methods 0.000 claims description 19
- 239000003153 chemical reaction reagent Substances 0.000 claims description 19
- 238000009396 hybridization Methods 0.000 claims description 19
- 108060002716 Exonuclease Proteins 0.000 claims description 17
- 238000004925 denaturation Methods 0.000 claims description 17
- 230000036425 denaturation Effects 0.000 claims description 17
- 102000013165 exonuclease Human genes 0.000 claims description 17
- JTBBWRKSUYCPFY-UHFFFAOYSA-N 2,3-dihydro-1h-pyrimidin-4-one Chemical compound O=C1NCNC=C1 JTBBWRKSUYCPFY-UHFFFAOYSA-N 0.000 claims description 16
- 108020004707 nucleic acids Proteins 0.000 claims description 15
- 150000007523 nucleic acids Chemical class 0.000 claims description 15
- 102000039446 nucleic acids Human genes 0.000 claims description 15
- 230000002441 reversible effect Effects 0.000 claims description 12
- 102000004190 Enzymes Human genes 0.000 claims description 11
- 108090000790 Enzymes Proteins 0.000 claims description 11
- 238000000137 annealing Methods 0.000 claims description 10
- 238000001976 enzyme digestion Methods 0.000 claims description 8
- 108090000364 Ligases Proteins 0.000 claims description 7
- 102000003960 Ligases Human genes 0.000 claims description 7
- 108010052305 exodeoxyribonuclease III Proteins 0.000 claims description 5
- 238000012257 pre-denaturation Methods 0.000 claims description 5
- 238000000746 purification Methods 0.000 claims description 5
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 4
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 claims description 4
- 102100029075 Exonuclease 1 Human genes 0.000 claims description 4
- 102100034343 Integrase Human genes 0.000 claims description 2
- 230000029087 digestion Effects 0.000 claims description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims 7
- 239000008213 purified water Substances 0.000 claims 4
- 108010063905 Ampligase Proteins 0.000 claims 3
- BAWFJGJZGIEFAR-NNYOXOHSSA-O NAD(+) Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 BAWFJGJZGIEFAR-NNYOXOHSSA-O 0.000 claims 3
- 101710203526 Integrase Proteins 0.000 claims 1
- 241000713869 Moloney murine leukemia virus Species 0.000 claims 1
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 claims 1
- 102000005891 Pancreatic ribonuclease Human genes 0.000 claims 1
- 239000003161 ribonuclease inhibitor Substances 0.000 claims 1
- 125000006850 spacer group Chemical group 0.000 claims 1
- 230000004048 modification Effects 0.000 description 21
- 238000012986 modification Methods 0.000 description 21
- 230000015572 biosynthetic process Effects 0.000 description 17
- 238000003786 synthesis reaction Methods 0.000 description 17
- 238000005516 engineering process Methods 0.000 description 11
- 230000003321 amplification Effects 0.000 description 8
- 238000003199 nucleic acid amplification method Methods 0.000 description 8
- 238000011084 recovery Methods 0.000 description 7
- 239000011324 bead Substances 0.000 description 6
- 238000003908 quality control method Methods 0.000 description 5
- 239000012807 PCR reagent Substances 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 238000007403 mPCR Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 108010028773 Complement C5 Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 102100030011 Endoribonuclease Human genes 0.000 description 1
- 108010093099 Endoribonucleases Proteins 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 102000029749 Microtubule Human genes 0.000 description 1
- 108091022875 Microtubule Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 210000004688 microtubule Anatomy 0.000 description 1
- 241000264288 mixed libraries Species 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000036438 mutation frequency Effects 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/315—Phosphorothioates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/33—Chemical structure of the base
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种适用于高通量测序的探针及利用该探针富集目标区域的方法。探针从5’端依次为,连接臂,屏蔽序列1,UID序列1,Illumina Tag1序列,dU区,Illumina Tag2序列,UID序列2,屏蔽序列2,延伸臂;其中屏蔽序列1,屏蔽序列2,dU区,UID序列1,UID序列2可以是0bp。采用本发明的探针构建的文库测序时无需额外添加测序引物,采用本发明的方法可直接以RNA为模板进行目标区域捕获,简化实验流程。
Description
技术领域
本发明涉及生物技术测序领域,尤其涉及一种探针及其适用于高通量测序的对目标区域进行富集的方法。
背景技术
随着高通量测序技术的快速发展,测序效率明显提升,时间明显缩短,费用明显降低,基因检测手段有了革命性的变化,其技术正向着大规模、工业化的方向发展。虽然高通量测序总体成本大幅下降,然而高深度的全基因组测序成本和解读海量测序数据的复杂程度还是让科研人员倍感困难。目标序列靶向测序技术的出现,在一定程度上缓解了上述困难。目标序列靶向测序是一种对感兴趣的基因区域进行富集测序的研究策略。目标区域测序的主要优势在于可针对特定区域进行测序,有效降低了测序成本,提高了测序深度,能够更为经济有效地研究特定区域的遗传变异信息。
目前实现目标区域富集主要有三种方法:杂交捕获技术、多重PCR技术和分子倒置探针技术(Molecular Inversion Probe,MIP)。杂交捕获技术:首先用物理方法或酶切法把基因组DNA片段化,并在两端连接上接头,进行PCR扩增。然后与标记有生物素的探针杂交,没有杂交上的DNA不能被磁珠捕获而被清洗掉。最后富集到的DNA样本进行PCR扩增、测序。杂交捕获的特点是可扩展性好,且能够对外显子组甚至更大的目标区域进行捕获,但缺点是操作流程复杂、周期较长、成本较高、需要依赖较多特殊的仪器设备。
多重PCR扩增技术根据靶序列设计特异性引物,通过多重扩增,对靶序列进行富集。多重PCR技术操作简便、应用灵活、价格低廉、分析简单、对仪器要求最小化,能在数小时内完成目标序列富集和文库构建。利用超高的测序深度,扩增子测序可以检测复杂样品中的超低频突变,特别适用于癌症等疾病的临床科研。其缺点是只适用于相对较小的目标序列捕获,需要解决扩增抑制、引物交叉扩增、严重的引物二聚体等问题。
分子倒置探针技术是一种新型多重靶向测序方法,这种方法具有操作流程简单、样品需求量小、成本低、精确度高等优点。然而,分子倒置探针在高通量测序领域的应用并不成熟,具有杂交时间久、错误率高、操作步骤复杂等缺点。
发明内容
本发明的目的在于提供一种利用改进的分子倒置探针技术设计一种简单、快速、高效、准确的富集目标区域的方法。
为实现上述目的,本发明提供一种探针,其特征在于,其从5’端依次为,连接臂,屏蔽序列1,UID序列1,Illumina Tag1序列,Illumina Tag2序列,屏蔽序列2,延伸臂;所述UID序列1为3-12个随机碱基组成;所述屏蔽序列1为0-3个不与连接臂对应的模板上游的序列互补的随机碱基;所述屏蔽序列2为0-3个不与连接臂对应的模板下游的序列互补的随机碱基。
本发明的另外一个方面,也提供一种探针,其特征在于,其从5’端依次为,连接臂,屏蔽序列1,Illumina Tag1序列,Illumina Tag2序列,UID序列2,屏蔽序列2,延伸臂,所述UID序列2为3-12个随机碱基组成;所述屏蔽序列1为0-3个不与连接臂对应的模板上游的序列互补的随机碱基;所述屏蔽序列2为0-3个不与连接臂对应的模板下游的序列互补的随机碱基。
本发明的另外一个方面,也提供一种探针,其特征在于,其从5’端依次为,连接臂,屏蔽序列1,UID序列1,Illumina Tag1序列,Illumina Tag2序列,UID序列2,屏蔽序列2,延伸臂;所述UID序列1和UID序列2均为3-12个随机碱基组成;所述屏蔽序列1为0-3个不与连接臂对应的模板上游的序列互补的随机碱基;所述屏蔽序列2为0-3个不与连接臂对应的模板下游的序列互补的随机碱基。
本发明的另外一个方面,还提供一种探针,在上述探针的基础上,Illumina Tag1序列和Illumina Tag2序列中间,还有dU区,其为1-3个脱氧尿嘧啶碱基。
进一步,所述连接臂为15-45bp与核酸模板互补结合的碱基序列;
所述Illumina Tag1序列和Illumina Tag2序列为Illumina平台任意建库试剂盒中的转座子Adapters、接头上的序列或其互补或反向互补序列的任意组合;
延伸臂为15-45bp与核酸模板互补结合的碱基序列。
进一步,所述延伸臂进行了修饰;优选的,进行了硫代修饰;更优选的,连接臂Tm值高于延伸臂Tm值2℃以上;
任选的,所述连接臂5’端进行了磷酸化修饰;
任选的,所述Illumina Tag1序列和Illumina Tag2序列选自Illumina平台建库试剂盒中转座子Adapters、接头上的序列或其互补序列的任意组合。
本发明的另外一个方面,还提供一种适用于高通量测序的对目标区域进行富集的方法,其特征在于,使用了所述的探针。
进一步,步骤为,
杂交、延伸、连接反应:模板DNA与所述探针杂交,延伸、连接,得到第一产物;
第二产物的获得:酶切消化掉剩余的探针和模板DNA,通过标签引物进行PCR扩增,得到第二产物;
纯化:对第二产物进行纯化得到文库;
将文库上机测序即可。
进一步,所述杂交、延伸、连接反应步骤为:模板DNA与所述探针先杂交,然后加入聚合酶、连接酶进行延伸、连接,得到第一产物;
优选的,反应体系和反应程序为:
程序为95℃变性5min,60℃孵育2h;然后在上述体系中再加入以下试剂进行延伸、连接反应,反应程序为60℃孵育1h;
或模板为RNA时,
70℃变性2min,65℃孵育2h;然后再加入以下试剂,42℃反应1h,进行延伸、连接反应;
或同时加入模板DNA、所述探针和聚合酶、连接酶,同时进行杂交,延伸、连接,得到第一产物;
优选的,反应体系和反应程序为:
反应程序为95℃5min,60℃3h。
进一步,所述第二产物的获得步骤为:先用外切酶消化掉剩余的探针和模板DNA,然后利用USER酶将第一产物线性化,再通过标签引物进行PCR扩增,得到第二产物;
优选的,反应体系和程序为:
第一产物
Exonuclease I 0.5μL;
Exonuclease III 0.5μL。
37℃孵育40min,95℃孵育5min;
再加入以下试剂:
37℃孵育15min,98℃预变性30s;98℃变性10s,58℃退火30s,72℃延伸30s,26cycles;72℃延伸2min,4℃保温;
或同时加入核酸外切酶和标签上游引物,标签下游引物,同时进行酶切消化、线性化和PCR扩增得到第二产物;
所述标签上游引物和标签下游引物的3’端有硫代修饰,5’端有硫代、氨基或间臂修饰,防止被外切酶酶切;
优选的,模板为DNA时的反应体系和程序为:
反应程序为37℃孵育40min,95℃孵育5min,98℃预变性30s;98℃变性10s,58℃退火30s,72℃延伸30s,26cycles。72℃延伸2min,4℃保温;
或模板为RNA时的反应体系和程序为:
37℃孵育60min,95℃孵育5min,98℃预变性30s;98℃变性10s,60℃退火30s,72℃延伸30s,27cycles。72℃延伸2min,4℃保温。
进一步,所述标签引物中的上游引物结构从5’端开始为Illumina测序时用于簇生成的序列区,index序列区;与Illumina Tag1序列反向互补配对的全长序列区;
标签引物中的下游引物结构从5’端开始为Illumina测序时用于簇生成的序列区,index序列区;Illumina Tag2全长序列区。
其实施过程具体包括以下部分:
1.探针与核酸样本杂交
探针与核酸样本杂交是指探针的延伸臂和连接臂与单链的核酸样本的靶区域具有互补配对的序列,在合适的杂交体系和温度下进行杂交。核酸样本可以是DNA、RNA或者由RNA反转录得到的cDNA,也可以是DNA和cDNA或DNA和RNA的混合物。在图1中描绘了改进的其中一种MIP探针结构。探针的来源可以是多种合成方式,也可以合成后通过分子生物学手段进行改造。探针由8部分结构组成:1)与核酸模板互补结合的长度可变的连接臂(15~45nt);2)0-3个不与连接臂对应的模板上游的序列互补的随机碱基,起屏蔽作用;3)1-2个UID(Unique Identifier)序列,所述UID序列由3-12个随机碱基组成,用于区分原始模板的标签序列;4)用于Illumina测序平台测序的标签序列1(Tag1,IlluminaNextera LibraryPrep Kits中NexteraTransposaseAdapters Read 2的一段序列的反向互补序列5’-CTGTCTCTTATACACATCTCCGAGCCCACGAGAC-3’),该序列3’端可减少0-16个碱基;5)0-3个脱氧尿嘧啶(dU)碱基;6)用于Illumina测序平台测序的标签序列2(Tag2,Illumina TruSeq试剂盒5端接头上的一段序列5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’),该序列5’端可减少0-19个碱基;其中标签序列1和2这两个用于测序的标签序列可以是Illumina平台任意建库试剂盒中转座子Adapters、接头上的序列或其互补序列的任意组合。7)1-3个不与延伸臂对应的模板的下游序列互补的随机碱基,起屏蔽作用;8)与核酸模板互补结合的长度可变的延伸臂(15~45nt)。延伸臂可进行硫代修饰或其它修饰;在合成探针时,连接臂5’端进行磷酸化修饰,也可以选择在合成时不做磷酸化修饰,通过磷酸化反应对探针5’端进行磷酸化修饰)。
2.延伸、连接酶连接反应
当探针的延伸臂和连接臂都锚定到靶区域后,利用DNA聚合酶的聚合功能,从延伸臂3’端延伸到连接臂的5’端。优选保真性高的DNA聚合酶。当模板为RNA时,采用反转录酶进行延伸。然后利用连接酶将切口连接,得到环状产物。当然,杂交、延伸、连接反应也可以在一步里面同时进行。
3.外切酶消化线性探针和核酸
为了消除核酸样本和剩余探针对后续PCR扩增的影响,利用单链核酸外切酶、双链核酸外切酶将探针和单链、双链核酸样本消化,只保留环状的产物。外切酶可以是单酶或多种酶的混合物。
4.将环状产物线性化、PCR扩增
为了提高PCR扩增效率,利用USER酶将环状产物切成线性,再用含有与探针结构中测序标签序列相同或互补结构的上下游引物(CAAGCAGAAGACGGCATACGAGATTTCTGCCTGTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG(未经过硫代修饰的SEQ ID NO:9)和
AATGATACGGCGACCACCGAGATCTACACTATAGCCTACACTCTTTCCCTACACGACGCTCTTCCGATCT(未经过硫代修饰的SEQ ID NO:10)进行文库扩增。下划线部分为index序列,用于混合文库测序时区分不同文库的标签,该序列可更改。
当然,也可以将外切酶和PCR试剂(不含USER酶)混合,先进行酶切反应,再利用硫代修饰的上下游引物进行文库扩增。
5.文库纯化
为了去除文库中的酶、脱氧核糖核苷三磷酸(dNTPs)、离子、引物、引物二聚体等杂质,采用Beckman公司的AgencourtAMPure XP磁珠对文库进行纯化,也可采用电泳后切胶回收或者柱纯化等其他方式进行纯化。
6.高通量测序
制备好的文库经浓度、片段质控合格后在高通量测序仪上测序。本发明的文库测序方法包括但不限于可逆末端终止测序法,也可以是其它测序平台。测序类型可以为单端测序或双端测序。在本发明的实施方案中,所述的测序平台为Illumina,测序类型为双端测序。
与目前常规的MIP方法相比,本发明的有益效果主要有:
1.本发明采用IlluminaNextera和IlluminaTruSeq接头上的序列做为探针的骨架序列,测序时无需额外添加测序引物,简化了实验流程。
2.本发明对PCR标签引物进行修饰,可将酶切试剂、PCR试剂同时加入反应管,减少操作步骤。
3.本发明可直接以RNA为模板进行目标区域捕获,不需要先进行反转录,简化实验流程。
4.本发明通过引入UID结构,可去除由PCR扩增得到的重复序列,明显降低错误率,还原样本真实的突变频率。在探针结构中引入dU碱基,利用USER酶将环状模板线性化来提高PCR扩增效率,降低PCR扩增错误。
附图说明
图1是本发明的其中一种探针结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
以下引物和探针均由生工生物工程(上海)股份有限公司合成。
本实施例所使用HCT15细胞,可自普诺赛生物,上海研域生物工程有限公司等生物公司购买,然后按照常规DNA提取方法提取其DNA即可。
NCI-H3122细胞系可以购自上海泽叶生物科技有限公司、上海继和生物科技有限公司等公司,然后按照常规RNA提取方法提取其RNA即可。
以下结合图1中的探针结构来理解和说明实施例中的探针结构。
实施例1:用改进的MIP探针库进行目标区域富集
在该实施例中,使用4条靶向人类乳腺癌易感基因(BRCA)的探针。实验分两组,组1为探针不含dU结构,组2为探针含有dU结构,其余结构及序列均相同。
备注:B表示可以是G、T或C;D表示可以是G、A或T;H表示可以是A、T或C;V表示可以是G、A或C;N表示可以是A、T、C或G;5Phos表示磷酸化修饰;-s-表示两个碱基之间进行硫代修饰。
组1探针序列如下:
P01:
其中从5’端开始,下划线为连接臂,NNNNNNNNNNNN为UID序列1,双下划线为Illumina Tag1,下划线为点线的是Illumina Tag2,波浪下划线为延伸臂。
P02:
其中从5’端开始,下划线为连接臂,VV为屏蔽序列1,双下划线为Illumina Tag1,下划线为点线的是IlluminaTag2,NNNNNNNNNNNN为UID序列2,波浪下划线为延伸臂。
P03:
其中从5’端开始,下划线为连接臂,VBD为屏蔽序列1,NNN为UID序列1,双下划线为Illumina Tag1,下划线为点线的是IlluminaTag2,NNN为UID序列2,BDB为屏蔽序列2,波浪下划线为延伸臂。
P04:
其中从5’端开始,下划线为连接臂,B为屏蔽序列1,NNNNN为UID序列1,双下划线为Illumina Tag1,下划线为点线的是Illumina Tag2,NNNNN为UID序列2,H为屏蔽序列2,波浪下划线为延伸臂。
组2探针序列如下:
P05:
其中从5’端开始,下划线为连接臂,NNNNNNNNNNNN为UID序列1,双下划线为Illumina Tag1,dU为脱氧尿嘧啶,下划线为点线的是IlluminaTag2,波浪下划线为延伸臂。
P06:
其中从5’端开始,下划线为连接臂,VV为屏蔽序列1,双下划线为Illumina Tag1,dU为脱氧尿嘧啶,下划线为点线的是Illumina Tag2,NNNNNNNNNNNN为UID序列2,波浪下划线为延伸臂。
P07:
其中从5’端开始,下划线为连接臂,VBD为屏蔽序列1,NNN为UID序列1,双下划线为Illumina Tag1,dU为脱氧尿嘧啶,下划线为点线的是Illumina Tag2,NNN为UID序列2,BDB为屏蔽序列2,波浪下划线为延伸臂。
P08:
其中从5’端开始,下划线为连接臂,B为屏蔽序列1,NNNNN为UID序列1,双下划线为Illumina Tag1,dU为脱氧尿嘧啶,下划线为点线的是Illumina Tag2,NNNNN为UID序列2,DBH为屏蔽序列2,波浪下划线为延伸臂。
杂交反应体系如下:
程序为95℃变性5min,60℃孵育2h。然后在上述杂交产物中再加入以下试剂进行延伸、连接反应,反应程序为60℃孵育1h。
使用核酸外切酶将剩余的探针和DNA消化。在上述产物中再加入以下试剂:
Exonuclease I(NEB) 0.5μL;
Exonuclease III(NEB) 0.5μL。
37℃孵育40min,95℃孵育5min。
为了将含dU结构组的环状产物切成线性单链,在PCR反应中加入了USER酶。即在上述产物中再加入以下试剂:
标签1引物序列:
标签2引物序列:
其中下划波浪线的序列为IlluminaTruSeq试剂盒5端接头上的一段序列,本发明探针结构中的Illumina Tag2就是这段序列的5’端减少0-19个碱基。双下划线为Illumina测序时用于簇生成的序列,不可更改。下划线部分均为index序列,序列可变。下划点线为Illumina Nextera TransposaseAdapters Read 2的一段序列,与本发明探针结构中的Illumina Tag1反向互补配对。
标签引物序列用于环状产物的PCR放大,当Tag1、2序列更换为Illumina建库试剂盒其他转座子Adapters、接头上的序列或其他组合时,下划线和波浪点线位置的序列要对应更改。)
37℃孵育15min,98℃预变性30s;98℃变性10s,58℃退火30s,72℃延伸30s,26cycles;72℃延伸2min,4℃保温。
扩增结束后使用AgencourtAMPure XP磁珠对文库进行纯化。然后对文库进行质控,Illumina测序仪上机测序。
表1采用含dU结构和不含dU结构探针建库的文库产量、模板回收率结果表
| 实验组 | 文库产量(ng) | 模板回收率 |
| 组1(不含dU结构组) | 62.3 | 22.6% |
| 组2(含dU结构组) | 224.6 | 23.1% |
从表1可以看出,虽然含dU结构探针与比不含dU结构探针相比模板回收率差异不大,但是可以明显提高文库产量。
实施例2:用优化连接臂、延伸臂熔解温度(Tm)值的MIP探针库进行目标区域富集
探针序列如下:
P09:
在P5的基础上,其3’端最后三个碱基之间进行硫代修饰。
P10:
在P6的基础上,其3’端最后三个碱基之间进行硫代修饰。
P11:
在P7的基础上,其3’端最后三个碱基之间进行硫代修饰。
P12:
在P8的基础上,其3’端最后三个碱基之间进行硫代修饰。
PCR引物序列同实施例1,即标签1引物序列同实施例1中的标签1引物序列;此处的标签2引物序列同实施例1中的标签2引物序列。
在本实施例中,探针设计时连接臂的Tm值高于延伸臂2℃以上,延伸臂进行硫代修饰。实验分两组,对照组采用P05-P08探针、优化组采用优化后的P09-P12探针,具体步骤如下:
1.杂交、延伸、连接反应,见表3:
表3反应体系表
反应程序为95℃5min,60℃3h。
2.在上述体系中再加入以下试剂,进行酶切反应,反应程序为37℃孵育40min,95℃孵育5min。
ExonucleaseⅠ(NEB) 0.5μL;
ExonucleaseⅢ(NEB) 0.5μL;
Exonuclease Lambda(NEB) 0.5μL;
3.上述体系中加入以下试剂进行产物线性化和PCR扩增。
此处的标签1引物序列同实施例1中的标签1引物序列;此处的标签2引物序列同实施例1中的标签2引物序列。
反应程序为:37℃孵育15min,98℃预变性30s;98℃变性10s,58℃退火30s,72℃延伸30s,26cycles;72℃延伸2min,4℃保温。
4.扩增结束后使用AgencourtAMPure XP磁珠对文库进行纯化。然后对文库进行质控,Illumina测序仪上机测序。分析结果见表4。
表4实验结果表
| 实验组 | 文库产量(ng) | 模板回收率 |
| 对照组(不含硫代修饰) | 22.5 | 3.4% |
| 优化组(含硫代修饰) | 158.2 | 18.7% |
从表4可以看出,采用本实施例的方法,优化组的文库产量和模板回收率都明显高于对照组。
实施例3:用改进流程的MIP方案进行目标区域富集
在该实施例中,优化流程为将酶切试剂、PCR试剂同时加入反应管。杂交反应体系如下:
程序为95℃变性5min,60℃孵育2h。然后在上述杂交产物中再加入以下试剂进行延伸、连接反应,反应程序为60℃孵育1h。
使用核酸外切酶将剩余的探针和DNA消化,再进行PCR扩增。在上述产物中加入以下试剂。反应程序为37℃孵育40min,95℃孵育5min,98℃预变性30s。98℃变性10s,58℃退火30s,72℃延伸30s,26cycles。72℃延伸2min,4℃保温。
标签3引物序列:
标签4引物序列:
标签3引物序列在标签1引物的基础上5’端进行硫代修饰,标签4引物序列在标签2引物的基础上5’端进行硫代修饰。
扩增结束后使用Agencourt AMPure XP磁珠对文库进行纯化。然后对文库进行质控,Illumina测序仪上机测序。文库产量为58.5ng,模板回收率为22.4%,可以看出,将酶切试剂、PCR试剂混合方案可行,简化了操作流程。
实施例4:用改进流程的MIP方案对RNA模板进行目标区域富集
本实施例的探针序列为:P13:
其中从5’端开始,下划线为连接臂,HVD为屏蔽序列1,NNNNN为UID序列1,双下划线为Illumina Tag1,dU为脱氧尿嘧啶,下划线为点线的是Illumina Tag2,NNNNN为UID序列2,HHH为屏蔽序列2,波浪下划线为延伸臂。
P14:
其中从5’端开始,下划线为连接臂,HVD为屏蔽序列1,NNNNN为UID序列1,双下划线为Illumina Tag1,dU为脱氧尿嘧啶,下划线为点线的是Illumina Tag2,NNNNN为UID序列2,BBB为屏蔽序列2,波浪下划线为延伸臂。
在该实施例中,使用两条靶向人类EML4-ALK(-棘皮动物微管结合蛋白样4-间变性淋巴瘤激酶)融合基因的探针。杂交反应条件如下:
程序为70℃变性2min,65℃孵育2h。然后在上述杂交产物中加入以下试剂,反应程序为:42℃1h,进行延伸、连接反应。
使用核酸外切酶、核糖核酸内切酶将剩余的探针、RNA及DNA-RNA杂交链上的RNA消化,再进行PCR扩增。
在上述产物中加入以下试剂。反应程序为37℃孵育60min,95℃孵育5min,98℃预变性30s。98℃变性10s,60℃退火30s,72℃延伸30s,27cycles。72℃延伸2min,4℃保温。
此处的标签1引物序列同实施例1中的标签1引物序列;此处的标签2引物序列同实施例1中的标签2引物序列。
扩增结束后使用AgencourtAMPure XP磁珠对文库进行纯化。然后对文库进行质控,Illumina测序仪上机测序。结果见表5。
表5实施例4的实验结果表
| 实验组 | 比对率 | 覆盖度 |
| 1 | 96.24% | 100% |
| 2 | 95.87% | 100% |
| 3 | 96.16% | 100% |
实验组1-3为3个重复。从表5可以看出,文库测序结果比对率95%以上,覆盖度100%,说明用改进流程的MIP方案可以直接以RNA为模板进行目标区域富集。
以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
SEQUENCE LISTING
<110> 厦门艾德生物医药科技股份有限公司
<120> 一种探针及其适用于高通量测序的对目标区域进行富集的方法
<130> ADSW-17002-CNI
<160> 14
<170> PatentIn version 3.5
<210> 1
<211> 120
<212> DNA
<213> 人工合成
<220>
<221> 磷酸化
<222> (1)..(1)
<223> 5'端的G磷酸化
<220>
<221> misc_feature
<222> (27)..(38)
<223> n is a, c, g, or t
<400> 1
gggccgcttc attttgtaag acttatnnnn nnnnnnnnct gtctcttata cacatctccg 60
agcccacgag acacactctt tccctacacg acgctcttcc gatcttgtct gctccacttc 120
<210> 2
<211> 129
<212> DNA
<213> 人工合成
<220>
<221> 磷酸化
<222> (1)..(1)
<223> 5'端的C磷酸化
<220>
<221> 兼并碱基
<222> (46)..(47)
<223> V表示G、A或C
<220>
<221> misc_feature
<222> (89)..(100)
<223> n is a, c, g, or t
<400> 2
ctctttatac tcttaaaaat tactgaggac ctaaaagagc atttgvvctg tctcttatac 60
acatctccga acgacgctct tccgatctnn nnnnnnnnnn aaatgaattt gacaggataa 120
tagaaaatc 129
<210> 3
<211> 77
<212> DNA
<213> 人工合成
<220>
<221> 磷酸化
<222> (1)..(1)
<223> 5'端磷酸化
<220>
<221> 碱基兼并
<222> (16)..(59)
<223> V表示G、A或C;B表示G、T或C;D表示G、A或T
<220>
<221> misc_feature
<222> (19)..(21)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (54)..(56)
<223> n is a, c, g, or t
<400> 3
tgcattcttc aaagcvbdnn nctgtctctt atacacatcc gctcttccga tctnnnbdbg 60
aggtacctga atcagca 77
<210> 4
<211> 90
<212> DNA
<213> 人工合成
<220>
<221> 磷酸化
<222> (1)..(1)
<223> 5’端磷酸化
<220>
<221> 碱基兼并
<222> (24)..(72)
<223> B表示G、T或C;H表示A、T或C
<220>
<221> misc_feature
<222> (25)..(29)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (67)..(71)
<223> n is a, c, g, or t
<400> 4
cagtgtttag aatcaggtca ctcbnnnnnc tgtctcttat acacatctcc gacgctcttc 60
cgatctnnnn nhcccagttt gaagcaaatg 90
<210> 5
<211> 123
<212> DNA
<213> 人工合成
<220>
<221> 磷酸化
<222> (1)..(1)
<223> 5’端磷酸化
<220>
<221> misc_feature
<222> (27)..(38)
<223> n is a, c, g, or t
<220>
<221> 特殊碱基
<222> (73)..(75)
<223> Z为脱氧尿嘧啶
<400> 5
gggccgcttc attttgtaag acttatnnnn nnnnnnnnct gtctcttata cacatctccg 60
agcccacgag acwwwacact ctttccctac acgacgctct tccgatcttg tctgctccac 120
ttc 123
<210> 6
<211> 130
<212> DNA
<213> 人工合成
<220>
<221> 磷酸化
<222> (1)..(1)
<223> 5’端磷酸化
<220>
<221> 兼并碱基
<222> (46)..(47)
<223> V表示G、A或C
<220>
<221> 特殊碱基
<222> (71)..(71)
<223> W为脱氧尿嘧啶
<220>
<221> misc_feature
<222> (90)..(101)
<223> n is a, c, g, or t
<400> 6
ctctttatac tcttaaaaat tactgaggac ctaaaagagc atttgvvctg tctcttatac 60
acatctccga wacgacgctc ttccgatctn nnnnnnnnnn naaatgaatt tgacaggata 120
atagaaaatc 130
<210> 7
<211> 80
<212> DNA
<213> 人工合成
<220>
<221> 磷酸化
<222> (1)..(1)
<223> 5’端磷酸化
<220>
<221> 兼并碱基
<222> (16)..(62)
<223> W为脱氧尿嘧啶,V表示G、A或C;B表示G、T或C;D表示G、A或T
<220>
<221> misc_feature
<222> (19)..(21)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (57)..(59)
<223> n is a, c, g, or t
<400> 7
tgcattcttc aaagcvbdnn nctgtctctt atacacatcw gacgctcttc cgatctnnnb 60
dbgaggtacc tgaatcagca 80
<210> 8
<211> 93
<212> DNA
<213> 人工合成
<220>
<221> 磷酸化
<222> (1)..(1)
<223> 5’端磷酸化
<220>
<221> 兼并碱基
<222> (24)..(75)
<223> B表示G、T或C;D表示G、A或T;H表示A、T或C;
<220>
<221> misc_feature
<222> (25)..(29)
<223> n is a, c, g, or t
<220>
<221> 特殊碱基
<222> (51)..(51)
<223> W为脱氧尿嘧啶
<220>
<221> misc_feature
<222> (68)..(72)
<223> n is a, c, g, or t
<400> 8
cagtgtttag aatcaggtca ctcbnnnnnc tgtctcttat acacatctcc wgacgctctt 60
ccgatctnnn nndbhcccag tttgaagcaa atg 93
<210> 9
<211> 66
<212> DNA
<213> 人工合成
<220>
<221> 硫代修饰
<222> (65)..(66)
<223> 硫代修饰
<400> 9
caagcagaag acggcatacg agatttctgc ctgtctcgtg ggctcggaga tgtgtataag 60
agacag 66
<210> 10
<211> 70
<212> DNA
<213> 人工合成
<220>
<221> 硫代修饰
<222> (69)..(70)
<223> 硫代修饰
<400> 10
aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60
cttccgatct 70
<210> 11
<211> 66
<212> DNA
<213> 人工合成
<220>
<221> 硫代修饰
<222> (1)..(2)
<223> 硫代修饰
<220>
<221> 硫代修饰
<222> (65)..(66)
<223> 硫代修饰
<400> 11
caagcagaag acggcatacg agatttctgc ctgtctcgtg ggctcggaga tgtgtataag 60
agacag 66
<210> 12
<211> 70
<212> DNA
<213> 人工合成
<220>
<221> 硫代修饰
<222> (1)..(2)
<223> 硫代修饰
<220>
<221> 硫代修饰
<222> (69)..(70)
<223> 硫代修饰
<400> 12
aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60
cttccgatct 70
<210> 13
<211> 119
<212> DNA
<213> 人工合成
<220>
<221> 磷酸化
<222> (1)..(1)
<223> 5’端磷酸化
<220>
<221> 兼并碱基
<222> (21)..(74)
<223> H表示A、T或C;V表示G、A或C;D表示G、A或T
<220>
<221> misc_feature
<222> (24)..(28)
<223> n is a, c, g, or t
<220>
<221> 特殊碱基
<222> (50)..(50)
<223> W为脱氧尿嘧啶
<220>
<221> misc_feature
<222> (67)..(71)
<223> n is a, c, g, or t
<400> 13
agctccatct gcatggcttg hvdnnnnnct gtctcttata cacatctccw gacgctcttc 60
cgatctnnnn nhhhaggtgt gggctctaca gtagttttgc tccatataag catgactcc 119
<210> 14
<211> 97
<212> DNA
<213> 人工合成
<220>
<221> 磷酸化
<222> (1)..(1)
<223> 5’端磷酸化
<220>
<221> 兼并碱基
<222> (21)..(74)
<223> H表示A、T或C;V表示G、A或C;D表示G、A或T;B表示G、T或C
<220>
<221> misc_feature
<222> (24)..(28)
<223> n is a, c, g, or t
<220>
<221> 特殊碱基
<222> (50)..(50)
<223> W为脱氧尿嘧啶
<220>
<221> misc_feature
<222> (67)..(71)
<223> n is a, c, g, or t
<400> 14
agctccatct gcatggcttg hvdnnnnnct gtctcttata cacatctccw gacgctcttc 60
cgatctnnnn nbbbcgcgag ttgacatttt tgcttgg 97
Claims (25)
1.一种探针,其特征在于,其从5’端依次为,连接臂,屏蔽序列1,UID序列1,IlluminaTag1序列,Illumina Tag2序列,屏蔽序列2,延伸臂;所述UID序列1为3-12个随机碱基组成;所述屏蔽序列1为0-3个不与连接臂对应的模板上游的序列互补的随机碱基;所述屏蔽序列2为0-3个不与连接臂对应的模板下游的序列互补的随机碱基;所述Illumina Tag1序列为Illumina Nextera Library Prep Kits中Nextera Transposase Adapters Read 2序列的反向互补序列从3’端依次减少0-16个碱基;所述Illumina Tag2序列为用于Illumina测序平台Illumina TruSeq试剂盒5’端接头上的一段序列,其5’端依次减少0-19个碱基。
2.一种探针,其特征在于,其从5’端依次为,连接臂,屏蔽序列1,Illumina Tag1序列,Illumina Tag2序列,UID序列2,屏蔽序列2,延伸臂,所述UID序列2为3-12个随机碱基组成;所述屏蔽序列1为0-3个不与连接臂对应的模板上游的序列互补的随机碱基;所述屏蔽序列2为0-3个不与连接臂对应的模板下游的序列互补的随机碱基;所述Illumina Tag1序列为Illumina Nextera Library Prep Kits中Nextera Transposase Adapters Read 2序列的反向互补序列从3’端依次减少0-16个碱基;所述Illumina Tag2序列为用于Illumina测序平台Illumina TruSeq试剂盒5’端接头上的一段序列,其5’端依次减少0-19个碱基。
3.一种探针,其特征在于,其从5’端依次为,连接臂,屏蔽序列1,UID序列1,IlluminaTag1序列,Illumina Tag2序列,UID序列2,屏蔽序列2,延伸臂;所述UID序列1和UID序列2均为3-12个随机碱基组成;所述屏蔽序列1为0-3个不与连接臂对应的模板上游的序列互补的随机碱基;所述屏蔽序列2为0-3个不与连接臂对应的模板下游的序列互补的随机碱基;所述Illumina Tag1序列为Illumina Nextera Library Prep Kits中Nextera TransposaseAdapters Read 2序列的反向互补序列从3’端依次减少0-16个碱基;所述Illumina Tag2序列为用于Illumina测序平台Illumina TruSeq试剂盒5’端接头上的一段序列,其5’端依次减少0-19个碱基。
4.权利要求1-3任一所述探针,其特征在于,在Illumina Tag1序列和Illumina Tag2序列中间,还有dU区,其为1-3个脱氧尿嘧啶碱基。
5.权利要求1-3任一所述探针,其特征在于,所述连接臂为15-45bp与核酸模板互补结合的碱基序列;延伸臂为15-45bp与核酸模板互补结合的碱基序列。
6.权利要求4所述探针,其特征在于,所述连接臂为15-45bp与核酸模板互补结合的碱基序列;延伸臂为15-45bp与核酸模板互补结合的碱基序列。
7.权利要求1-3任一所述探针,其特征在于,所述延伸臂进行了修饰。
8.权利要求1-3任一所述探针,其特征在于,所述连接臂5’端进行了磷酸化修饰。
9.权利要求1-3任一所述探针,其特征在于,所述Illumina Tag1序列和Illumina Tag2序列选自Illumina平台建库试剂盒中转座子Adapters、接头上的序列或其互补或反向互补序列的任意组合。
10.权利要求7所述探针,其特征在于,所述延伸臂进行了硫代修饰。
11.权利要求10所述探针,其特征在于,所述连接臂Tm值高于延伸臂Tm值2℃以上。
12.权利要求4所述探针,其特征在于,所述延伸臂进行了修饰。
13.权利要求4所述探针,其特征在于,所述连接臂5’端进行了磷酸化修饰。
14.权利要求4所述探针,其特征在于,所述Illumina Tag1序列和Illumina Tag2序列选自Illumina平台建库试剂盒中转座子Adapters、接头上的序列或其互补或反向互补序列的任意组合。
15.权利要求12所述探针,其特征在于,所述延伸臂进行了硫代修饰。
16.权利要求15所述探针,其特征在于,所述连接臂Tm值高于延伸臂Tm值2℃以上。
17.一种适用于高通量测序的对目标区域进行富集的方法,其特征在于,使用了权利要求1-3任一所述的探针或权利要求4所述的探针。
18.如权利要求17所述的方法,其特征在于,步骤为,
杂交、延伸、连接反应:模板DNA与权利要求1-3任一项所述探针或权利要求4所述的探针杂交,延伸、连接,得到第一产物;或同时加入模板DNA、权利要求1-3任一项所述探针或权利要求4所述的探针和聚合酶、连接酶,同时进行杂交,延伸、连接,得到第一产物;
第二产物的获得:酶切消化掉剩余的探针和模板DNA,通过标签引物进行PCR扩增,得到第二产物;
纯化:对第二产物进行纯化得到文库;
将文库上机测序即可。
19.如权利要求18所述的方法,其特征在于,所述杂交、延伸、连接反应步骤为模板DNA与权利要求1-3任一项所述探针或权利要求4所述的探针杂交,延伸、连接,得到第一产物时,模板DNA与权利要求1-3任一项所述探针或权利要求4所述的探针先杂交,然后加入聚合酶、连接酶进行延伸、连接,得到第一产物。
20.如权利要求19所述的方法,其特征在于,所述杂交、延伸、连接反应的反应体系和反应程序为:
纯化水 6μL;
50 ng/μL 模板DNA 2μL;
3Í10-3μM 权利要求1-3任一所述探针或权利要求4所述的探针 1μL;
10ÍAmpligase Buffer 1μL;
程序为95℃变性5 min,60℃孵育2 h;然后在上述体系中再加入以下试剂进行延伸、连接反应,反应程序为 60℃孵育1 h;
纯化水 1.4μL;
1 mM dNTPs 1μL;
5 U/μL Ampligase DNA ligase 1μL;
10ÍAmpligase Buffer 0.5μL;
50 mM NAD+ 0.1μL;
Phusion® High-Fidelity DNA Polymerase 1μL;
或模板为RNA时,
无核酸酶水 5.5μL;
50 ng/μL 模板RNA 2μL;
3Í10-3μM权利要求1-3任一所述探针或权利要求4所述的探针 1μL;
RNase Inhibitor 0.5μL;
10ÍAmpligase Buffer 1μL;
70℃变性2 min,65℃孵育2 h;然后再加入以下试剂,42℃反应1 h,进行延伸、连接反应;
1 mM dNTPs 1μL;
5 U/μL Ampligase DNA ligase 1μL;
10ÍAmpligase Buffer 1μL;
50 mM NAD+ 0.1μL;
5Í First-Strand Buffer 4μL;
100 mM DTT 2μL;
SMART MMLV RT 1μL。
21.如权利要求18所述的方法,其特征在于,所述杂交、延伸、连接反应步骤为同时加入模板DNA、权利要求1-3任一项所述探针或权利要求4所述的探针和聚合酶、连接酶,同时进行杂交,延伸、连接,得到第一产物时,其,反应体系和反应程序为:
纯化水 3.4μL;
50 ng/μL 模板DNA 2μL;
3Í10-3μM 权利要求1-3任一所述探针或权利要求4所述的探针 1μL;
1 mM dNTPs 1μL;
5 U/μL Ampligase DNA ligase 1μL;
10ÍAmpligase Buffer 1μL;
50 mM NAD+ 0.1μL;
Phusion® HiFi DNA Polymerase 0.5μL;
反应程序为95℃ 5 min,60℃ 3 h。
22.权利要求18所述的方法,其特征在于,所述第二产物的获得步骤为:先用外切酶消化掉剩余的探针和模板DNA,然后利用USER酶将第一产物线性化,再通过标签引物进行PCR扩增,得到第二产物;或同时加入核酸外切酶和标签上游引物,标签下游引物,同时进行酶切消化、线性化和PCR扩增得到第二产物,其中标签上游引物和标签下游引物的3’端有硫代修饰,5’端有硫代、氨基或间臂修饰,保护引物不被外切酶酶切。
23.权利要求22所述的方法,其特征在于,第二产物的获得的反应体系和程序为:
第一产物
Exonuclease I 0.5μL;
Exonuclease III 0.5μL;
37℃孵育40 min,95℃孵育5 min;
再加入以下试剂:
2Í iProof HF Master Mix 50μL;
纯化水 29μL;
20 μM标签上游引物 2μL;
20 μM标签下游引物 2μL;
USER酶 1μL;
37℃孵育15 min,98℃预变性30 s;98℃变性10 s,58℃退火30 s,72℃ 延伸30 s,26cycles;72℃延伸2 min,4℃保温。
24.权利要求22所述的方法,其特征在于,第二产物的获得步骤为同时加入核酸外切酶和标签上游引物,标签下游引物,同时进行酶切消化、线性化和PCR扩增得到第二产物时,模板为DNA时的反应体系和程序为:
第一产物 18μL;
Exonuclease Lambda 0.5μL;
Exonuclease III 1μL;
2Í iProof HF Master Mix 50μL;
H2O 29.5μL;
20 μM标签上游引物 2μL;
20 μM标签下游引物 2μL;
反应程序为37℃孵育40 min,95℃孵育5 min,98℃预变性30 s;98℃变性10 s,58℃退火30 s,72℃ 延伸30 s,26 cycles;72℃延伸2 min,4℃保温;
或模板为RNA时的反应体系和程序为:
第一产物 10.1μL;
Exonuclease I 1μL;
RNase A 0.1μL;
RNase H 0.1μL;
2Í iProof HF Master Mix 50μL;
H2O 24.8μL;
20 μM标签上游引物 2μL;
20 μM标签下游引物 2μL;
37℃孵育60 min,95℃孵育5 min,98℃预变性30 s;98℃变性10 s,60℃退火30 s,72℃ 延伸30 s,27 cycles;72℃延伸2 min,4℃保温。
25.权利要求24所述的方法,其特征在于,所述标签引物中的上游引物结构从5’端开始为Illumina测序时用于簇生成的序列区,index序列区;与Illumina Tag1序列反向互补配对的全长序列区;
标签引物中的下游引物结构从5’端开始为Illumina测序时用于簇生成的序列区,index序列区;Illumina Tag2全长序列区。
Priority Applications (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201710918635.3A CN109593757B (zh) | 2017-09-30 | 2017-09-30 | 一种探针及其适用于高通量测序的对目标区域进行富集的方法 |
| EP18861441.6A EP3674419A4 (en) | 2017-09-30 | 2018-07-18 | PROBE AND APPLICANT METHOD FOR ENRICHING A TARGET REGION IN HIGH-RATE SEQUENCING |
| PCT/CN2018/096078 WO2019062289A1 (zh) | 2017-09-30 | 2018-07-18 | 一种探针及其适用于高通量测序的对目标区域进行富集的方法 |
| US16/650,320 US11761037B1 (en) | 2017-09-30 | 2018-07-18 | Probe and method of enriching target region applicable to high-throughput sequencing using the same |
| JP2020518408A JP7641118B2 (ja) | 2017-09-30 | 2018-07-18 | プローブ及びこれをハイスループットシーケンシングに適用するターゲット領域の濃縮方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201710918635.3A CN109593757B (zh) | 2017-09-30 | 2017-09-30 | 一种探针及其适用于高通量测序的对目标区域进行富集的方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN109593757A CN109593757A (zh) | 2019-04-09 |
| CN109593757B true CN109593757B (zh) | 2021-08-03 |
Family
ID=65900546
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201710918635.3A Active CN109593757B (zh) | 2017-09-30 | 2017-09-30 | 一种探针及其适用于高通量测序的对目标区域进行富集的方法 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US11761037B1 (zh) |
| EP (1) | EP3674419A4 (zh) |
| JP (1) | JP7641118B2 (zh) |
| CN (1) | CN109593757B (zh) |
| WO (1) | WO2019062289A1 (zh) |
Families Citing this family (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110699425B (zh) * | 2019-09-20 | 2024-01-26 | 上海臻迪基因科技有限公司 | 基因目标区域的富集方法及体系 |
| JP7503134B2 (ja) * | 2019-12-03 | 2024-06-19 | 湖南雑交水稲研究中心 | 物理的及び化学的突然変異誘発植物のm1世代突然変異を同定する方法、と突然変異体を取得する方法、及びイネの突然変異同定用のタイピングプライマー、突然変異遺伝子及び使用 |
| CN113122612B (zh) * | 2019-12-31 | 2023-06-27 | 深圳华大智造科技股份有限公司 | 一种用于目标区域捕获测序的dna捕获探针制备方法及其应用 |
| CN112410329A (zh) * | 2020-10-16 | 2021-02-26 | 深圳乐土生物科技有限公司 | 引物组合、试剂盒及其在卵巢癌早期筛查中的应用 |
| CN112458085A (zh) * | 2020-12-10 | 2021-03-09 | 北京求臻医学检验实验室有限公司 | 一种新型分子捕获优化探针及其文库构建方法 |
| WO2023021518A1 (en) * | 2021-08-18 | 2023-02-23 | Yeda Research And Development Co. Ltd. | Ultrafast molecular inversion probe-based targeted sequencing assay for low variant allele frequency |
| CN117343929B (zh) * | 2023-12-06 | 2024-04-05 | 广州迈景基因医学科技有限公司 | 一种pcr随机引物及用其加强靶向富集的方法 |
| CN117821564A (zh) * | 2023-12-11 | 2024-04-05 | 深圳海普洛斯医学检验实验室 | 一种新型引物及其应用 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101067156A (zh) * | 2007-05-18 | 2007-11-07 | 中国人民解放军第三军医大学第一附属医院 | 一种基于选择性探针的多重pcr方法及其应用 |
| CN105714383A (zh) * | 2014-12-22 | 2016-06-29 | 深圳华大基因研究院 | 一种基于分子反向探针的测序文库构建方法和试剂 |
| WO2017020024A2 (en) * | 2015-07-29 | 2017-02-02 | Progenity, Inc. | Systems and methods for genetic analysis |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8759036B2 (en) * | 2011-03-21 | 2014-06-24 | Affymetrix, Inc. | Methods for synthesizing pools of probes |
| EP2774998A1 (en) * | 2013-03-08 | 2014-09-10 | Roche Diagniostics GmbH | Improved sequence tags |
| CN116426520A (zh) * | 2013-11-26 | 2023-07-14 | 杭州联川基因诊断技术有限公司 | 选择性扩增核酸序列 |
| EP3271480B8 (en) * | 2015-01-06 | 2022-09-28 | Molecular Loop Biosciences, Inc. | Screening for structural variants |
| CN111621548A (zh) | 2016-04-26 | 2020-09-04 | 序康医疗科技(苏州)有限公司 | 扩增dna的方法 |
-
2017
- 2017-09-30 CN CN201710918635.3A patent/CN109593757B/zh active Active
-
2018
- 2018-07-18 EP EP18861441.6A patent/EP3674419A4/en active Pending
- 2018-07-18 WO PCT/CN2018/096078 patent/WO2019062289A1/zh not_active Ceased
- 2018-07-18 US US16/650,320 patent/US11761037B1/en active Active
- 2018-07-18 JP JP2020518408A patent/JP7641118B2/ja active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101067156A (zh) * | 2007-05-18 | 2007-11-07 | 中国人民解放军第三军医大学第一附属医院 | 一种基于选择性探针的多重pcr方法及其应用 |
| CN105714383A (zh) * | 2014-12-22 | 2016-06-29 | 深圳华大基因研究院 | 一种基于分子反向探针的测序文库构建方法和试剂 |
| WO2017020024A2 (en) * | 2015-07-29 | 2017-02-02 | Progenity, Inc. | Systems and methods for genetic analysis |
Non-Patent Citations (2)
| Title |
|---|
| Molecular Inversion Probes for targeted resequencing in non-model organisms;Niedzicka M ET AL;《Sci Rep》;20160405;摘要,6-7页,图1 * |
| Niedzicka M ET AL.Molecular Inversion Probes for targeted resequencing in non-model organisms.《Sci Rep》.2016,摘要,6-7页,图1. * |
Also Published As
| Publication number | Publication date |
|---|---|
| JP7641118B2 (ja) | 2025-03-06 |
| US11761037B1 (en) | 2023-09-19 |
| WO2019062289A1 (zh) | 2019-04-04 |
| EP3674419A4 (en) | 2021-05-26 |
| JP2020536525A (ja) | 2020-12-17 |
| EP3674419A1 (en) | 2020-07-01 |
| CN109593757A (zh) | 2019-04-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN109593757B (zh) | 一种探针及其适用于高通量测序的对目标区域进行富集的方法 | |
| EP3252174B1 (en) | Compositions, methods, systems and kits for target nucleic acid enrichment | |
| CN106192021B (zh) | 一种串联rad标签测序文库的构建方法 | |
| WO2016082129A1 (zh) | 一种核酸的双接头单链环状文库的构建方法和试剂 | |
| CN105238859B (zh) | 一种获取鸡全基因组高密度snp标记位点的方法 | |
| CN110079592B (zh) | 用于检测基因突变和已知、未知基因融合类型的高通量测序靶向捕获目标区域的探针和方法 | |
| CN110036117A (zh) | 通过多联短dna片段增加单分子测序的处理量的方法 | |
| TW201321518A (zh) | 微量核酸樣本的庫製備方法及其應用 | |
| CN113166809B (zh) | 一种dna甲基化检测的方法、试剂盒、装置和应用 | |
| CN112410331A (zh) | 带分子标签和样本标签的接头及其单链建库方法 | |
| US20140336058A1 (en) | Method and kit for characterizing rna in a composition | |
| CN110331446A (zh) | Dna甲基化标志物筛查试剂盒及方法 | |
| CN112941635A (zh) | 一种提高文库转化率的二代测序建库试剂盒及其方法 | |
| CN109825552B (zh) | 一种用于对目标区域进行富集的引物及方法 | |
| CN114250279B (zh) | 一种单倍型的构建方法 | |
| CN102559856B (zh) | 去除测序文库中的载体片段的方法 | |
| CN112680796A (zh) | 一种靶标基因富集建库方法 | |
| CN112941147A (zh) | 一种高保真靶标基因建库方法及其试剂盒 | |
| CN112063690A (zh) | 单分子探针多重靶向捕获文库的构建方法及应用 | |
| WO2025000136A1 (zh) | 一种快速检测多种类型rna的链特异性文库制备方法与高通量测序技术 | |
| CN112080555A (zh) | Dna甲基化检测试剂盒及检测方法 | |
| CN118451196A (zh) | 一种生成标记的核酸分子群的方法及其试剂盒 | |
| CN112126987A (zh) | 一种用于甲基化扩增子测序的建库方法 | |
| CN118308462A (zh) | 一种用于空间多组学测序的建库试剂盒及建库方法 | |
| CN102329873A (zh) | 全基因组范围内基因组dna修饰定量测序方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |