新品速递 | 三代人基因组重测序

2017-06-07    编辑:诺禾致源

三代人基因组重测序是基于PacBio Sequel平台,
通过构建超长片段文库,轻松跨过高重复和高GC区段,
从而实现染色体结构变异和融合基因等的准确检测。

产品优势

  • 超长读长,平均12K,精确解析染色体结构变异及融合基因等;
  • 无GC偏好性,DNA无需PCR扩增,保证基因组覆盖的完整性和均一性;
  • 直接获得甲基化等表观遗传信息。

技术参数

技术路线与生信分析项目

应用方向

1. 单基因病、复杂疾病

斯坦福大学等单位[1]利用PacBio单分子实时测序技术成功找到了二代测序未能检测到的致病性大片段deletion,该成果发表于BioRxiv。研究者对一个表型疑似Carney综合征的患者进行三代低深度(8.6X)测序,得到26.7G的数据。发现PRKAR1A 基因第一个外显子中包含2184bp的杂合性缺失,该区域有4条long reads覆盖并有2条reads支持变异,如图所示。经过一代和二代测序的双重验证,证明了该位点的真实可靠。

图1. 杂合性变异位点的鉴定

2. 癌症研究

日本东京大学等单位[2]对73名青年白血病患者,3名染色体阳性患者及8名健康志愿者的血细胞进行了二代转录组测序。分析发现D4Z4重复片段插入 IGH 基因中,但是无法检测完整的融合基因序列,也无法鉴定插入 IGH 基因中的DUX4 拷贝数。对一个患者进行了三代测序,深度23x,得到约69G的数据。准确检测到单拷贝的D4Z4片段在IGHM与IGHJ4位点间插入;双拷贝D4Z4片段在IGHJ6与IGHV3-15位点间插入;同时还检测到IGHD2-15和IGHVII-60-1区域发生了轻微重排。该成果发表于Nature Genetics。

图2. SMRT测序鉴定 DUX4-IGH 融合基因

3.单体型分型

三代测序不仅可以获得某个基因高质量、全长的序列,还可对其整个基因座,包括外显子、内含子以及上游和下游区域进行准确的单体型分型。荷兰莱顿基因组技术中心[3]利用三代测序检测了24个样本的CYP2D6 基因,分析得到695个变异位点,去重后留下61个突变位点,其中含有49个单核苷酸变异、5个插入和7个缺失,这些变异位点大部分位于CYP2D6 基因的非编码区,有9个未被SNP数据库收录。该成果发表于Human Mutation。

图3. 61个突变位点在CYP2D6 基因座上的分布

4. 表观遗传研究

PacBio平台基于单分子实时测序,不仅能进行脉冲荧光检测,还能够记录两次荧光之间的持续时间,不同类型甲基化具有不同的持续时间,基于时间变化,就能检测到不同类型甲基化修饰。一般认为,5-甲基胞嘧啶(5-methylcytosine,5mC)是哺乳动物中唯一的甲基化形式,但耶鲁大学等单位[4]在小鼠胚胎干细胞中发现了N6-甲基腺嘌呤,并用质谱分析证实,同时该研究小组开发了一种结合染色质免疫共沉淀(ChIP)与三代单分子实时测序的新方法,该成果发表于Nature。

图4. PacBio测序检测甲基化原理

参考文献

[1]  Merker J, Wenger A M, Sneddon T, et al. Long-read whole genome sequencing identifies causal structural variation in a Mendelian disease[J]. bioRxiv, 2016: 090985.
[2]  Yasuda T, Tsuzuki S, Kawazu M, et al. Recurrent DUX4 fusions in B cell acute lymphoblastic leukemia of adolescents and young adults[J]. Nature genetics, 2016.
[3]  Buermans H P J, Vossen R H A M, Anvar S Y, et al. Flexible and Scalable Full‐Length CYP2D6 Long Amplicon PacBio Sequencing[J]. Human Mutation, 2017.
[4]  Wu T P, Wang T, Seetin M G, et al. DNA methylation on N6-adenine in mammalian embryonic stem cells[J]. Nature, 2016.