胡萝卜全基因组测序文献

2017-03-10    编辑:诺禾致源

传统方法

在这个三代测序、光学图谱、10×genomics和Hi-C 等新技术横飞的年代,本研究仍采用 454 及 Illumina 平台二代测序技术,结合BAC末端测序和连锁图谱对一个橙色胡萝卜的双单倍体进行了全基因组测序组装和后期研究。
胡萝卜基因组大小约为 473Mb,组装后的基因组大小为 421.5Mb,共包含4907条 scaffold,组装结果中 Contig N50:31.2kb,Scaffold N50:12.7Mb,大约86%的基因组序列包含在60条超长 scaffold 中。基因组组装完成后进一步被定位到染色体水平,最长的 scaffold 长度达到 30.2 Mb,占到4号染色体总长的85%。之后利用亚端粒 BAC 克隆以及端粒探针进行细胞学评估,结果表明组装延伸到了端粒和亚端粒区域,进一步说明了胡萝卜基因组组装的高物理覆盖水平。

图1 胡萝卜1号染色体的多维图像和串联重复进化

全基因组测序研究

全基因组研究中基因家族、进化历史、基因共线性等研究是最为主流的分析内容,即使研究方向在不同层面展开,基础的比较基因组研究仍要完整进行。

研究对重要基因家族的分析表明,涉及调节功能(结合)和信号通路(蛋白激酶)的蛋白域在胡萝卜特有基因中较丰富,并且在γ事件后发生 WGD 事件的基因组含有更多的调节基因。研究预测了643个抗性基因(R基因),胡萝卜和其他基因组中,种系特异性复制促成了 R 基因家族的扩增和多样化,NL 和 CNL 家族的扩增可能反 映了进化事件中的串联重复,最终导致了染色体2、3~7上优质的基因簇。分析表明串联重复在 R 基因扩增中的重要作用,此外,R基因簇可能形成了不断进化的新的植物病原体相互作用遗传多样性资源。

研究还对13个不同基因组进行了比较系统学分析,结果表明胡萝卜和葡萄发生分歧大约在113百万年前,和猕猴桃在约101百万年前,和马铃薯、番茄在约90.5百万年前,之后和生菜在约72百万年前发生分歧。确定了两次胡萝卜特有的全基因组复制(WGD)事件,Dc-α 和 Dc-β,与所有真双子叶植物共享的γ复制事件有重叠部分。这些 WGD 事件分别发生在约43百万年和70百万年前(图2a,b)。

研究还采用已有方法重构了胡萝卜的复制历史。来自7个祖先核心双子叶植物的染色体高度碎片化并分散在胡萝卜的9条染色体中(图2c)。和葡萄,西红柿,咖啡以及猕猴桃基因组的比对分析清晰地表明了基因组复制情况(图2d)。对 α 峰下包含旁系同源基因的重复版块的深度分析表明了重复序列的过保留,而 β 峰下则有大量的三倍化版块(图2e)。研究认为有至少60个染色体融合或易位、一个种系特异性 WGT(Dc-β)以及一个 WGD(Dc-α)促成了从21个染色体祖先到胡萝卜9条染色体的多样化变化。大量结果表明一假说:编码相互作用产物的基因类别有可能被过度保留。

图2 胡萝卜基因组进化分析

多组学联合分析

在物种基因组测序研究快速发展的今天,即使全面进行了基础分析,单一组学的研究已经显得比较单薄,即便是全基因组测序也大多要结合其他测序研究,本篇文献就分别结合了重测序、转录组测序以及遗传图谱技术等,使研究内容更加精准深刻。

为了探究胡萝卜的驯化模式,对35个个体进行了重测序,之后确定了1,393,431个高质量的 SNP。对不同地区和栽培模式的胡萝卜品种进行系统发育和聚类分析,东部野生品种是和栽培种亲缘关系最近的品种,进一步说明了中东和东亚地区是胡萝卜驯化的中心地区。聚类分析体现出广泛的等位基因混合,体现出野生种和栽培种之间的异交特征以及广泛的地域重叠(图3a)。在自交品系中遗传多样性和杂合性水平明显降低,可能是杂合胡萝卜育种过程导致的。为了探究遗传区域和驯化事件的关系,研究对东部栽培和野生品种胡萝卜进行了成对群体分化(FST) 水平研究,并在染色体2、5、6、7、8上确定了不同分化信号。染色体5和7上的峰和之前控制主根上类胡萝卜素积累的 QTL 重叠,而这是胡萝卜驯化的一个主要特征(图3b)。

图3 胡萝卜遗传多样性

物种生物学亮点

图4 胡萝卜中与类胡萝卜素积累相关的表型、
候选基因和转录差异

再高新的技术,再全面的测序,再精准的组装,想要冲刺高分文献,都离不开一大法器——生物学亮点。抓住准确的物种生物学亮点并极致深入地研究透彻,是高分期刊不可抗拒的一大武器。

本篇文献的亮点就是调节类胡萝卜素累积的基因的研究,研究利用两个作图群体,确定了在黄色和暗橙色根中都是 Y 调节类胡萝卜素的大量累积,结论和之前的假设模型一致。精细的定位分析确定了5号染色体上含有 Y 基因的一段 75Kb 的区域(图4b-e)。在此区域预测的8个基因中没有一个与已知异戊二烯生物合成基因有同源性,说明胡萝卜根中 Y 基因位点对类胡萝卜素累积的调节,超出了异戊二烯生物合成基因的范畴。在这一 75Kb 的区段内,DCAR_032551 是唯一含有突变而造成类胡萝卜素差异的基因,DCAR_032551 在其第二个外显子上含有一个 212nt 的插入,导致黄色和暗橙色胡萝卜中形成了移码突变。

利用重测序数据,一个长度为 65Kb 的单倍型区块和所有根样本(两个高度着色根除外)相关。在这个 65Kb 区域内,7个单倍型版块在野生种中检测出来,在黄色和暗橙色胡萝卜单倍型块中的多态性检测,于4个基因中确定了8个八个非同义 SNP 位点,确定了2个插入缺失,包括 DCAR_032551 中 212nt 的插入(图4f)。

为了确定这一区域是否处在选择压力之下,研究进行了核苷酸多样性,分化和连锁不平衡(LD)的差异分析,在5号染色体上有一个峰值,与 DCAR_032551 部分重叠。在这一区域,栽培种的高色素部分 LD 增高,而核苷酸多样性大幅降低(图4g,h)。

参考文献

Iorizzo M, Ellison S, Senalik D, et al. A high-quality carrot genome assembly provides new insightsinto carotenoid accumulation and asterid genome evolution.