西瓜基因组解析

2017-03-16    编辑:诺禾致源

西瓜基因组组装及评估

关于西瓜基因组,早在2012年11月西瓜的基因组就被北京农林科学院、深圳华大基因以及美国康奈尔大学等多家单位合作完成相应的测序及解读工作。他们选用人工培育的西瓜品种97103,进行全基因组 de novo 测序,采用 Illumina 测序方法测得46.18Gb 的数据(108.6X)。通过 K-mer 评估,预估的基因组大小为 425Mb,组装的基因组大小为 353.5Mb,基因组覆盖度达 83.2%。ContigN50 长度为 26.38Kb,ScaffoldN50 长度为 2.38Mb。并将 330Mb 的 Scaffold 定位到了11条染色体上。

接着通过 EST 数据和 BACs 数据对组装的基因组进行评估,结果显示组装的基因组为高质量基因组。同时与其他发表利用二代测序技术拼接的基因组进行比较,同样说明西瓜基因组组装质量较高(表1)。

西瓜基因组注释及进化

对西瓜基因组进行注释发现,在组装的353.3Mb的区域有159.8Mb为转座重复区域,在这些重复区域中有68.3%可以注释到重复序列家族,此结果也说明在真核生物的基因组中,重复序列占有相当高的比例。同时预测23,440个编码蛋白的基因,另外还预测了123个rRNA,789个tRNA,335个snRNA以及141个MiRNA。

被子植物中基因组重复非常常见,这种基因组重复也见证了现代植物多种倍型。在西瓜的基因组中我们发现了7个大的triplications,这些区域约占基因组的29%(图2)。这种三倍化事件可以追溯到76~130百万年前。为了进一步评估西瓜基因组的进化地位,研究人员通过分析西瓜、黄瓜、甜瓜以及葡萄的基因组,了解它们的系统进化关系,同时进一步分析了葫芦科家族的染色体进化关系(图3),染色体共线关系表明葫芦科植物染色体在进化过程中的复杂性。

评估西瓜基因组的遗传多样性

为了评估西瓜基因组的多样性,研究人员选择了20个具有代表性的西瓜基因组进行重测序,这20个西瓜包括5个东亚的、5个美洲的、6个半野生型的以及4个野生型的。通过重测序共识别了6,784,860个SNPs和965,006个Indels,这些遗传多样性为后续培育新的西瓜品种奠定了基础。

为了进一步分析验证不同品种的远近关系,研究人员对不同品种基因组进行群体结构进化分析(图3)和主成分分析(图4),分析结果表明,C. lanatus subsp. vulgaris和 C. lanatus subsp.Mucosospermus 存在较近的亲缘关系。

西瓜发育的研究

西瓜的发育是个复杂的过程,这个过程包括体积的改变、颜色改变、纹理的改变、糖分的改变以及营养成分的改变等方面。为了研究发育的过程,研究人员对西瓜发育的4个关键时期的瓜皮、瓜肉进行了RNA-seq分析,分别在瓜肉、瓜皮中识别3046和558个异常表达的基因。通过GO分析,这些基因在西瓜发育过程中参与细胞墙的合成、黄酮类代谢等过程,而在瓜肉中,差异基因主要是参与己糖、单糖以及类胡萝卜素的代谢。

糖分含量是影响西瓜品质的重要因素,在注释的西瓜基因组上有62个有关糖代谢的酶,76个糖分转移基因。在西瓜发育中,有13个糖代谢酶和14个糖分转移酶出现异常表达。说明这些酶在西瓜发育过程中占有重要地位。

参考文献

Guo S, Zhang J, Sun H, et al. The draft genome of watermelon (Citrullus lanatus) and resequencingof 20 diverse accessions[J]. Nature genetics, 2013, 45(1): 51-58.