全基因组关联分析研究芝麻油脂产量和品质

2016-01-08    编辑:诺禾致源
全基因组测序解析胰腺发育不全致病原因

研究简介

芝麻为二倍体,基因组较小,共有27,148个注释基因,
且重复序列所占比例较低(28.5%),是油脂相关性状研究的理想作物。
中国农业科学院油料研究所张秀荣研究员带领的团队在前期完成芝麻基因组测序的基础上,
在国际上率先构建了高密度芝麻单倍型图谱;
并对重要农艺性状进行了全基因组关联分析,获得大量关联位点和候选基因。
该研究成果发表于2015年10月19日的Nature Communications(IF: 11.47)。

研究方法

取    材

筛选全世界29个国家的705份芝麻资源,其中405份为国内传统地方品种,95份为国内栽培种,另205份收集于28个其他国家以及地区,基本涵盖了芝麻的四大种植区域

建    库

每个品系选择一株进行DNA提取,构建300 bp文库

测    序

Illumina HiSeq 2500,平均测序深度2.6 X

研究结果

1. 变异检测结果

通过对705份材料进行全基因组重测序,共挖掘到5,407,981个SNP,平均50 bp有一个SNP。经分析发现,其中有254,781个非同义突变的SNP,分别位于24,089个基因上。

2. 群体分层分析结果

系统进化树和主成分分析将芝麻分为两个亚群(蓝色表示亚洲北部地区,红色表示亚洲南部地区),而芝麻的起源一般认为是亚洲南部,北方地区的芝麻品种的产生应该是源于光周期和气候的长期选择(图1)。
Fst分析的结果表明两个亚群间的差异较小,平均为0.02(图2)。LD分析的结果显示当LD衰减到一半时,其衰减距离为88Kb。

 群体遗传多样性分析结果

图1   群体遗传多样性分析结果

3. 全基因组关联分析结果

对油脂和产量相关的56个重要农艺性状进行了全基因组关联分析,其中包括芝麻叶柄颜色、花唇色、开花期、含油量、脂肪酸的11个组分以及芝麻产量相关性状等,总共获得关联位点549个,候选基因46个(图3上)。

3.1 对芝麻含油量的遗传分析发现: 芝麻含油量不仅受油脂代谢酶类调控,还受到其他基因调控,如受到种皮颜色控制基因(SiPPO)和木质素合成基因(SiNST1)影响(图3下)。

3.2 对芝麻种子脂肪酸成分的关联分析发现: 脂肪酸代谢关键基因KASIDGATFATAFATBSAD等,初步解析了芝麻油脂代谢调控网络。研究还发现芝麻一系列产量相关基因,这些基因的优异等位基因的积累是芝麻育成品种产量较地方种高的重要影响因素。

选择消除分析结果

图2   选择消除分析结果

芝麻含油量性状的全基因组关联分析结果

图3   芝麻含油量性状的全基因组关联分析结果

阅读原文>>