真菌群体重测序解析裂殖酵母进化

2015-12-15    编辑:诺禾致源
真菌群体重测序解析

2015年3月的Nature Genetics报道了伦敦大学
对裂殖酵母基因型及表型的多样性研究;
该研究精心取材、样本珍贵,且数据分析全面深入,
为科研领域提供了真菌群体重测序数据挖掘的范本。

研究背景

裂殖酵母(Schizosaccharomyces pombe)是真核生物研究中的重要模式生物,但对其进化历史缺乏系统的研究。研究人员汇集了100年内收集到的161株野生裂殖酵母,通过重测序的手段,多角度深入挖掘了酵母的进化相关信息,特别是在地理分布、驯化起源、及表型关联方面获得了突破性的进展。

研究方法

取    材

100年时间内收集到的161株野生裂殖酵母菌株

建    库

小片段文库

测    序

PE54/PE100测序 ≥30 X

信息分析

SNP及InDel检测,基因型多样性分析、重组及连锁不平衡分析、群体结构分析、进化及起源节点估计、全基因组关联分析。

研究亮点

研究对象关注度高,材料珍贵完备,研究角度多样化,解决了裂殖酵母地理传播、起源时间、表性关联等重要问题,展示如下:

主成分分析
明确变异信息与地理信息的相关性

主成分分析(Principal Component Analysis,PCA)是采用线性变换从多个变量中筛选出少量重要变量的一种多元统计分析方法。通过大量样品变异信息的主成分分析,可以了解不同采样地域之间变异信息的相似性,从中寻找变异和地理信息的关系。
以752个非连锁的SNP位点基因型信息为基础进行PCA分析,结果显示,裂殖酵母的变异基因型和采样的地理位置不存在强相关性。

真菌采样地点分布(左)与基于变异位点的PCA分析(右)

图1  真菌采样地点分布(左)与基于变异位点的PCA分析(右)

真菌进化模型(左上)、采样时间与进化距离的关系(右上)及可能的起源时间(下)

图2  真菌进化模型(左上)、采样时间与进化距离的关系(右上)及可能的起源时间(下)

进化分析
追踪起源时间

进化分析是依据基因序列、SNP、SSR等分子标记,利用数学模型构建样品之间进化关系的方法。由于一定时间范围内,菌株的变异发生率相对稳定,我们可以借助分支之间的变异程度,反推菌株的分化和起源时间。
研究利用了SNP作为标记,结合采样的时间,推测出酵母菌可能的驯化起源。根据推算得到的裂殖酵母预期驯化起源时间,大致和希腊文明、汉文明等古文明时期相吻合。

全基因组关联分析
基因型与表型的对应关系

基因型是表型的基础,基于全基因组变异位点信息,和样品的表型信息,我们可以进行一系列关联分析,找到具体变异和基因组之间的关联关系,从而获得基因型和表型的对应关系。从细胞形态、不同介质的生长特性等223个性状中,发现89个性状与具体的变异信息存在显著关联。

性状关联位点显著性指标(上、中)及其在染色体上的分布(下)

图3  性状关联位点显著性指标(上、中)及其在染色体上的分布(下)

讨  论

依托大规模真菌样本的重测序和进化研究,是了解真菌进化史、传播规律,区分真菌的致病机制,解读真菌基因型与表型间关联的有效手段。这篇裂殖酵母群体研究的文章,作为优秀的真菌群体研究范本,对于真菌大规模测序数据挖掘,有着重要的指导意义。

阅读原文>>