SOAP3:超快的基于GPU的短片段并行比对工具

2013-03-14    编辑:诺禾致源
       2012年8月,继新一代测序技术数据分析软件包SOAP(包括短序列比对软件SOAP、SOAP2、多态性识别软件SOAPsnp、基因组组装软件SOAPdenovo等)之后,研究团队又发表了基于图形处理器(Graphic Processing Unit,GPU)的短序列片段比对工具,相关论文发表在BIOINFORMATICS上。


       SOPA3的核心引擎来源于SOAP2,针对GPU架构改进了部分数据结构,实现了GPU版本的Burrows-Wheeler Transform(BWT)算法。SOAP3可高效地同时利用GPU与多核CPU进行加速。与其前身SOAP2相比,在允许错配碱基个数为1、2、3的情况下,可分别获得10倍、22倍和40倍的加速。当允许3个错配时,SOAP3可在46秒内将100万个长度为100bp(base pair)的序列比对到人类基因组上;而在允许2个错配的情况下,时间可以缩短到15秒。


       SOPA3的创新性主要来自两个方面:1. 重新设计BWT引擎所使用的部分数据结构来合并内存访问,以此减少内存访问次数,缩短内存访问时间;2. 引入基于模式匹配的特定参数,使得程序可以在运行时,暂缓处理产生过多不同分支的步骤,从而减少因GPU的单指令多线程特性造成的处理器闲置。

论文链接:http://bioinformatics.oxfordjournals.org/content/28/6/878.short