人类疾病基因组测序数据分析之Burden analysis

2017-03-16    编辑:诺禾致源
Burden analysis定义

中文可翻译为负荷检验,对于复杂疾病研究的传统的关联分析都是基于位点的case-control法,寻找疾病组和正常对照组之间存在显著性频率差异的位点。而Burden analysis作为一种统计算法,则是将位于某一基因(或是和某一代谢途径相关的基因组区域,或是任意指定的某一基因组区域)内的变异位点放在一起考虑,将其作为一个整体,与性状进行关联分析。

Burden analysis的应用

之前基于芯片的GWAS研究是基于常见疾病—常见变异(common disease common variants)假说,现在基于二代测序的关联分析研究重点关注常见疾病—稀有变异(common disease rare variants);因为稀有变异的频率低(小于1%),需要使用基于基因的Burden analysis来增加统计功效。此外,常见疾病致病基因异质性问题远远超出了我们的想象,为了在有限范围内捕捉到目标基因,基于代谢通路或基因组区段的Burden analysis更有助于复杂疾病的研究。

Burden analysis的优势

本次升级亮点即为增加基于基因的Burden analysis,利用Fisher's exact test和SKAT统计方法。结果展示如下:

1. 整合P-value的excel(表1)
2. Heatmap图展示(图1)
3. 通过以上分析得到的候选基因可以进行如下分析

a 富集分析,包括KEGG富集分析和GO富集分析(图2)
b 蛋白网络互作(PPI)(图3)

参考文献

[1] Ware J S,Li J, Mazaika E, et al. Shared Genetic Predisposition in Peripartum and Dilated Cardiomyopathies[J]. New England Journal of Medicine, 2016, 374(3): 233-241.
[2] Cirulli E T, Lasseigne B N, Petrovski S, et al. Exome sequencing in amyotrophic lateralsclerosis identifies risk genes and pathways[J]. Science, 2015, 347(6229):1436-1441.
[3] Akinrinade O, Ollila L, Vattulainen S, et al. Genetics and genotype–phenotype correlations in Finnish patients with dilated cardiomyopathy[J]. European heart journal,2015, 36(34): 2327-2337.
[4] Do R, Stitziel N O, Won H H, et al. Exome sequencing identifies rare LDLR and APOA5 alleles conferring risk for myocardial infarction[J]. Nature, 2015,518(7537): 102-106.
[5] Tang H, Jin X, Li Y, et al. A large-scale screen for coding variants predisposing topsoriasis[J]. Nature genetics, 2014, 46(1): 45-50.