好端端的一篇文章,因为用了DAVID,在PubPeer上就被吐槽了:

群众纷纷表示我的包靠谱,希望我能够用我的包来再跑一篇,看看差距:

下图是之前《why clusterProfiler fails》一文中的评论,非常感谢大家的喜爱和推荐!

以下结果是两年前重新分析的结果,现在如果再分析的话,结果又会稍有不同。点击阅读原文,直达github上的代码和报告。


GO (BP) 分析

clusterProfiler可以注释到194个基因,DAVID是168,DAVID报出14个富集的BP terms,而clusterProfiler报出222个,所以DAVID报出来的,clusterProfiler也有。富集的结果都是和翻译、蛋白合成有关,两个结果比较一致,clusterProfiler有大量比较结节性的信息出来,而DAVID只报出很general的terms。

KEGG

DAVID的背景注释是5085个基因,clusterProfiler的注释是6895。DAVID能够注释到83个基因,而clusterProfiler能够注释到104个基因,DAVID富集到1个通路,而clusterProfiler富集到9个通路。

Reactome

另外我用了ReactomePA跑了一下,发现了3个功能簇,两个和GO/KEGG是一致的,都是和翻译有关,当然ReactomePA给出更清楚的线索,就是和高可变剪切有关。另外一个是免疫响应,没有在KEGG和GO分析中发现,当然也没有在文章中报导出来,但免疫响应和高可变剪切是有关系的,显然结合ReactomePA可以给出更全面的信息,能够发现额外的线索。

Citation

Yu G, Wang L, Han Y and He Q*. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 2012, 16(5):284-287.