很多人会有这样一个问题,差异基因一大堆,到底该选那个来做下游的实验验证?这个问题,说白了是个基因「重要性」的打分问题,你做差异基因分析的时候,就可以看做是个打分的过程,p值是你的统计量,p值越小,打分越高,然而所有的打分都是辅助帮我们进一步缩小范围而已,并不是打分越高就越「重要」,如果打分可以说明一切,那么我们就不需要实验验证了。所以像差异基因分析,我们一般是卡p < 0.01或p < 0.05来过滤,把p值小的基因留下来,但我们并不能说p值最小的基因就是最重要的。

回到开头的问题,我们要的是对打分(差异分析)结果再利用别的手段,再一次进行打分,进一步缩小范围。比如你可以通过构建相互作用网络,通过分析betweenness,找hub分子。当然打分不一定是要基于基因/蛋白水平,也可以是通路水平,比如你可以用clusterProfiler进行富集分析,然后把你的目标限定在某个/些通路上。反正就是各种手段一起上,直到你能够限定到少量几个基因上,对于做实验验证的人来说,再好不过。

上一周发表的《GOSemSim: GO语义相似性度量》,我记录了GOSemSim包被应用于各种各样的场景,它当然也可以拿来给基因/蛋白质打分。比如你用clusterProfiler分析后,就想验证某一通路,但不知道要选这个通路的哪个基因来做为切入点。

首先问一个问题,同一通路上的基因功能相似性高吗?大家可能会潜意识地认为应该比较高,这不一定的,基因/蛋白有直接或间接的相互作用,但这种相互作用可能只是「月上柳梢头,人约黄昏后」而已,可能偶尔才来一发,这种属于约会型。一个基因/蛋白通常会参与到多条不同的通路中,如果两个蛋白在不同的通路中经常一起出现,那么它们的功能相似性才会高,这种属于基友/闺蜜的死党型。今天就来讲一讲到底谁和谁在约会,谁和谁又是死党。

Y Han, G Yu, H Sarioglu, A Caballero-Martinez, F Schlott, M Ueffing, H Haase, C Peschel, AM Krackhardt. Proteomic investigation of the interactome of FMNL1 in hematopoietic cells unveils a role in calcium-dependent membrane plasticity. Journal of Proteomics. 2013, 78:72-82.

这篇文章是和慕尼黑工业大学(Technische Universität München)合作的一篇文章,使用了Co-IP去拉蛋白,再用LC-MS/MS进行鉴定,Co-IP是鉴定蛋白相互作用的常用手段,当然拉下来的蛋白不见得就是有真实的相互作用,它甚至于可能只是背景污染而已,所以我们需要对拉下来的蛋白进行打分,找出一些可能性比较高的候选蛋白进一步进行验证。

Continue reading

![](http://guangchuangyu.github.io/blog_images/R/ppipre/Screenshot 2017-11-10 00.10.22.png)

Scientific Report上有一篇文章是抄袭的,然而杂志最终决定不撤稿,而被抄的人是Johns Hopkins的,于是jh的人全都要离开Scientific Report的编委。我也被人抄了不撤稿,然而我人微言轻,不单被编辑部欺负,还要被我们国内生信界的网红欺负。

SR与jh的事情,我和BMC的故事,是相似的,我们可以想像这样的学术界惨剧比想像中的要多。学术圈,真是有时候得呵呵哒。

Continue reading

My friend who doing his PhD study at Johns Hopkins just send me the link about a SR paper of plagiarism. I have very similar experence of a paper published on BMC Systems Biology, which plagiarized my work and the editor just decided to publish an erratum.

Deng etc. published an R package, ppiPre, that copied source code of my package, GOSemSim, and pretended that they developed these algorithms by themselves in their paper.

Here is the screenshot of the source code (left: ppiPre, right: GOSemSim).

![](https://guangchuangyu.github.io/blog_images/screenshots/Screenshot 2017-07-17 19.43.51.png)

You can find out more on my blog post.

As a developer of several open source software, I am glad that someone find my source code useful and happy if someone use my source code to make something better. But I am not happy if someone copies my source code by removing author information and changing function names to pretend the code was developed by himself. The situation is even worse in academic. Taking someone else’s works and passing it off as one’s own is definitely plagiarism and not allow in academic.

Continue reading

大学教授力挺抄袭,强行洗地到裤衩都不要了,到底图什么?》这篇文章发出来之后,引起大家讨论,有一些小伙伴截了屏给我看。所以我想有必要再讲几句,我这篇文章写两个方面,一方面是重用代码,一方面是文章抄袭,这两方面可以是不相关的,这里的文章抄袭并不特指你抄了代码。

X教授《如何姿势正确的使用他人代码?》,总结起来两个点,一是开源代码随便用,二是文章有引用/致谢就OK。这两个点都是错误的。

Continue reading

we’re talking about people who already are skating on the ethical edge (as scientists, we should always respond to serious criticism; if we don’t, that’s bordering on ethical violation already) – Andrew Gelman对此事的评论

我原以为邓岳是个学生,我的本意是要给他一个教训,制止这种行为,我不出来给他这个教训,早晚他也会为自己的投机付出代价,而且如果以后出现多次抄袭,直接会导致无法继续在学术界生存。后来我发现他还是个讲师,我觉得更不应该了,编辑部必须要对这件事做出处罚。这就是我的本意,让邓岳认识到错误,并为此付出应有的代价。

搞得我像祥林嫂一样到处找人说

然而编辑一直不做为,就逼得我只能借助于舆论,我本无意于去网上传播这件事,我写的博客,都是针对编辑部,最后我对编辑提议的处理方式表达不满之后,编辑就消失了,再也不回应邮件。我只能再写博客,再发动舆论,联系之前高调出来说撤稿了43篇文章的那些编辑,推特上也骚扰他们。微博上也AT西电官方微博,求转发之类的。虽然我没有想去闹大事情(尼马我也不想花时间扯这些蛋啊),但BMC就是逼着我跟他斗,而事情闹越大,对抄袭的人来说,越是不利,搞不好学术界就不用混了。谁都不傻,所以终于坐不住给我写信。

其中说到“1、2月份和您邮件沟通”,只是说了按照CRAN policy改了代码,并把我列为作者,而后面我回应把我名字从软件包作者中去掉而已。

他的邮件大概讲了和编辑并无操作,软件包已经按要求更新,犯错是源自于无知。

这事最后怎么处理?

Continue reading

50%的利润,它就铤而走险;

100%的利润,它就敢践踏一切人间法律;

300%的利润,它就敢犯任何罪行,甚至绞首的危险.

–马克思 《资本论》

ppiPre抄袭GOSemSim,然后我发现他还发了一个叫HPOSim的R包,又是语义相似性度量,我的第一反应是必须还抄我的,他要是有能力写出来,就不会抄GOSemSim了。然而我看了一下代码,确实不是抄我的!这他妈就奇了怪了!

必须还是抄的!

做语义相似性度量也就那么几个包,我看了一遍之后,发现HPOSim抄了DOSim,你妹啊,用心良苦,同样/相似的东西换不同的包来抄!抄袭惯犯了,事实证明,走捷径的人,是不可能好好走路的,一旦尝到了甜头,必然是铤而走险!

以下两个截屏,大家感受一下,左边是HPOSim,右边是DOSim:

Continue reading

抄袭的是西安电子科技大学的讲师,靠着两三篇抄袭的文章,已经是副教授了。

这种抄袭的事情就应该暴光,这个事件中,更可恶的是BMC,BMC这种保护抄袭的行为更应该暴光,大家不要再给BMC送钱了,还不如发PLoS One。

公众号有人评论说:

这竟然也被捕捉到了,确实他在2012年的时候,就在copy我的代码,然后打R包的时候,还请教了我:

抄了我的代码,之后厚颜无耻地感谢我说学了很多东西,他的良心真的不会痛吗?

Continue reading

Author's picture

Guangchuang Yu

Bioinformatics Professor @ SMU

Bioinformatics Professor

Guangzhou