很多人会有这样一个问题,差异基因一大堆,到底该选那个来做下游的实验验证?这个问题,说白了是个基因「重要性」的打分问题,你做差异基因分析的时候,就可以看做是个打分的过程,p值是你的统计量,p值越小,打分越高,然而所有的打分都是辅助帮我们进一步缩小范围而已,并不是打分越高就越「重要」,如果打分可以说明一切,那么我们就不需要实验验证了。所以像差异基因分析,我们一般是卡p < 0.01或p < 0.05来过滤,把p值小的基因留下来,但我们并不能说p值最小的基因就是最重要的。

回到开头的问题,我们要的是对打分(差异分析)结果再利用别的手段,再一次进行打分,进一步缩小范围。比如你可以通过构建相互作用网络,通过分析betweenness,找hub分子。当然打分不一定是要基于基因/蛋白水平,也可以是通路水平,比如你可以用clusterProfiler进行富集分析,然后把你的目标限定在某个/些通路上。反正就是各种手段一起上,直到你能够限定到少量几个基因上,对于做实验验证的人来说,再好不过。

上一周发表的《GOSemSim: GO语义相似性度量》,我记录了GOSemSim包被应用于各种各样的场景,它当然也可以拿来给基因/蛋白质打分。比如你用clusterProfiler分析后,就想验证某一通路,但不知道要选这个通路的哪个基因来做为切入点。

首先问一个问题,同一通路上的基因功能相似性高吗?大家可能会潜意识地认为应该比较高,这不一定的,基因/蛋白有直接或间接的相互作用,但这种相互作用可能只是「月上柳梢头,人约黄昏后」而已,可能偶尔才来一发,这种属于约会型。一个基因/蛋白通常会参与到多条不同的通路中,如果两个蛋白在不同的通路中经常一起出现,那么它们的功能相似性才会高,这种属于基友/闺蜜的死党型。今天就来讲一讲到底谁和谁在约会,谁和谁又是死党。

Y Han, G Yu, H Sarioglu, A Caballero-Martinez, F Schlott, M Ueffing, H Haase, C Peschel, AM Krackhardt. Proteomic investigation of the interactome of FMNL1 in hematopoietic cells unveils a role in calcium-dependent membrane plasticity. Journal of Proteomics. 2013, 78:72-82.

这篇文章是和慕尼黑工业大学(Technische Universität München)合作的一篇文章,使用了Co-IP去拉蛋白,再用LC-MS/MS进行鉴定,Co-IP是鉴定蛋白相互作用的常用手段,当然拉下来的蛋白不见得就是有真实的相互作用,它甚至于可能只是背景污染而已,所以我们需要对拉下来的蛋白进行打分,找出一些可能性比较高的候选蛋白进一步进行验证。

Continue reading

Scientific Report上有一篇文章是抄袭的,然而杂志最终决定不撤稿,而被抄的人是Johns Hopkins的,于是jh的人全都要离开Scientific Report的编委。我也被人抄了不撤稿,然而我人微言轻,不单被编辑部欺负,还要被我们国内生信界的网红欺负。

SR与jh的事情,我和BMC的故事,是相似的,我们可以想像这样的学术界惨剧比想像中的要多。学术圈,真是有时候得呵呵哒。

Continue reading

大学教授力挺抄袭,强行洗地到裤衩都不要了,到底图什么?》这篇文章发出来之后,引起大家讨论,有一些小伙伴截了屏给我看。所以我想有必要再讲几句,我这篇文章写两个方面,一方面是重用代码,一方面是文章抄袭,这两方面可以是不相关的,这里的文章抄袭并不特指你抄了代码。

X教授《如何姿势正确的使用他人代码?》,总结起来两个点,一是开源代码随便用,二是文章有引用/致谢就OK。这两个点都是错误的。

Continue reading

we’re talking about people who already are skating on the ethical edge (as scientists, we should always respond to serious criticism; if we don’t, that’s bordering on ethical violation already) – Andrew Gelman对此事的评论

我原以为邓岳是个学生,我的本意是要给他一个教训,制止这种行为,我不出来给他这个教训,早晚他也会为自己的投机付出代价,而且如果以后出现多次抄袭,直接会导致无法继续在学术界生存。后来我发现他还是个讲师,我觉得更不应该了,编辑部必须要对这件事做出处罚。这就是我的本意,让邓岳认识到错误,并为此付出应有的代价。

搞得我像祥林嫂一样到处找人说

然而编辑一直不做为,就逼得我只能借助于舆论,我本无意于去网上传播这件事,我写的博客,都是针对编辑部,最后我对编辑提议的处理方式表达不满之后,编辑就消失了,再也不回应邮件。我只能再写博客,再发动舆论,联系之前高调出来说撤稿了43篇文章的那些编辑,推特上也骚扰他们。微博上也AT西电官方微博,求转发之类的。虽然我没有想去闹大事情(尼马我也不想花时间扯这些蛋啊),但BMC就是逼着我跟他斗,而事情闹越大,对抄袭的人来说,越是不利,搞不好学术界就不用混了。谁都不傻,所以终于坐不住给我写信。

其中说到“1、2月份和您邮件沟通”,只是说了按照CRAN policy改了代码,并把我列为作者,而后面我回应把我名字从软件包作者中去掉而已。

他的邮件大概讲了和编辑并无操作,软件包已经按要求更新,犯错是源自于无知。

这事最后怎么处理?

Continue reading

50%的利润,它就铤而走险;

100%的利润,它就敢践踏一切人间法律;

300%的利润,它就敢犯任何罪行,甚至绞首的危险.

–马克思 《资本论》

ppiPre抄袭GOSemSim,然后我发现他还发了一个叫HPOSim的R包,又是语义相似性度量,我的第一反应是必须还抄我的,他要是有能力写出来,就不会抄GOSemSim了。然而我看了一下代码,确实不是抄我的!这他妈就奇了怪了!

必须还是抄的!

做语义相似性度量也就那么几个包,我看了一遍之后,发现HPOSim抄了DOSim,你妹啊,用心良苦,同样/相似的东西换不同的包来抄!抄袭惯犯了,事实证明,走捷径的人,是不可能好好走路的,一旦尝到了甜头,必然是铤而走险!

以下两个截屏,大家感受一下,左边是HPOSim,右边是DOSim:

Continue reading

抄袭的是西安电子科技大学的讲师,靠着两三篇抄袭的文章,已经是副教授了。

这种抄袭的事情就应该暴光,这个事件中,更可恶的是BMC,BMC这种保护抄袭的行为更应该暴光,大家不要再给BMC送钱了,还不如发PLoS One。

公众号有人评论说:

这竟然也被捕捉到了,确实他在2012年的时候,就在copy我的代码,然后打R包的时候,还请教了我:

抄了我的代码,之后厚颜无耻地感谢我说学了很多东西,他的良心真的不会痛吗?

Continue reading

编辑部的恶才是最大的恶!

大家是否还记得2015年BioMed Central高调地撤稿了43篇文章,站在道德制高点对审稿过程进行了指责,吐了学术不端一脸口水?

就在这个时候,我写信去BMC Systems Biology告别人抄袭,编辑部信誓旦旦,他们对这种事情是非常认真对待的,然而接下来的剧情却反转了,在我证据甩他们一脸的时候,他们拖着不处理,拖多久呢,超过1年!一直在给抄袭者洗地,最好在没有告知我的情况下,静悄悄地出了个所谓的erratum

erratum是什么?字典里这样写:

erratum |ɛˈrɑːtəm|
noun (pl.errata |ɛˈrɑːtə| )
an error in printing or writing.

我告的是抄袭,plagiarism:

plagiarism |ˈpleɪdʒərɪz(ə)m|
noun [ mass noun ]
the practice of taking someone else's work or ideas and passing them off as one's own. 

结果plagiarism到了编辑部那里变成了erratum.

Continue reading

Author's picture

Guangchuang Yu

a senior-in-age-but-not-senior-in-knowledge bioinformatician

Postdoc researcher

Hong Kong