做为生物狗,我时常不知道自己在干什么,包括读文献,费了老大劲读一篇文献,然后经常也不明白人家在说什么。懒人需要借助神器,本公众号已经介绍了好几个神器,江湖传说收集7大神器,可以召唤出paper,渡自己毕业。

拿到一篇文献,先问一句,牛逼吗?靠谱吗?

我拿ARID1A去pubmed搜,第一篇文章《ARID1A-mutated ovarian cancers depend on HDAC6 activity》为例,2017年7月24号才上线的文章,请看下图:

IMPACT这里有期刊的影响因子20分,文章在社交网站上传播指数Altmetric 54分,文章在文献管理Mendeley中被收藏2次。这是3天前的文章,所以指数还不高,试想一下,文章传播越广,收藏人数越多,必定也就越重要,这给了我们评估文章的第一印象。这是3天前的文章,所以没有引用,如果有文章引用,这个神器还会列出来呢。

注意到AUTHORS没有?如果作者有ORCID主页的话,直接链接过去,我们可以去看作者们的publication列表、教育背景、工作经历等信息,牛人为自己带盐,牛人的文章我们更愿意相信。


Continue reading

模式生物做什么都简单,非模式生物则很多缺少注释,没有注释你就没法做,只能是借助于各种软件比如blastgo,自己跑电子注释。但今天要讲的不是这种情况,很多物种还是有注释的,只是你有时候不知道该去那里下载,或者你有数据,却不知道该怎么用!很多的软件都是针对模式生物的,或者针对某一些类型的非模式生物,能够支持多种非模式生物,能够支持用户自己的注释文件的软件相对来讲,就非常少有了,然而clusterProfiler就是这类少有的软件之一。

获得OrgDb

今天要讲的是通过OrgDb来做GO分析,这是clusterProfiler的enrichGO函数所支持的背景注释,Bioconductor自带20个OrgDb可供使用,多半是模式生物,难道我们要做的物种不在这20个里面就不行了吗?显然不是的,clusterProfiler能支持的物种我自己都数不过来。

我们可以通过AnnotationHub在线检索并抓取OrgDb,比如这里以玉米为例:


Continue reading

听说你想学R

先来点八卦

当年学R的时候,并没有现在这么多的书籍,老用户一般都知道丁国徽,因为他翻译了诸如《R导论》之类的文档,属于最早的中文材料了。跟生物狗有关的中文书有两本,一本是《R语言及Bioconductor在基因组分析中的应用》,这本我在2006年的时候看过,被坑大发了,里面逻辑混乱、错误满篇。

以下这段豆瓣书评可以说很好的总结了这本书 https://book.douban.com/review/3017404/#comments:

首先,打开前言,读者们会发现“编写本书,参加这些工作的教师和研究生有15人之多”。当然,名字后面带头衔的最后都在出现在封面了。也就是说由12位”无名的岳武穆“研究生同学造就了3名”有名的岳武穆“之砖家叫兽。

然后,本书共24章,模12为零,当然,这只是一个巧合,只是暗合天命罢了。

最搞笑的就是这本书的编排和审校,十分差,许多小错误,就好像从没有审过一样。

譬如第13页上,对order()函数的介绍,居然有这么句绕口令“x[order(x)]等效于order(x)“,当然其实等效的是 sort(x).

其他的诸如第17页上>=的打印错误,就不一一细表了。

最搞笑的就是只有三页的第4章,在数组、函数的介绍之前,就开始讲“聚集计算”!!!然后再来讲解语言基本的语法。。。。 这种“由深入浅,化简单为复杂,化复杂为天书”之功力,更让吾辈叹服砖家叫兽吞云吐雾之神功。

作为一本实例讲解的书,根本就没有提供源码和实例样本,也就说,根本就是没头没脑的演示。有点专业精神好么,好歹也是本标价68的书,当然只有400页草纸, 本科生水平的语言文档翻译。


Continue reading

we’re talking about people who already are skating on the ethical edge (as scientists, we should always respond to serious criticism; if we don’t, that’s bordering on ethical violation already) – Andrew Gelman对此事的评论

我原以为邓岳是个学生,我的本意是要给他一个教训,制止这种行为,我不出来给他这个教训,早晚他也会为自己的投机付出代价,而且如果以后出现多次抄袭,直接会导致无法继续在学术界生存。后来我发现他还是个讲师,我觉得更不应该了,编辑部必须要对这件事做出处罚。这就是我的本意,让邓岳认识到错误,并为此付出应有的代价。

搞得我像祥林嫂一样到处找人说

然而编辑一直不做为,就逼得我只能借助于舆论,我本无意于去网上传播这件事,我写的博客,都是针对编辑部,最后我对编辑提议的处理方式表达不满之后,编辑就消失了,再也不回应邮件。我只能再写博客,再发动舆论,联系之前高调出来说撤稿了43篇文章的那些编辑,推特上也骚扰他们。微博上也AT西电官方微博,求转发之类的。虽然我没有想去闹大事情(尼马我也不想花时间扯这些蛋啊),但BMC就是逼着我跟他斗,而事情闹越大,对抄袭的人来说,越是不利,搞不好学术界就不用混了。谁都不傻,所以终于坐不住给我写信。

其中说到“1、2月份和您邮件沟通”,只是说了按照CRAN policy改了代码,并把我列为作者,而后面我回应把我名字从软件包作者中去掉而已。

他的邮件大概讲了和编辑并无操作,软件包已经按要求更新,犯错是源自于无知。

这事最后怎么处理?


Continue reading

50%的利润,它就铤而走险;

100%的利润,它就敢践踏一切人间法律;

300%的利润,它就敢犯任何罪行,甚至绞首的危险.

–马克思 《资本论》

ppiPre抄袭GOSemSim,然后我发现他还发了一个叫HPOSim的R包,又是语义相似性度量,我的第一反应是必须还抄我的,他要是有能力写出来,就不会抄GOSemSim了。然而我看了一下代码,确实不是抄我的!这他妈就奇了怪了!

必须还是抄的!

做语义相似性度量也就那么几个包,我看了一遍之后,发现HPOSim抄了DOSim,你妹啊,用心良苦,同样/相似的东西换不同的包来抄!抄袭惯犯了,事实证明,走捷径的人,是不可能好好走路的,一旦尝到了甜头,必然是铤而走险!

以下两个截屏,大家感受一下,左边是HPOSim,右边是DOSim:


Continue reading

抄袭的是西安电子科技大学的讲师,靠着两三篇抄袭的文章,已经是副教授了。

这种抄袭的事情就应该暴光,这个事件中,更可恶的是BMC,BMC这种保护抄袭的行为更应该暴光,大家不要再给BMC送钱了,还不如发PLoS One。

公众号有人评论说:

这竟然也被捕捉到了,确实他在2012年的时候,就在copy我的代码,然后打R包的时候,还请教了我:

抄了我的代码,之后厚颜无耻地感谢我说学了很多东西,他的良心真的不会痛吗?


Continue reading

Author's picture

Guangchuang Yu

a senior-in-age-but-not-senior-in-knowledge bioinformatician

Postdoc researcher

Hong Kong