之前有写过读文献的文章,也介绍了如何获取文献,那是我还在读硕士的时候写的,覆盖了找文献、文献管理、下载文献、订阅期刊等方方面面,说到下文献,最大的神器当然是sci-hub,但是sci-hub的域名sci-hub.cc, sci-hub.bz, sci-hub.io纷纷都沦陷,最近国内有一神器geenmedical,整合了影响因子、引用数等指标,然而这一神器的下文献功能只是提供外链,有一种说法是geenmedical=pubmed+scihub,当然geenmedical的资源还可能来自于百度学术、researchGate等,不都是来自于sci-hub,然而我们必须承认的是最大的文献提供来源必须还得是sci-hub,所以如果sci-hub挂了,基于sci-hub的神器也就神奇不起来了。如果有人跟你说忘记sci-hub吧,用geenmedical,那绝对是标题党!这里并没有说geenmedical不好,它整合了多方面的资源并且本地化得非常好,很适合国内使用。

比如我在geenmedical里搜clusterProfiler,给出的下载链接第一个就是sci-hub的:http://doi.org.sci-hub.cc/10.1089/omi.2011.0118,然而这个链接是不可用的!当然它给出了比如百度学术的链接是可以下载到文献的。然而还是那句话,论「海盗精神」我只服sci-hub,虽然我之前也介绍了《sci-hub如果挂了,你还有神器下文献吗?》,但任何下文献的神器,在sci-hub面前都是渣渣。

Continue reading

Scientific Report上有一篇文章是抄袭的,然而杂志最终决定不撤稿,而被抄的人是Johns Hopkins的,于是jh的人全都要离开Scientific Report的编委。我也被人抄了不撤稿,然而我人微言轻,不单被编辑部欺负,还要被我们国内生信界的网红欺负。

SR与jh的事情,我和BMC的故事,是相似的,我们可以想像这样的学术界惨剧比想像中的要多。学术圈,真是有时候得呵呵哒。

Continue reading

在很久很久以前,当我还在用perl的时候,有一个TGen-EUtils的perl模块,可以去爬PubMed,我喜欢用它来画所谓的pubmed趋势,比如说我在2012年的时候,就画了各个组学技术的pubmed趋势,通过每一年的文章发表量来看某个技术到底火不火,走势怎么样。

当年microarray还特别猛,但显然可以看到二代测序必须要火,也可以看到proteomics在吹了几年牛B之后,有回落的趋势。

Continue reading

请用事实怼我

在《你昨天才做的分析,可能是几年前的结果!》这篇文章的开头,我吐槽了WEGO+华大(虽然文章是转载自《嘉因生物》,但这段是我给自己加的戏码,广告后面才是原帖内容 -,-)。

这只不过是我任性了一番,因为华大的拥护者来骂人了,我真的不理解,如果我说错了,你们可以拿事实啪啪啪地打我脸的,为什么要骂人,所以我任性地再吐一口口水。

这里我必须承认,我说错了,华大用的WEGO不是那在线版的09年以后就不更新的WEGO,09年人的注释不超过7000个,华大给的报告有12929个(BP),当然也不是最新的,目前org.Hs.eg.db中GO的数据源是2017-03-29, BP的注释有16992个,比华大多了1/3,所以《你昨天才做的分析,可能是几年前的结果!》这篇文章要吐槽的依然对,谁知道差这1/3会发生什么呢。

> (16992-12929)/12929
[1] 0.3142548

Continue reading

做为生物狗,我时常不知道自己在干什么,包括读文献,费了老大劲读一篇文献,然后经常也不明白人家在说什么。懒人需要借助神器,本公众号已经介绍了好几个神器,江湖传说收集7大神器,可以召唤出paper,渡自己毕业。

拿到一篇文献,先问一句,牛逼吗?靠谱吗?

我拿ARID1A去pubmed搜,第一篇文章《ARID1A-mutated ovarian cancers depend on HDAC6 activity》为例,2017年7月24号才上线的文章,请看下图:

IMPACT这里有期刊的影响因子20分,文章在社交网站上传播指数Altmetric 54分,文章在文献管理Mendeley中被收藏2次。这是3天前的文章,所以指数还不高,试想一下,文章传播越广,收藏人数越多,必定也就越重要,这给了我们评估文章的第一印象。这是3天前的文章,所以没有引用,如果有文章引用,这个神器还会列出来呢。

注意到AUTHORS没有?如果作者有ORCID主页的话,直接链接过去,我们可以去看作者们的publication列表、教育背景、工作经历等信息,牛人为自己带盐,牛人的文章我们更愿意相信。

Continue reading

we’re talking about people who already are skating on the ethical edge (as scientists, we should always respond to serious criticism; if we don’t, that’s bordering on ethical violation already) – Andrew Gelman对此事的评论

我原以为邓岳是个学生,我的本意是要给他一个教训,制止这种行为,我不出来给他这个教训,早晚他也会为自己的投机付出代价,而且如果以后出现多次抄袭,直接会导致无法继续在学术界生存。后来我发现他还是个讲师,我觉得更不应该了,编辑部必须要对这件事做出处罚。这就是我的本意,让邓岳认识到错误,并为此付出应有的代价。

搞得我像祥林嫂一样到处找人说

然而编辑一直不做为,就逼得我只能借助于舆论,我本无意于去网上传播这件事,我写的博客,都是针对编辑部,最后我对编辑提议的处理方式表达不满之后,编辑就消失了,再也不回应邮件。我只能再写博客,再发动舆论,联系之前高调出来说撤稿了43篇文章的那些编辑,推特上也骚扰他们。微博上也AT西电官方微博,求转发之类的。虽然我没有想去闹大事情(尼马我也不想花时间扯这些蛋啊),但BMC就是逼着我跟他斗,而事情闹越大,对抄袭的人来说,越是不利,搞不好学术界就不用混了。谁都不傻,所以终于坐不住给我写信。

其中说到“1、2月份和您邮件沟通”,只是说了按照CRAN policy改了代码,并把我列为作者,而后面我回应把我名字从软件包作者中去掉而已。

他的邮件大概讲了和编辑并无操作,软件包已经按要求更新,犯错是源自于无知。

这事最后怎么处理?

Continue reading

50%的利润,它就铤而走险;

100%的利润,它就敢践踏一切人间法律;

300%的利润,它就敢犯任何罪行,甚至绞首的危险.

–马克思 《资本论》

ppiPre抄袭GOSemSim,然后我发现他还发了一个叫HPOSim的R包,又是语义相似性度量,我的第一反应是必须还抄我的,他要是有能力写出来,就不会抄GOSemSim了。然而我看了一下代码,确实不是抄我的!这他妈就奇了怪了!

必须还是抄的!

做语义相似性度量也就那么几个包,我看了一遍之后,发现HPOSim抄了DOSim,你妹啊,用心良苦,同样/相似的东西换不同的包来抄!抄袭惯犯了,事实证明,走捷径的人,是不可能好好走路的,一旦尝到了甜头,必然是铤而走险!

以下两个截屏,大家感受一下,左边是HPOSim,右边是DOSim:

Continue reading

Author's picture

Guangchuang Yu

a senior-in-age-but-not-senior-in-knowledge bioinformatician

Postdoc researcher

Hong Kong