ggplot2的一个坑

今天以ggplot2的一个坑来说一下,坑无处不在,防不胜防,你大可以试一下下面的代码:

> set.seed(123)
> require(ggplot2)
Loading required package: ggplot2
> rnorm(3)
[1]  0.8005543  1.1902066 -1.6895557
> set.seed(123)
> rnorm(3)
[1] -0.5604756 -0.2301775  1.5587083

在两次set.seed和rnorm之间,第一次因为加载了ggplot2,结果就不一样了!这必须是第二次是正确答案,也就是说加载ggplot2把你的seed给吃了!加载包会改变R环境?这绝对不是好主意,我们来试试加载别的包试试,比如我的clusterProfiler:

Continue reading

PubMed停更?

今天学术圈刷屏的是美国政府关门,pubmed停更,有些标题党说成了美国政府破产,又说得好像中国人的科研也要跟着放假似的,还一堆人疯传,似乎暗示着pubmed也关门,而且没有pubmed会死一样。所以我感觉有必要普及一下姿势,毕竟吃瓜的人群基数太大。

Holy shit what a fucking disaster, pubmed is such an amazing resource, unbelievable the US would let it waste away. What an embarrassment of a country.

气愤归气愤,但标题党甚至于跑偏了就不可取了。无非只是停更,也就是说文章该发的照样发,只是暂时不会被收录进pubmed而已,也就是说pubmed照常用,只不过搜不到最新的文献,如果说这样就可以去放大假了,那么似乎如果不停更,你看多了几篇新文献,就能够发paper,迎娶白富美了?而看少了这最新的文献,就秒变科研屌丝,可以回家睡大觉了?

The website continues to work. The shutdown will be over in a few days and everything will go back to normal. You can also use Google Scholar, Web of Science, and Scopus.

事实上,pubmed只是一个搜文献的数据库,它停更,文章照发,而大家可以通过别的途径去获得,如果你只有这一条途径,那么你做科研也确实少了点B数。上面提到的google scholar很多人可能上不去(梯子在这里),而Scopus是要收费的。然后途径是很多的,

Continue reading

之前的《如何获取文献》介绍了方方面面,不单单是下载文献,而对于下载文献,scihub必须是首选,虽然我们有备选方案《sci-hub如果挂了,你还有神器下文献吗?》,但总是没scihub爽,之前介绍了用洋葱链接,《再不用担心打不开sci-hub了 听说你也在读文献》,在写这篇文章的时候,我还测试了一下,现在依然可用!

目前挂掉的scihub镜像已经很多,导致很多人认为scihub没法用了,其实还有很多的镜像是可以用的,当然能用的,以后也可能会挂,但新的镜像我相信还是会不断出现的,大家且行且珍惜吧。

Continue reading

画一只恐龙

大家是否还记得我的《webinar录播 (2017-10-24):plotting tree + data》,这可以说是R画图最好的课程,PPT也分享给大家《ggtree直播PPT第一部分》和《ggtree直播PPT第二部分》。

我在PPT中,用了meme,发现没有R包可以做,于是我写了一个R包来做这个事情。

后来又写一个R包来实现字体的阴影效果:

Continue reading

最近似乎就oncotarget是否要被SCI踢出来这事情,真真假假的报道挺多。以我的观点来看,它被踢是正常的;它不被踢也迟早要被踢!就像当年它的影响因子还在7点多的时候,我就预言oncotarget药丸一样,结果就直接掉到5点多,然后关于神刊的报道就开始多了起来。

话说我在某高校工作的时候,有一个同事,他跳槽了!跳槽前各种暗渡陈仓,压着文章不发表,蓄谋已久的事情,然后就在跳槽的当年,可能为了掩饰,当年还继续招生,结果当然坑惨了那一届的学生,当然前面两三届也惨,因为数据压着不发表。

虽然离职前和旧单位签了协议,数据是在旧单位做的,发表文章旧单位必须是通讯作者,仅此而已,反正都是他通讯,挂两单位而已嘛,这在学术界再正常不过。此人去了新单位之后,本来该发文章了,原来的学生干了几年,也该给人一个authorship了,然而他把新单位的领导放在了第一作者,自己当了通讯,原来的学生嘛,见鬼去了,其他作者多半是他的新同事/学生。当然通讯也没挂原单位,对于没有社会契约精神的人来说,协议就是一张废纸。

Continue reading

使用新姿势玩KEGG

有小伙伴说他要用gage这个包,因为可以选择sigmet这个index,然后得到的结果只有signaling and metabolic pathways,而不会有他不关心的disease pathways。然而也有各种不爽,他最喜欢的还是clusterProfiler,但没办法只做某些pathways。

我发现大家对clusterProfiler有各种误解,各种觉得没办法,我也很无语啊,明明我写了大量的文档,你们偏不看。clusterProfiler啥都可以做,你想做COG,domain这些没有内置支持的富集分析都可以的,因为clusterProfiler是通用的分析工具,啥都能做。

说到gage的pathway index,这其实是他们对pathway有个分类,这个数据就在https://pathview.uncc.edu/data/khier.tsv可以下载到,要支持他还不容易,但我不喜欢把别人的东西打包在自己的包里,所谓走别人的路,让别人无路可走,这可不是什么好主意。所以呢,我不会内置支持的,你们自己玩。

Continue reading

画个小圈圈

之前我发表读书笔记《主成分分析

这可能是你见过最好看的PCA图了,有人在「宏基因组」群里问有没有什么包可以画?像这种提问,我以前是吐槽过的,请猛击《如何画类似MEME的注释序列》,当然说什么都没用,大家就是喜欢凡事问有包吗?因为包治百病嘛,不信你送个包给你女票试试!

jimmy回答说ggbiplot可以画差不多的,于是「宏基因组」公众号立刻就出来一篇《ggbiplot-最好看的PCA作图:样品PCA散点+分组椭圆+变量贡献与相关》,后面又有人提问,能不能加两个置信区间?@Chenhao童鞋就给出了解决方案,并且写了篇博客文介绍.

他的作图是基于ggord包,只能应用于LDA,于是「宏基因组」公众号又跟进发一篇《比PCA更好用的监督排序—LDA分析、作图及添加置信-ggord》,你会发现他们介绍同一类型的作图,一会这个包,一会那个包,一会某包有A功能,某包又有B功能,我就不说什么了。

Continue reading

Author's picture

Guangchuang Yu

Bioinformatics Professor @ SMU

Bioinformatics Professor

Guangzhou