DOSE包引用过百

Disease ontology (DO) annotates human genes in the context of disease. DO is important annotation in translating molecular findings from high-throughput data to clinical relevance. DOSE is an R package providing semantic similarity computations among DO terms and genes which allows biologists to explore the similarities of diseases and of gene functions in disease perspective. Enrichment analyses including hypergeometric model and gene set enrichment analysis are also implemented to support discovering disease associations of high-throughput biological data.

Continue reading

首先基因下游是什么?

我们知道上游很重要啊,因为可能会调控转录,但注释的时候,没有上游这个东西,为什么呢?因为转录起始位点TSS的上下游被定义为promoter,所以啊上游被包括在promoter中,也就没有上游这个category了。

Continue reading

转换UpSet图为ggplot对象

我在2018年4月份的一条推特文,https://twitter.com/guangchuangyu/status/988672880551518210,可以把UpSetR变成ggplot然后可以各种玩,比较我在推特文中所展示的,图上嵌入venn图、使用cowplot拼图等。然而过了大半年,我的pull request并没有被作者接收,也就是说这功能还不存在于官方的版本中。

如果有兴趣的话,应该安装我fork的版本。

devtools::install_github("GuangchuangYu/UpSetR")

Continue reading

(翻)云(覆)雨图

生物狗喜欢画barplot,但毕竟只有均值和标准误差信息量太低,万一有outliers呢?万一不是正态分布呢?所以就吐槽了又吐槽,但大家还是乐此不疲,因为大家都在用,因为很多人只会画barplot,所以产生各种反barplot运动,并呼吁大家使用boxplot,boxplot有四分位数的统计量,可以反应outlier和数据的分布,比barplot高得多了。

然而事情是不断在进化的,我们的手段是要跟上潮流的,现在的潮流就是除了要有统计量,还要有原始数据,甚至于有统计推断,全集中一图中,揭开数据的红盖头,给大家呈现全方位无死角的面貌。

Continue reading

小伙伴发来这个图,问我是不是bug,这真是犯了程序员的社交礼仪。

你如果对一个程序员说,“你的代码有bug。” 他的第一反应是:

  • 1. 你的环境有问题吧
  • 2. 傻逼你会用吗。

如果你委婉地说:“你这个程序和预期的有点不一致,你看看是不是我的使用方法有问题。”

他本能地会想:“操,是不是出bug了!”

这显然不是bug,这是绝大多数人对ggplot2的误解,他们认为用xlimylim是放置一个窗口去看你的图,然而在ggplot2是限定一个窗口去过滤你的数据,并重新画图!你的数据被过滤了!如果是放置窗口在图上,一条线从A到B,如果B在窗口之外,那么线被截断了,你看到半条线,但如果是过滤数据呢?B不复存在,那么线条A到B也不复存在,没有B,A到B的线画不出来。就是这样,所以这绝逼不是bug,而是程序员本能反应的第二种情况,你用错了。

那么怎么样不过滤数据,而只是设置可视化窗口呢?你基本上很少看到有人这么用,因为几乎99%的人都只知道xlimylim,一般人我也不告诉他,快点拿去小抄把下面的代码记录一下。

Continue reading

王八拳编程及其它

什么是王八拳

王八拳是四肢生物,包括人类天生会的一种本能打斗方式,男女都会,老少皆宜。 – 百度百科

显然从定义上来看,这是一套在人类存在以前早已有之的古拳法,当然做为人类我们还是希望找到人类创始的起源,给人类找一点体面。

据(百度百科)说,有三种可疑的起源说法:

  • 起源一:王朔的《看上去很美》中学会的一种中国古拳法。这种拳一般流行于幼儿园中,打这种拳,讲究的是打拳的小朋友眼睛紧闭,双拳握紧,两条胳膊以肩为圆心,向前乱轮圆圈,远里看就象乌龟爬坡爬不上去乱蹬的那个样子。这种拳一般不以击中目标为目的,主要是以一种盲目的抡拳动作在气势上威吓对你有攻击企图的小朋友。而如果打拳者在使出这种拳法的时候拌以大声的哭叫,更可以极大的增加威吓对方的力量。
  • 起源二:一夫多妻制的中国农村妇女发明的一种古拳法,起源于于公元前5世纪,具有广泛的妇女基础,王八拳吸取了猴、狗、猪诸拳种之长,把形意拳的手法、手型、步型、步法、腿法、平衡、跳跃等动作规格化。它的特点是姿势绝不优美,动作绝不快捷,出手阴,跳得低,蹦得不远。它的内容包括挠、掐、咬三种动作,还有一定数量的击打敌人下三路的跳跃、跌仆、滚翻动作。长拳在技术上有八点要求:①姿势。头正,颈直,沉肩,挺胸,直腰,敛臀,上肢舒展、挺拔,下肢稳定、匀称。②动作。在做踢、打、摔、拿等技击动作时,起止点、路线、力点都要清晰。
  • 起源三:巴塞罗那奥运会前,朱时茂和陈佩斯的表演的著名小品中,“陈小二”以一轮凶残猛烈的正反王八拳与当时的“拳王”朱时茂战成平手,并相约巴塞罗那再战。也正是因为这经典的一战,王八拳才被百姓所熟知。

Continue reading

生信界的网红Stephen Turner在github上有个msigdf的包,我在他写这个包的时候,就写了个gist,连接clusterProfiler,我写gist的时候是2016年的8月,很高兴网红还惦记着我的gist

msigdf这个包把著名的Broad Institute著名的Molecular Signatures Database (MSigDB)数据以data frame的形式打包成R包,这样子非常方便使用,当然他后来没有更新,而一个fork的版本,ToledoEM/msigdf把数据更新为最新版本v6.2,发布于2018年7月。

Continue reading

Author's picture

Guangchuang Yu

a senior-in-age-but-not-senior-in-knowledge bioinformatician

Postdoc researcher

Hong Kong