大学教授力挺抄袭,强行洗地到裤衩都不要了,到底图什么?》这篇文章发出来之后,引起大家讨论,有一些小伙伴截了屏给我看。所以我想有必要再讲几句,我这篇文章写两个方面,一方面是重用代码,一方面是文章抄袭,这两方面可以是不相关的,这里的文章抄袭并不特指你抄了代码。

X教授《如何姿势正确的使用他人代码?》,总结起来两个点,一是开源代码随便用,二是文章有引用/致谢就OK。这两个点都是错误的。

Continue reading

连遮羞布都不要,难道这是个一被子的故事?

事情开始于我整理并曝光了西安电子科技大学一个讲师读在职博士期间抄袭了两篇文章,并顺利拿到学位晋升为副教授的故事。

这个故事很精彩

亮点1: 期间发现了一条抄袭链,GOSim被DOSim抄,而DOSim又被HPOSim抄,抄袭者都在文章中把抄来的算法实现当成自己做的东西来介绍。

亮点2: ppiPre抄袭GOSemSim的文章,我跟BMC Systems Biology反馈了,而编辑部竟然各种包庇,最后抄袭者两面三刀,和编辑部黑箱操作,在未告知我的情况下,出来一个洗地的Erratum,把抄袭说成不好意思,忘记引用了。

整个过程连载于以下四篇文章中:

如果想要分享这整个过程,可以分享以下这个汇总的文章:

Continue reading

Galaxy-ChIPseq流程

这篇文章介绍如果把ChIPseeker搬上galaxy,和galaxy上其它软件一起拼成流程,跑一个ChIPseq注释的流程,从fastq文件开始,比对生成bam文件,peak calling生成bed文件,基因组注释,一个完整的流程,这个流程一旦设置好,每次跑都只是点点鼠标就可以了。 本文额外附送:

  1. 如何把R程序变成命令行程序
  2. 如何把命令行程序搬上galaxy (知名的程序都有人搬好,但自己的程序还是需要学一下怎么配置的)

Galaxy可以说是低端生信从业者杀手,如果你的能力只是跑跑流程,galaxy完全可以取代你的工作。

如果你是苦逼的生物研究生,苦于要自己分析数据,不会跑命令行程序,对各种参数表示晕菜,galaxy也是拯救你的神器,如同有个做生信的人在旁边帮助你,参数你点点菜单就可以了,跟程序变运行又可以了,流程自己都可以设计并一键运行。

安装galaxy

  • requirements: python 2.7 and git
  • only three steps

克隆galaxy项目

git clone https://github.com/galaxyproject/galaxy/
cd galaxy
## switch to master branch, stable release
git checkout -b master origin/master

Continue reading

Dear GuangChuangyu,

I’m trying to use the clusterProfiler package for GSE analysis on DGE data obtained from RNAseq. While I can run enrichKEGG, I’m unable to run gseKEGG basically because I don’t know how to obtain an order ranked gene list.

I work on R. I have a dataframe or matrix with gene names, log2 fold change values, pvalues and adjusted pvalues among others.

How can I get the order ranked gene list to feed in gseKEGG?

Moreover what is the more reliable way to obtain functional insight about each sample? enrichKEGG or gseKEGG?

Thank you in advance for your help.

best regards

bruno saubaméa

今天收到一封来自Université Paris Descartes的求助信,这个问题我被问过好多次了,显然很多新手都有这问题,根本不知道该怎么跑GSEA,搞不清GSEA的输入是什么。

Continue reading

薛宇这篇《BMC Systems Biology没有学术不端》写作水平还真是高啊,先来个不拉干的小事情,用了软件没引用,来铺垫并以此对抄袭事情进行定位/定性。再来一堆论据和结论不相关的逻辑来论证,好像很有道理的样子,不明真相(没有读我的4篇连载)的群众很容易就掉坑里了。

首先讲了他和R教授的故事,那只不过是用了工具没引用而已,和抄袭是两码事!试图把抄袭写成与此类似的「忘记引用」!

比方说我给R教授写信,就只是问有没有用我的工具。都是聪明人,话不需要说的那么透,点到为止就得了。那您要问,如果人家不回信或者耍赖说没用呢?很简单,三天不回信我会立马写信杂志社,说作者用了我的东西并且刻意没有引用也没有致谢,态度极其恶劣建议撤稿,并且把我三天前发的信抄给编辑作为证据。

为了把抄袭这种严重的事情与用了工具没引用这种简直太常见且不值一提的小事做类比,薛宇教授是用心良苦啊,把小事给说大了!

这就是牛逼之处,我不得不服,用小事与大事类比,将大事说小!将小事说大,让大事化小于无形中。

有德国学者使用了GOSemSim的代码设计了预测蛋白质相互作用的工具IntScore,发表在2012年的核酸研究上,作者专门写了一节来介绍GO的语义学相似性并且标明引用,所以这篇文章符合学术规范,没有问题。我们再看看DOSim,这篇文章里注明了GO注释的分析使用的是GOSim并且加了引用,所以也没有问题。

这段话很有水平,首先是不对等类比,以2012年NAR的符合学术规范的文章来类比一篇抄袭文章,试图化抄袭于无形中。

我们来看所谓的一节专门介绍和标明引用是怎样的:

Continue reading

Author's picture

Guangchuang Yu

Bioinformatics Professor @ SMU

Bioinformatics Professor

Guangzhou