Guangchuang Yu

a senior-in-age-but-not-senior-in-knowledge bioinformatician

Bootstrap Method

Jul 31, 2009 - 1 minute read - Comments statistics

bootstrap是对观测数据集进行有放回(replacement)的随机抽样,以评估总体的各项统计指标。可以用于假设检验、参数估计。好处是并不要求大样本,也不要求正态数据,并且对于不同的统计指标使用的是同样的计算方法。结果也更为可靠,坏处是计算量大。

统计推断(statistical inference)是基于样本统计值的抽样分布来计算的,抽样分布需要从总体中许多的样本来计算,在只有一个样本的情况下,bootstrap对这一随机样本进行有放回的重复抽样,每一个重抽样本与原始随机样本一样大,每次计算相应的抽样的统计值,重复了N次之后,就可以计算统计值的bootstrap分布。

下面做一个小小的试验:

a <- c(seq(1:10), rnorm(50))  

#创建一个样本,60个数据,非正态分布的,如下图

博客转WordPress

Sep 30, 2008 - 1 minute read - Comments Blog

找了一个叫博客备份软件的小工具,备份了新浪和ChinaUnix上的blog,导出为RSS 2.0, sina的blog导出没问题,但是cu的blog导出后,文不对题.狂汗啊… 但是生成的xml文件导入到wordpress里不成功.需要改一下才行.

从导出的xml文件里,把<description><![CDATA[替换成<content:encoded><![CDATA[

相应地把]]></description>替换成]]></content:encoded>

通过局域网在linux下使用windows的程序

Sep 22, 2008 - 1 minute read - Comments LinuxWindows

用了好多年linux,现在用windows越来越少了,但是还是得用。没办法,上taobao买个东西,上网银都得用ie,有时候还得用office等其它一些软件。

实验室里有台机子是做文件服务的,装的是windows 2003 server。之前使用rdesktop远程桌面,最近发现配合seamlessrdp可以让rdesktop实现更好的效果,运行windows程序,就像linux中原生程序一样。。

> [下载
> seamlessrdp.zip](http://www.cendio.se/files/thinlinc/seamlessrdp/seamlessrdp.zip)
> 解压丢在C盘。

在linux下运行这样的指令

> rdesktop -A -s "c:\\seamlessrdp/seamlessrdpshell.exe C:\\Program
> Files\\Internet Explorer\\iexplore.exe" ip:3389 -u administrator -p
> password

就可以在linux下运行服务器端的ie了。windows下所有程序都没问题。

从概率的角度看 如何告别单身

Aug 26, 2008 - 1 minute read - Comments Statistics

国家人口统计男人比女人多了3700万,在大学校园里更是流传着“我很丑,可是我很抢手”(女生版)、“我很帅,可是我很无奈”(男生版)。

鉴于大龄猥琐男越来越盛行,以及小平同志说“让一部分人先恋起来嘛” 今日从科学的角度,让大家明白如何告别单身。 授人与鱼不如授人与渔。即使没能让你奔小康,起码也解决温饱~~~

告别单身的不二法则,三个字,“厚脸皮”,详见下面分析

如果一个男人追一个女人,成功的概率只有0.2, 那么连续追6个,至少有一个成功的概率,高达0.74

> 1-0.8^6
[1] 0.737856

如果连续追7个的话,至少一个成功的概率将达到0.79

> 1-0.8^7
[1] 0.7902848

如果你不是特别差,成功的概率假如是0.3,那么连续追几个的成功概率将更高。。

> 1-0.7^6
[1] 0.882351
> 1-0.7^7
[1] 0.9176457

GOSemSim

Aug 11, 2008 - 1 minute read - Comments Bioinformatics

第一次写软件包,计算基因和GO的语义相似性。

实现Wang的方法,基于GO的图结构。 以及四种基于信息含量的计算方法(Resnik, Jiang, Lin, Rel)。

可以从Bioconductor下载到。 http://bioconductor.org/packages/release/bioc/html/GOSemSim.html http://bioconductor.org/packages/devel/bioc/html/GOSemSim.html

支持human, rat, mouse, fly, yeast, zebrafish,worm, E coli, arabidopsis等物种。