[bootstrap](http://en.wikipedia.org/wiki/Bootstrapping_(statistics))是对观测数据集进行有放回(replacement)的随机抽样,以评估总体的各项统计指标。可以用于假设检验、参数估计。好处是并不要求大样本,也不要求正态数据,并且对于不同的统计指标使用的是同样的计算方法。结果也更为可靠,坏处是计算量大。

统计推断(statistical inference)是基于样本统计值的抽样分布来计算的,抽样分布需要从总体中许多的样本来计算,在只有一个样本的情况下,bootstrap对这一随机样本进行有放回的重复抽样,每一个重抽样本与原始随机样本一样大,每次计算相应的抽样的统计值,重复了N次之后,就可以计算统计值的bootstrap分布。

下面做一个小小的试验:

a <- c(seq(1:10), rnorm(50))  

#创建一个样本,60个数据,非正态分布的,如下图

Continue reading

国家人口统计男人比女人多了3700万,在大学校园里更是流传着“我很丑,可是我很抢手”(女生版)、“我很帅,可是我很无奈”(男生版)。

鉴于大龄猥琐男越来越盛行,以及小平同志说“让一部分人先恋起来嘛” 今日从科学的角度,让大家明白如何告别单身。 授人与鱼不如授人与渔。即使没能让你奔小康,起码也解决温饱~~~

告别单身的不二法则,三个字,“厚脸皮”,详见下面分析

如果一个男人追一个女人,成功的概率只有0.2, 那么连续追6个,至少有一个成功的概率,高达0.74

> 1-0.8^6
[1] 0.737856

如果连续追7个的话,至少一个成功的概率将达到0.79

> 1-0.8^7
[1] 0.7902848

如果你不是特别差,成功的概率假如是0.3,那么连续追几个的成功概率将更高。。

> 1-0.7^6
[1] 0.882351
> 1-0.7^7
[1] 0.9176457

Continue reading

Author's picture

Guangchuang Yu

Bioinformatics Professor @ SMU

Bioinformatics Professor

Guangzhou