一、样本容量

mark

研究不同个体的表达量,样本容量(Sample size):N=3

mark

研究不同个体的表达量,样本容量(Sample size):N=3

技术重复只能告诉我们该测量基因表达的方法准确性,并不会反应个体间的区别。

mark

研究一个方法的准确性,样本容量(Sample size):N=4

二、有效样本容量

mark

假设,蓝色小人是一对双胞胎,他们有着高度相似的基因组,但很明显又是两个不同的个体。那么现在不能简单的用样本容量,需要用到有效样本容量来评价。

假设,双胞胎的相关性为0.7,有效样本容量公式:

mark

代入数值,发现相关性高,有效样本容量就会很小,也就是说,两个高相似度的样本更能看做是一个样本:

mark

计算上面的样本容量:N=3.18

假设一个很低的相关性 0.1,代入计算,会发现更接近2,更像两个样本:

mark

这种情况下,样本容量:N=3.82

致谢:

https://www.youtube.com/channel/UCtYLUTtgS3k1Fg4y5tAhLbw