顶[0] 分享评论[0] 编辑

生物学重复

核心概念与定义编辑本段

生物学重复是实验设计的基石，其关键特征如下：

ADFASDFAF23RQ23R

独立性：每个重复样本必须来自不同的、独立的生物实体（如不同小鼠、不同培养批次细胞、不同植物、不同人体捐献者）。
平行性：所有生物学重复在实验处理、培养条件、取样时间点等关键因素上应尽可能保持平行和一致。
目的：用于评估由生物个体差异（英文：Biological variation）引起的变异，这些差异可能源于遗传背景、年龄、生理状态、环境暴露的微小差别等。

在实验设计中，必须明确区分生物学重复与其他类型的重复：

ADSFAEQWER353423413434

表1：生物学重复与技术重复、实验重复的对比 ADSFAEQWER353423413434

类型	定义	目的	举例
生物学重复	对来自不同生物个体的样本进行独立测量。	估计生物群体的自然变异，检验处理效应是否具有普遍性，进行可靠的统计推断。	从5只不同小鼠（遗传背景相同但非克隆）身上分别采集肝脏组织进行RNA测序。
技术重复	对同一个生物样本进行多次技术测量。	评估实验技术或仪器的精密度和噪声，降低测量误差。	将同一份提取的RNA样本分成3份，分别建库、上机测序。
实验重复	在不同时间、由不同操作者独立地重复整个实验过程（包含新的生物学重复）。	验证实验结果的可再现性，是科学发现的最高级别验证。	另一名研究员在另一实验室，用新购买的小鼠和试剂，重复整个实验。

在基因组学、转录组学、蛋白质组学等高通量实验中，生物学重复具有不可替代的关键作用：

ADFASDFAF23RQ23R

可靠估计组内变异：这是进行任何统计假设检验（如t检验、方差分析、差异表达分析）的前提。只有通过生物学重复，才能量化处理组或对照组内部的自然波动范围。
提高统计检验效能：足够的生物学重复能增加统计功效（英文：Statistical power），即更有可能检测到真实存在的生物学差异（如基因表达变化），降低假阴性率。
验证发现的普遍性：如果某个效应（如基因上调）在多个独立的生物学重复中 consistently 出现，那么该发现就更可能代表该生物群体的普遍规律，而非个别动物的异常。
区分生物变异与技术变异：通过结合生物学重复和技术重复，可以解构数据中的总变异来源，更准确地建模和分析数据。

基本原则：每个实验条件（如对照组、处理组）下至少需要3个生物学重复，这是进行基本统计分析和方差估计的最低要求。更多的重复（如5-10个或更多）能提供更稳健的结果，尤其在生物个体变异较大时。
样本量估算：在设计实验前，可使用功效分析（英文：Power analysis）工具，基于预期的效应大小、可接受的误差率和变异度初步估计，来估算所需的生物学重复数量。
避免“假重复”：例如，从同一只动物的不同部位取样（如肿瘤组织的三个不同位置）是技术重复或伪重复，因为它们反映的是空间异质性，而非个体间变异。它们不能替代来自不同动物的生物学重复。

生物学重复的数据是下游统计分析的基础：

ADFASDFAF23RQ23R

差异表达分析（英文：Differential expression analysis）：工具如DESeq2、edgeR、limma正是利用生物学重复提供的变异信息，来可靠地估计基因表达差异的显著性。
统计建模：线性或广义线性模型将每个样本视为一个独立的数据点，其残差包含了生物变异的信息。
批次效应校正：当生物学重复分在不同实验批次中时，需使用统计方法（如ComBat、limma的removeBatchEffect）来校正批次效应，以分离出真正的生物信号。

Blainey, P., Krzywinski, M., & Altman, N. (2014). Replication. Nature Methods, 11(9), 879–880.
The ENCODE Project Consortium. (2012). An integrated encyclopedia of DNA elements in the human genome. Nature, 489(7414), 57–74.
Schurch, N. J., et al. (2016). How many biological replicates are needed in an RNA-seq experiment and which differential expression tool should you use? RNA, 22(6), 839-851.
Vaux, D. L., Fidler, F., & Cumming, G. (2012). Replicates and repeats—what is the difference and is it significant? EMBO Reports, 13(4), 291–296.
Love, M. I., Huber, W., & Anders, S. (2014). Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology, 15(12), 550.
Fang, Z., & Cui, X. (2011). Design and validation issues in RNA-seq experiments. Briefings in Bioinformatics, 12(3), 280-287.
Hurlbert, S. H. (1984). Pseudoreplication and the design of ecological field experiments. Ecological Monographs, 54(2), 187-211.
李金明. (2019). 临床基因检测中生物学重复的重要性及质控策略. 中华检验医学杂志, 42(5), 327-331.
王曦, 肖华胜. (2014). 高通量测序技术实验设计中的重复原则. 遗传, 36(7), 680-686.