生物百科  > 所属分类  >  生物信息学   

族错误率

族错误率(英文:Family-wise error rate, FWER)是统计学和多重假设检验中一种严格的多重比较误差控制方法。其定义为:在进行一组(一个“族”)假设检验时,至少出现一个假阳性(即错误地拒绝一个为真的零假设,Ⅰ型错误)的概率。

核心定义与意义

  • 数学定义:FWER = P(V ≥ 1),其中 V 是错误拒绝的假设数量(假阳性数)。

  • 控制目标:确保在整个假设检验族(例如,测试多个基因、多个通路、多个脑区或多次时间点测量)中,做出任何错误发现的总体风险被限制在一个预设的显著性水平 α(通常为0.05)以下。

  • 应用场景:适用于确证性研究,或当假阳性的后果非常严重时,例如:临床关键终点的确认性分析、新药有效性的最终判定、需要高度可靠性的科学研究等。

控制FWER的主要方法

为了将FWER控制在α水平,必须对每个单独检验的p值进行比常规α水平严格得多的校正。

1. 邦弗朗尼校正(英文:Bonferroni correction)

  • 方法:将显著性水平α除以检验的总次数 *m*,作为每个检验的新阈值。即,只有当单个检验的 p值 ≤ α / m 时,才拒绝该假设。

  • 公式:调整后的阈值 = α / m (或等效地,将原始p值乘以 m 后与 α 比较)。

  • 特点

    • 极其保守:控制FWER的简单、通用方法。

    • 无需假设检验间的独立性

    • 统计功效很低:当检验次数 *m* 非常大时(如基因组学中的数万次检验),阈值变得极为严格(如 0.05 / 20000 = 0.0000025),导致很难检测到真实效应(高假阴性率)。

2. 霍尔姆-邦弗朗尼步降法(英文:Holm–Bonferroni method)

  • 方法:一种逐步改进的方法。

    1. 将 *m* 个 p 值从小到大排序。

    2. 从最小的 p 值开始,依次判断:若 p(i)α/(mi+1),则拒绝该假设;一旦某个 p 值不满足条件,则停止,并接受所有剩余假设。

  • 特点

    • 比邦弗朗尼校正功效更高(更宽松),但仍严格控制FWER。

    • 同样不依赖独立性假设

表1:FWER控制方法与FDR控制方法的比较

特征族错误率 控制错误发现率 控制
控制目标至少出现一个假阳性的概率所有发现中假阳性的期望比例
严格程度非常严格相对宽松
统计功效低(尤其在大规模检验中)
适用场景确证性、推断性研究,假阳性后果严重探索性、筛选性研究,可容忍少量假阳性
典型方法邦弗朗尼校正、霍尔姆校正本杰明尼-霍克伯格程序、Storey's q值
输出值经过FWER调整的p值q值(FDR调整后的p值)

在生物信息学中的应用与局限

  • 传统应用:在早期的遗传关联研究和小规模微阵列分析中曾广泛使用。

  • 当前局限:在现代高通量组学研究中(如全基因组关联分析、转录组学),由于同时检验的假设数量(*m*)极其庞大(数万至数百万),使用邦弗朗尼校正等FWER控制方法会导致功效严重不足,几乎无法检测到任何真实信号。因此,在这些领域已基本被错误发现率控制方法取代。

  • 特殊应用:在某些特定情境下仍被使用或作为参考:

    • 全基因组关联研究中定义的“基因组范围显著性”水平(通常为 p < 5×10⁻⁸),其本质是邦弗朗尼校正的变体,旨在控制在全基因组范围内进行数百万次独立SNP检验时的FWER。

    • 在分析预先定义的、数量很少的假设集合(如验证少数几个候选生物标志物)时,可能仍采用FWER控制。

优势与劣势

优势

  • 误差控制最严格:为整个研究结论的可靠性提供了最强保证。

  • 解释简单明确:若将FWER控制在0.05,则研究者可以有95%的置信度认为,所有报告为显著的结果中没有一个是假阳性

劣势

  • 统计功效低:尤其是在大规模多重检验中,为控制整体风险而付出的代价是可能错过许多真实存在的效应(假阴性)。

  • 保守性可能导致生物学发现被遗漏:在探索生命复杂性的研究中,过于严格的标准可能阻碍新知识的发现。

参考文献

  1. Bonferroni, C. E. (1936). Teoria statistica delle classi e calcolo delle probabilità. Pubblicazioni del R Istituto Superiore di Scienze Economiche e Commerciali di Firenze, 8, 3-62. (提出了邦弗朗尼不等式,为校正奠定了基础)

  2. Holm, S. (1979). A simple sequentially rejective multiple test procedure. Scandinavian Journal of Statistics, 6(2), 65-70. (提出了功效更高的霍尔姆步降法)

  3. Shaffer, J. P. (1995). Multiple hypothesis testing. Annual Review of Psychology, 46, 561-584. (对多重假设检验的多种方法,包括FWER控制,进行了全面回顾)

  4. Benjamini, Y., & Hochberg, Y. (1995). Controlling the False Discovery Rate: A Practical and Powerful Approach to Multiple Testing. Journal of the Royal Statistical Society: Series B (Methodological), 57(1), 289–300. (在提出FDR的论文中,也对比并阐述了FWER的局限性,推动了领域范式的转变)

  5. Dudbridge, F., & Gusnanto, A. (2008). Estimation of significance thresholds for genomewide association scans. Genetic Epidemiology, 32(3), 227-234. (讨论了在GWAS中如何确定基因组范围显著性阈值以控制FWER)

附件列表


0

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

如果您认为本词条还有待完善,请 编辑

上一篇 蛋白质组学    下一篇 质谱

关键词

暂无关键词

同义词

暂无同义词