生物行•生命百科  > 所属分类  >  生物统计学   

族错误率

目录

核心定义与意义编辑本段

  • 数学定义:FWER = P(V ≥ 1),其中 V 是错误拒绝的假设数量(假阳性数)。 ADFASDFAF23RQ23R

  • 控制目标:确保在整个假设检验族(例如,测试多个基因、多个通路、多个脑区或多次时间点测量)中,做出任何错误发现的总体风险被限制在一个预设的显著性水平 α(通常为0.05)以下。

    ADSFAEQWER353423413434

  • 应用场景:适用于确证性研究,或当假阳性的后果非常严重时,例如:临床关键终点的确认性分析、新药有效性的最终判定、需要高度可靠性的科学研究等。

    ADSFAEQWER353423413434

控制FWER的主要方法编辑本段

为了将FWER控制在α水平,必须对每个单独检验的p值进行比常规α水平严格得多的校正。

ADFASDFAF23RQ23R

1. 邦弗朗尼校正(Bonferroni correction)

  • 方法:将显著性水平α除以检验的总次数 m,作为每个检验的新阈值。即,只有当单个检验的 p值 ≤ α / m 时,才拒绝该假设。

    ADFASDFAF23RQ23R

  • 公式:调整后的阈值 = α / m (或等效地,将原始p值乘以 m 后与 α 比较)。

    ADSFAEQWER353423413434

  • 特点ADFASDFAF23RQ23R

    • 极其保守:控制FWER的简单、通用方法。 ADSFAEQWER353423413434

    • 无需假设检验间的独立性ADFASDFAF23RQ23R

    • 统计功效很低:当检验次数 m 非常大时(如基因组学中的数万次检验),阈值变得极为严格(如 0.05 / 20000 = 0.0000025),导致很难检测到真实效应(高假阴性率)。 ADFASDFAF23RQ23R

2. 霍尔姆-邦弗朗尼步降法(Holm–Bonferroni method)

  • 方法:一种逐步改进的方法。

    ADFASDFAF23RQ23R

    1. 将 m 个 p 值从小到大排序。 ADSFAEQWER353423413434

    2. 从最小的 p 值开始,依次判断:若 p(i) ≤ α / (m - i + 1),则拒绝该假设;一旦某个 p 值不满足条件,则停止,并接受所有剩余假设。 ADSFAEQWER353423413434

  • 特点ADFASDFAF23RQ23R

    • 比邦弗朗尼校正功效更高(更宽松),但仍严格控制FWER。

      ADFASDFAF23RQ23R

    • 同样不依赖独立性假设 ADSFAEQWER353423413434

表1:FWER控制方法与FDR控制方法的比较

ADFASDFAF23RQ23R

特征族错误率 控制错误发现率 控制
控制目标至少出现一个假阳性的概率所有发现中假阳性的期望比例
严格程度非常严格相对宽松
统计功效低(尤其在大规模检验中)
适用场景确证性、推断性研究,假阳性后果严重探索性、筛选性研究,可容忍少量假阳性
典型方法邦弗朗尼校正、霍尔姆校正本杰明尼-霍克伯格程序、Storey's q值
输出值经过FWER调整的p值q值(FDR调整后的p值)

在生物信息学中的应用与局限编辑本段

  • 传统应用:在早期的遗传关联研究和小规模微阵列分析中曾广泛使用。

    ADFASDFAF23RQ23R

  • 当前局限:在现代高通量组学研究中(如全基因组关联分析转录组学),由于同时检验的假设数量(m)极其庞大(数万至数百万),使用邦弗朗尼校正等FWER控制方法会导致功效严重不足,几乎无法检测到任何真实信号。因此,在这些领域已基本被错误发现率控制方法取代。 ADSFAEQWER353423413434

  • 特殊应用:在某些特定情境下仍被使用或作为参考:

    ADSFAEQWER353423413434

    • 基因组关联研究中定义的“基因组范围显著性”水平(通常为 p < 5×10⁻⁸),其本质是邦弗朗尼校正的变体,旨在控制在全基因组范围内进行数百万次独立SNP检验时的FWER。 ADSFAEQWER353423413434

    • 在分析预先定义的、数量很少的假设集合(如验证少数几个候选生物标志物)时,可能仍采用FWER控制。

      ADSFAEQWER353423413434

优势与劣势编辑本段

优势

  • 误差控制最严格:为整个研究结论的可靠性提供了最强保证。

    ADFASDFAF23RQ23R

  • 解释简单明确:若将FWER控制在0.05,则研究者可以有95%的置信度认为,所有报告为显著的结果中没有一个是假阳性

    ADSFAEQWER353423413434

劣势

  • 统计功效低:尤其是在大规模多重检验中,为控制整体风险而付出的代价是可能错过许多真实存在的效应(假阴性)。

    ADSFAEQWER353423413434

  • 保守性可能导致生物学发现被遗漏:在探索生命复杂性的研究中,过于严格的标准可能阻碍新知识的发现。 ADFASDFAF23RQ23R

参考资料编辑本段

  • Bonferroni, C. E. (1936). Teoria statistica delle classi e calcolo delle probabilità. Pubblicazioni del R Istituto Superiore di Scienze Economiche e Commerciali di Firenze, 8, 3-62.
  • Holm, S. (1979). A simple sequentially rejective multiple test procedure. Scandinavian Journal of Statistics, 6(2), 65-70.
  • Shaffer, J. P. (1995). Multiple hypothesis testing. Annual Review of Psychology, 46, 561-584.
  • Benjamini, Y., & Hochberg, Y. (1995). Controlling the False Discovery Rate: A Practical and Powerful Approach to Multiple Testing. Journal of the Royal Statistical Society: Series B (Methodological), 57(1), 289-300.
  • Dudbridge, F., & Gusnanto, A. (2008). Estimation of significance thresholds for genomewide association scans. Genetic Epidemiology, 32(3), 227-234.
  • 方积乾. (2008). 生物统计学. 北京: 中国统计出版社.
  • Hochberg, Y., & Tamhane, A. C. (1987). Multiple Comparison Procedures. New York: Wiley.
  • Westfall, P. H., & Young, S. S. (1993). Resampling-Based Multiple Testing: Examples and Methods for p-Value Adjustment. New York: Wiley.

附件列表


0

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

如果您认为本词条还有待完善,请 编辑

上一篇 生物学重复    下一篇 统计显著性