生物百科  > 所属分类  >  统计学   

标准误

1. 概述
标准误(Standard Error, SE)是样本统计学中的一个概念,用于衡量样本统计量(如样本均值)相对于总体参数的变异程度。标准误反映了抽样分布(Sampling Distribution)的波动性,即若重复抽样多次,每次计算的样本均值如何围绕总体均值波动。标准误越小,说明样本均值对总体均值的估计越精确。

2. 计算公式
标准误的计算公式取决于不同的统计量,最常见的是样本均值的标准误(Standard Error of the Mean, SEM):

SE=snSE = \frac{s}{\sqrt{n}}

其中,
ss 为样本标准差(Sample Standard Deviation),
nn 为样本数量(1⁺)。

对于总体标准误,如果总体标准差 σ\sigma 已知,则计算公式为:

SE=σnSE = \frac{\sigma}{\sqrt{n}}

标准误也可以推广到其他统计量,例如:

  • 比例的标准误(Standard Error of Proportion):

    SEp=p(1p)nSE_p = \sqrt{\frac{p(1-p)}{n}}

    其中,pp 为样本比例。

  • 回归系数的标准误(Standard Error of Regression Coefficient):用于回归分析,计算公式较为复杂,涉及协方差矩阵。

3. 发展历史
标准误的概念来源于抽样理论,最早由罗纳德·费舍尔(Ronald A. Fisher)在统计推断和方差分析(ANOVA)中系统化(2⁺)。

4. 计算方法
计算标准误通常采用以下步骤:

  1. 计算样本的标准差 ss
  2. 计算样本数量 nn
  3. 用标准差除以样本平方根得到标准误。

5. 性质

  1. 样本量对标准误的影响:样本量 nn 增加时,标准误减小,即更大的样本可以提供更精确的估计。

  2. 与标准差的关系:标准误是标准差的调整版本,标准差衡量单个数据点的离散程度,而标准误衡量样本均值的稳定性。

  3. 与置信区间的关系:标准误用于构造置信区间,例如 95% 置信区间通常为

    Xˉ±1.96×SE\bar{X} \pm 1.96 \times SE

    其中,1.961.96 为正态分布下的临界值(3⁺)。

6. 应用领域
标准误在多个领域有重要应用,包括:

  1. 统计推断:用于估计总体均值的置信区间和假设检验。
  2. 回归分析:用于衡量回归系数的置信度。
  3. 医学研究:用于衡量实验数据的稳定性,例如药物试验的均值误差。
  4. 经济学:用于评估不同经济指标的可靠性。

7. 相关概念

  1. 标准差(Standard Deviation, SD):衡量单个数据点的变异程度,而标准误衡量样本均值的稳定性。
  2. 置信区间(Confidence Interval, CI):由标准误推导出的总体参数估计范围。
  3. t 分布:当样本量较小时(n<30n < 30),使用 t 分布计算标准误相关的统计推断。

参考文献
(1)Fisher, R. A. (1925). Statistical Methods for Research Workers. Edinburgh: Oliver & Boyd.
(2)Snedecor, G. W., & Cochran, W. G. (1989). Statistical Methods (8th ed.). Iowa State University Press.
(3)Montgomery, D. C. (2017). Design and Analysis of Experiments (9th ed.). Wiley.

附件列表


0

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

如果您认为本词条还有待完善,请 编辑

上一篇 标准差    下一篇 统计方法

关键词

暂无关键词

同义词

暂无同义词