BioGuider生命百科  > 所属分类  >  心理学   

信度

目录

信度概述编辑本段

信度系指测验结果的一致性、稳定性及可靠性,一般多以内部一致性来加以表示该测验信度的高低。信度系数愈高即表示该测验的结果愈一致、稳定与可靠。系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的,因此不会造成不一致性。反之,随机误差可能导致不一致性,从而降低信度。信度可以定义为随机误差R影响测量值的程度。如果R=0,就认为测量是完全可信的,信度最高。

评介方法编辑本段

一般通过使用同一量表进行不同测量,分析各测量结果之间联系的方法来评价信度。如果联系密切,各测量结果具有一致性,则认为量表是可信的。评介信度的方法主要有:重测信度、复本信度、内部一致性方法。

重测信度

用同样的量表,对同一组访问对象在尽可能相同的情况下,在不同的时间进行两次测量。两次测量相距一般在两到四周之间。用两次测量结果间的相关分析或差异的显著性检验方法,可以评价量表信度的高低。结果越是相关,差异越不显著则信度越高。重测法存在一些问题:结果与时间间隔关系密切,间隔越长,信度越低;最初的测量可能会改变被测特征;重复测量有时是不可能的;第一次测量的答案可能会对以后测量有影响;两次测量之间的有利信息可能改变态度;再测信度的相关系数可能因项目自身相关而偏高。

复本信度(替换形式信度)

用两个形式不同的等价量表,对同一组受访者在不同的时间(通常间隔两到四周)进行测量。两次测量结果间的相关性被用来评价量表的信度。该方法存在两个主要问题:构造等价的量表既费时又花钱;很难构造出完全等价的量表。两个量表在内容上应该等价,具有相同的均值、方差和相关性,但即使这些条件满足,仍可能出现内容不等价。低相关可能是量表信度不够或形式不等价造成的。

内部一致信度

内部一致信度用于评价累加量表的信度。在这种量表中,各个测量项目的得分被累加以得到一个总分,每个项目都测量整个量表所要测量对象的某个方面,项目之间就它们各自的特征而言应该是一致的。内部一致信度强调一组测量项目内部的一致性。

折半信度是测量内部一致性的简单方法。量表中的项目被分成两半并计算测量结果的相关系数。这两半相关系数高,说明量表内部一致性高。量表的项目可按序号的奇、偶分为两半,也可以随机划分。问题在于划分方法可能影响评价结果。克服这一问题的常用方法是采用α系数(克朗巴哈α系数),它是所有可能的项目划分方法得到的折半信度系数的平均值。α系数在0和1之间,如果不超过0.6,一般认为内部一致信度不足。α系数会随项目增加而增加,可能因包含多余项目而被不适当提高。还有一种可与α系数同时使用的系数,帮助评价平均数计算是否掩盖了某些不相关的测量项目。

有些多项目量表在结构上是多维的,含有几组,每一组项目测量一个方面的特征。例如,商店形象是一种多维结构,包括商品质量、花色种类、货与保修政策、人员服务、价格、商店位置、店面布局等。用于测量商店形象的量表应包括测量每个维度的项目。这些维度之间比较独立,因此在整个量表内部考察一致性不适宜,但可以计算每个维度的内部一致性。

效度和信度编辑本段

效度和信度的关系可以用测量值的构成公式O = T + S + R 来理解。如果测量完全有效,即O = T,S = 0,R = 0,则测量必然完全可信。若量表信度不足,它也不可能完全有效,因为有O = T + R。如果量表完全可信,可以达到完全有效,也可能达不到,因为可能存在导致误差的因素。虽然缺乏信度必然缺乏效度,但信度的大小并不能体现效度的大小。信度是效度的必要条件,但不是充分条件。从理论角度看,量表应具有足够的效度和信度;从实践观点看,好的量表还应具有实用性,即经济性、便利性和可解释性。

分析编辑本段

信度是指一个衡量的正确性或精确性,包括稳定性以及一致性。学者Kerlinger认为信度可以衡量出工具(问卷)的可靠度、一致性与稳定性。测验信度越高,表示测验结果越可信,但也无法期望两次测验结果完全一致。信度受测验质量及受测者因素影响,没有一份测验是完全可靠的。信度只是一种程度上的差别。一致性高的问卷是指同一群人接受性质相同、题型相同、目的相同的各种问卷测量后,各衡量结果间显示出强烈的正相关。稳定性高的测量工具是指一群人在不同时空下接受同样的衡量工具时,结果的差异很小。一般信度测量易产生误差的原因,来自研究者的因素包括:测量内容(遣词用句、问题形式等)不当、情境(时间长短、气氛、前言说明等)以及研究者本身的疏忽(听错、记错等);来自受访者的因素则可能是由于其个性、年龄、教育程度、社会阶层及其它心理因素等,影响其答题的正确性。

检视信度的方法有很多种,其中最常用的是Cronbach α系数。简介以下四种:

  • 再测法:使用同一份问卷,对同一群受测者,在不同时间前后测试两次,求出两次分数的相关系数,此系数又称为稳定系数。相关系数高,表示此测验的信度高。前后两次测验间隔的时间要适当,间隔太短受测者记忆犹新通常分数会提高,但题数够多则可避免;间隔太长受心智成长影响,稳定系数可能降低。
  • 复本相关法:内容相似、难易度相当的两份测验,对同一群受测者,第一次用甲份,第二次用乙份,两份分数的相关系数为复本系数或等值系数。若两份测验不是同时实施,相距一段时间施测,算出的相关系数为稳定和等值系数。复本相关法是信度测量的最好方法,但编制复本测验相当困难,且不受记忆效应影响,对测量误差的相关性也比再测法低。
  • 折半法:与复本相关法类似,在同一时间施测,将同一量表中测验题目(项目内容相似)折成两半(单数题、偶数题),求这两个各半测验总分的相关系数。折半信度系数需考虑两半问题的内容性质和难易度,使两半问题尽可能一致。
  • 克朗巴哈α系数:1951年Cronbach提出α系数,克服部分折半法的缺点,为目前社会科学研究最常使用的信度。它量测一组同义或平行测验总和的信度,如果尺度中的所有项目都在反映相同的特质,则各项目之间应具有真实的相关。若某一项目与尺度中其它项目之间无相关,则表示该项目不属于该尺度,应剔除。只要有做问卷就可以做信度分析,提供客观指标作为测验与量表良窳程度的具体证据。

测试信度编辑本段

测试信度也叫测试的可靠性,指的是测试结果是否稳定可靠,即测试的成绩是否反映了受试者的实际语言水平。如果同一套测试在对同一测试对象(受试者本身没有变化)进行的数次测试中,分数忽高忽低,则说明该测试缺乏信度。测试的信度与效度关系密切,一般只有信度较高的测试才能有较高的效度,但效度高不能保证信度也一定高。测试的信度主要涉及试题本身的可靠性和评分的可靠性。试题本身是否可靠取决于试题的范围、数量、区分度等因素;评分是否可靠则看评分标准是否客观准确。

测试的信度通常用相关系数表示,相关系数越大,信度越高。系数为1.00时测试可靠性最高,系数为0.00时可靠性最低。一般情况下,系数介于两者之间。对信度指数的要求因测试类别而异:标准化测试的信度系数通常要求在0.90以上,例如“托福”信度约为0.95;课堂测试的信度系数以0.70-0.80为可接受。以下三种信度计算方法易于操作:

  • 重测法:用同一套试卷在两个不同时间测试同一批受试者,获得两组分数,计算相关系数。若试题可靠,每个学生在两次测试中的排名次序应基本不变。
  • 交替形式法:对同一批受试者使用试题类型完全相同、难易程度相当但具体题目不同的两套对等试卷先后进行两次测试,计算两次得分的相关系数。
  • 对半法:测试只进行一次,但将整份试卷的题目按单、双数分成两组分别计分,算出两组分数的相关系数,再用Spearman-Brown公式计算整份试卷的信度系数。具体步骤:将两组分数的相关系数乘以2,再除以1加两组分数的相关系数。

参考资料编辑本段

  • 中国知网. 信度研究. http://www.cnki.com.cn/Article/CJFDTotal-XLXB802.011.htm
  • 搜狐新闻网. 心理测量信度. http://news.sohu.com/20071115/n253260533.shtml
  • 新浪教育网. 测试信度. http://edu.sina.com.cn/psy/2008-11-28/1443158593.shtml
  • Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16(3), 297-334.
  • Nunnally, J. C., & Bernstein, I. H. (1994). Psychometric theory (3rd ed.). McGraw-Hill.
  • DeVellis, R. F. (2016). Scale development: Theory and applications (4th ed.). SAGE Publications.
  • 吴明隆. (2010). 问卷统计分析实务——SPSS操作与应用. 重庆大学出版社.

附件列表


55

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

如果您认为本词条还有待完善,请 编辑

上一篇 信号灯    下一篇 信息储存

同义词

暂无同义词