第五章 测量的信度
第一节 什么是信度
一、信度的定义
信度又叫可靠性,指的是测量的一致性程度。一个好的测量工具必须稳定可靠,即多次测量的结果要保持一致,否则便不可信。信度只受随机误差影响。随机误差越大,信度越低。因此,信度亦可视为测量结果受机遇影响的程度。系统误差产生恒定效应,不影响信度。
在测量理论中,信度被定义为:一组测量分数的真变异数与总变异数(实得变异数)的比率。即,
r(xx)=S^2(t)/S^2(x)(5.1)
式中rxx代表测量的信度,S 代表真分数的变异数。
根据公式(4.3),信度还可表示为
r(xx)=S^2(x)-S^2(e)/S^2(x)
=1-S^2(e)/S^2(x)(5.2)
该定义有两点要注意: 1)信度指的是一组测验分数或一列测量的特性,而不是个人分数的特性。2)真分数的变异数是不能直接测量的,因此信度是一个理论上构想的概念,只能根据一组实得分数作出估计。
任何测验只能包含特定样本的题目,由特定的施测者,对特定的被式,在特定的时间、地点施测,情况不同便会得到不同的分数。信度涉及的主要问题是对测验分数的意义的概化能力,即从一次测量来推论总体(真实分数)能达到何种正确程度。
根据现代信息论,每组信息可包括一些真正信息(信号)和一些错误的信息(噪音)。为了提供有用的数据,任何测量必须有高的信号噪音比率——即提供更多真正的信息。信号可由真实分数的变异数表示,噪音可由误差分数的变异数表示。
信噪比与信度有如下关系:
信号/噪音= (5.3)
公式(5.3)并不难证明,将 代入上式的右端可得:
=信号/噪音
假如一个测验的信度为0.90,则信噪比为0.90/(1—0.90)=9.0即真正变异数对误差变异数的比率为9:1。
一个测验的信度只要稍微增加一点就会使信噪比大大改变。例如,信度从0.90增为0.91,可使信噪比从9:1,变为10.1:1。因此,即使一个相当可靠的测验也应努力改善其信度。
二、信度系数
大部分的信度指标都以相关系数表示,即用同一被试样本所得的两组资料的相关作为测量一致性的指标,称作信度系数。
与信度系数有关的一个概念叫信度指数,是实得分数与真分数的相关,这是部分与整体的相关,可用下式表示:
信度指数的平方就是信度系数,可用下列公式表示,
r(xx)=r^2(xt)=S^2(t)/S^2(x)(5.4)
换言之,信度系数是实得分数与真正分数相关的平方。相关系数的平方表示两个变量间共有的变异数比例。因此,信度系数实际是真正分数与实得分数之间的决定系数。可以解释为在实得分数的变异数中有多少比例是由真分数的变异决定的。例如,当rxx =0.90时,我们可以说实得分数中有90%的变异数是来自真正分数的差别,仅有10%是来自测量误差,在极端例子中,如rxx=1.00,则无测量误差,所有的变异都来自真分数,若rxx=0,则所有的变异均反映了测量误差。
对信度系数也要注意三点,1)在不同情况下,对不同样本,采用不同方法会得到不同的信度系数,因此一个测验可能不止一个信度系数。2)信度系数只是对测量分数不一致性程度的估计,并没有指出不一致的原因。3)获得较高的信度系数并不是心理测量追求的最终目的,它只是迈向目标的一步,是使测验有效的一个必要条件。
信度系数达到多高才可以接受呢?最理想的情况是 rxx=1.00m,但这是办不到的。不过我们可用已有的同类测验作为比较的基准。一般能力与学绩测验的信度系数在0.90以上,有的可以达0.95,至于性格、兴趣、价值观等人格测验的信度系数,通常在0.80到0.85或更高些。当 rxx<0.70时,不能用测验来对个人作评价,也不能在团体间作比较,当 rxx="">0.70时,可用于团体间比较;当 rxx>0.85时,可用于鉴别个人。
由于信度系数总是在特定情况下获得的,因此只有当一个测验在很多情况下都被证实具有较高的信度时,才可以说它是比较可靠的测验。