效度
【汉语拼音】xiaodu
【中文词条】效度
【外文词条】validity
测量的有效性程度。即测量工具确能测出其所要测量特质的程度。效度是科学的测量工具所必须具备的最重要的条件。在社会测量中﹐对作为测量工具的问卷或量表的效度要求较高。鉴别效度须明确测量的目的与范围﹐考虑所要测量的内容并分析其性质与特征﹐检查测量的内容是否与测量的目的相符﹐进而判断测量结果是否反映了所要测量的特质的程度。
内容效度凭借逻辑去判断一项测量工具是否有效﹐凭借对概念的了解去鉴别该变量的特征是否都被考虑到﹐在理论层次上概念所具有的各种特征﹐在经验层次上的测量也应具有﹐如果二者相吻合﹐则表示具有内容效度﹔否则﹐便是无内容效度。
准则效度(预测效度)同一概念可能有多种测量方法﹐假如其中一种成为准则﹐另外一种就可以与之比较而判断其效度。当某种测量法A具有内容效度时﹐另一种测量法B的准则效度则由A决定﹔如果测试某样本﹐显示B与A高度相关﹐即谓B准则效度高。
构念效度(构想效度)如果在理论层次上﹐概念X和概念Y是相关的﹐那末﹐在经验层次上对X的测量 与对Y的测量 也相关﹐假如有另一个对X的测量﹐则它也应该与Y的测量 相关﹐这就称作构念效度。例如﹐X为“工作积极性”﹐Y为“对业余学习的重视”﹐X与Y在理论层次上是相关的﹐即工作积极性愈高对业余学习也愈重视。将 X以 (对“工作有奔头”的赞成程度)来测量﹐将Y以 (每天进行业余学习的时间)来测量﹐ 与 必然相关。现若 X有另一测量法 ′(工作量完成的多少)﹐若 ′与 的测量结果是相关的﹐则称 ′具有构念效度。
效度鉴定程序从内容效度﹐到准则效度﹐再到构念效度﹐可视为一种累进﹐即构念效度需要比准则效度更多的信息﹐准则效度需要比内容效度更多的信息。
效度比信度有更高的要求﹐信度是效度的必要条件﹐没有信度的测量工具就谈不上具有效度﹐但信度高的测量工具未必具有高的效度。
测试效度的维度1)表面效度(face validity)。指测试应达到的卷面标准,即一套测试题从表面看来是否是合适的。例如,若一次阅读理解力的测试包括许多受试者没有学过的方言词汇,则可认为这次测试缺乏表面效度。表面效度是测试出受试者正常水平的一种保证因素。
2)内容效度(content validity)。指一套测试题是否测试了应该测试的内容或者说所测试的内容是否反映了测试的要求,即测试的代表性和覆盖面的程度。例如,如果某一套发音技能测试题仅仅考查发音所必须具备的某些技能,如只考单一音素的发音,而不考查重读、语调或音素在词语中的发音,那么,该测试的内容效度就很低。
3)编制效度(construct validity)。指一套测试题的诸项目对编制该测试所依据的理论的各个基本方面的反映程度。例如,以结构主义语言理论为基础,认为系统的语言习惯是通过句型而获得的,那么,强调词汇和语法环境的测试题目就失去了编制效度。
4)经验效度(empirical validity)。经验效度是一种衡量测试有效性的量度,通过把一次测试与一个或多个标准尺度相对照而得出。经验效度可分为两种:一是共时效度(concurrent validity),即将一次测试的结果同另一次时间相近的有效测试的结果相比较,或同教师的鉴定相比较而得出的系数;二是预测效度(predictive validity),即将一次测试的结果同后来的语言能力相比较,或是同教师后来对学生的鉴定相比较而得出的系数。
一般来说,对某次测试的效度进行检验时,除了要根据教学大纲的要求和观念有效性的理论对试卷的内容进行考查以外,还须采用计算相关系数的定量方法,即计算出本次试卷与另一份已被确定能正确反映受试者水平的试卷之间的相关系数。系数高则有效性大。课堂测试的效度应在0.4-0.7之间,规模较大的测试其效度应在0.7以上。