1 测验标准化
一个测验的好坏,取决于对该测验的标准化水平。所谓标准化是指测验的编制、施测、评分以及解释测验分数的程度的一致性。具体地说,测验标准化包括下列内容:
①测验内容 标准化的首要前提,是对所有受测者施测相同的或等值的题目,测验内容不同,所测得的结果无法比较。
②施测过程 标准化的第二个条件是所有受测者必须在相同的条件下施测。
a相同的测验情境。如统一的采光条件,统一的场所布置等。b 相同的指导语。
c相同的测验时限 通常的时限定为大约90%的受测者在预定的时间完成全部测验项目即可。
③测验评分 评分的客观性是标准化测验的第三个条件。评分的客观性意味着两个或两个以上的评分者对同一份测验试卷的评定是一致的。
客观性评分要求:a 对反应要及时清楚地记录,以免由于记忆丧失造成混乱。b 要有一张标准答案或正确反映的表格。c 将受测者的反应与记分键比较,确定受测者反应应得的分数。
④测验分数的解释 一个标准化的测验,不仅指测验内容、施测过程和评分程序的标准化,而且指测验结果的解释的标准化。如果对同一测验结果可作出不同的解释,那么测验便失去了客观性。
2 心理与教育测验的分类
按评价所参照的标准分为 常模参照测验、目标参照测验和潜力参照测验。
3 心理与教育测验的实际应用功能(大题,结合269例子)
⑴选拔人才。心理与教育测验的发展为大规模选拔人才提供了可能。心理测量学家根据对各种工作的性质和特点的分析,寻找出适应特定工作要求的心理模式,然后根据这种模式编制测验,借此识别适合从事这种工作的人。这不仅大大提高了选才的效率,而且可以避免选材过程中各种人为因素的影响,从而提高选才的科学性和客观性。美国在1942年第二次世界大战期间将心理测验应用于飞行员的选拔,结果淘汰率有原来的65%下降到36%。
⑵人员安置。随着社会化大生产的发展,人事分工越来越细,不同的工种需要不同的人来做,借助于心理与教育测验可以使人与事做到最佳分配,做到人尽其才,提高劳动生产率。在教育领域,可以借助于心理与教育测验的资料,作为按能力和成绩分班的依据,为分类教育、因材施教提供了条件。
⑶心理诊断。对于治理缺陷者和心理障碍者的识别是推动心理测验发展的重要动力。心理与教育测验的诊断功能不只限于临床,在教育工作中同样可以发挥作用。例如,可以应用测验发现学生学业成绩不良或社会适应不良的原因,查明学习困难或造成困难的症结所在,从而采取适当的帮助和补救措施。
⑷描述评价。应用心理与教育测验可以对人们在智力水平、学业成就、人格特点等心理特质上的优势和劣势作出描述和评价,使一个人知道自己的长处和短处,以便扬长避短,更好地学习、工作和生活。
⑸心理咨询。应用心理与教育测验获得的资料,可以作为从事心理咨询工作的依据。例如,综合成就测验、智力测验、能力倾向测验的资料,可以就一个人的未来职业方向提供咨询意见,以便帮助来访者作出正确的职业选择。
4 心理与教育测量工作者的道德准则 心理测验工作者,简称 者
①者应知道自己承担的重大社会责任,对待测验工作须持有科学、严肃、谨慎、谦虚的态度。
②心理测验工作者应自觉遵守国家的各项法令与法规,遵守《心理测验管理条例》。
③者在介绍测验的效能与结果时,须提供真实和准确的信息,避免感情用事,虚假断言。
④心理测验工作者应尊重被侧者的人格,对测量中获得的个人信息要加以保密,除非对个人或社会可能造成危害的情况,才能告知有关方面。
在测验工作中,尤其是人格测验工作中经常遇到的一个不可忽视的问题是侵犯受测者的个人隐私问题。在日常生活中,受测者一般不愿意向别人透露隐私,而在测验条件下,为寻求帮助或配合测验,很可能表露出来。因而受测者在测验条件下会产生一定的顾虑。在这种情况下,测验工作者应采取适当的保护措施:只有在必要的情况下,测验工作者才能询问个人隐私,凡是与测验目的无关的方面就不应涉及;对受测者保证为其保密,并在实际上为受测者严守秘密;凡测验中须涉及的个人隐私应事先征得受测者本人或其他有关人员的同意。
⑤心理测验工作者应保证以专业的要求和社会的需要来使用心理测验,不得滥用和单纯追求经济利益。对测验之所以要控制使用,是为了保证测验的实施和对测验分数的解释既做到合乎科学,又对受测者未来的成长有益。
⑥为维护心理测验的有效性,凡规定不宜公开的心理测验内容、器材、评分标准以及常模等,均应保密。
a对测验保密是为了保证测验的价值,防止测验失效。在实施测验时,人们常碰到这样的情况:一所小学尝试用智力测验对新入学儿童的智力水平进行识别,以此作为分班和因材施教的参考依据。有的家长为了使自己的孩子进入理想的班级,找到心理测验工作者说:让我的孩子先做做这个测验行吗?我希望他能够测到一个好分数,进入一个好班级。假如测验工作者满足了家长的要求,那么这个测验对于鉴别这个儿童的智力水平就毫无价值了。
b对测验内容的保密,并不意味着不需要对受测者和一般的公众介绍关于测验的知识。但这种介绍的目的应限于:消除对测验的神秘感;了解测验的一些技术和方法;熟悉测验的程序和手续,消除受测者的紧张和焦虑。
⑦心理测验工作者应以正确的方式将所测结果告知被测者或有关人员,并提供有益的帮助与建议。在一般情况下,只告诉测验的解释,不要告诉测验的具体分数。在测验工作中,人们也常碰到类似这样的情况:一个女青年愁眉苦脸地来找心理咨询工作者,诉说:有人给我做了一个人格测验,说我的神经质分数高。此后,我就经常心神不宁。显然,这是由于测验人员缺乏专业知识,对测验结果的解释不慎,给受测者造成沉重的心理负担。
⑧心理测验工作者及各心理测量机构之间在业务交流中,应以诚相待,互相学习,团结协作。
⑨在编制、修订或出售、使用心理测验时,应考虑到可能带来的利益冲突,避免有损于心理测量工作的健康发展。
5 心理与教育测量的早期探索者
㈠高尔顿 高尔顿对现代心理与教育测量的产生起到了直接推动作用。
①他提出人的能力是由遗传而来的,并设想不同的人的能力水平的分布是正态的,其差异是可以测量的。②1884年,他成立了一个“人类测量实验室”,通过这种方法,高尔顿积累了有关简单心理现象的个别差异的大量系统资料,这可以视为第一个大规模系统测量人的个别差异的尝试。③高尔顿发明了许多测量仪器,如用于测量长度视觉辨别的高尔顿棒、用于测量听力的高尔顿笛等。④他是应用评定量表、问卷法及自由联想法的先驱。⑤高尔顿在心理与教育测量史上最重要的贡献之一,是把统计方法应用到对个别差异资料的分析之中。他不但扩充了百分位法,而且创造了一种简单的计算相关系数的方法。
㈡卡特尔 ①1890年,卡特尔在《心理》杂志发表《心理测验与测量》一文。在这篇论文中,首次提出了“心理测验”这个术语,并报到了他所编制的一套能力测验在大学生身上的应用结果。②卡特尔认为,心理学只有立足于实验与测量,才能达到如同自然科学的准确性;心理测验只有建立普遍的统一标准,并要与常模相比较,才能充分地实现其科学价值和实用价值。这些观点都已成为测量学上的重要观念。
㈢比内 ①比内提出心理测量的根本原理在于将个人的行为与他人作比较。这个观点已成为现代心理与教育测量的一个普遍原理。②他提出智力的定义,认为智力是高级心理过程,包括推理、判断以及动用已知知识解决新问题的能力。
③比内---西蒙量表
a.1905年量表 这是比内和西蒙出于诊断异常儿童智力的需要,于1905年编制而成的世界上第一个智力量表。它包括30道测验项目,种类繁多,可以测量智力的多方面表现,比如记忆、言语、理解等。
b 1908年量表 这是第一个年龄量表。比内和西蒙在此对1905年量表作了如下修订:测验项目增至59个;测验项目以年龄分组(3~13岁,每岁一组);以智力年龄来评估个体智力,即儿童最后能通过哪个年龄组的项目,便说明他具有这一年龄的智力水平,而不论他的实际年龄是多少。
c 1911年量表 这次修订没有重大的变化,只是改变了几种年龄分组,并将测验扩展到承认。
6心理特质的含义
①特质是一组具有内部相关的行为的概括,具有一定的抽象性。例如,某人在公共汽车上总是给老弱病残和小孩让座,在生活中总是能对他人友好相待、热情相助等,则可以称该人具有“善良”的特质,因为在他身上总是表现出一组具有内部相关的行为(让座、友好待人、热情助人),这种行为经概括后便具有抽象性了。
②特质是“一种一般的神经心理系统……它可以综合不同的刺激,使人对这些刺激作出相同的反应”。例如,某人在公共汽车上如果只给熟人和朋友让座而不理睬不认识的老弱病残,则不能说他具有“善良”的特质。因为,“善良”特质要求他对各种不同的刺激都能作出相同的反应(让座)。
③特质是一个人身上比较稳定的特点。人的心理活动是十分丰富的,并不是他的每一种心理活动都会表现为一种特质,而是那些经常出现的比较稳定的心理特征才称得上特质。
④一个人的精神面貌(人格)是由多种特质分多个层次有机结合而成的。心理学家在研究人的人格特征时,一般是把他们分解成多个单元(特质)和层次进行分析的,并认为,人格就是多个特质多种层次的有机组合。
⑤特质可以决定一个人对特定刺激的反应倾向,可以对人的行为进行某种预测。心理测量的最终目的就是要了解人的特点,并对人的行为倾向作出预测。
7 测量误差的种类 随机误差和系统误差。
8 测量误差的来源 测量工具、被测对象和施测过程。
9数学模型及其假设(有待补充)
公式
根据这一模型,我们可以引申出三个相关联的假设公理:
①若一个人的某种心理特质可以用平行的测验反复测量足够多次,则其观察分数的平均值会接近于真分数。②真分数和误差分数之间的相关为零。③各平行测验上的误差分数之间相关为零。
对CTT的这一数学模型及其假设公理,我们可以从以下3个方面来加以理解。首先,在问题的研究范围之内,反映个体某种心理特质水平的真分数是假定不会变的,测量的任务就是估计这一真分数的大小。其次,观察分数被假定等于真分数与误差分数之和。第三,测量误差是完全随机的,并服从均值为零的正态分布。
10 重测信度—使用前提条件
①所测量的心理特性必须是稳定的。 例如,一个成人的性格特点一般是稳定的,所以许多人格测验常使用重测信度,但是刚入学儿童的识字量是极不稳定的,只要两次施测的间隔时间稍长,儿童的识字量就会有很大变化,因此,重测信度不能用于这种情况。
② 遗忘和练习的效果基本上相互抵消。在做第一次测验时,被试可能会获得某种技巧,但只要间隔的时间适度,这种练习效果会基本上被遗忘。
③在两次施测的间隔期内被试在所要测查的心理特质方面没有获得更多的学习和训练。这一点,实际上也要保证被试具有稳定的心理特质。
11 复本信度—使用前提条件
①要构造出两份或两份以上真正平行的测验(即A/B卷)
复本测验之间必须在题目内容、数量、形式、难度、区分度、指导语等方面相同或类似。
②被试要有条件接受两个测验。这种条件主要取决于时间、经费等几个方面。
12影响测量信度的主要因素
㈠被试方面
①就单个被试而言,被试的身心健康状况、被试动机、注意力、耐心等会影响测量误差,因为这些因素往往会影响被试心理特质水平的稳定性。
②就被试团体而言,整个团体内部水平的离散程度以及团体的平均水平都会影响测量信度。这是因为,我们所计算的信息估计值大都是以相关为基础的,而相关系数的大小往往取决于全体被试得分的分布情况。
㈡主试者方面
①就施测者而言,若他不按指导手册中的规定施测,或故意制造紧张气氛,或给考生一定的暗示、协助等,则测量信度会大大降低。②就阅卷评分者而言,若评分标准掌握不一,或前紧后松,甚至是随心所欲,则也会降低测量信度。
㈢施测情境方面
在实施测验时,考场是否安静、光线和通风情况是否良好、所需设备是否齐全等都可能影响到测量的信度
㈣测量工具方面
以测验为代表的心理与测量工具是否性能稳定是测量工作成败的关键。试题的取样、试题之间的同质性程度、试题的难度等是影响测验稳定性的主要因素。
㈤两次施测的间隔时间
两次测验的间隔时间越短,其信度值越大;间隔时间越长,其他因素带来影响的机会就多,因而信度值就可能越小。
13 提高测量信度的常用方法
㈠适当增加测验的长度 由于项目数量太少会降低测量的信度,所以,提高测量信度的一个常用方法是增加一些与原测验项目中具有较好的同质性的项目,增大测验长度。
㈡使测验中所有试题的难度接近正态分布,并控制在中等水平。当测验中所有试题的难度接近正态分布并控制在中等水平时,被试团体的得分也会接近正态分布,且标准差会较大,以相关为基础的信度值必然也会增大。
㈢努力提高测验试题的区分度。一份测验所有试题区分度高低直接影响测验的信度。
㈣选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度。由于被试团体的平均水平和内部差异情况均会影响测量信度,所以在检验测量的信度时,一定要根据测验的使用目的来选择被试。
㈤主试者严格执行施测规程,评分者严格按标准给分,实测场地按测验手册的要求进行布置,减少无关因素的干扰。
14 效度与信度的关系(补充公式)
根据公式,可以得到信度与效度的关系如下:
⑴信度高是效度高的必要非充分条件。信度高不一定效度高,但一个测验要想效度高,真分数的变异数必须占较大的比重,即测验的信度必须高。一个测量工具具有一定的信度,但对于某一个目的并不一定是有效的;而一个测量工具如果对于某一个目的是有效的,那么它一定是可信的。
⑵测验的效度受它的信度制约。
15 影响测量效度的因素
㈠测验的构成 当组成测验的试题样本没有较好地代表欲测内容或结构时,测量的内容效度或结构效度就必然会不高。同时,若题目语义不清、指导语不明等都会降低测量效度。
㈡测验的实施过程
一个测验在实施过程中,如不遵从指导语的要求,或出现意外干扰,或评分、计分出现差错等,都会降低测量效度。
㈢接受测量的被试
一般情况下,被试的应试动机、情绪、态度、身体状态等,都会影响测量信度,造成较大的随机误差,进而影响测量的效度。
就整个被试团体而言,如果缺乏必要的同质性,则很可能得到不恰当的效度资料。有时候,同样一个测验,对年龄、性别、文化程度等方面不同的被试团体,常常表现出不同的预测能力,即不同的测量效度。
㈣所选效标的性质
由于同一个测验可以有不同的效标,同一个观念效标也可以有不同的效标测量,因此在评价测量效标时,所选效标的性质是很重要的考虑因素。在考虑效标与分数的相关时,有一个因素是必须重视的,即测验分数与效标之间是否符合线性关系的问题。
㈤测量的信度
测量信度是测量随机误差的反映,而任何误差的增加都会降低测量的效度,所以在考察测量效度时,一定要注意测量效度。
16 提高测量效度的方法
㈠精心编制测验量表,避免出现较大的系统误差。这就要求题目样本要能较好地代表欲测内容或结构,要避免出现题目偏倚。同时,题目的难易程度、区分度也要恰当,题目的数量也要适中。测量试卷的印制,题目作答的要求、评分计分的标准等,都必须严格检查,避免一切可避免的误差的出现。
㈡妥善组织测验,控制随机误差。测验实施者一定要严格按手册指导语进行操作,要尽量减少无关因素的干扰。
㈢创设标准的应试情境,让每个被试都能发挥正常的水平。在各种测验中,有些被试往往因种种原因而发挥不出应有水平,因此,我们应让被试调整好应试心态,让他们从生理上、心理上、学识上等做好应有的准备。
㈣选好正确的效标,定好恰当的效标测量,正确地使用有关公式。在评价一个测验是否有效时,效标的选择是一个重要方面。如果效标及效标测量都合乎要求,则公式的选择是影响效度估计的另一个重要方面。
17 猜测校正的优缺点
赞成使用猜测校正公式的人认为:
⑴可避免降低测验的信度。因为如果不使用校正公式,被试必然会盲目猜测而影响测验的信度。⑵校正后的得分可以反映被试的真正水平和能力。对每个项目来说,校正后可以反映项目的真实难度,便于在备选答案数目之间进行统计比较分析。⑶在教育测验中,可以培养被试诚实的美德。⑷比较公平。即使事前鼓励学生答完全部试题,但事实上总有人无法答完全部试题,所以使用猜测校正的方式比较公平。
反对使用猜测校正公式的人认为:
⑴公式的基本假设不成立。因为被试答错试题,并非都是存心投机取巧。事实上,有些学生答错,可能是观念模糊、记忆错误或粗心大意所致。
⑵只要被试能答完全部试题,则猜测校正无实质作用。
⑶不采用猜测校正对信度并无重大影响。据研究:鼓励被试猜测,其影响只有4%左右,此项缺点可通过增加试题的数目来提高测验信度。
⑷有时会出现无法解释的现象。一个学生如果答对的题数等于或少于答错的题数。
⑸实际生活中,经常缺乏充分的证据与资料,必须凭借部分知识来判断,且进行合理猜测是值得培养的习惯。
综上所述,对于是否需要采用猜测校正,并无定论。但是在答题时间充裕,备选答案数目在四个或以上的选择题,则没有必要进行校正计分。
18 编制心理与教育测验的基本程序
⑴确定测验目的。这一步主要解决三个问题:明确测量对象;明确测量目标;明确测量用途
⑵制定编题计划。编题计划是编制测验的总体构思。编题计划要明确的信息主要有两个方面:以上全面而具代表性的测验内容;二是对各个内容点的相对重视程度。
⑶编辑测验项目。在编辑测验项目时需要解决以下3个问题:收集测验资料;选择项目形式;编写测验项目
⑷预测与项目分析。初编的测验项目是否具有适当的难度和区分度,必须通过预测进行测验项目分析,以便进一步修改。
⑸合成测验。她要解决的问题有两个:测验项目的选择;测验项目的编排。
⑹测验标准化。所谓标准化是指测验的编制、施测、评分以及解释测验分数的程度的一致性。
⑺鉴定测验。测验编好后,必须对其可靠性和有效性进行鉴定,以便确定该测验是否可用。对测验的鉴定,主要是确定其信度系数和效度系数。
⑻编写测验说明书。测验说明书向测验使用者说明如何使用该测验,以此才能保证测验的信度和效度。
19 施测前的准备工作
一个好的施测程序中最重要的就是预先做好准备。⑴准备好测验材料。施测者必须把施测中所要用的材料按一定顺序放置在适当的位置,使受测者易于看到和找到。⑵熟练掌握施测手续。熟悉测验内容;掌握施测步骤;掌握计分方法;掌握解释分数的技术。⑶熟记测验指导语并能用口语清楚而流利地说出来。⑷指导语。指导语通常包括对测验目的的说明和对题目反应方式的解释。一般要求测验的主持者和指导语都应保持和表述中立的态度。
20 在解释测验分数的意义时,应遵循一下几个基本原则
⑴主试应充分了解测验的性质与功能。测验使用者必须具备心理测验的基本知识与概念,方能了解测验的性质与限制。
⑵对导致测验结果的原因的解释应慎重,谨防片面极端。为了对分数作出有意义的解释,必须将个人在测验前的经历或背景因素考虑在内。
⑶必须充分估计测验的常模和效度的局限性。为了对测验分数作出确切的解释,只有常模资料是不够的,还必须有效度资料。
⑷解释分数应参考其他有关资料。测验分数的解释应尽可能参考其他资料,如教育经验,文化背景、习惯、态度等资料,这样解释才能更客观深入。
⑸对测验分数应以“一段分数”来解释,而不应以“特定的数值”来解释。应该把测验分数视为一个范围而不是一些确定的点,也就是要对测验分数提供带状的解释。
⑹对来自不同测验的分数不能直接加以比较。即使两个测验名称相同,由于所包含的具体内容不同,其分数也不具备可比性。
21 如何将测验分数的意义告诉受测者?
⑴使用当事人所理解的语言。测验像其他特殊领域一样,具有自己的词汇,因此你所理解的词并不意味着当事人也一定理解。
⑵要保证当事人知道这个测验测量或预测什么,这里并不需要作详细的技术性解释。
⑶如果分数是以常模为参考的,就要使当事人知道他适合什么团体在进行比较。
⑷要是当事人认识到分数只是一个估计。由于测验的信度、效度不足,分数可能有误差。
⑸要是当事人知道如何运用他的分数。当测验用于人员选拔和安置问题时这点事特别重要的。要想当事人讲清测验分数在做决定过程中起什么作用。
⑹要考虑测验分数将给受测者带来什么影响。在解释分数时要把对分数意义的解释和必要的咨询工作结合起来,以免受测者因分数不理想而产生自卑心理。
⑺测验结果应向无关人员保密。以免对当事人造成不良的影响。
⑻对低分者的解释应谨慎小心。在测验上获得低分者易产生自卑心理,因此,对这些当事人报告测验分数时,态度要诚恳,措辞要委婉。
⑼报告测验分数时应设法了解当事人的心理感受,并采取适当的措施加以引导。
22教师自编课堂测验的特点
⑴测验形式灵活多变,与测验目的完全一致。教师自编课堂测验完全由教师根据测验目的自己确定测验的时间、地点、内容和形式。
⑵测验内容与教材内容高度一致。教师自编课堂测验完全依据教师自己所用教材编写,不必顾忌其他教材的内容和形式。因此,教师自编测验内容与教材内容可以高度一致,可以考出所选教材的特色。
⑶测验难度切合学生的实际水平。教师自编课堂测验由教师自己编写,可以针对自己学生的实际水平出题。
⑷测验编制简易快速。教师自编课堂测验是在教师对学生、教材、教学要求都非常熟悉的情况下进行的,编制一份测验是比较容易的。
23 教师自编课堂测验应注意的问题
⑴教师要深入研究教材,深入调查学生。有时候教师认为自己很熟悉教材和学生,就不再去认真研究教材、调查学生,凭自己的经验命题。这样可能造成所命试卷内容不全面,不能适合大多数学生的后果。所以命题时,教师要—
⑵要维护准确稳定的合格标准。教师自编测验多数是目标参照性测验,目标参照性测验编制的一个重要原则是要维护准确稳定的合格标准。
⑶要客观评价自己的命题技术,合理使用各种题型。
⑷要注意总结命题经验,提高命题技术。
⑸要尽量控制评分误差,防止简单粗糙。
⑹要做一些定量分析研究。施测之后教师对试卷做一些定量分析研究是很有益处的,根据计算数据可以评价各试题质量,这是总结命题经验、提高命题技术更易见效的措施。