自考大专05616心理测量与评估常考重点

复习资料

自考05616 心理测量与评估常考重点

第一章绪论

S1 测量和测量量化水平

1、测量的科学定义名词解释：

★测量（识记）是按一定规则给所考察对象在某种性质的量度系统上指定值的活动。简而言之，测量就是使对象特点予以量化的活动。测量的要素：一是测量的参照点；二是测量单位

2、★性质不同的量度系统（精确度水平由低到高）选择或简答

① “名义量表”，其上的值量化水平最低，只有类别标志的含义，不能施行任何运算（车牌号码）

② “顺序量表”，其上的值量化水平略高，只有顺序的含义而不等距，既无可加性更无可除性，只可施行顺序递推的逻辑运算（品德评定心理测量）

③ “等距量表”，其上的值不但有顺序含义，还是等距的，即单位相等，所以量化水平更高，没有绝对零点，只有可加性而无可除性，故只可施行加减运算不可做乘除运算（温度）

④“比例量表”，其上的值不但有顺序性，还等距、等单位、有绝对零点，既有可加性又有可除性，量化水平最高（身高体重）

3、心理测量及其特点

①★心理测量：是按规则给所考察对象的心理特质，在一定性质的量度系统上，即量表上指定值的活动。

② 心理测量的特点（与物理测量的区别跟物理测量比，有其显著不同的突出特点；★即心理测量的性质具有：间接性、相对性和主体间交往性的突出特点：

⑴心理测量的间接性（心理的相对性和稳定性）

a被测对象的心理活动，无论是他的感觉知觉，还是他的情感态度等，都不是测量活动的主持者、施测者所能直接观察与了解的

b人的心理是世界物质发展到最高阶段的产物，个体的心理特性既是相对稳定的，又是对人的行为活动起支配决定作用的，因而会在人的行为的各个方面不断表现出来

⑵心理测量的相对性（测量结果的函数关系、测量结果取值）

a内部心理特性与外显行为间不存在确定性函数关系，测量结果只有相对意义

b按心理测量对象本身的特性，测量结果大都只能在顺序量表上取值，具有相对性；即使放宽某些要求，最多也只能在等距量表上取值

⑶心理测量的主体间的交往性

a作为心理测量活动对象的受测者并非静止消极的，只单纯接受施测；相反他要积极作用于测量活动本身

b测量活动所测的对象是受测主体的心理特性，而主体具有能动性，所以一定要重视受测者在测量过程中的学习和迁移能力

c由于施受双方都是能动主体，处在同一发展层级上，因而有时其施受地位也可以互换，并非绝对固定

4、心理测验

①★心理测验的定义（识记）名词解释心理测验是心理测量的一种，是更加符合实证科学精神与要求的心理测量中特别的一种。其定义一般认为是行为样本的客观而标准化测量

②★行为样本的意思（领会）多选

⑴测验所直接测察的是：个体的外部行为⑵这些外部行为应是：所要测察的内部心理结构的代表性“行为样本” ⑶所测行为是否能构成代表性“行为样本”，要经实际检验由客观事实资料来确证

③★心理测验标准化（领会）（S3所谓标准化就是指测验内容、施测、评分以及分数解释规划化、一致性与科学性）

多选：标准化是所有测量活动走向科学的共同要求，包括：⑴测验编制即测量工具的标准化 ⑵测验实施与评分的标准化 ⑶分数解释的标准化

④★心理测验客观性：⑴（实操）测验的实施、评分与测验结果的解释应用都要严格按测验指导书的统一规定办，不能任意来确定；⑵（编制与修改）测验开发编制过程中，测验项目难度及测试性能如何，应该依据客观事实来得出；筛选项目应通过调查研究根据事实资料来确定；⑶（效果评估）标准化测验的实际质量如何更要通过实证检验来确定

⑤★常模：打算要测的被试群体在所测特性上的一般水平与水平分布状态（S4测验常模（识记）简称常模，理论上是指所有应测被试在测验所测特质上的实有水平的分布状况或分布形态；实际操作中是指代表性被试样组在测验上得分的分布状况或分布形态）

5、★心理评估（识记）就是使用测验、行为观察、晤谈、个案资料研究和其他测评程序（评定量表、问卷），为达到对个体作出深入的心理评价，从而进行收集和整合资料的活动。是临床心理工作的重要组成部分。途径：测验、行为观察、晤谈、个案资料研究、评定量表

6、心理评估过程的特点与作用（领会）

①心理评估是针对特定个体或少数个体的某种心理问题，连续不断地提出假设和检验假设的过程。

②心理评估的目的在于为决策服务；即为诊断决策，为职业选择、治疗建议、教育计划的决策，乃至为司法决策等服务。

7、心理评估与心理测量及测验的区别（简单应用）

①心理评估是通过多种途径、工具与方法来收集和整合资料的，而心理测量是只通过量化的方法常在严格条件下使用标准化工具来收集资料的（心理评估包括了测量与测验在内但不限于测量和测验，它强调多种方法的综合运用，并强调不把任何一种方法收集到的资料绝对化）

②心理评估要完成的根本任务是要“作出深入的心理评价”。评估中不但要收集量化资料还要收集质性资料，不但作出事实判断还要作出价值判断。

S2 心理测样的发展

1、中国古代的心理测量思想和实践探索（识记）：①汉代推行察举制 ②三国时代魏人刘劭著有《人物志》一书，他奉行“中庸至德” 的儒家教义，对人的形质、人性、才具以及志业的“考课核实”做了深入的研究。③著名的心理学家伍德沃斯将九连环称为“中国式的迷津”，七巧板则被称为唐图

2、科学心理测验的诞生：

①高尔顿：重视个体差异和提倡心理测量（心理测量运动的重要任务）等级评定量表、问卷法及自由联想法的先驱；②卡特尔：首次提出了“心理测验”一词； ③1905年比纳—西蒙量表的编制发行，标志了人类历史上科学的标准化心理测验的诞生。19世纪80年代是高尔顿的十年，90年代则是卡特尔的十年，进入20世纪的头十年就属于比纳

3、各种类型心理测验的发展（识记）

①智力和能力测验的发展：1916年美国斯坦福大学修订了比纳—西蒙量表，推出了斯坦福—比纳智力量表作为标准化测量工具，首次采用了“智力商数（IQ）”来描述个体的智力水平。此后智商成为一个广为流传的概念。1918年美国参加第一次世界大战，编织成了“军队甲种测验”“军队乙种测验”，前者为一般常规的言语测验，后者为非言语测验

②学业成就测验的发展：1908年桑代克发表了书法量表，1923年斯坦福成绩测验发表，产生了第一个学业成就成套测验

③人格测验的发展：早期的人格测验起源于对精神病人的关爱，先驱是克雷佩林，他1892年对精神病患者实施自由联想测验。心理测验的另一领域涉及情感行为或非智力行为，适于这一目的测验一般称为人格测验；

★人格测验的三种技术：⑴人格问卷的原型即自陈问卷 ⑵表现型技术或情境测验方法； ⑶投射技术。

④心理卫生评定量表等的发展：上世纪50年代以来，心理卫生评定量表有了很大的发展。严格地说，心理卫生评定量表并不属于心理测验的范畴，当然二者也不是截然分开的

4、★心理测验的种类和功能多选

①按测验所测心理特性分类：⑴能力测验；⑵学业成就测验；⑶人格测验；⑷神经心理测验；⑸心理卫生评定量表

②按接受对象规模分类：⑴个别测验； ⑵团体测验

③按施测方式分类：⑴文字测验； ⑵非文字测验； ⑶情境测验； ⑷计算机化测验；

④按测验对作答行为要求分类⑴最高成就测验； ⑵典型行为测验

⑤按测验分数解释参照体系分类⑴常模参照测验；⑵标准参照测验

★常模参照测验：参照体系是常模，即所测被试团体在所测特性上的实有水平分布。

★标准参照测验：参照体系是社会应有要求，即所设置的标准；这类测验上被试的表现，要跟社会设定的要求去作比较，看其是否达标，掌握的程度如何，这样来解释测验分数的意义

⑥按测验刺激性质（按测验任务）分类：⑴结构化测验 ⑵投射测验

⑦按测验目的分类：⑴描述性测验 ⑵诊断性测验 ⑶预测性测验

⑧按测验的应用领域分类： ⑴教育测验； ⑵职业测验 ⑶临床测验

临床测验：广义上是指所有为临床工作之用的心理测验，包括智力、人格测验；狭义是指专为医学临床应用的或者某种心理咨询和辅导而设计应用的测验，包括神经心理测验、儿童心智缺陷测验、心理卫生评定量表等

5、★心理测验的基本功能（鉴定个别差异最基本功能、描述、诊断、预测和评价功能）：认识和鉴定清楚人的心理特征、结构、发展水平的实际状况及潜力如何，跟他人的差别何，并用量化的方式准确表示出来；以据此给出有针对性建议。描述、诊断和预测的功能从鉴定个体差异中派生出来，并进一步派生出评价功能。这些都是心理测验的基本功能

6、★理测验的应用领域：当心理测验应用在教育、职业、人事、心理咨询与辅导、以及科学研究当中时，会产生出其他的功能。在职业与人事领域，会发挥出应选、安置和分类功能；在心理咨询和辅导领域，会发挥出搜集资料、做出评估与诊断、协助决策、对干预措施或指导建议做评价等功能；在教育领域会用于学生、教师、管理者的评价，包括学生的学习和发展、教师和管理者的评价，在科研领域，可用于搜集资料、实验分组和提出与检验实验假设等

S3正确对待和使用心理测验

1、心理测验在我国的发展历史

2、正确对待和使用心理测验

①测验的错误观：

⑴测验万能论：测验解决一切问题，分数绝对化； ⑵测验无用论：测验侵犯个人隐私、违背民主原则。为宿命论和种族歧视提供依据

②测验的正确观：

⑴一是认识到心理测验是心理学重要的研究方法，是决策的辅助工具；

⑵二是认识到测验作为研究方法和测量工具尚不完善

第二章心理测量中的统计技术

1、数据和变量的种类：

①变量种类：称名变量、顺序变量、等距变量、比率变量（名义、顺序、等距、比例量表）；

②按照是否有连续性分为：离散性变量、连续性变量

离散性变量：称名变量，如球衣号

顺序变量，如成绩名次

连续性变量：等距变量，如温度

比率变量，如考试成绩分数、能力/智力测验分数

2、总体样本和取样（理解）

①总体是具有某种特征的一类事物的全体；总体中的每个基本单元但与称为个体；从总体抽取的一部分个体，称为总体的一个样本，这样的行动叫取样；而样本所含的每一个体，有时有被称为元素或样品

②个体数目超过30的样本称为大样本，等于或小于30的样本称为小样本，一般来说，样本越大，对总体的代表性就越强。

S1次数分布与集中量数

1、测验分数的次数分布表与图

次数（识记）即现象出现的频数，一般用符号f表示

①次数分布表的编制

★次数分布，指的是一批数据中各个不同数值所出现次数多少的情况，或者是这批数据在轴上各个区间所出现次数多少的情况。次数分布表可分为简单次数分布表、相对次数分布表和累积次数分布表（以下累积递减、以上累积递增）

全距是最大数值和最小数值之差，又名两级差，用符号R表示，R=Xmax-Xmin

相对次数分布编制：将简单次数分布中各组的实际次数除以总次数（f/N）表2-5

②次数直方图与多边图：次数分布图有次数直方图和次数多边图表2-1 表2-2

③累积次数分布图表2-3

④测验分数的正态与偏态分布多选，或者考图

正态分布曲线：一条单峰对称的曲线，如果这种形状的曲线还符合统计数学的某些要求就可称为正态分布曲线

正偏态分布曲线：高峰偏向数量小的方向的曲线，即曲线尾巴指向正无穷大表明一笔数据中数值小的数居多，难度小，测量集中在大部分人去

负偏态分布曲线：高峰偏向数量大方向的曲线，即曲线尾巴指向负无穷大，表明一批数据中数值大的数据居多，难度大，测量分数比较低

2、★集中量数：指用来描述数据的集中趋势的特征量数~包括算术平均数、中数、众数等

3、中数和众数

中数：按大小顺序排列的一组数据中，位置居中的那个数称为中位数，简称中数

众数有粗略众数和理论众数两类，粗略众数是指一组数据中频数出现最多的那个数，可通过观察法直接求得

S2 差异量数与标准分数

1、差异量数：是用来描述数据离散程度的特征量数，包括平均差、方差、标准差

①平均差：即全组数据与其平均数的离差的绝对值的平均数，用符号AD表示

②方差与标准差：★方差S2指的是这组数据的离均平方数的算术平均数。方差的算术平方根叫标准差，用符号S表示

③★集中量数的差异量数对数据分布形态的影响简答论述

⑴集中量数影响着数据分布的位置：集中量数越小，则数据在数轴上的分布越靠左，集中量数越大，则数据在数轴·分布越靠右。

⑵差异量数影响到数据分布曲线的“展形”或“胖瘦”：差异量数越小，则数据分布曲线越高瘦，分布的覆盖范围越窄；差异量数越大，则数据分布曲线越矮胖，覆盖范围越宽。

2、★正态分布的性质：简答

⑴ 正态分布曲线是单峰对称的，以过平均数点的垂线为对称轴；

⑵ 正态分布曲线上平均数对应点最高，然后向两侧逐渐下降，不断地靠近基线无限延伸，但始终不和基线相交；

⑶ 正态分布曲线下的总面积为1，过平均数点的垂线将正态分布曲线下的面积划分为各是0.5的相等两个部分；

⑷ 正态分布曲线，根据平均数、标准差的不同有不同的分布形态。平均数决定曲线的位置，标准差决定曲线的展形；

⑸ 正态分布曲线下，随机变量离平均数多少个标差距离内取值的概率，有一定规律。正负一个标准差之间取值的概率为68.26%；正负两个标准差之间取值的概率为95.44%；正负三个标准差之间取值的概率为99.72%。所以服从正态分布的随机变量几乎所有取值都处于正负三个标准差之内

3、标准分数

⑴地位量数与标准分数

地位量数：指反映次数分布中各数据所处地位的量

★标准分数（识记）又称Z分数，是原始分数以本组标准差为单位时对本组平均数的距离；其值就是该分数与平均数之差除以标准差后所得之商

⑵★标准分数的性质简答

⑴ 标准分数的平均数为0，标准差为1（即转换成Z分数后，以1为单位，以0为参照点）；

⑵ 标准分数是原始分数线性转换的结果，其分布形态和原始分数分布形态完全相似；

⑶ 标准分数有正、负号与绝对值；正负号表示原始分数是大于还是小与平均分数，绝对值表示原始分数对平均分数的距离；

⑷ 如果原始分数呈正态分布或近似正态分布，查正态分布表可知，在正负3个标准差之间的取值范围即可能为99.73%，这就意味着原始分数的绝大多数取值都在正负3个标准差之间。

由标准分数的求法和性质可知，把原始分数转换成标准分数的实质，就是把单位不等距和缺乏明确参照点的分数，转换成为以标准差为单位，以平均数为参照点的量表分数。可以证明，任何一组数据的标准分数的平均数为0，标准差为1.

⑶★标准分数的应用简答

A明确每个原始分数在分布中的相对位置；

B比较两种测验成绩的优劣；

C计算被试接受不同测验之后的总分和平均分

S3相关与回归

1、相关（事物或现象之间的相互关系有两种类型：函数关系、相关关系）

①变量间的关系

★相关关系：是指两个事物或现象之间存在不十分严格的依存关系，其特征是现象与现象之间存在一定的数量关系，但又不象函数关系那样能以一个变量的数值精确地求出另一个变量的数值。（回归分析）

★相关关系的分类：选择

按照变量关系的表现形态，相关可分为直线相关和曲线相关。图2-11

按照数值变化的总趋势，相关关系又可分为正相关和负相关；图2-10

按照两个变量联系的紧密程度，相关关系还可以分为：完全相关、高度相关、低度相关、零相关

②★相关关系的性质

在相关分析中，有相关系数来描述变量之间的相关方向和程度。相关系数取值范围-1和+1之间，相关系数的正负号表示相关的方向，正号表示为正相关，负号表示负相关。相关系数的绝对值表示相关程度，绝对值越大，表示相关越强，绝对值越小，表示相关程度越弱。相关系数等于0时为零相关（即两个变量不存在相关关系，彼此独立），等于为完全相关。需要特别注意的是，事物间有相关关系并不能说明就存在有因果关系。

③★积差相关系数是心理学研究中常用的相关系数之一。积差相关又称积矩相关，皮尔逊提出的一种计算变量间的积差相关系数，因而有称为皮尔逊相关

④当两列变量符合以下条件时，可以计算变量间的积差相关系数多选简答

⑴两列的变量均为连续变量； ⑵两列的变量的数据一一对应； ⑶两列的变量所来自的总体服从正态分布

2、回归

①名解回归分析：通过变量间不确定的关系，去发现变量内在的、隐藏的数量关系规律性的统计学方法

②选择回归方程y值计算（a 是回归线在Y轴的截距，b是回归线的斜率，称回归系数）：

③★名解决定性系数：在回归分析中，用决定性系数来表达回归方程式的有效性程度，决定性系数就是相关系数的平方r2

④回归线有两个特征，一是截距，另一是斜率。截距是指自变量取值为0时因变量的取值。斜率表明自变量对因变量所具有的影响程度。

第三章测验的编制、实施与评分

S1 测验的编制

1、测验编制的一般程序：①确定测验目的； ②拟定编制计划； ③开发测验项目； ④预测和项目分析； ⑤合成测验； ⑥测验的标准化； ⑦测验的质量检验（收集信度、效度资料）； ⑧编制测验手册；

①确定测验目的

⑴测验对象：测验要测的人，或者说测验编成后要施用于何种群体

⑵测验目标：所编测验是用来测量的是人的什么心理特质；

⑶测验用途：测验在社会生活、教育过程、心理咨询辅导与科研工作中的具体功用。

②拟定编制计划（使用双向细目表）理解

工作内容：确定测验所包含的内容和各种技能,以及每一种内容或技能在测验中的地位.

用途：一是：明确了应该编哪方面的测验项目以及多少测验题目，结束后可比照核对测验项目是否反映了所要测量的领域；二是：记分时可按计划中百分比确定每类测验项目的分数标准。

③开发测验项目：

⑴测验编制资料，遵循以下原则： a资料要有丰富性； b资料要有普遍性；

⑵选择项目的形式，项目确定的重要原则：a使受测者容易明了测验的方法； b使受测者在完成时不会因为项目形式不当而出错； c测验过程省时； d计分省时神力； e经济

⑶编写测验项目：

a项目来源：I直接选用国内外优秀的相关测验项目；II修改前人测验中的有关项目；III 自己独立编

b 编写项目的要注意的问题：I测验项目的取样应该具有代表性；II项目的范围与测验计划相一致；III测验项目的难度应有一定分布空间； IV初编项目数量要比所需数目多一倍至几倍，以备筛选；V用语力求精炼简短，浅显明了；VI作答说明必须简明

c初步检查的方面：1测验项目编制的技术性问题2初步确定测验项目是否具有必要的有效性与可信度

④预测和项目分析

⑴预测，预测要注意的问题：a对象取自正式测验准备应用的群体； b样本应有充分代表； c实施的情境与过程应与正式测验相同；d时间充裕，可适当延长时间，使被试将题目完成从而获得充分的反应资料 e测验过程中，随时记录被试的反应

⑵项目分析，项目分析的内容包括：质的分析和量的分析。一是要从内容上检查取样的适当性，文字表达是否清晰；二是要对预测的数据结果进行统计分析，确定难度、区分度及备选答案的适宜性

⑤合成测验：包括三部分内容：⑴测验项目的选择； ⑵测验项目的编排 ⑶测验复本的编制

⑴测验项目的选择，标准由三个：一是能否符合测验目的与性质；b二是项目难度要恰当；c三是项目区分度要高；

⑵测验项目的编排，题目编排一般有一下两种方式：a逐类直进式（韦克斯勒量表，同一分测验内由易到难）；b混合螺旋式（比纳——西蒙智力量表）

⑶测验复本的编制，编制复本的关键是等值，所谓等值需要符合下列条件（如何编制复本）：

A复本和原本所测量的是同一心理特质；

B复本和原本必须具有相同的内容和项目类型；

C复本和原本不能有相同的项目；

D复本和复本的项目数量必须等同，并且有大体相同的难度和区分度；

E在测量同一团体时，复本和原本的分数分布大致相同；

⑥测验的标准化：所谓标准化就是指测验内容、施测、评分以及分数解释规划化、一致性与科学性

⑴测验内容（工具）标准化；⑵施测过程标准化；⑶测验评分标准化；⑷分数解释标准化

⑦测验的质量检验（收集信度、效度资料）；

⑧编制测验手册包括以下内容： ⑴测验的目的和功用；⑵编制测验的理论背景及开发测验项目的依据；⑶测验的实施方法、时限及注意事项；⑷测验的标准答案和评分方法；⑸常模资料；⑹测验的信度与效度资料

2、测验项目的编制技术

①命题的一般原则：（理解）

1．测题要符合测验目的；2．内容取样要有代表性；3．题目格式不要让被试产生误解；4．文句要简明扼要，排除无关因素；5．应有不致引起争论的确定答案（创造力和人格测验除外）；6．各个试题必须彼此独立，不可相互牵连；7．题目不可含有暗示本题或其它答案的线索；8．题目内容不要超过受测团体的知识能力；9．所提出问题应避免涉及社会禁忌和个人隐私；10．施测与评分省时.

②几种主要的测验项目类型：1论文题2选择型项目3判断型项目4匹配型项目5填空型项目6简答题7操作题8联想题和投射题

③罗夏墨迹测验：是以墨迹图来引起被试者的联想，探测被试的人格特征

S2 测验的实施

1、主试的资格（测验的主持和实施者在心理测量中被称为主试；只有训练有素、资质合格的心理测试工作者才能胜任）满足三方面要求：④心理学基础知识；①心理测验的理论知识 ②心理测验的专业技能 ③测验工作者的职业道德

很能体现心理测验工作者的职业道德的表现之一就是对测验的保密

2、★测验的选择（临考前看书）P46-47

⑴根据测验目的来选择测验：测验的目的是我们选择测验的首要考虑问题。由于每个测验的用途和使用范围都是不一样的，所以研究者在使用测验之前都要研究测验的功用，优缺点；在实际工作中，不能通过测验的名称盲目选择测验，必须了解该测验真正测的什么心理特这及使用范围和功效，否则会造成测验使用不当。

⑵根据被试的情况来选择测验：被试的特点和具备的条件也是选择测验的重要依据。因为每个测验都有一个使用的年龄和年纪范围，不在此范围的被试是不能使用这一测验。

⑶根据测验的质量来选择测验：测验的技术参数是一个测验编制好坏的重要指标，测验的信度、效度和常模的优劣常被用来选择的依据；另外还要考虑测验的时效性，这包括项目内容时效和常模资料时效两个方面。

3、测验的准备

①预告测验 ②准备好测验材料 ③熟悉测验的具体程序 ④确保满意合适的测验情境 ⑤协助被试做好准备

主试应协助被试做好哪方面的准备：⑴时间准备 ⑵生理准备 ⑶心理准备

4、测验的实施：①指导语和时限 ②做记录 ③如何对待被试的要求 ④测验中主试的职责

①指导语和时限：指导语一般包括针对主试和针对被试两部分。针对主试的指导语通常单独印在另外一张纸上，主要是对测验的细节的进步一步说明及注意事项。

②做记录 ⑴记录要隐蔽 ⑵记录要忠实

③如何对待被试的要求

④测验中主试的职责 ⑴遵从指导语； ⑵测验前不讲无关的话； ⑶主试在测验时应集中注意，认真观察被试的所有反应行为； ⑷在任何情况下，主试都不能对被试的回答有所暗示； ⑸在测验中也可适当强化被试的行为，以此鼓励被试继续集中注意力在测验上； ⑹鼓励被试回答； ⑺对特殊问题有所准备； ⑻与被试建立良好的协调合作关系

5、★影响被试作答反应的因素：⑴测验技巧 ⑵练习效应 ⑶教练测验 ⑷应试动机 ⑸测验焦虑 ⑹反应定势

①测验技巧：被试的测验经验和测验技巧会影响测验分数

②练习效应：任何一个测验在第二次应用时，都会有练习效应而使得成绩有所提高

③教练测验：是针对着测验内容与形式进行专门的教学和辅导

④应试动机

⑤测验焦虑：是指被试因接受测验而产生的一种忧虑和紧张情绪，它会影响测验结果的真实性

⑥反应定势：也称反应的方式或反应风格，是指独立于测验内容的反应倾向；即由于每个人回答问题习惯的不同而使有相同能力的被试获得不同的分数(S7反应定势：反应定势与测验内容有关，指被试有意或无意地掩盖其真实情况按自己或别人所希望表现的形象进行作答。如应聘工作。常见的反应定势：社会称许性：指被试在测验上有依附社会所期望的行为方式作答的倾向)。不用的反应定势对测验分数影响如下：

⑴“精确—速度”反应定势； ⑵肯定（否定）反应定势； ⑶偏好特殊位置反应定势； ⑷偏好较长选项反应定势； ⑸猜测反应定势

S3测验的评分与解释

1、测验的评分：评分是整个测验施测过程的最后步骤，也是为测验结果的解释报告做好准备的关键环节

①原始分数：根据被试的实际作答，按测验的评分程序与标准，对每个测验项目及整个测验上所作反应评出的分数。

②原始分数的转化

2、测验分数的解释

⑴如何看待测验分数的意义：解释分数的原则

a主试应充分了解测验的性质与功能

b对导致测验结果的原因、解释应慎重，谨防片面极端

c必须充分考察测验的效度和局限

d解释分数应参考其他相关资料

e对测验分数应以“一个区间分数”来对待，不应以“特定的数值”来解释

f对来自不同测验的分数不能直接比较

⑵如何向被试和有关人员报告测验分数，报告分数的原则

a使用当事人所理解的语言

b要保证当事人知道这个测验测量或预测了什么

c如果分数是以常模为参照的，就要使被试知道他和什么团体进行比较

d要使当事人认识到分数只是一个估计

e要使被试知道分数将被如何运用

f要考虑测验分数将给被试带来什么心理影响

g测验结果应向无关人员保密

h对低分者的解释应谨慎小心

I报告测验分数时应设法了解被试的心理感受并采取适当的措施加以引导

第四章项目分析与常模

S1项目分析

★名解项目分析：就是对测验中每个项目的质量，都进行质和量的分析评价，从而为筛选修改项目提供依据，确保和改进整个测验质量（主要包括难度和区分度）（S3项目分析，项目分析的内容包括：质的分析和量的分析。一是要从内容上检查取样的适当性，文字表达是否清晰；二是要对预测的数据结果进行统计分析，确定难度、区分度及备选答案的适宜性）

1、★项目难度

① ★项目难度（识记）是用来表示测验项目难易程度的指标。用被试通过率P来表示，如果大部分被试能答对就认为该项目难度小，反之难度大

②难度的计算：

⑴二值计分制的难度（评分规则只有对或错，采用“全或无”办法计分，一般记为1分或0分的测验项目），

a通过率： P=R/N，R：答对人数；N：总人数（P通过率越大，难度越小）

b高-低分分组法（极端分组法）：P=（PH+ P L）/2

*分数从高到低排列，分成高分组合低分组，各取27%，分别计算通过率。求两组通过率的算术平均数

⑵非二值计分制的难度（论述题和简答题都是非二值计分制）

P=X/XMAX （X为平均分，XMAX为该题的满分）

③★项目难度对测验的影响（领会）

⑴难度过大或过小都会造成测验分数偏离正态分布，因此测验难度适中一般来说是比较理想的情况

⑵同时测验难度也会影响测验的信度

⑶测验难度对测验的鉴别力也有一定影响

④项目难度的等距量表（等距量尺）：按照项目难度的本来含义把它表达在被试能力水平量表上，即直接在横轴上来指定为Z值时，难度就会有相等单位了，就表达在等距量表上了~等距量表上的项目难度被称为绝对难度。

项目难度（绝对难度）转换：△=13+4Z，（△：项目难度或绝对难度；Z：由P值转换而来的标准分数）

2、项目区分度

①★名解区分度（识记）又称项目鉴别力指数，一般用D表示。是指项目得分对被试心理特质水平高低的区分鉴别性能，也即项目得分的高低与被试实际能力或特质水平高低的一致性程度。项目鉴别力指数的取值范围介于-1.00——+1.00之间，D为正值称作积极区分，为负值称为消极区分（负鉴别力），D为0称无区分作用。D>0（在积极区分区域）时，D值越大，项目鉴别力约好。

②项目区分度的计算：

⑴高-低分组法（二值积分法）

D= PH - P L

连续变量的分数从高到低排列，分成高分组合低分组，各取27%

l 当D=1.00表示高分组被试全部通过，低分组被试全部失败；相反，如果低分组的被试全部通过，高分组的被试全部失败，则D=-1.00，如果两组通过率相等，D=0

l 相关系数指标：项目与总分相关；计算项目的区分度，一般是用项目得分与测验总分的积差相关系数来求取。

⑵多值计分法：

D=（XH-XL）/W=XH/ XMAX -XL/ XMAX

XH：高分组的平均分 XL：低分组的平均分 W：该题目的满分

⑶求项目与总分的相关系数法：皮尔逊积差相关系数法：看笔记，不考

③★名解项目区分度与难度的关系：项目难度会影响项目区分度，对于一份测验来讲，题目的平均难度越接近0.50，不同得分被试间相互比较的次数就越多，测验的区分鉴别力就越高

④测验项目的筛选评价

⑴根据难度来筛选项目：一般要求测验项目的难度可位于0.2—0.8或0.3—0.7之间；同时所有项目的平均难度则要求在0.5之间。

⑵★根据区分度来筛选项目：

a区分度的提高会显著地提高测验的信度和效度

b根据下表，区分度在0.3以上就比较理想，但有些区分度在0.2—0.3之间的项目，如果能很好地体现测验目的，也应酌情予以保留

S2 常模与发展常模

1、常模及常模在测验分数解释中的作用

⑴当前常用的心理测验都是常模参照测验，常模是这类心理测验的解释分数含义的参照体系。按照参照的是以达到的发展水平还是某团体中的相对位置，常模可以划分发展常模和团体常模

⑵测验常模（识记）简称常模，理论上是指所有应测被试在测验所测特质上的实有水平的分布状况或分布形态；实际操作中是指代表性被试样组在测验上得分的分布状况或分布形态

⑶为了能参照着常模来对分数做出解释，原始分数就应该转换成导出分数。导出分数是从原始分数转换而来的，具有一定的参照点和单位的，测验量表上的数值。

⑷理解常模概念时需清楚

1.常模是测验分数的总体分布形态，一般用测验分数的平均数和标准差来表示，它能对个体的分数加以解释。

2.常模就是各种导出分数，由于这些导出分数具有相等的单位，所以它能比较各种不同的分数。

3.常模具有相对性，只能用来解释一个测验范围内的情况。

2、常模的求取过程：取样→测试→数据分析

⑴确定有关的测试团体，并从中抽取有代表性的被试样组

⑵对代表性被试样组进行合于标准化要求的测试，获得该被试团体成员在所测特质上足够而真实可靠的数据与测验分数

⑶把原始分数转化为某种形式的导出分数，制作常模表并给出使用说明

3、发展常模的种类（识记）：年龄常模、年级常模、顺序常模

⑴年龄常模（理解）：比纳智力量表首先寻找和设计出可区分各年龄儿童智力的项目，然后将每个项目都放到合适的年龄水平中去。当每个年龄水平都有了适量的恰当项目后就可以得到一个可评价儿童智力发展水平的年龄常模量表。一个儿童在此量表上所得分数就是最能代表其智力水平的年龄。这种分数叫做智力年龄（或心理年龄），简称智龄

年龄常模的三个基本要素：第一、一个能区分不能年龄组的项目；第二、一个由各个年龄的被试所组成的代表性常模样组；第三、一个表明答对多少项目或得多少分，及该归入那个年龄的常模表

⑵年级常模（理解）：在学业成就测验中通常建立年级常模，如识字测验、阅读测验、算术测验的年级常模等。就是常说的学业成就发展水平常模。它是用某年级学生在某一测验上的平均分数和相应的年级当量之间的对应关系来进行描述的测验常模。年级当量通常用两位数表示，第一位为年，第二位为月。年纪常模使用中注意事项：

首先，年级常模仅仅适用于各个年级都开设的科目；其次，年级当量解释比较困难；另外，年级常模不能被误认为成绩标准；

⑶顺序常模

4、格赛尔的儿童动作发展顺序量表：格赛尔认为儿童行为模式出现是有一定程序的，出生后4周、16周、28周、40周、52周、18个月、24个月、36个月都是行为发展的关键年龄，这些年龄阶段出现的行为可作为测查项目和诊断标准。测查包括：动作能、应物能、应人能、言语能。他对儿童这8个年龄阶段的典型行为作了考察，按月份显示了儿童在动作、适应性、语言、社会性等4中主要行为领域中所达到的大致发展水平，从而建立了儿童早期行为发展的顺序模式，即格赛尔儿童动作发展顺序量表。格赛尔认为，儿童动作各发展阶段遵循一定的顺序前进，每一阶段掌握前一阶段的必要行为特征为前提。

5、发展常模的评价：（优点）发展常模用来表示个体在正常发展途径上处于怎样的水平。它以年龄或年级作为单位，容易为人所接受理解；也可以与同等团体做直接比较，并且为个人内比较与纵向比较提供了基础。（缺点）同时也有一些不足之处，一方面由于它只适用于所测特质随年龄或年级而发生系统变化的状况，因此常只适用于年龄较小的儿童；另一方面由于人的行为发展受教育与经验的影响，发展常模只适用于典型环境下的儿童

S3团体内常模及其应用

1、★名解团体内常模的含义：团体常模也称作组内常模，通常是根据标准化被试样组的测验分数、经过统计处理而建立起来的具有参照点和单位的测验量表

2、团体内常模的种类：百分等级常模、标准分数常模、其他导出分数常模

⑴百分等级常模（识记）它从应测试的被试团体中，抽取一个有代表性的被试样组，并把这个被试样组所有个体在某一心理测验上的原始分数，按大小顺序分为100个等级，并建立起原始分数与百分等级的一一对应关系。

A百分等级：一个原始分数的百分等级是指在常模样本中低于该分数人数的百分比。百分等级是应用最广的测验分数表示方法。

B百分等级是对原始分数的非线性转换；

C百分量表是一个顺序量表，数据只具有区分性和顺序性。

D百分等级是相对于特定的被试团体而言的，所以解释时不能离开特定的参照团体。

⑵★名解标准分数常模（识记）：就是用被试所得测验分数转换成标准分数来揭示其在常模团体中的相对地位的组内常模。Z分数常有带有小数和出现负值，这会给使用过程带来不便。所以我们通常对Z分数做线性转化，使负号和小数消失，全部变为正数。线性转换公式为：

T=a+bz T分数：表示线性转化后的导出分数，a变换分数的平均分数，b表示变换分数的标注差，Z表示标准分数；

其实就是Z分数的变式。T分数：平均数为50，标准差为10的分数。这一词最早由麦柯尔于1939年提出

l 韦氏智力量表各分测验的量表分：T=10+3Z

l 韦氏智力量表的智商离差智商：T=100+15Z

l 美国大学入学考试报告分数：T=500+100Z

l 我国四六级英语考试分数：T=500+70Z

标准分数进一步线性变换为导出分数的优点：

1具有等单位特性，便于进一步的统计分析

2在正态分布下，可以利用正态分布表将各种导出分数与百分等级作换算

3可以将几个测验上的分数做直接比较并累加求和和求总分、

⑶其他导出分数常模

A标准九分=5+2Z

B几种导出分数间的相互关系：

1标准分数与百分等级之间的关系：标准分数Z值的大小表示被试的原始分数与他所属团体的平均分数的距离恰有Z个标准差那么远；

2各常模导出分数的相互关系：在心理测量中，当被试群体足够大时，若所测的又是人的基本心理特质，那么，所得分数的分布形态，一般都能接近正态

3、常模的应用

①单选科学的合成方法：先把各分测验的原始分转换成量表分，然后再求各量表分的累加和

主要方法：

1、利用常模资料：在求出分测验的量表分的基础上累加求和或剖析图法

2、临床诊断方法：根据直觉或经验，主观地将各种因素加权而获得结论或评定的方法

3、加权求和法：包括单位加权，等量加权和差异加权。

②剖析图：对于有多个分测验的标准化心理量表（或成套测验），把被试在全量表中各个分测验上的得分的总体形状表达出来，并具体说明被试各个分测验的实际表现以及彼此间相对地位的直观而形象的图形。

绘制测验量表剖析图：⑴绘出直角坐标。一般，横轴上可指定分测验，纵轴则可以进行量表取分； ⑵分别对各分测验按量表分值在直角坐标系中描点； ⑶将各量表的得分点连结，从而得到所有分测验分数的折线；

③全国常模与特殊常模

⑴多选根据样本的大小和来源，常模可分为全国常模、区域常模和特殊常模

一个量表如果既有合格的地区性常模又有全国性常模，那么，使用被试适合的地区性常模来作解释，其信度和效度可能会更好些。

对特殊被试的测验结果的解释，不能以普通的常模为依据

特殊常模：根据特殊群体的较少而特定的范围对测验进行标准化，建立起的适合特定群体实际情况和测验目的的要求的常模。

第五章测验的信度和效度

S1 测验的信度

1、★信度概述

①定义（识记）信度就是测验抗干扰能力或者说所得结果一致性的指标（稳定性、可靠性、一致性）（每个被试在测验工具上所获分数都可以视为由两部分构成：一真分数；二测量误差：随机误差和系统误差）

②信度的作用：信度是衡量一个测验质量的重要指标之一。它的作用表现在：第一，反映测量过程中所存在的随机误差的大小，能有效地评价一份测验的可靠性程度；第二，用来解释个体测验分数的意义；第三，用来解释不同测验间的分数差异；

2、信度的估计方法（实施两次测验：重测信度、复本信度；实施一次：同质性信度、评分者信度）信度系数：用相关系数来表示信度的高低，这种相关系数称为信度系数；

①重测信度（稳定性系数），也叫重测法：用同一个测验对同一组被试施测两次时所得结果的一致性程度（两次测验得分用皮尔逊积差相关法计算相关系数）。使用重复信度的几个前提条件：

⑴所测的心理特质必须是稳定； ⑵练习和遗忘效果基本上相互抵消

②复本信度（等值稳定性系数），也叫交替测验法：两个平等的测验测量同一批被试所得结果的一致性程度（两分测验得分用皮尔逊积差相关法计算相关系数）

③同质性信度：指测验内部所有项目间的一致性程度。项目间的一致性有两层意思：一是所有项目测的是同一种特质；二是指所有项目得分之间都具有较高的正相关；估计同质性信度的方法有：分半信度；库德——理查逊信度；克隆巴赫的α系数

⑴分半信度：一个测验分成平行对等两半后，被试在这两半上所得分数的一致性程度

⑵库德——理查逊信度：适合于全部是二值计分制项目的测验；

⑶克隆巴赫的α系数：用于测样是论述题或既有选择题又有论述题等多种题型的情形

④评分者信度：指多个评分者给同一被试的作答反应进行评分的一致性程度

3、信度系数的使用（不考）

4、保证和提高测验信度的方法

①影响测验信度的主要因素：⑴抽样误差； ⑵随机误差

②提高测验信度的常用方法：

⑴选取恰当的被试样本；

⑵延长测验的长度，长度指测验的项目数量，新增项目必须与原有项目同质；

⑶控制测验的难度，提高测验的区分度（难度控制在中等水平且接近正态分布分布）；

⑷提高测验内容的同质性；

⑸测验实施时严格按要求施测，努力争取被试积极配合，测验评分严格按标准客观评定（保证测验标准，尽可能减少随机因素的影响）；

S2 测验效度

1、效度的概述

①定义（识记）效度就是测验测到它打算要测的心理特性的程度（测验结果的有效性程度）

②★效度与信度的关系：高信度是高效度的必要条件，但不是充分条件；信度高的测验不一定效度高，但效度高的测验信度一定要高。经典测验理论

2、效度的验证：就是从多个方面寻找证据来证明一个测验的有效性程度的过程，通常会从以下三种途径来验证分析：第一，（内容效度）从测验内容的角度来分析验证，并提供证据说明是否能达到测样的目的；第二，（构想效度）从测验是否符合心理学上某种心理理论的角度来分析验证，并提供证据说明是否能达到测样的目的；第三，（实证效度）从测验的实效的角度分析验证，并提供证据说明是否能达到测样的目的；

①内容描述的效度验证分析法：是系统检查一个测验实际测到的内容与所要测量的内容之间的吻合程度；所得结论通常称为内容效度

⑴考察测验的内容效度包括三个方面问题：a项目要测量的是否真属于应测量的领域；b测验所包含的项目是否覆盖了应考察领域的所有方面；c考察所测特质不同方面的测验项目，其比例是否恰当

⑵内容效度的测验方法：逻辑分析法、再测法、复本法、经验法

②结构鉴别的效度验证分析法：是分析和证实测验能够说明心理学上的理论结构或特质的程度，所得结论通常称为结构效度法。方法包括：逻辑分析法、发展水平的变化、与另一有较高结构效度的测验比较；与另一测查不同结构的测验相比较、实验操作法、因素分析法

③效标预测的效度验证分析法：是分析测验分数与作为效标的另一独立测量结果之间的一致性程度；所得结论通常称为效标关联效度（实证效度）。

⑴效标：测验外变量的取值就被称为效标，因为它是用来判断测验是否有效的标准。

⑵效标污染：主试知道被试原来的测验成绩，从而影响了效标测量中对被试的评定

⑶根据效标资料收集的时间差异：效标关联效度又分为同时效度和预测效度

A同时效度：所要验证效度的测验，与另一效标测量的数据资料，是大约同时获得的

B预测效度：测验结果是用来对未来的行为或效标测量做出预测的，测验分数本身跟效标测量资料是一先一后获得的。

3、效度系数及应用（不考）

4、提高测验效度的方法：

①影响测验效度的因素：⑴测验信度；⑵测验的构成 ⑶接受测验的被试；⑷所选效标的性质

②提高测验效度的方法：

⑴所有提高信度的方法，均有助于提高效度；

⑵精心编制测验，避免出现较大的系统误差

⑶创设规范化标准化的测试情景，妥善组织测验，保证每个被试都能发挥正常水平，控制随机误差

⑷选好正确恰当的效标，准确地进行效标测量，尽力避效标污染并正确地使用有关统计方法进行分析

⑸选取具有代表性和异质性的被试群体。

1、测验性能考察与选用决策。

选择考察信度和效度资料，主要方面应该有：

①设计验证了哪些种类的信度和效度指标； ②信度和效度的分析验证是在什么样的被试组上，如何具体地进行的； ③信度和效度的时效性

2、测验有偏性分析：有偏性是指测验对于参加测试的某些群体或个体来说有偏见或不公平，如果一个测验在两个不同的子群体上有不同的测验效度，即认为该测验存在有偏性

第六章智力测验

S1 概述

l 高尔顿是第一个对智力进行系统研究的人重视个体差异和提倡心理测量（心理测量运动的重要任务）等级评定量表、问卷法及自由联想法的先驱

l 1、智商及其定义

①智龄（心理年龄）：指通过被试的测验作答表现确定下来，某一年龄儿童通常具有的智力水平。

②比率智商应用：比率智商是指采用心理年龄与实足年龄的比值进行计算的智商.IQ=MA/CA*100。1916年斯坦福比纳量表提出比率智商

③离差智商是确定个体在相同条件的团体中的相对位置，它实质是将被试的智力测验成绩和同年龄组被试的平均成绩相比较而得出的相对分数。离差智商IQ=100+15Z

2、智商的分布（识记）和智力的等级划分：呈正态分布，大部分人的智商处于中间水平，只有极少数人的智商极端地高或低

推孟智力分布表识记（9个等级，最后60以下，分为50—70：低能；25—50：无能；25以下：白痴）：

韦克斯勒智力等级分布表：

S2 个别智力测验（常见的智力量表有：斯坦福—比纳测验、韦克斯勒智力测验、考夫曼儿童成套智力测验、区分能力量表等）

1、斯坦福——比纳智力量表

①斯坦福——比纳智力量表的发展简史（识记）

⑴1905年编制了世界上第一个智力量表——比纳-西蒙量表，目的之是是要将智力正常和智力落后儿童区分开来1908年进行了第一次修订，第二次修订本发表于比纳逝世后的1911年~量表首次发表后，受到美国大批心理学家的关注和修订，最负盛名的是斯坦福大学心理学家推孟教授及同事修订的斯坦福-比纳量表

⑵第一版斯坦福-比纳量表出版于1916年(运用比率智商)，1937年第二版，1960年第三版中不再使用比率智商而采用离差智商，1986年第四版，2003年出版了第五版

②第４版斯坦福——比纳智力量表（S－B4）：第四版理论框架（识记）是由桑代克等人编制的，创建了三层次的认知能力结构模型以此作为编制量表的依据。最高层是一般智力因子，第二层包括流体-分析智力因子、晶体智力因子和短时记忆能力因子，第三层包括各项具体的能力。编制了15个分测验用来测量4个主要认知领域（言语推理、数量推理、抽象/视觉空间推理、短时记忆）的能力（与弗农的三层次结构论比较）

S-B4的施测（领会）1施测用的材料2施测程序3施测过程4测验的评分与分数的转换5结果的解释

③斯坦福——比纳智力量表第５版（S－B5）简介（识记）：

⑴5个核心领域，分别是流体推理、知识、数量推理、视空间加工和工作记忆。每个领域均包括言语和非言语两个部分，共有10个分测验

⑵适用于2~85岁及以上年龄的被试，时间需要45~75分钟~施测分三步：1进行例行的分测验2进行非言语水平的测试3进行言语水平的测试

2、韦克斯勒智力量表

①韦克斯勒智力量表发展简史（识记）

⑴1939年韦克斯勒编制了韦克斯勒—贝勒维智力量表（W—BI）1955年韦克斯勒编制了韦氏成人智力量表（WAIS），用它取代了W-BI。WAIS的修订本于1981年，1982年出版中国修订版（WAIS-RC），1997年出版了第三版

⑵1949年问世韦氏儿童智力量表（WISC），1974年修订，第三版发表于1991年，我国于1981年初步完成修订工作，量表用代号表示为WISC-CR~韦氏学龄前和学龄初智力量表（WPPSI）是WISC的延伸和修改，于1967年问世，1988年修订，我国修订后名称为中国-韦氏幼儿智力量表（C-WYCSI）

②★韦克斯勒成人智力量表第３版（识记）：（WAIS-Ⅲ）基本结构包括言语量表、操作量表和由二者构成的全量表，一共含有14个分测验——适用于16-89岁的成人

③韦克斯勒儿童智力量表第３版和第４版：

⑴（WISC-Ⅲ）包括言语和操作两个量表，总共由13个分测验组成~（WISC-Ⅳ）删除了WISC-Ⅲ中的物体拼凑、图片排列和迷津三个分测验，其余10个分测验被保留下来并进行了修正。另外增加了5个新的分测验

⑵对（WISC-Ⅲ）进行因素分析可得到四个基本因素他们分别是a言语理解因素；b知觉组织因素；c注意集中或克服分心因素；d加工速度因素；

④考夫曼儿童评定成套测验（K-ABC）

⑴选择考夫曼夫妇赞成认知心理学的观点，即人类信息加工方式包括同时性加工和继时性加工两种

⑵名解K-ABC由心理加工量表和成就量表二者组成；心理加工量表又由同时性加工量和继时性加工量表组合而成

S3团体智力测验（在测验的过程中，由一个或几个的主试对多个被试同时施测的测验）

常见的团体智力测验工具：陆军甲种和乙种测验，瑞文测验和多水平团体测验

1、陆军甲种和乙种测验（识记）第一次世界大战期间，为适应战争需要，美国心理学家推孟的研究生奥提斯为美国研制的。

陆军甲种测验为文字测验，它易受被试的知识经验影响，适用于文化水平较高的被试，陆军乙种测验为非文字测验，适用于文化程度较低的士兵和文盲士兵

陆军乙种包括有：迷津、立方体分析、补齐数列、数字校对、填图、几何图形分析等7个分测验

2、瑞文图形矩阵推理测验（RPM）

①选择由英国心理学家瑞文1938年编制，一种非文字智力测验。理论依据是斯皮尔曼的智力二因素理论。RPM主要以引发能力为依据编制而成。引发能力是不依赖过去经验和已有知识的、对事物之间关系的认识能力。斯皮尔曼之所以用“引发”一词，是因为觉得变量之间的内在关系并非直接呈现，而需要人主动地从背景中已有的信息出发，去建构出清晰的知觉心理构造

3、奥蒂斯——莱农学校能力测验

影响最广发多水平成套测验：奥蒂斯——莱农学校能力测验、认知能力测验、认知技能测验

S4智力测验的理论问题

1、智力的结构：斯皮尔曼的二因素论、瑟斯顿的群因素论、弗农的三层次论、吉尔福特三维结构论、卡特尔的流体智力和晶体智力、斯滕伯格的智力三元论、加德纳的智力多元论

①斯皮尔曼的二因素论：英国心理学家斯皮尔曼提出。在一切心理任务上都包括这个一般因素（g因素）和某个特殊因素（或称s因素）两种因素。一般因素是人的一切智力活动的共同基础，特殊因素只与特定的智力活动有关。一般因素就是智力

②瑟斯顿的群因素论：美国心理学家瑟斯顿提出，智力由字词流畅性，语词理解，空间能力，知觉速度，计算能力，归纳推理能力和记忆能力7种基本心理能力构成，并且彼此独立，这是一种多因素论。研究结果发现，7种基本能力之间都有不同程度的正相关，似乎仍可以抽象出更高级的心理因素，也就是g因素。

③弗农的三层次结构论：智力由三个层次的因素构成：最高层次的是智力的G因素，第二层次的因素有两个，分别是言语因素和操作因素；第三层次的因素是一些主要的心理能力（与S—B4的三层次的认知能力结构模型比较）

④三维结构理论：美国心理学家吉尔福特认为，智力活动可以区分出三个维度，即内容维度、操作维度和产品维度。其中内容维度即引起个体心智活动的各种刺激物，包括听觉、视觉、符号、语义和行为5种类型。操作维度即它是由上述种种对象或材料引起的智力的加工活动，包括认知、记忆、发散思维、聚合思维和评价。产品维度即智力活动的结果。包括：单位，类别，关系、系统、转化和蕴涵6种。3个维度的不同变化组合可以产生150种心理能力

⑤卡特尔的流体智力和晶体智力理论：一般智力或g因素可以分成流体智力和晶体智力两种。流体智力主要和神经生理的结构和功能有关，指一般的学习和行为能力，主要作用是学习新知识和解决新问题。流体智力在青少年期达到高峰，在成年期保持一段“高原状态”然后逐渐下降。晶体智力与知识经验的积累有关，指已获得的知识和技能，主要作用是处理熟悉的、已加工过的问题。随着年龄增长，晶体智力的发展在成年期不仅不下降，反而在以后的过程中还会有所增长

⑥斯腾伯格的智力三元论：他认为，一个完备的智力理论必须对智力的三个方面予以说明：智力的情景亚理论、智力的经验亚理论、智力的成分亚理论（元成分、操作成分、知识获得成分）

⑦加德纳的智力多元理论：美国心理学家加德纳通过对脑损伤病人的研究及对智力特殊群体的分析，提出智力智是多元的，它由7种相对独立的智力成分所构成：⑴言语智力⑵逻辑——数学智力⑶空间智力⑷音乐智力⑸运动智力⑹社交智力⑺自知力

⑧智力的PASS模型：加拿大心理学家达斯提出了研究认知活动的PASS模型。该模型由三个认知系统组成：注意系统、信息加工系统、计划系统。注意系统又称注意——认知系统，是整个系统的基础；信息加工系统包括同时性加工系统和继时性加工系统两个子系统，处于中间层次；计划系统处于最高层次。三个系统协调合作，保证了一切智力活动的运行

2、智力发展的影响因素

影响智力发展有两种观点：一是遗传决定论，另一种是环境决定论。目前大部分人都赞同的观点基本思想是：

①两种因素相互依存，任何一种因素作用的大小、性质都依赖于另一种因素，它们之间不是简单的相加或会合

②两种因素相互渗透和相互转化，当前对环境刺激作出某种行为反应的有机体是它的基因和过去环境相互作用的产物

3、智力测验成绩的公平性（看书理解）

①性别的公平性②职业公平性③文化与教育差异

4、智力测验的预测能力

①婴幼儿智力成绩的预测能力②智力测验分数的稳定性③成人智力测验分数的变化

第七章人格测验

自陈量表：是目前使用最广泛的人格测验工具，常用：MMPI 16PF EPQ。自陈量表的优缺点：

①优点：⑴自陈量表项目结构清晰，意义明确，被试只须根据自己的实际情况选择较符合自己人格特征的描述回答即可；⑵自陈量表施测使用简单方便经济，主试只需做一简要指导，就可对大量被试同时进行施测；它对主试的要求不高，记分和解释也较为明确；

②缺点：易受被试反应定势的影响，作答也较受限制，提供的备选项不一定完全包含被试实际人格特征的描述

1、明尼苏达多相人格问卷（MMPI）；2加利福尼亚心理调查表（CPI）；3、卡特尔16种人格因素问卷；4、艾森克人格问卷（EPQ）5、修订NEO人格因素调查表、6、中国人人格量表（QZPS）

1、明尼苏达多相人格问卷（MMPI）

① MMPI的简单描述：MMPI是采用经验法编制，是现今国外最流行的人格测验之一，由明尼苏达大学教授哈撒韦和麦金利所编制的。适用于16岁以上具有小学文化水平以上的群体（或有阅读能力的成人），有研究认为13岁以上能读懂题目也可以。MMPI最初编制的目的是为精神病人提供一个患者评估和诊断的工具。它不但可做临床上的诊断依据，也可用来评定正常人的人格。最终项目为566个（实际上550个，其中有16个是前后一样的）。所有项目构成了10个临床量表和3（4）个效度量表（说谎分数L、诈病分数F——诈病或严重偏执、校正分数K——自卫反应），还加上一个疑问分数Q——无法作答的项目数。常模分男女两种，采用标准T分数积分T=50+10Z

② MMPI-2简介：由567个项目组成（分基础量表、内容量表和附加量表三大类），前370个项目包含了10个临床量表和3个效度量表，其余197个项目是新编的、修订的和保留的效度量表、内容量表和补充量表及分量表所需要的（如果只为精神病人临床诊断，可只用前370题）。MMPI-2的10个床量表提供了传统的MMPI一样的分数，同时保留了原有3个效度量表，新增了反向量表（Fb）、可变反应不一致量表(VRIN)、真实反应不一致量表(TRIN)。内容量表包括直接反映临床问题的核心症状项目及日常生活的各个不同方面。这样的量表使医师可以摆脱对诊断标签的单纯依赖，而去采用一种更具动力学性质的解释。 T 分数超过65分，在临床上才有意义。

③ MMPI中国版（1989版）的使用

MMPI的解释有两种：一种是分量表解释（T分数超过60分，可以视为可能有心理病理性异常表现或某种心理偏离现象）；另外一种是编码系统分析；

2、加利福尼亚心理调查表（CPI）：也是采用经验法编制的，用于测量健康的人格层面。CPI第三次修订于1987年，项目共包括434个是非题，其中近一半来自于MMPI。共组成20个量表，其中3个是用来评定参加测试者态度的“效度量表”分别是幸福感、好印象和社会性。幸福感以要求常模“装坏”的反应为基础；好印象以要求常模“装好”的反应为基础，社会性以易为大家接受回答的频次计算为基础。对CPI的进行因素分析可以得到3个结构量表，分别测量内在——外在、规范接受——规范拒绝和自我实现这三个较高层次的维度。

3、卡特尔16种人格因素问卷（16PF）采用因素分析法编制量表的典范。编制的理论基础是卡特尔的人格特质理论，认为人格是由许多特质构成的，这些特质可以分为两种类型：表面特质与根源特质。1949年卡特尔采用因素分析方法和词汇学的传统，以抽取到的根源特质为基础编制出16PF问卷，采取标准10分制积分。

16PF，除聪慧因子（B）项目外，其他因子的每个项目有a b c(如a：是的；b：不一定；c：不是的)，根据被试对每一项的回答，分别积分为0、1、2或2、1、0.聪慧性因子的项目只有a和b两个选项，计分只用1、0两种，答对记1分，答错记0分

①英文版16PF的发展 ②我国修订的16PF

4、艾森克人格问卷（EPQ），

①艾森克人格问卷简介：采用因素分析法编制1975年编制而成，理论基础是艾森克的人格类型理论，认为人格类型是由3个基本维度构成，分别是内倾-外倾、神经质和精神质，它们都有一定的生理基础。EPQ分儿童问卷和成人问卷两种，都包含4个分量表，其中3个用来测量上述3种人格维度，它们的名称分别是外倾性（E量表）、神经质（N量表）、精神质（P量表），还有一个是效度量表或说谎量表(L量表)用来识别受测者回答问题时的诚实程度。英文版儿童问卷共有97个项目，我国修订版的儿童和成人问卷均由88个项目组成

② EPQ中国龚耀先修订版的使用，平均数为50，标准差为10的的标准T分数

③艾森克还将外倾性（E）神经质（P）两个维度联合起来做垂线交叉分析。两维人格图：4种典型人格：外向稳定型、外向不稳定性、内向稳定型、内向不稳定型

5、修订NEO人格因素调查表：NPO-PI-R包含了人格的5个领域或维度，分别是神经质、外倾性、经验的开放性、宜人性和自觉性，每个领域又包含6个分量表，共30个分量表，每个分量表项目均为8个，共包括240个项目，项目采用5级评分法

6、中国人人格量表（QZPS）：采用因素分析法、词汇学假设，建立了中国人人格7因素模型。QZPS由七个大的人格因素分别是外向性、善良、行事风格、才干、情绪性、人际关系和处世态度（以下细分18个小人格），根据18个小人格因素进行二阶因素分析，QZPS还得到中国人的自我指向，他人指向和事物指向三个组合因素。

S2 投射测验

①1921年瑞士精神医学家罗夏克设计的罗夏墨迹测验（罗夏墨迹测验：是以墨迹图来引起被试者的联想，探测被试的人格特征），被认为是投射测验的发端。多选投射测验包括：墨迹技术、图片技术、言语技术、自传体记忆、表演技术

②★投射技术的特点：测验刺激结构不甚明确，意义较为模糊，被试的反应不受限制，必须凭自己的想象才能作答，从而可把个人的经验、情感和愿望赋予刺激，产生出对被试来说的某种特定意义。

③投射测验的理论基础：如果给被试一些模棱两可的刺激，当被试认真理解那些模棱两可的情节时，防御性降低，与动机、情感和欲望等有关的人格特点也会显露出来。投射测验的传统假设之一，就是被试对模棱两可的刺激的反应，体现出重要的和相对持久的人格特点。

1、罗夏墨迹测验：共包括10张墨渍卡片组成，每张卡片上印有一幅左右对称的墨迹图，其中5张为黑白图形（阴影是黑色），2张卡片的墨迹图黑白之中添加了少许鲜红色，剩余3张卡片是彩色墨迹图。施测时每次按顺序给被试呈现1张，同时问被试：“你看到了什么？“这可能是什么东西？”或“这使你想到了什么？”等，允许被试自己转动图片从不同的角度去看。每次只能施测一个。施测时主试一方面要记录被试的语言反映，同时还要注意被试的情绪表现及伴随的动作。罗夏墨迹测验的记分方法很多种，但基本原则是相同的，一般是根据位置、决定因素、内容和通俗性等进行记分。

2、主题统觉测验TAT：由美国心理学家莫瑞编制的。这种测验性质与看图说故事的形式很相似。由30张模棱两可的图片构成，另有一张空白图片，图片内容多为人物。测验时每次给被试一张图片，让他根据所看到的内容编出一个故事。故事内容不加限制，但必须符合以下四点：图中发生了什么事情，为什么会出现这种情境，图中的人正想些什么，故事的结局会怎样。主题统觉测验的主要假定是，被试在面对图片情境时所编出来的故事，常会与其生活经验有联系。被试在编故事时，常常会不自觉地把自己隐藏或压抑在内心的动机、欲望以及矛盾穿插在故事中，进而把个人的心理历程“投射”出来。因此，通过分析被试编的故事，有可能对他的需要和动机做出决定。

S3人格测验的理论问题

特质与情景相互作用；人格问卷的反应偏向问题；投射测验的信度和效度问题

1、特质与情境的交互作用：行为差异到底是因为个体的人格特质的差异导致的还是由个体所处的情境决定的存在一些争议。特质论者认为人的行为在不同的情境中具有一致性，表现为一定的行为模式。传统的人格测验大多是以此思想为指导而编制成的；情境论者对以上观点持反对意见，认为个体的行为具有高度的动态性，常因情境的不同而有所变化，因此情境才是决定行为的主要因素。在某一情境中个体是否表现出某种行为受该情境的客观因素和个体过去在类似情况中的学习经历的影响。两种观点都揭示了行为的某些方面的本质特性，两种观点的追随者逐渐达成共识，认为行为的特质和情境解释可以共存，行为是由特质和情境变量的交互作用决定的

2、人格问卷的反应偏向问题：有的被试的作答反应与事实不相符合，特别是在做罪犯精神病司法鉴定时。有学者将反应偏向分为两种类型：反应定势和反应风格

①反应定势：反应定势与测验内容有关，指被试有意或无意地掩盖其真实情况按自己或别人所希望表现的形象进行作答。如应聘工作。常见的反应定势：社会称许性：指被试在测验上有依附社会所期望的行为方式作答的倾向。

②反应风格：反应风格与测验内容无关，指当测验的刺激或意义并不明确时或当被试实际作出反应时使用一种特别的反应方式

③为了防止被试作答时产生反应偏向，一些人格问卷采用了某些技术：⑴采用中性语句； ⑵迫选技术； ⑶测谎量表； ⑷校正量表

3、投射测验的信度和效度问题

①信度问题：由于投射测验记分方法的特殊性和常模资料的不足，因而，评分者信度成为考察测验稳定性的重点；由于投射测验记分方法的特殊性和常模资料的不足，不能像自陈量表那样可以根据常模进行解释，因而同一个记录对不同的主试来说可以解释为不同的意义；

②效度问题：由于人格特质难以作出明确的界定、效标行为或效标样本不容易建立、存在反应偏向的干扰等原因，导致投射测验的效度较低

剖面图：

第八章心理卫生评定量表

S1 心理卫生综合评定量表

症状自评量表SCL—90；大学生人格问卷UPI；中小学生心理健康量表MHT；焦虑自评量表SAS；抑郁自评量表SDS；生活事件量表LES；社会支持量表；应对方式问卷

1、心理卫生评估概述

①心理卫生评估的任务、手段和作用：

⑴心理卫生评估的任务（理解）：描述个体或人群有关疾病的特征2描述个体或人群的健康状况3评估日常健康行为习惯和日常功能的有效水平4评估疾病发展中的心理过程5评估心理、社会因素在疾病康复过程中的作用6评估个体对不同应激刺激的反应7评估疾病康复过程中的各种治疗方法的效果及其与心理社会影响因素的相互作用8评估生活方式对防治疾病和增进健康的影响9评估个体或人群的社会经济状况对健康的影响10评估各种有害因素对健康的影响11评估卫生保健的有效性12评估医嘱依从性对疾病和健康的影响等

⑵心理卫生评估的手段：健康史的自我报告、收集档案资料、观察法、晤谈法、心理测量（心理测验和评定量表）、生物医学检查及其他手段

⑶心理卫生评估的作用： I做决定 II形成印象 III核实假设

②心理卫生评定量表的种类及优点

⑴心理卫生评定量表的种类

a按项目编排方式分类：I数字量表 II描述量表 III标准量表 IV检选量表 V强迫选择量表

b按测评主体分：I自评量表II他评量表

c按量表内容分类：可分为心理卫生综合评定量表等13类

⑵心理卫生评定量表的优点：a客观 b数量化 c全面 d经济方便

③心理卫生评定量表的选择和评价原则：⑴量表功效 ⑵敏感性 ⑶简便性 ⑷可分析性

2、★症状自评量表（SCL—90）

①症状自评量表简介：又名症状清单，有时也叫做Hopkin’s症状清单（HSCL）。现版本由德若伽提斯编制于1975年。HSCL最早版本编于1954年，称为“不适感量表”。在国外应用广泛，1984年我国王征宇首先翻译了该量表。误用仍较普遍，很多使用者把该量表作为某人群或个体的整体心理健康水平的测查方法，试图作出心理健康水平高低的结论；这种用法显然不妥。

⑴按照WHO提出的定义，心理健康并不只限于有无心理症状，心理健康水平测查范围要远远超出SCL-90的范围，不适合于比较普通人之间心理健康水平的差异

⑵ SCL-90评定的是一个人某段时间（近一周内）心理状态好坏的自我感受，易受多种因素影响。某些因子分高并不一定就反映被试存在心理症状。任何一种心理障碍的诊断都有一套标准，其中包括了时限，不只是症状持续一周或单凭SCL-90某因子分高就可作出诊断，还要经过一整套心理测查才能得到肯定的诊断

适合人群：13岁或6年级以上；用途：症状筛查、监控病情变化、疗效评估、研究；临床应用：可广泛应用于精神科、心理咨询、心理治疗门诊中，作为了解就诊者或受咨询者心理卫生问题的一种评定工具。在综合医院中，可以用于了解躯体疾病患者的精神症状；不能做诊断心理疾病。★评定的时间范围：是现在或者最近一周内，评分方法：采取5级评分制，有两种：1-5的5级评分，0-4的5级评分；统计指标：均为两项，即总分和因子分。

②量表的内容与结构：有90个项目，包含有较广泛的精神症状学内容。10个因子为：⑴躯体化 ⑵强迫症状 ⑶人际关系敏感 ⑷抑郁 ⑸焦虑 ⑹敌对 ⑺恐怖 ⑻偏执 ⑼精神病症 ⑽其他或叫附加因子

③★量表的实施及解释计分：

总分

总分是90个项目所得分之和

总症状指数（General Symptomatic Index），或称总均分：总分/90

阳性项目数：1-5的5级：项目分≥2；0-4的5级：被评为1～4的项目数；

阴性项目数：1-5的5级：单项分=1； 0-4的5级：单项分=0

阳性症状痛苦水平，1-5的5级：总分-阴性/阳性项目数；0-4的5级：总分/阳性项目数(不用减阴性，因为为0)

总分的参考标准：问题越轻，总分越低；

1-5的5级：总分超过160分，或阳性项目数超过43项，或任一因子分超过2分，可考虑筛选阳性

0-4的5级：总分超过70分，或阳性项目数超过43项，或任一因子分超过1分，可考虑筛选阳性

因子分：共有10个因子

组成某一因子的各项目总分

因子分 = -------------------------

组成某一因子的项目数

因子分的参考标准： 2.5：怀疑有症状；3.0：有症状；3.5：症状显著

疗效：减分率=（治疗前总分-治疗后总分）/治疗前总分

用总分的减分率来评估，减分≥50%为显著；≥25%为有效

3、大学生人格问卷（UPI）

①大学生人格问卷简介：1966年由日本大学的心理咨询专家与精神科医生集体编制而成。1991年译入我国，后1993年进行较为系统的修订。作用1全面掌握了解新生入学时的心理健康状态，为制定有关教育政策提供参考2做到有心理问题的学生的早期发现并及时的帮助和必要的治疗3起到心理卫生宣传作用4作为大学生心理健康的研究手段与工具。特点是简便易行，适于团体施测，测验过程不易引起心理抵抗，对施测人员无特别要求等

②问卷的内容与结构：1学生的基本情况2问卷本身3辅助题

③问卷的计分及解释：2级计分方式

4、中小学生心理健康量表（MHT）

①★量表的内容与结构：MHT量表共有100个项目，包含8个内容量表和一个效度量表（测谎量表）8个内容量表分别为：学习焦虑、对人焦虑、孤独倾向、自责倾向、过敏倾向、身体症状、惊恐倾向、冲动倾向

②量表的计分与解释

S2情绪及相关问题评定量表

1、焦虑自评量表（SAS）：焦虑是一种负性的情感体验，包括一系列的情绪：轻微的是不安和担心，中度的是害怕和恐慌，重度是极端恐怖。由W.K.Zung在1971年编制，用于评定被试焦虑的主观感受及其在治疗中的变化。由20个反映焦虑主观感受的项目组成，每个项目按症状出现的频度分为四级评分，其中15个为正向评分（1,2,3,4），5个为负向评分（4,3，2,1）。20个项目相加之和就是全量表的粗分，粗分乘以1.25，再取整数部分就得到标准分。SAS标准分的分界分为50分，其中50-59为轻度焦虑，60-69分为中度焦虑，69分以上即重度焦虑。

2、抑郁自评量表（SDS）W.K.Zung在1965年编制，DS由20个反映抑郁主观感受的项目组成，每个项目按症状出现的频度分四级评分。10个正向评分，是跟负向评分。20个项目相加之和就是全量表的粗分，粗分乘以1.25，再取整数部分就得到标准分。SAS标准分的分界分为53分，其中53-62为轻度抑郁，63-72分为中抑郁，72分以上即重度抑郁。

3、自我意识与自尊评定量表（自我意识又称自我概念）

① Piers-Harris儿童自我意识量表简称为PHCSS，1969年编制。1974年修订成为儿童自评量表。1990年翻译介绍到中国，2002年完成该量表的中国城市常模~该量表主要用于评价儿童自我意识状况。适用于8-16岁的儿童~由80个项目构成，分为6个分量表：行为、智力与学校情况、躯体外貌与属性、焦虑、合群、幸福与满足

②自尊量表（SES）SES编制于1965年，后翻译介绍到中国~最初设计用于评定青少年关于自我价值和自我接纳的总体感受~一共有10个项目，从“非常符合”到“很不符合”按1-4级评分~SES因简明、易于评分而被广泛使用，是对自己积极或消极感受的直接估计~但也存在一些问题，如回答项目时被试容易按照社会的期望来作答，另在大学生中的评定容易偏低

S3应激及相关问题评定量表

1、生活事件量表（LES）

①生活事件量表简介：我国于上世纪80年代初引进社会再适应量表SRRS，使用者们根据实际情况对某些条目进行了修订或增删，其中包括由杨德森等1986年编制的《生活事件量表》

②量表的内容与结构：共有48个条目，涉及三方面的问题。一是家庭方面（28条），二是工作学习方面（13条），三是社交及其他方面（7条）

③量表的实施与解释

⑴一次性的事件如流产、失窃要记录发生次数，长期性事件如住房拥挤、夫妻分居等不到半年记为1次，超过半年记为2次。影响程度分为5级，从毫无影响到影响极重分别记为无影响0分、轻度1分、中度2分、重度3分、极重4分。影响持续时间分为三月内、半年内、一年内、一年以上共4个等级，分别记1、2、3、4分

⑵生活事件刺激量的计算方法：

l 某事件刺激量=该事件影响程度分×该事件持续时间分×该事件发生次数

l 正或负性事件刺激量=全部好事或坏事刺激量之和

l 生活事件总刺激量=正性事件刺激量+负性事件刺激量

⑶结果的解释：LES总分越高反映个体承受的精神压力越大。95%的正常人一年内的LES总分不超过20分，99%的不超过32分。负性生活事件的分值越高对身心健康的影响越大，正性生活事件分值的意义还需进一步的研究。

2、社会支持评定量表

①社会支持评定量表简介：学术界对社会支持和身心健康的关系进行研究，良好的社会支持有利于健康，而劣性的社会关系则损害身心将由于SSQ和ISSI等国外流行的问卷条目繁多，且其中相当一部分条目不太符合中国国情，我国学者肖水源本着有效和简洁原则，在参考有关资料基础上，于1986年编制了只有10个条目的《社会支持评定量表》~肖水源认为，社会支持从性质上可以分为两类：一类为客观的、可见的或实际的支持，包括物质上的直接援助、社会网络、团体关系的存在和参与；另一类是主观的、体验到的情感上的支持，指的是个体在社会中受到尊重、被支持和理解的情感体验和满意程度，与个体的主观感受密切相关

② ★量表的内容与结构：共有10个条目，包括客观支持（3条）、主观支持（4条）和对社会支持的利用度（3条）三个维度

③量表的计分方法

3、应对方式问卷

①应对方式问卷简介：应对作为应激与健康的中介机制，对身心健康的保护起着重要作用。应对方式的评定主要采取两种方法：一是让被试自己描述，可视作非结构式的评定方法；二是依据理论分析事先编出的问卷或量表，由被试作答~肖计划曾运用其所编的应对方式问卷在青少年学生和神经症——对照组这两个特定群体中进行信度和效度研究。说明该量表具有较高的信度和效度。此外还具有以下应用价值1可以作为不同群体的应对行为研究的标准化工具之一2评估个体或某个群体的应对行为有助于为心理健康保健工作提供依据3用于不同群体应对行为类型和特点研究，为不同专业领域选拔人才提供帮助4用于不同群体应对行为类型和特点研究，为培养人才提供帮助5用于各种心理障碍的行为研究，为心理治疗和康复治疗提供指导6用于各种有心理问题者的行为研究，为提高和改善人的应对水平提供帮助

②★量表的内容与结构{包括62个条目，共分为6个分量表：解决问题、自责、求助、幻想、退避、合理化

③量表的实施与解释

报名留言

留言后，我们将尽快回复您

姓名

电话

学历

专业

"自考大专05616心理测量与评估常考重点"由湖北自考大专网整理编辑，转载请注明出处。

上一篇：自考大专05615心理健康教育概论识记知识点

下一篇：自考大专05616心理测量与评估复习重点

复习资料

报名留言

热点问题

推荐招生简章

最新文章

大专学历热点专题

自考大专招生问答

热门招生简章

复习资料

报名留言

相关文章

热点问题

推荐招生简章

最新文章

大专学历热点专题

自考大专招生问答

热门招生简章