-
第
29
卷第
2
期
咸
宁
学
院
学
报
Vo. l 29, No .
2
文章编号
:1006-5342(2009
02-
0065-03
项目反应理论模型及参数估计方法
*
李传益
(
咸宁学院
外国语学院
,
湖北
咸宁
437005
摘
要
:
为了克服经典测量理论中题目参数等指标的变异
性
,
项
目反应理
论得
到
了发展
,
现已
产生了很
多估计
题
目参数和能力的
模型
。
本
文简要介绍了项目
反应理论中单维潜在特质假设下的几种二值记分
(
评定
模型及参数
估计方法
。
关键词
:
项目反应理论
单
维性
局部独立性
模型
参数估计方法
中图分类号
:G424.
74
文献标识码
:A
由于经
典测
量理
论在
测量
过程
中暴
露的
问
题越
来越
多
,
心理测量理论家
和实
践者都
注意到
组成测
验的
项目与
测验分数的分离现象
,
他们认为
,
测验理
论应该注重对组成
测验的项目和它所刻
画的心理特质之间关系的研究而不应
该把
测验总分作为最终的裁决
。正是为
了克服经典测量理
论的各种局限性而发
展了一
种全新的测量理论
项目反
应理论。
一
、
项目反应理论的发展过程
项目反应理论
(IRT
是
20
世纪
80
年
代测量
专家们研
究的主题之一。它建
立
在潜在
心理
特质理
论基
础之上
,
不
再以整个测验而是
以单个
测验项目
为考
察对
象
,
以
要研究
的被试的潜在心理特
质和被试在测验项目上的反应之间的
关系作为
自己的核
心内容
,
并用
某种数
学形式
来表
示这种
关系
[1]
。
其实
,
这种基于项目的测验思想
最早出现在
B i net
和
S i 2 mon
编制的世界
上
第一个智力量表中。他们分析了不同年龄
的儿童对测验项目的不同反应情况
,
画出
了被试年龄与正确反
应水平之间的散点图。只要用一条光滑的曲线对图中的散点
拟合一
下
,
就
能得
到一
条项
目
反应
曲线
(Ite m Character i stic Curve , I CC
。因
此
,
这一图形通常被认为是最早的项目反应
曲线图。
1946
年
Tucker
提出了项目特
征曲线的概念。所谓项
目特征曲线
,
就是被试对一个测验
项目的正确反应概率与被
试
能力或特质水平之间的一种二维曲线图。这种曲线图可以用
特定的数学
模型
表
示
,
这就是
项目
反应
模型
[2]
。
1952
年
和
1953
年
Lord
提出了双参数正态拱形模
型
(t w
o-Para meter Nor 2 ma lOgi veM o del,
并提出了与此相关的参数估计方法
,
使
I RT
可被用来解决实际的二值计分的测验问题。这是
IRT
发展史
上的重要里程碑
,
它标志着这一理论的正式诞生
[3]
。但是
,
由
于
I
RT
数学上的复杂性以及缺乏有效
的计算机程序的支持
,
一
直到六十年代末
, I RT
的发展始终都是缓慢的。随着计算
机技
术的发展
,
以及参数估计方法及相应计算机程序的出现
,
七十
年代以后
, I RT
逐渐成为心理与教育测验理论的研究重点。
二
、
项目反应理论的假设
项目反应理论的
几个假设
是估
计
I
RT
参数
所必
需的。
要估计被试的能力
参数
,
我们就
要把特
定被试
对若
干题目
的反应概率乘起来
要估计题目参数
,
就
要把若干被试
对一
个题目的若干反应概率乘
起来
当题
目和能
力参
数都不
知
道
时
,
我们要对这两类参数做联合估计
,
即要把若干被
试对
若干题目的反应的若干个
概率乘在一起。当我们要把
这些
事件的概率乘在一起时
,
必须先假定它们是相互
独立的
,
否
则
,
就不能这样做。
(
一
潜在特质单维性假设
1.
特质
(Tra i t
特质是指一个人所具有
的稳
定、
持久而
又独
立于情
境
的心理
特征
,
如推理
能力、
创造性、
社会性、
注意力的稳
定性
等。在
心理测验中
,
特
质是心
理测
量
的期
望对
象。在语
言
测验中
,
特质一般指语言能力
,
又因为能力或特质只能
根据
行为表现来推
断或估计
,
无法直
接测量到
,
故称
为
/
潜
在特
质
0[4]
。
2.
潜在特质
空间
(La tent Trait Space
和完
全潜
在特
质
空间
潜在特质的集合被称作潜在特质空间
,
也就
是说
,
如果
被试的行为受
k
个潜在
特质
(
能
力
所决定
,
则此
k
维空
间
就称为
/
潜在特
质空
间
0
。
假定
每个
项目
对
每
个被
试施
行
一次
,
并考虑对任何固定
H
值的所有
项目分数
y
g
的条件
联
合次数
分布
(
对所有人
,
如果这种
(
不
可观测的
分布
对所
有这些被试总体不相同
,
那么在
H
1
, H
2
, , H
k
之外
,
就还
有一
个或多
个能鉴别到有关总体的心理维度。这样
,
通过定义
,
在
完全潜在空间中
,
项目分数对于特定
H
的条件
分布来说
,
对所有
有关总体是相同
的。潜在特质理论当
k
很小时
是最
有用的
。简单地
说就是
,
模型所解释的能力
,
仅仅是影
响被
试反应的那些因素
,
这组能力代表了完全的潜在
特质空间。
当单维
性假
设成
立
时
,
完
全
潜
在
空间
就
只
由
一种
能
力
构
成
[5]
。
3.
单维性假
设
一般来说
, I RT
假
设被
试做
出正
确反
应的
概率
可归
因
于被试
在某些潜在
特质或能力
(k
个
上
的地位。用几
何术
语说
,
就是个体在每个潜
在特
质上的
地位
可以看
成是
k
维
空间上的一个点。就
I RT
的
大多
数实际
应用
而言
,
潜在
特
质
空间被假设成单维的。单
维性
意味着
,
被
试的
表现被
归
:2
因于一个单一的能
力或特
质
,
其
它潜在
特质或
能力
均可忽
略。或者说
,
项
目测的是
一个变
量
(
知
识、
能
力、
属性、
人格
特质等
。单维潜在空间假设是最
常见的
,
因为测验
编制者
通常希望编制单维的测验
,
以提高一组测验分数的
解释
力。
测验使用者也
往往
想要单
一的
分数
(
如
成套
测验
的总
分
而不管其解释力
如
何。当然
,
这个
单维
假设是
不能
严格满
足的
,
因为总会有一些认
知的、
人格
的、
测验中
的因
素如测
验动机、
测验焦
虑、
表现
速度、
测
验的
复杂
程度
(
或
测
验误
导
,
以及其他认知技能
等影响
测验表
现
,
或至少
会在某种
程度上影响。
但只要
有一个主
导成
分或主
导因
素即可
,
这
个主导成分或因素就
被认为是测验
所测的能力
[6]
。
由此可见
,
潜在特质空间既可以是单维的
,
也可以是多
维的。虽然测量学专
家
们也看
出
,
从严
格意义
上来
说并不
能保证所测特质的
单维性
,
但他
们又都
希望
所
考察
的特质
是单维的
,
因为只有这样
,
能力和各种参
数才能定义在同一
个量表
上
,
才能利用所开发的模型进行参数估计
,
从而也才
能对分数或能力进行
有效的解
释和预测。
(
二
局部独立性假设
罗德和诺维克
[7]
认为
当几个
项目被
同时处
理时
,
局部
独立性假设
通常
是有
效地
解决
项目
特征
函数
问
题所
必要
的。局部独立意味着在由相同的
H 1, H 2, ,
H k
值所刻画的任
何被试群
体内
部
,
项
目分
数
的
(
条
件
分布
都
是相
互
独立
的。
H a m bleton
[7]
认为这一假设说的是
,
如
果考虑
到被试的
能力水平
,
那么一个
被试
对一测
验各个
项目的
各个
反应就
在统计上是独立的。
要让这个
假设
成立
,
一被
试在
一个项
目上的表现就不能
影响到
他对另一
项目
的反应
,
不
论是往
好里
影响还是往坏
里影响。例
如
,
一个
项目不
能为
回答另
一项目提供线索。因此
,
这
个假设的意思是
,
只有被试能力
和测验项目的特性是影响表现
的因素。当局部独
立性假设
得到满足时
,
任一被试
得到任一组分数
(
如
100110
的总概
率就等于每一
项目概率的乘积
。每个项
目的概率依赖于对
项目和被试能力的
统计。换句
话说
,
当
一被试
的反
应模式
的概率等于他在各
项目上
反应概率
的乘
积时
,
局部
独立性
假设得到满足。
张凯则认为
/
局部独立性
0
可以在
两个意
义上为
真
:
一
是题目之间不要有连
带关系
(
即
无干扰
,
二是被
试不要作
弊。当这两
条
都
满
足时
,
被
试的
反
应
就
都是
相
互
独
立的
了
[7]
。
因此
,
从局部独立性方
面来
说
,
任何一
个项
目
,
被试对
它的答对概率只取决
于被试的特质水平和该项目的技术质
量
,
与其他被试和项目无关。另外
,
单维
性和
局部独立性并
不是等价的概念
,
一个单
维或多
维的测
验都能
保证
或不保
证其项
目之间具有
独立性
,
因此
,
我
们毫
无理由
断言
,
如果
一个测验测的是单
一的特
质
,
其
项目之
间就一
定局
部独立
了
;
或者说
,
一个多维的测验项目之间就
一定不
具备局部独
立性。
(
三
项目特征函数的假设
项目反应理论的
最大特点就是建立了被试能力和项目
参数之间的
函数
关系
,
并
且用
项目
特征
函数
(Ite m Charac 2( ,
在项目上的正确作答概率对潜在特质分数
的回归曲
线。这
样
,
我们就可以根据不
同的反
应数据
选择相
应的
模型来
估
计参
数。
三
、
项目反应理论模型
用来描述
I CC
的项目反应模型有很多种。我们主
要
讨
论单维二值反应
(
评分
模型。
1.
正态拱形
曲线模型
1952
年
, Lord
提出了双
参数正
态拱形曲
线模
型
(t wo-para m ete r nor m a l ogi
ve m o
de l,
其表达式为
:
P i
(H = a i (H -b i
-]
1e -z
2d z P i (H
表示
能力
为
H
的被
试在
项目
i
上的
正确
作答
概
率。项
目
特征曲线为
S
形
,
因为
它形
同累积
分布
函数且
是
中心对称的
,
自然假设曲线可