-

China Family Panel Studies
CFPS
中国家庭动态跟踪调查
技术报告系列:CFPS-11
系列编辑:谢宇 责任编辑:胡婧炜
中国家庭动态跟踪调查
2010年综合变量(1):字词与数学测试
徐宏伟 骆为祥
2012.12.20
1. wordtest:字词测试原始得分
CFPS根据受访者在字词测试部分的回答,为用户生成了字词 测试得分的综合变量,命名为
wordtest。CFPS 2010的字词测试部分为识字类题目,在 设计的时候按照由易到难的顺序排列,变量
wordtest的取值为答对的最难的一道题的题号。受访 者在T1表中的最后学历(B4题)不同,提问
起点也会不同:如果B4题的答案为1-2(小学或以下 ),从第一个字开始,顺序提问;如果为3(初
中),从第9个字开始,顺序提问;如果为4-8(高中 或以上),从第21个字开始,顺序提问。因此,
在数据处理时,我们假定受过初中教育的受访者至少认 识8个字,受过高中或以上教育的受访者至
少认识20个字。如果受访者一道题也没有答对,则以其起点 题的前一题的题号作为得分。如,一
个受过初中教育的受访者从第9题开始答题,但是连续答错了第9、 10、11题,测试终止,
1
其得
分为8(即第8题)。
需要注意的是, 按照以上方法计算所得的字词测试得分并未考虑随年龄增长或受教育水平提高
而逐渐增强的字词认识水平 。因此,该方法所得的字词测试得分是未经任何标准化处理的,在具体
数据分析时需要进行额外的加工。
表1给出了少儿与成人样本中分性别的字词测试得分的描述性统计。
表1. 字词测试得分(未标准化)
样本量
成人(16岁及以上)
男
女
总计
少儿(10-15岁)
男
女
总计
1,702
1,658
3,360
21.1
22.4
21.7
7.3
7.0
7.2
22
23
23
0
0
0
34
34
34
16,270
17,293
33,563
18.9
15.2
17.0
9.9
11.5
10.9
21
18
20
0
0
0
34
34
34
均值 标准差 中位数 最小值 最大值
1
根据CFPS的设计,如果受访者有连续3道字词题回答错误,提问终止。
1
图1展示了少儿(15岁及以下)样本中,字词测试得分相对于年龄的Lowess曲线
2。由图1
可见,随着年龄的增长,受访者的平均测试得分也随之增长。
图2展示了成人( 16岁及以上)样本中,字词测试得分相对于年龄的Lowess曲线。有趣的是,
随着年龄的增长,受 访者的平均测试得分反而随之降低。一个可能的解释是在成人样本中,年龄与
受教育水平成负相关,因而 年龄愈长者,识字(及数学)水平愈低。这个解释与图3中所显示的字
词测试得分相对于受教育年限的L owess曲线的模式相吻合——随着受教育年限的提高,受访者的
平均字词测试得分亦随之提高。
图1. 字词测试得分对于年龄的Lowess曲线: CFPS 2010少儿(15岁及以下)样本
2
Lowess曲线是通过局部加权多项式回归分析(locally weighted polynomial regression)的技术从原始数据中绘制出
的平滑曲线。对于数据中每 个点附近的局部数据,拟合多项式回归曲线,并在拟合时给予与选定点较近的数据更
多的权重。详情可参 考Cleveland, William S. 1979. “Robust Locally Weighted Regression and Smoothing Scatterplots.”
Journal of the American Statistical Association 74 (368): 829-836.
2
-
-
-
-
-
-
-
-
本文更新与2020-11-29 03:33,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/469275.html
-
上一篇:小学二年级下册数学测试卷(人教版)
下一篇:小升初数学测试卷完整版