北大大学校-北大大学校
华中师范大学网络教育学院
《社会统计学》练习测试题库及答案
p>
(加粗红色字体为
2013
下新增题目)
一、填空题
1、
抽样调查是指( )
。
2、
对于定类变量,变量取值只有类别属性之分,而无( )
、
( )之分。
3、
定距/定比变量:变量取值除了有类别属性、等级次序之分外,还有具体的
可测
的距离。其中定比变量还有一个具有真实意义的确定的( )
。
4、
偏态图形左边尾巴拖得较长叫做( )
。
5、用某个典型的变量值或者特征值来代表全体变量,则这个典型的变量值或特
征值就叫做( )
。
6、众值适用于(
)
、
( )和( )变量。
7、均值仅适用于( )变量。
8、
( )变量即可进行加减运算,也可进行乘除运算。
9、统计调查表可以分为(
)和( )
。
10、变量是(
)
。
11、
( )是统计的前提条件,没有( )就用不着统计。
12、统计总体的特征是(
)
、
( )和( )
。
13、具体的说,统计描述法包含( )
、
( )和( )
。
14、统计研究现象总体的数量特征,其数学依据是( )
。
15、在等距数列中,组距的大小与组数的多少成( )
。
16、通过样本对总体的某种假设进行检验,称为( )
。
17、参数估计可以分为两类:
( )和( )
。
18、所谓区间估计就是(
)
。
19、统计调查收集的资料有两类,一类是(
)
,另一类是( )
。
20、统计资料按照调查登记的时间是否具有连续性分为( )和(
)
。
21、统计调查时间有两个含义,即(资料所属)的时间叫做(
)和( )
时间叫做( )
。
22、抽样调查是按( )原则,从总体中抽取部分单位组成(
)
,并对其
加以研究,从而以( )推算(
)的非全面调查。
23、
( )即每次从总体中抽取一个单位,登记后不放回原总体,不参加下一
轮抽样。
24、
( )就是先从总体中抽出较大范围的单位,再从中选的较 大单位中抽取
较小范围的单位,依此类推,最后从更小的范围抽出样本基本单位。
25、
( )变量可以做单项式或组距式分组,而( )变量一般只作组距分
组,并且其相邻的( )最好要重合。
26、在组距数列中,
( )可以代表组的一般水平,其假定条件是( )
。
< br>27、有
10
件产品,其中
7
个正品,3< /p>
个次品。现在从中有放回地随机抽取三个,
则三个都是正品地概率是(
)
,2
个正品一个次品地概率是( )
,1
个正
品
2
个次品的概率是( )
,3
个都是次品的概率是( )
。
28、总体分布的两个重要特征值是( )和(
)
。
( )反映总体分布的
集中趋势,
( )反映总体的离中趋势。
29、加权平均数不仅受( )的影响,而且也受( )的影响。
30、简单随机抽样的抽样方法有( )和( )两种。
31、抽样极限误差就是限定的( )指标与( )指标之间抽样误差的最
大
允许范围。抽样极限误差通常要以(抽样平均误差)为标准单位来衡量,表示为
( )的若干倍,其计算公式为( )
。
32、在确定样本单位数的过程中,如果有数个标准差可供选择,则一般应选较
( )的;而如果没有成数的标准差,则成数数值可以用(
)据以计算样
本总量。
33、就正态总体而言,假设检验的参数主要是( )和(
)
。
34、在单侧检验中,由于原假设不同,有( )和(
)之分。
35、相关关系按相关程度不同可分为(
)
、
( )和( )
。
36、相关关系按相关的形式不同可分为( )和( )
。
37、如果相关系数
r
越接近于±1,则估计标准误差< /p>
Syx
就越接近于( )
。
38、原假设
H0
为假却被接受的错误称作( )
,也称( )
。
39、两变量线性相关系数为-1,说明两变量( )
。 p>
40、某一多元线性回归模型有
3
个自变量,但其中两个自变 量的相关关系达到
0.9,则称此现象为( )
。
41、
( )是指从一个总体中可能抽去多少个样本。
42、
( )就是将总体各单位分为若干群,然后从其中随机抽取 部分群,对中
选的群进行全面调查的抽样组织形式。
43、在统计调查方式中,
( )
、
( )和( )属于非全面调查。
44、总体内各部分数值与总体数值的比称为( )相对指标。
45、从概率理论的发展来说,概率有(
)
、
( )和( )
。
46、随着
n
不但增大,二项分布的终极结果逼近( )
。
47、利用组中值计算加权算术平均数是假定各组内的标志值呈(
)分布,其
计算结
果是一个( )
。
48、
调和平均数是平均指标的一种,
它是各变量值 p>
( )
的算术平均数的
( )
,
49、众数取决于(
)的变量值,因此不受( )的影响;中位数是
50、常数的方差等于(
)
。
51、重复抽样的抽样平均误差总是(
)不重复抽样的平均误差,两者之间相
差( )
,当( )很小时,可用重复抽样的公式近似地计算不重复抽样
地抽样平均误差。
52、分类抽样是( )与( )两种科学的方法相结合的抽样方式。
53、抽样法的理论基础是( )和( )
。
54、相关关系是指现象之间( )
,但关系数值( )的相互依存关系。
55、相关系数是用于反映(
)条件下,关系密切程度的统计分析指标,
其取值范围是(
)
。
56、在一元线性回归方程中,t
检验与
F
检验是( )
。
57、一组资料可以配合两条回归直线的条件是两变量存在着(
)关系,并且
两直线回归系数( )
,相关系数( )
。
58、在线性回归模型中,随机误差ε被假定服从(
)
。
59、一般将拒绝区域与接受区域的交点值称为(
)
。
60、一元线性回归模型与多元线性回归模型的区别在于只有一个(
)
。
61、用来反映回归直线代表性大小和因变量估计值准确程度的指
标称()
。
62、抽样推断中,判断一个样本估计量是否优良的标准是
()
、
()
、
()
。
63、在一副扑克牌中单独抽取一次,抽到一张红桃的概率是( )
。
64、
不论总体是否服从正态分布,
只要样本容量
n
足够大,
样本平均数的抽样分
布就趋于()分
布。
65、
统计检验时,
被我们事先选定的可以犯第一 类错误的概率,
叫做检验的( ),
它决定了否定域的大小。
p>
66、
假设检验中若其他条件不变,
显著性水平的取值越小,
接受原假设的可能性
越(
)
,原假设为真而被拒绝的概率越( )
。
67
、
参数估计,
即由样本的指标数值推断总体的相应的指标数值,
它 包括点估计
和( )
。
68、变量间的
相关程度,可以用不知
Y
与
X
有关系时预测
Y
的全部误差
E1,减
去知道
Y
与
X
有关系时预测
Y
的联系误差< /p>
E2,再将其化为比例来度量,这就是
( )
。 p>
69、根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对
具有相关关系的现象之间数量变化的议案关系进行测定,
即建立一个相关的数学 p>
表达式,
称为
( )
,
并 据以进行估计和预测。
这种分析方法,
通常又称为
( )
。
70、变量层次一般分为__________、__________
、_________和__________。
71、国民收入中消费额和积累额的比例为
1:0.4,这是( )相对指标。
72、对一个确定的总体,抽选的样本可能个数与( )和(
)有关。
二、选择题
1、统计总体的特征是(
)
。
A 大量性、总体性、数量性 B
总体性、数量性、变异性
C 同质性、数量性、变异性 D
大量性、同质性、变异性
2、要考察全国居民的人均居住面积,其统计总体是(
)
。
A 全国所有居民 B
全国的住宅
C 各省、市、自治区 D 某一居民户
3、要对某单位的生产设备的实际生产能力进行调查,则该企业的“生产设备”
是( )
。
A 调查对象
B 调查单位
C 调查项目 D
报告单位
4、统计学是一门关于研究客观事物数量方面和数量关系的(
)
。
A 社会科学
B 自然科学
C 方法论科学 D
实质性科学
5、统计测定必须遵循的两个重要方法原则是(
)
。
A 实用与科学
B 科学与合理
C 互不与无穷 D
互斥与穷尽
6、贯穿于统计工作认识过程的中心问题是( )
。
A 如何研究现象的量 B
如何正确区分现象质与量的界限
C 如何研究现象的质
D 如何正确对待现象质与量的辩正关系
7、在调查项目不多时,宜采用的调查表形式是( )
。
A 简单表 B 复合表
C 单一表 D 一览表
8、抽样调查应遵循的原则是( )
。
A 准确性原则 B 可靠性原则
C 随机性原则 D 灵活性原则 <
/p>
9、某变量数列末组为开口组,下限为
500,又知其邻组的组中值是 p>
480,则该组
的组中值应为( )
。
A 490 B
500
C 510
D 520
10、类型抽样影响抽样平均误差的方差是( )
。
A 组间方差 B 组内方差
C 总方差 D
允许误差
11、
在下列两两组合的平均指标中,
哪一组 的两个平均数完全不受极端数值的影
响?( )
A
算术平均数和调和平均数 B 几何平均数和众数
C
调和平均数和众数 D 众数和中位数
12、若两数列的标准差相等,而平均数不等,则( )
A 平均数小代表性大 B
平均数大代表性大
C 代表性也相等
D 无法判断
13、任一随机事件出现的概率( )
A 大于
0 B
小于
0
C 不小于
1 D 在
0
与
1
之间
14、二项分布的数学期望为( )
A
n(1-n)p B np(1—p)
C np
D n(1-p)
15、
若
A 与
B 是任意的两个事件,
且
P(AB)=P(A)
?
P (B),则可称事件
A
与
B
(
)
A 等价
B 互不相容
C 相互独立
D 即互不相容,又相互独立
16、若两个相互独立的随机变量
X p>
和
Y
的标准差分别是
6
和
8,则(X+Y)的标
准差是( )
A 7
B 10
C 14
D 无法计算
17、重点调查中的重点是指( )单位。
A 工作中的重点 B
标志总量在总体中占很大比重
C 在全局中占重要地位
D 数量在整个总体中占很大比重
18、抽样调查中( )
。
A 只有登记性误差,没有代表性误差 B
没有登记性误差,只有代表性
误差
C
既没有登记性误差,也没有代表性误差 D 既有登记性误差,也有代表性
误差
19、抽样平均误差反映样本指标与总体指标之间的( )
。
A 实际误差 B
实际误差的绝对值
C 平均误差程度
D 可能误差范围
20、用简单随机重复抽样方法选取样本单位,如果要使抽样平均误
差降低
50%,
则样本容量需要扩大到原来的(
)
。
A 2
倍 B 3
倍
C 4
倍 D 5
倍
21、
如果一个统计量能把含在样本中有关总 体的信息完全提取出来,
那么这种统
计量称为(
)
。
A 充分统计量
B 无偏估计量
C 有效统计量
D 一致估计量
22、
根据某城市电话网
400
次通话调查得知每次通话持续时间为
5
分钟,
标准差 p>
为
2
分钟,请以
95%的把握程度估计该城市 每次通话的平均持续时间为( )
。
A
4.5~5.5
分钟 B 4.836~5.164
分钟
C
4.804~5.196
分钟 D 0~11
分钟
23、假设检验的基本思想可以用( )来解释。
A 中心极限定理 B
置信区间
C 小概率事件
D 正态分布的性质
24、设某事件在试验中出现的概率为
1/6,则 在
6
次重复试验中该事件出现的次
数将为(
)
。
A 1 次
B 大于
1
次
C
小于
1
次 D 上述结果都可能
25、某市有
50%的住户订日报,有
65%的住户订晚报,有
85%的住户至少订两
种报纸中的一种,则同时
订这两种报纸的住户的百分比是( )
。
A 30%
B 50
C 65%
D 85%
26、在
10
道“是非题”中,每道题答对 的概率为
0.5,若对各道题的回答相互
独立,则答对
5
道题的概率为( )
。
A 0.8
B 0.5
C 0.25
D 0.1
27、
一张试卷上有
5
道单 选题,
每道题有
4
个备选答案,
某学生凭猜测至少 能答
对
4
道题的概率为( )
。
A 1/1024
B 15/1024
B 1/64
D 0.1
28、分组数据中,若各组变量值都增加
2
倍,每组次数都减少一半,则其中位数
的数值将( )
。
A 增加
2
倍 B 不变
C 减少一半
D 无法判断
29、比较两个性质不同的变量数列的平均数的代表性大小,必须计算(
)
。
A 标准差
B 平均差
C 全距
D 标准差系数
30、在反映总体分布的散布特征中,由总体的两个极端数值决定的散
布特征是
( )
。
A 极差
B 平均差
C 平均偏差
D 标准差
31、随着物价上涨,商品的需求量相应减少,则两者之间(
)
。
A 不相关
B 存在着正相关
C 存在着负相关
C 存在着完全相关
32、当自变量
x
值增加时,因变 量
y
值随之下降,则
x
与
y
存在着( )
。
A 正相关关系
B 负相关关系
C 曲线相关关系
D 直线相关关系
33、三个或三个以上变量之间的相关关系叫做(
)
。
A 单相关
B 复相关
C 直线相关
D 曲线相关
34、下列根据两现象计算的相关系数
r
中,相关程度最高的是( )
。
A r = 0.86
B r = -0.92
C r = 0.65
D r =-0.15
35、相关系数( )
。
A 只适用曲线相关 B
可用于直线,
也可用于曲线相关
C 只适用于直线相关
D 不适用直线,
也不适用于曲线相
关
36、说明回归方程拟合程度的统计量是( )
。
A 相关系数 B
回归系数
C 判定系数
D 估计标准误差
37、假设检验中的临界区域是( )
。
A 接受域 B
拒绝域
C 置信区域
D 检验域
38、假设检验中,若增大样本容量,则犯两类错误的可能性(
)
。
A 都增大
B 都缩小
C 都不变
D 一个增大,一个缩小
39、对一个无限总体进行无放回的抽样时,这种抽样方式叫做(
)
。
A 重复抽样
B 不重复抽样
C 随意抽样
D 无限抽样
40、置信区间的大小表达了区间估计的( )
。
A 可靠性 B
精确性
C 显著性
D 及时性
41、
在综合统计指标分析的基础上,
对社 会总体的数量特征作出归纳、
推断和
预测的方法是
A.大量观察法
B.统计分组法 C.综合指标法
D.模型推断法
42、对同一总体选择两个或两个以上的标志分别进行简单分组,形成
A.复合分组
B.层叠分组 C.平行分组体系 D.复合分组体系
43、交替标志方差的最大值为 A.1
B.0.5
C.0.25
D.0
4
4、
如果采用三项移动平均修匀时间数列,
那么所得修匀数列比原数列首尾各少
A.一项数值
B.二项数值
C.三项数值
D.四项数值
45、可变权数是指在一个指数数列中,各个指数的
A.同度量因素是变动的
B.基期是变动的
C.指数化因数是变动的
D.时期是变动的
46、
在统计检验中,
那些不大可能的结果称为( )。
如果这类结果真的发生了,
我们将否定假设。
A 检验统计量 B 显著性水平 C 零假设 D 否定域
47、在用样本指标推断总体指标时,把握程度越高则( )
。
A 误差范围越小 B 误差范围越大
C 抽样平均误差越小 D 抽样平均误差越大
48、当
x
按一定数额增加时,y
也近似地按一定数额随 之增加,那么可以说
x
与
y
之间存在( )关系。
A 直线正相关 B 直线负相关 C 曲线正相关 D
曲线负相关:
三、判断题
1、
三个同学的成绩不同,因此存在三个变量。
( )
2、
总体和总体单位是固定不变的。
( )
3、
统计学是数学的一个分支。
( )
4、
统计学是一门独立的社会科学。
( )
5、
统计学是一门实质性科学。
( )
6、
统计学是一门方法论科学。
( )
7、
描述统计是用文字和图表对客观世界进行描述。
( )
8、
对有限总体不必应用推断统计的方法。
( )
9、
工业设备普查中,全国工业企业数是统计总体。
( )
10、连续变量的数值既可以用整数表示,也可以用小数表示。
( )
11、在统计分组时,在全距一定的情况下,组距越大,组数越少。
( )
12、所谓总体,简单地讲就是研究对象的全体。
( )
13、置信度与显著性水品之和为
1。
( )
14、显著性水平越大,则相应的置信区间也愈宽( )
。
15、
统计调查是整个统计工作的基础,
只要有准确的统计数据 ,
统计分析就一定
能得到正确的结论。
( ) p>
16、
统计调查中的调查时间有两个时间概念,
即资料的所属 时间和搜集资料的工
作时间。
( )
17、统计报表只用于全面调查的情况。
( )
< br>18、
抽样调查是一种科学的调查组织形式,
因此在各种非全面的调查组织 形式中,
抽样调查最重要,重点调查次之,典型调查最不重要。
( )
19、
统计整理既是由对现象的个体认识过渡到现象的总体认识的阶 段,
也是由感
性认识上升到理性认识的重要过程。
( )
20、
由于离散型变量取的是整数而不能取小数,
因 此,
只能以单项数列来表现其
资料。
( )
21、统计分组应该遵循的原则是不重不漏的原则,即穷尽互斥原则。
( )
22、在频数分布中,频率之和等于
1(100%)
,所以频率密度之和也必然等于
1
(100%)
。
( )
23、频率分布就是概率分布,两者没有本质的区别。
( ) p>
24、抛掷一枚硬币,观察其出现正面或反面的过程,就是随机试验,
“正面 向上”
就是随机事件。
( )
25、当随机试验含有人的主观因素时,其概率就是主观概率。
( )
26、从装有
24
个球的袋中,随机抽出
< p>4个,其中有一个红球,说明红球的概率
为
1/4( 即
0.25)
,所以袋中共有
6
个红球。( )
27、频率是概率的估计值,概率是频率的期望值。
( )
28、对于任意的正态分布,都可以转化为标准正态分布。
( )
29、两变量之间的相关关系是否存在,主要是由两者相关系数的大小决定的。
( )
30、正相关是指自变量朝正方向变动的相互关系。
( )
31、相关分析中,所分析的两变量都是随机变量。
( )
32、相关系数越大,两变量的相关程度越高。
( )
33、完全相关就是函数关系。
( )
34、相关系数与回归系数是两个不同的分析指标,两者毫无关系。
( )
35、回归系数的取值范围介于-1
与+1
之间。< /p>
( )
36、回归分析中估计标准误差就是因变量的标准差。
( ) p>
37、相关系数
r
只说明样本的变量之间的关系,不能代表总 体,若要代表总体,
则还要进行检验。( )
38、当两
变量毫无关系,其相关系数为
0
时,估计标准误差也为
0。
( )
39、
第一类错误就是假设检验中出现的第一种错 误,
是将不真实的现象检验为真
实的现象。
( )
40、就正态总体而言,假设检验的参数主要是数学期望与方差。
( )
41、
在同样的显著性水平的条件下,
单侧检验较之 双侧检验,
可以在犯第一类错
误的危险不变的情况下,减少犯第二类错误
的危险。
( )
42、统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。
( )
43、检验的显著性水平(用
表示)被定义为能允许犯第一类错误的概率,它决定
了否定域的大小。
( )
44、第一类错误是,零假设
H0
实际上是错的,却 没有被否定。第二类错误则是,
零假设
H0
实际上是正确 的,却被否定了。 ( )
45、
每当方向能被预测的时候 ,
在同样显著性水平的条件下,
双侧检验比单侧检
验更合
适。 ( )
46、进行区间估计,置信水平总是预先给定的。 ( ) <
/p>
47、
由于削减误差比例的概念不涉及变量的测量层次,
因 此它的优点很明显,
用
它来定义相关程度可适用于变量的各测量层次。<
/p>
( )
48、
不管相关关系表现形式如何,
当 =1
< p>时,变量
X
和变量
Y
都是完全 相关。
(
)
四、计算题
1、
已知标志值综合为
415,标志值平方和为
1775,总体单位数为
100,试求其
方差和标准差。
2、
某生产班组
11
个工人日生产零件 数目为:15,17,19,20,22,22,23,
23,25,26,30。要求
:
(1)
计算平均数和方差;
(2) <
/p>
按照
15~19,20~24,24
以上分为三组,计算组内方差和 组间方差;
3、
设以下是
72
名离婚者的婚龄的统计
婚龄
1-3
4-6
7-9
10-12 13-15 16-18 19-21 22-24 25-27
28-30
5
10
20
14
9
4
3
2
4
1
人数
(1)
、试求众值、中位数和均值;
(2)
、是求四分互差和标准差;
4、
根据抽样调查,以下是
8
名同学社会统计学考试得分
学生
成绩
A
B
C
D
E
F
G
H
70
71
72
74
74
76
77
78
求总体的均值、方差和标准差的点估计值。
5、
为了对某工厂职工闲暇时间进行研究,根据一次样本(n=33) 的调查,平
均每天看电视时间为
0.96
小时,
标准差为
0.47
小时。
试求全厂职工平均每天看
电视时间的区间估计(置信度
95%)
,假定看电视时间满足正态 分布。
6、
假设某工厂妇女从事家务劳动时间服从正态分布 N(μ,0.662)
,根据< /p>
36
人的随机抽样调查,每天平均从事家务劳动时间为
2. 65
小时。求μ的双测置信
区间(置信度取
0.95)
7、
某工厂根据
200
名职工的抽样调查,
其中
60%参加各种形式的业 余学习。
求
青年职工参加业余学习比例的区间估计(置信度为
8、
某高校学生参加四级考 试的优秀率和合格率分别为
15%和
90%,
试计算优秀
率与合格率的方差和标准差。
9、在对
p>
100
家公司的最新调查中,发现
40%的公司在大力研究广告效果, 50%
的公司在进行短期销售预测,
而
30%的公司同时 从事这两件研究。
假设从这
100
家公司中任选一家,<
/p>
定义事件
A
为该公司在研究广告效果,
事件
B
为该公司在进
行短期销售预测,试求:
P(A),P(B),P(A+B),P(A/B),P(B/A)