-
SPSS
练习题
1
、现有两个
SPSS
数据文件 ,分别为“学生成绩一”和“学生成绩二”
,请将这两份数据文
件以学号为关键变量进行横向合 并,
形成一个完整的数据文件。
先排序
data---sort cases
再合
并
data---merge files
2
、有 一份关于居民储蓄调查的数据存储在
EXCEL
中,请将该数据转换成
SPSS
数据文件,
并在
SPSS
中指定其变量名标签和变量值标签。
转换
Data---transpose
,输题目
3
、利用第
2
题的数据,将数据分成两份文件,其中第一份文件存储常住地是“沿海或中心
繁华城市”
且本 次存款金额在
1000-2000
之间的调查数据,
第二份数据文件是按照简单随机< br>抽样所选取的
70%
的样本数据。
选取数据
data--- select cases
4
、利用第
2
题数据,将其按常住地( 升序)
、收入水平(升序)存款金额(降序)进行多重
排序。
排序
data ---sort cases
一个一个选,加
5
、根据第
1
题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的
降序排序。
计算
transform--- count
按个输,把所有课程选取,
define
设区间,再排序
6
、根据第
1
题的完整数据,计算每个学生课程的平均分和标准差,同时计算男生和 女生各
科成绩的平均分。
描述性统计,先转换
Data---transpose学号放下面,全部课程(
poli
到
his
)
放上面,
ok
,
analyze---descriptive statistics---desc riptives
,
全选,
options
。
先拆分
dat a---split file
按性别拆分,
analyze---descriptive statistics---descriptives
全选所有课程
options--- mean
7
、利用第
2
题数据,大致浏览存款金额的数据分布状况,并选择 恰当的组限和组距进行组
距分组。
数据分组
Transform---recode- --
下面一个,
输名字,
change
,
old
,
range
,
new value---add
挨个输,从小加到大,等距
8
、在第
2
题的数据中,如果认为调查“今年的收入比去年增加”且“预计未 来一两年收入
仍会会增加”的人是对自己收入比较满意和乐观的人,请利用
SPSS
的 计数和数据筛选功能
找到这些人。
(计算
transform--- count
或)
选取
data---select cases
9
、利用第
2
题数据,采用频数分析,分析被调查者的常住地、职业和年龄分布特征,并 绘
制条形图。
Analyze--- descriptive statistics--- frequencies
10
、利用第
2
题数据,从数据的集中趋 势、离散程度和分布形状等角度,分析被调查者本次
存款金额的基本特征,
并与标准分布曲线进 行对比,
进一步,
对不同常住地住房存款金额的
基本特征进行对比分析。
An
DS
d
Analyze--- Descriptive
Statistics---Descriptives,
选
择
存
款
金
额
到
Variable(s)
中
。
按
Option,
然
后
选
择
Mean,ion ,Minlmum,Variance,Maximum,Range,Kutosis,Skewness,V ariable
list.
然后按
continue
,
ok
11
、将第
1
题的数据看作来自总体的样本,试分析男生和女生的课程平均分是否存在显著 差异;试分析哪些
课程的平均差异不显著。
Transform compute
课程平均分
=mean()
analyze->compare means->independent-samples T
;
选择若干变量
作为检验变量到
test
variables< br>框
(课程平均分)
;
选择代表不同总体的变量
(
sex
)
作为分组变量到
grouping
variable
框;
.
定义分组变量的分组情况
Define Groups...
:
(填
1
,
2
)
。
1.
两总体方差是否相 等
F
检验:
F
的统
计量的观察值为
0.257,
对 应的
P
值为
0.614,
;如果显著性水平为
0.05,
由 于概率
P
值大于
0.05,
两种方式的方差
无显著差异
.< br>看
eaual variances
assumend
。
2.
两总体均值的检验:
.T
统计量的观测值为
-0.573,
对应 的双尾概
率为
0.569,T
的
P
值>显著水平
0.05,
故不能推翻原假设
,
所以女生男生的课程平均分无显著差异。
配对差异
:
analyze->compare means->paired-
samples T…paired variables
框中每科与不同科目配对很麻烦
略
12
、
某公司经理宣称他的雇员英语水平很高,
如果按 照英语六级考试的话,
一般平均得分为
75
,现从雇员中随机随出
11
人参加考试,得分如下:
80
、
81
、
72
、
6 0
、
78
、
65
、
56
、
79
、
77
、
87
、
76
,请问该经理的宣称是否可信?
步骤:采用单样本
T
检验(
原假设
H0:u=u0,
总体均 值与检验值之间不存在显著差异
.
)
;
菜单选项:
Analyze- >compare means->one-samples T test
;
指定检验值:
在
test
后的框中输入检验值
(填
75
)
,
最后
ok!
分析:
N
=
11
人的
平均值 (
mean
)
为
73.7
,
标准差(
ion
)
为
9.55
,
均值标准误差
(std
error < br>mean)
为
2.87.
t
统计量观测值
为
-4.2 2
,
t
统计量观测值的双尾概率
p-
值(
sig.(2-t ailed)
)为
0.668
,六七列是总体均值与原假
设值差的
9 5%
的置信区间
,
为
(-7.68,5.14),
由此采用
双尾检验比较
a
和
p
。
T
统计量观测值的双尾概率
p-
值
(
sig.(2-tailed)
)为
0.66
8< br>>
a
=0.05
所以不能拒绝原假设
;
且
总体均值的
95%
的置信区间
为
(67.31,80.14),
所以
均 值在
67.31~80.14
内
,75
包括在置信区间内
,
所以经理的话是可信的。
13
、
利用促销方式数据,
试分析这三种推销方式是否存在显著差异,
绘制各组均值的对比图,
并利用
L SD
方法进行多重比较检验。
单因素方差分析
对比图为
options
中的
descriptives
LSD
为
post
…
中的
P
值大于
a
接受
所以无关
14
、已知
240
例心肌梗塞患者治疗后
24
小时内的死亡 情况如表
1
所示,问两组病死亡率相
差是否显著?(
)
(显 著性水平为
5%
)
表
1
:急性心肌梗塞患者治疗后
24
小时生死情况
用单参注射液
未用单参注射液
合计
生存
187
36
223
死亡
11
6
17
·
提
出
假
设
:
H
0
:是否接受治疗的急性心肌梗塞患者的病死率相差不显著
H
1
:是否接受治疗的急性心肌梗塞患者的病死率相差显著
·
操
作
步
骤
:
1
、打开数据文 件:
file
-
open
-
data
-
2
、对
count
变量进行
weight cases
处理:
data
-
weight cases
选中
weight cases by
;在
Frequencies variable
中加入变量
count
。
3
、对数据进 行交叉汇总,如得出的下列频次交叉表,如图表
3
-
1
:
用
descriptive-cross tab
过程,
column
填
status, row
填
group
。
在
cell
选项中,选中
percentages
,以计算频数百分比。
·
统
计
表
格
及
分
析
:
表
3
-
1
是否接受治疗与生存状况的相关性检验成果表(
Chi-Square Tests
)
Asymp. Sig.
Pearson Chi-Square
Linear-by-Linear Association
有效个案数
Value
6.040(b)
6.015
240
df
1
1
(2-sided)
.014
.014
表
3
-
1
是相关 性卡方检验成果表。表中依次列出了
Pearson
卡方系数、线性相关的值
(
Value
)
、自由度(
df
)和双尾检验的显著水平(
Asym p. Sig. (2-sided)
)
。
表
3
-
2
显示了根据是否使用单参注射液对急性心肌梗塞患者进行分组后,患者的生存
和死亡状况频 数和所占总数的百分比。
表
3
-
2
急性心肌梗塞患者是否治疗与生死情况的列联表
分组
(group))
总数
用单参注射液
未用单参注射液
Count
% within
分组
(group)
Count
% within ·
分组
(group)
Count
% within ·
分组
(group)
状况
(status)
总数
195
100.0%
45
100.0%
240
100.0%
生存
185
94.9%
38
84.4%
223
92.9%
死亡
10
5.1%
7
15.6%
17
7.1%
·
结
论
:
根据表
3
-
1
可以看出,双侧检验的显著性概论为
0
.014
,小于显著性水 平
0
.05
;因此
否定原假设,接受备择假设,即两组患者的完全缓解率之间 差别显著。
15
、已知数据如表
2
所示,比较单用甘磷 酰芥(单纯化疗组)与复合使用光霉素、环磷酰胺
等药(复合化疗组)对淋巴系统肿瘤的疗效,问两组患 者的完全缓解率之间有无差别?
()
(显著性水平为
5%
)
表
2
:两化疗组的缓解率比较
治疗组
单纯化疗
复合化疗
合计
同上
小于
拒绝
显著
16
、已知数据如表
3
所示,问我国南北方鼻咽癌患者(按籍贯分)
的病理组织学分类的构成
比有 无差别?
()
(显著性水平为
5%
)同上
小于
拒绝
显著
表
3
:我国南北方鼻咽癌患者病理组织学分类构成
地域
南方四省
东北三省
合计
17、已知
97
名被调查儿童体检数据文件为
,请分别计算男性、女性与两性 合计的
儿童的平均身高与体重、中位身高与体重以及身高与体重的标准差。
1
、打开数据文件:
file
-
open
-
data
-
2
、均值比较与检验:
Analyze
-
Compare means
-
means
3
、在
independent Var.
中选性别,
dependent Var.
中选体重和身高
4
、在
option
子框中选择
median/mean/Std. Deviation
1
、男性儿童的平均身高为
109
.962
厘 米;平均体重为
18.202
千克;中位身高为
109.10
厘
米; 中位体重为
17.50
千克;身高的标准差为
6.084
厘米;体重的标准差 为
2.786
千克。
2
、女性儿童的平均身高为
109< br>.896
厘米;平均体重为
18.389
千克;中位身高为
109.4 50
厘米;
中位体重为
17.750
千克;
身高的标准差为
5.770
厘米;
体重的标准差为
3.235
千克。
3< br>、两性儿童的平均身高为
109
.930
厘米;平均体重为
18.29 2
千克;中位身高为
109.250
淋巴上皮癌
未分化癌
71
89
160
6
18
24
磷癌
16
22
38
其他
18
51
69
合计
111
180
291
缓解
2
14
16
未缓解
10
13
23
合计
12
27
39
厘米;
中位体重为
17.605
千克;
身高的标准差为
5.905< br>厘米;
体重的标准差为
2.995
千克。
18
、
已知
97
名被调查儿童体检数据文件为
,
请问儿童的身高与体重是否分别
受到性别与年龄的影响?(显著性水平为
5%
)
·
提
出
假
设
:
1
、
H
0
:
身高与体重受到年龄的影响不显著
H
1
:
身高与体重受到年龄的影响显著
2
、
H
0
:
身高与体重受到性别的影响不显著
H
1
:
身高与体重受到性别的影响显著
·
操
作
步
骤
:
1
、
打开数据文件:
file
-
open
-
data
-
2
、
均值比较与检验:
analysis
-
compare means
-
means
3
、
在
independent Var.
中选性别和年龄,
dependent Var.
中选体重和身高
4
、
在
option
子框中选择
median/mean/
Std. Deviation
在
statistic for first layer
区域内勾上
ANOVA table and eta
复选框
·
统
计
表
格
及
分
析
:
表
7
-
1
体重、身高与年龄的方差分析表
Mean
体重
(x4,kg) *
年龄
(age)
Between Groups
Within Groups
Total
Within Groups
Total
Sum of Squares
286.215
565.918
852.133
1757.707
1554.855
3312.562
df
2
93
95
2
93
95
Square
143.107
6.085
878.853
16.719
F
23.518
52.567
Sig.
.000
.000
身高
(x5,cm) *
年龄
(age)
Between Groups
在表
7
-
1
中,
分别列出了平方和
(
Sum of Squares
)
、
自由度
(
df
)
、
均方差
(
Mean Square
)
、
F
值以及
F
值的显著性水平 (
Sig.
)。
F
对应的概率值
P(sig)
<
α
(
α
=
0.05
);故拒绝原假
设
,接受备择假设,即身高与体重受到年龄的影响显著。
表
7
-
2
体重、身高与性别的方差分析表
Mean
体重
(x4,kg) *
性别
(x2)
身高
(x5,cm) *
性别
(x2)
Between Groups
Within Groups
Total
Between Groups
Within Groups
Total
df
1
94
95
1
94
95
Square
.839
9.056
.105
35.239
F
.093
.003
Sig.
.762
.956
在表
7
-
2
中,
F
对应的概率值
P(sig)>
α
(
α
=
0.05
);故接受原假设
,
即 身高与体重受
到性别的影响不显著。
19
、文件
中列出了某学校四个年级同学接受专业训练前后的铁饼成绩,问接受
专业训练后同学们的铁饼成绩有无 显著提高?(显著性水平为
5%
)
统
计
表
格
及
分
析
:
表
8
-
1
配对样本的相关性分析表
Pair 1
铁饼
(训练前)
&
铁饼
(训练后)
N
24
Correlation
.976
Sig.
.000
H
0
:
铁饼(训练前)和
铁饼(训练后)的数据之间不存在线性关系
H
1
:
铁饼(训练前)和
铁饼(训练后)的数据之间存在线性关系
表
8
-
1
列出了配对样本的个数(
N
)、相关系数(
Correlation
)、显 著性概率(
Sig.
)。
显著性概率趋近于
0
,远小于
0. 05
,所以认为铁饼(训练前)和
铁饼(训练后)的数据之间
存在线性关系。
表
8
-
2
配对样本
T
检验的成果表
Sig.
Std.
Mean
Deviation
Paired Differences
Std.
Error
Mean
95% Confidence
Interval of the
Difference
t
df
(2-tailed)
Pair 1
铁饼(训练
前)
-
铁饼
(训练后)
Lower
Upper
-.2417
.4323
.0882
-.4242
-.0591
-2.739
23
.012
表
8
-
2
中为铁饼(训练前)和
铁饼(训练后) 的数据的
T
检验结果。表中前
4
项分别
为配对样本数据差异的均值< br>(
Mean
)
、
标准离差
(
Std. Deviation
)
、
均值的标准差
(
Std. Error < br>Mean
)
以及
95
%置信区间。
后
3
项为
t
值
(
t
)
、
自由度
(
df)
和双尾显著性概率
(
Sig. (2-tailed)
)
。
表中双尾显著性概率为
0.012
,远小于
0.05
,故 拒绝原假设,接受备择假设,认为配
对样本之间有显著差异,即接受专业训练后同学们的铁饼成绩提高显 著。
·
结
论
:
铁饼(训练前)和
铁饼(训练后)的数据之间存在线性关系。且配对样本之间有显著
差异,即接受专业训练后同学们的铁饼成绩有显著提高。
20
、 文件
中列出了某学校四个年级同学的外语与中文成绩,问男女生总成绩
(英文
+
中文)之间有无显著差异?(显著性水平为
5%
)做法:
先计算出总成绩, 计算方
法:
Transform
菜单栏下的
Compute Variable
选项
总成绩计算出来之后,选择
Analyze
选项下
Compare Means
选项下“两独立样本
T
检验”
选项卡
将总成绩放入
Test Variable
一栏中,性别放入
Grouping Variable
一栏中并为其定义。
点
Ok
即可得出结果。
结果分析 :方差齐次性,采用
F
检验,
0.235
,大于
0.05
, 所以认为男女生总成绩两样本的
的方差是没有显著性差异的;
校正
t
检验的显著性水平
Sig
(
2-tailed
)为
0.951,大于
0.05
,所以男女生总成绩之间
没有显著性差异。
21
、
根据以往的资料,
学生中文的平均成绩为
80
分。< br>文件
中列出了某学校四个
年级学生的中文成绩,问学生中文成绩有无显著的下降 ?(显著性水平为
5%
)
·
提
出
假
设
:
H
0
:
μ
=
50(
μ
-50=0)
;即学生中文成绩无显著的下 降。
H
1
:
μ
≠
50(
μ
-50
≠< br>0)
;即学生中文成绩有显著的下降。
·
操
作
步
骤
:
1
、
打开数据文件:
file
-
open
-
data
-
2
、
单一样本的均值检验:
analysis
-
compare means
-
One Sample T Test
3
、
在
test value
中输入
80
,在
test Variable
中选“中文”
。
4
、
在
options
中输入显著性水平
5%
·
统
计
表
格
及
分
析
:
中文
表
9
-
1
数据统计量表
N
24
Mean
78.54
Std. Deviation
11.159
Std. Error Mean
2.278
表
9
-
1
为单样本数据的统计量表,
列出了变量
“中文”
对应的数据个数
(< br>N
)
、
均值
(
mean
)
、
标准离 差(
Std. Deviation
)、均值的标准差(
Std. Error Mean
)。
表
9
-
2
单样本均值检验成果表
Test Value = 80
95% Confidence Interval of
Mean
中文
t
-.640
df
23
Sig. (2-tailed)
.528
Difference
-1.458
the Difference
Lower
-6.17
Upper
3.25
表
9
-
2
为单样本均值检 验的成果表。表中分别为
t
值(
t
)、自由度(
df
)和双 尾显著性
概率(
Sig. (2-tailed)
)均值差(
Mean Difference
)以及均值差的
95
%置信区间。
表中的显 著性概率为
0.528
,远大于
0.05
;因此,可以认为该样本数据的均值 与总体均
值之间没有显著差异。故接受原假设,即学生中文成绩无显著的下降。
·
结
论
:
样本数据的均值与总体均值之间没有显著差异,即学生中文成绩无显著的下降。
< br>22
、文件
中列出了某学校四个年级同学的英文成绩,问学生英文成绩是否受到
年级因素的影响?(显著性水平为
5%
)
H
0
:
μ
1 =
μ
2 =
μ
3
;即学生英文成绩不受年纪影响。
H
1
:
μ
1
、
μ
2
、
μ
3
不完全相等;即学生英文成绩受年纪影响。
·
操
作
步
骤
:
1
、
打开数据文件:
file
-
open
-
data
-
2
、
单因方差分析检验:
Ana lysis
→
Compare Means
→
One-Way ANOV
A
3
、
在“
dependent list
”列表中输入变量名“英语”
;在“factor
”文本框中输入变量名“年
纪”
。
4
、
在
options
中输入显著性水平
5%
·
统
计
表
格
及
分
析
:
表
10
-
1
数据方差分析表
Sum of
Between Groups
Squares
105.000
df
3
Mean Square
35.000
F
.283
Sig.
.837
Within Groups
Total
2475.000
2580.000
20
23
123.750
表
10
-
1
中分别列出了方差来源 、
平方和
(
Sum of Squares
)
、
自由度(
df
)
、
均方差
(
Mean
Square
)
、
F
值以及
F
值的显著性水平
(
Sig .
)
。
由于表中的显著性水平为
0.837
,
远大于
0.05
;
故接受原假设,即认为学生英文成绩不受年级影响。
23
、
已知
10
名
20
岁男青年身高与臂长的数据,请计算其相关系数,
身高与臂长间存在显著
的相关关系吗?(显著性水平为
5%< br>)
(
)
表
4
青年身高与臂长的数据
身高
(cm)
臂长
(cm)
170
173
160
155
173
188
178
183
180
165
45
42
44
41
47
50
47
46
49
43
·
提
出
假
设
:
H
0
:
身高与臂长间不存在显著的相关关系。
H
1
:
身高与臂长间存在显著的相关关系。
·
操
作
步
骤
:
1
、
打开数据文件:
file
-
open
-
data
-
2
、
相关性检验:
Correlation
-
Bivariate
3
、
选择
Pearson(
积距相关
)
;在
option
子框中选择
means/Sd.
·
统
计
表
格
及
分
析
:
表
11
-
1
描述统计量表
Mean
172.50
45.40
Std. Deviation
10.341
2.951
N
10
10
身高(
cm
)
臂长(
cm
)
表
11
-
1
为描述统计量表。表中列出的统计 量包括变量的均值(
Mean
)、标准离差
(
Std. Deviation
)和数据个数(
N
)。
表
11
-
2
相关分析成果表
身高(
cm
)
臂长(
cm
)
身高(
cm
)
臂长(
cm
)
Pearson Correlation
Sig. (1-tailed)
N
Pearson Correlation
Sig. (1-tailed)
N
1
10
.823(**)
.002
10
.823(**)
.002
10
1
10
**
Correlation is significant at the 0.01 level (1-tailed)
表
11
-
2
为相关 分析成果表,
表中列出了
2
个变量之间的
Pearson
相关系数、
单侧显著
性检验概率(
Sig. (1-tailed)
)和数据组数(N
)。脚注内容显示相关分析结果在
0.01
的水平
上显著。另外,从表 中可以看出,显著性概率为
0.002
,远小于
0.05
,故拒绝原假设,接 受
备择假设;可以认为身高和臂长的数据有较强的相关性。
·
结
论
:
根据相关性分析结果,可知身高与臂长间存在显 著的相关关系,其相关系数为
0.823
,
属于强相关。
24
、已知学生铁饼与标枪的数据,请计算其相关系数?(
)
·
提
出
假
设
:
H
0
:
学生铁饼与标枪成绩之间不存在显著关系。
H
1
:
学生铁饼与标枪成绩之间存在显著关系。
·
操
作
步
骤
:
1
、
打 开数据文件:
file
-
open
-
data
-
2
、
相关性检验:
Correlation
-
Bivari ate
3
、选择
Pearson(
积距相关
)
;在
option
子框中选择
means/Sd.
·
统
计
表
格
及
分
析
:
表
12
-
1
描述统计量表
Mean
32.79
Std. Deviation
12.476
N
24
标枪(
m
)
-
-
-
-
-
-
-
-
本文更新与2021-01-26 08:52,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/570976.html