关键词不能为空

当前您在: 主页 > 英语 >

整理英语Excel中自动完成方差齐性与非齐性t检验

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2021-01-20 11:26
tags:

毛巾杆-整理英语

2021年1月20日发(作者:clubfoot)
1、缺失值处理



缺失值是数据分析中一个非常常见的现象,出 现的主要原因有:设备故障、拒绝回答、测验
时走神等,对此应对缺失值的进行检测,SPSS默认缺失 值以黑点表示,可以通过快速浏览数
据列表发现,记录下缺失值所在的变量即数据的列。



缺失值的处理方式有以下三种:



1
)剔除有缺失值的观测单位,即删除SPSS数据列表中缺失值所在的数据行。



在SPSS的统计分析程序中,打开options按钮,便会出现缺失值的处理 栏,可分
别选择下列选项:

剔除正在分析的变量中带缺失值的观察单位
”< br>、

剔除所有分析变量中带缺失值
的观察单位

。虽然这种做 法可以为执行许多统计分析命令扫清障碍,但要求每一步统计分析都联
系于特定的有效样本容量,而样本 容量不能稳定会给整个分析带来不便。




2
)对缺失值进行估计后补上。



主要有两 种方法:一是根据文献报道等知识经验进行估计;二是用SPSS提供的工具进行
估计。在
“< br>transform

菜单下的

replacemissingva lues

列出了5
种替代的方法:



1)seriesmean:以列的算术平均值进行替代;



2)meanofnearlypoint:以缺失值邻近点的算术平均值进行替代;



3)Medianofnearlypoint:以缺失值临近点的中位数替代;



4)linearinterpolation:根据缺失值前后的2个观察值进行线性内< br>查法估计和替代;



5)lineartrendatpoint:用线形回归法进行估计和替代。




3
)将缺失值作为常数值,如:作为


”< br>。



2、奇异值和极端值的处理



奇异值和极端值是指各变量中与整体数据相距太远的极值,由于它的夸大作用,常常会歪曲
统计 结果,导致犯一类和二类错误。



导致奇异值和极端值的原因:
(1)数据输入时出错;
(2)在不同数据格式之间进行转换时,
缺失值处的数码代号被当成了 实际观测值;
(3)出现奇异值的样本并非属于所要考察的总体;
(4)考察的样本相对于正态 分布有比较多的极值。



奇异值和极端值的检测:



在描述统计分析菜单下,点击Explore(探索性分析)对话框后把变量选入Vari< br>ables框中,单击统计量选择描述统计量,单击图可以选择箱形图、茎叶图、直方图与正态
检 验的Q-Q图等检测有无极端值和奇异值。通过箱形图可以发现数据中的异常点,对数据进行
核对、检验 和筛选。以箱形图为例,箱形图中都标有奇异值的行号。箱形图图形的含义是:中间
的粗线为中位数,灰 色的箱体为四分位,两头伸出的线条表现极端值(下线为最小值、上线为最
大值)
。箱形图用离 群值和极端值表示那些在绳索外侧的值。离群值,是指值与框的上下边界的距
离在1.5倍框的长度到3 倍框的长度之间的个案,在图种用



号表示。极端值是指值距离框
的上下边界超过3倍框长的个案,用



号表示。框的长度是四分位数之 间的全距。




如图1所示,对某问卷中家庭收入进行分析的箱 形图中既有离群值也有极端值。图中3个极端
值分别位于:81号家庭、93号家庭、62号;此外2个 离群值为:67号家庭、76号家庭。
有时,鉴于81号家庭远远游离于箱体、绳索及邻近的极端值所组 成的群体之外,可以把它视作
飞点。



减少奇异值和极端值影响的方法:



(1)将奇异值和极端值作 为缺失值处理:在

variableview

视图中点击
mi
ssing

栏下含有奇异值和极端值的变量,弹出

mi ssingvalues

对话框,有3
个选项可以使用:1)

d iscretemissingvalues

最多可以指定3个数值
为缺失值;2)

rangeofmissingvalues

指定某一取值范围内的数值 为缺
失值;3)

rangeplus

oneoptionald iscretemissing

指定某一取值范围和某一特定数值为缺失值;



(2)根据检测的奇异值和极端值,用

dataselect cases

工具中的

if
…”
对数据的取值范围进行限 定,然后再进行统计分析;



(3)对奇异值进行估计,方法同缺失值的估计;



(4)将原 始数据转换成标准Z分数(statis-tics/summarize/d
escriptives /save/standardizedvalueas)或进行其他
的转换后再进行统计分析;



(5)删除奇异值所在的观察单位。



3、统计分析前的假设检验



许多统计检验都需要样本数据服从 正态分布,并且相关联的变量之间应方差齐同。若不符合
上述条件便应进行数据转换,否则便会导致错误 。但大样本数据可以近似地认为其为正态分布,
而不用去进行正态性检验。

anal yze

下的

descriptives



freque
ncies



explore

可以完成这些工作。



(1)方差齐性检验(spreadvs.levelwithlevenetest)




descriptives



frequencies

的功能基本相同,都可进行正态性
检验和方差齐性检验。若 满足方差齐性,则可进行下一步工作;若不满足,选

powerest
-imeti on

进行数据变换来满足。方差齐性,有6种方法可供选择:
(1)natura< br>llog:取自然对数;
(2)1/squareroot:取平方根的倒数;
(3)r ecip
rocal:取倒数;
(4)squareroot:取平方根;
(5)sq uare:取平方;
(6)cube:取立方。若SPSS提供的6种变换均不能满足要求,应考虑采用 非参数统计
的方法。



(2)正态检验(normalityplotswithtests)





analyzedescriptivesstatisticsexplore

中可
进行正态检验,及做出Q-Q图。若不支持正态分布,则应进行数据变换,方法 同方差齐性检验,
或选用非参数统计的方法。



4、相关分析前的数据检查



相关分析之前应用
descriptivesstatistics

对数据进行观察。当
一个变量 取值范围很窄时,应做数据变换后再进行相关分析,否则会使相关的资料得出不相关的
结论;在做连续变 量和等级资料的相关或两个等级



资料的相关时,若90%的被试都选择 等级资料中的一种情况(如:90%的被试都选择





,则相关性通常会很低,对这类数据应用其他方法进行分析;当均值是一个很大的数,而同
时标准差很 小时,相关系数值通常也会很小,对这样的资料不宜做相关分析。



摘自 刘莹《SPSS在问卷数据校验中的应用研究》

《科技资讯》2008(8)





多项选择题数据的输入



方法
1
:多重二分法。有多少选项就设多少个变量,某个个案选择了某项则 在该变量名下录

“1”
,未选择某项则录入
“0”
,即将每个变量 变成类似于







的选择题。< br>


方法
2
:多重分类法。有多少选项就设多少个变量,某 个个案选择了某项则在该变量名下录

“1”
,未选择某项则录入
“0”。例如,某个个案选择了第
“1”

“3”

“4”

,
则依次录入
“1

0

1


1

0


0”




方法
3
:多重分类法。选了多少项就设置多少个变量,如命名为
seq1

seq2

seq3
,如果
某个个案选择 了第
“1”

“3”

“2”
项时,则依次输入
“ 1”

“3”

“2”




方法
4
:多重分类法,利用
Excle
的分列功能。



第一步,设置一个变量,命名为
var1




第二步,录入数据。例如
,
某个个案选择了第
“1

3


2”
项,则输入
“1 3 2”




第三步
,
将该多选题及其数据另存为
Excle
文件。



第四步
,

excle
中将
var1
这一个变量分列
,
步骤是

选定该变量


数据


分列


固定宽度


下一步

使用鼠标分列


下一步


完成。这样
,
原来的一个变量组成的数据库转化为由几个变
量组成的新的数据库
,
如下。



第五步
,
将新的变量
Seq1 ,Seq2 ,Seq3
保存。



最后
,
使用
SPSS
软件读取该数据文件。


多项选择题的数据集合的定义



可从两种方式进入:



(1)
从菜单
Analyze
(分析)

ultiple

esponse
(定义多重响应集)

进入。



(2)

从菜单
Analy ze
(分析)
→Tables
(表)


ultiple

esponse

Tables
(多响应集)

进入。



例:




项目1、您的性别:1-男

2-女




项目2、您购车时,哪些因素会影响你的购车决策。
(允许选择



个答案,而且要求被
调查者按主



次顺序选出答案,如521,即价格最重要,其次是款式,再次是性能。




1-性能

2-款式

3-油耗

4-品牌

5-价格

6-颜色

7-其他



从菜单Analyze(分析)

Tables(表)

Multiple

Respon
se

Tables(多响应集)进入:



第一步:在

Variables

in
Set(设置定义)框是选入需要加入同一个多项
选择题变量集的变量系列,这些变量必须进行分类 ,

并按照相同的方式来编码。



若项目是按多重二分法编码,将Set

Definition(设置定义)框中的

a1、
a2、

a3
……
a7

放入

Variables

in

Set(集合中的变量)框,在V
ariablesAre

Coded

As(将变量编码为)单选框中的选择

dichot
omies

(二分法)
,在

Counted

value(计数值)

右侧框中输入1。



若项目是按多重分类法编码,将

Set

Definition

(设置定义)框中的b
1、b2、b3

放入Variables

in

Set(集合中的变量)框,在Varia
blesAre

Coded

As(将变量编码为)单选框中的选择categories
( 多重分类法编码方式)
,则需要设定取值范围,在该范围内的记录值纳入分析。一般的取值范围
是该多项选择题选项的最大和最小代码,因此,在range右侧框中输入1,through
后输入7 。



第二步:

定义多重反应分析的变量集的名称并附上名称标签。在

Name(名称)框是
输入多项选择题变量集的名称,项目2命名为

GCJCYXYS

。在Lable(标签)框
是多项选择题变量集定以一个名称 标签,项目2用的是

购车决策影响因素


毛巾杆-整理英语


毛巾杆-整理英语


毛巾杆-整理英语


毛巾杆-整理英语


毛巾杆-整理英语


毛巾杆-整理英语


毛巾杆-整理英语


毛巾杆-整理英语



本文更新与2021-01-20 11:26,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/538332.html

Excel中自动完成方差齐性与非齐性t检验的相关文章

  • 爱心与尊严的高中作文题库

    1.关于爱心和尊严的作文八百字 我们不必怀疑富翁的捐助,毕竟普施爱心,善莫大焉,它是一 种美;我们也不必指责苛求受捐者的冷漠的拒绝,因为人总是有尊 严的,这也是一种美。

    小学作文
  • 爱心与尊严高中作文题库

    1.关于爱心和尊严的作文八百字 我们不必怀疑富翁的捐助,毕竟普施爱心,善莫大焉,它是一 种美;我们也不必指责苛求受捐者的冷漠的拒绝,因为人总是有尊 严的,这也是一种美。

    小学作文
  • 爱心与尊重的作文题库

    1.作文关爱与尊重议论文 如果说没有爱就没有教育的话,那么离开了尊重同样也谈不上教育。 因为每一位孩子都渴望得到他人的尊重,尤其是教师的尊重。可是在现实生活中,不时会有

    小学作文
  • 爱心责任100字作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
  • 爱心责任心的作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
  • 爱心责任作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文