ch3coona：icc组内相关系数_高中生题库网|高考真题|高考试题-「密云二中」

作者：高考题库网

来源：https://www.bjmy2z.cn/gaokao

2020-11-21 02:25

tags:互相关系数公式

北京民办-励志幽默有深意的故事

2020年11月21日发(作者：祁书臣)
转贴）如何选择Intraclass correlation coefficient (组内相关系数)
的模型
祝老师：您好！经常来您这看看，获益非浅。有一个问题想向您请教。我现在在做一个关于
学龄儿童健康行为问卷的重测信度研究。如在过去一周你有几天参与体力活动至少60分钟？
选项 1，2，3，4，5，6，7 天。因为数据是interval level，所以打算计算ICC。根据组内
效应和项目效应是否随机，Single Measure ICC有三种类型，ICC(1,1), ICC(2,1) 和 ICC(3,1)。
按我的理解，学生在不同时间回答同一道问题可以认为是two same judges in different time
with fixed effect，因此应该采用ICC(3,1)。但是看过去的文献，针对同一道问题，如上题，
三种算法都被用过，所以比较迷惑，希望您能指点，谢谢！
庄主 @ 2009-05-17:
你提到的ICC，指Intraclass Correlation Coefficient（通常翻成“组内相关系数”）。ICC在心
理学和教育学研究中用得较多，但本庄大多数读者来自新闻传播学界，可能不甚了解，所以
我先简单交代一下有关背景。
ICC涉及到多种用途，含义各有所不同。你是将其用于检验变量的信度（reliability），所以
我这里也就仅谈谈信度检验中的I CC模型问题。（但是，要真正理解ICC，还是应该放在
ANOVA的框架下进行。以下涉及到一点A NOVA、但我无意从ANOVA的ABC讲起，只假定
大家已经掌握了。）
有人也许会问，检验信度不是已经有Cronbach’s alpha，为什么还要用ICC？这与被检验的
变量之性质有关。我们通常检验的“信度”是指 the consistency between two or more
concepts（两个或更多概念之间的一致性），这时我们确实是用Cronbach’s alpha，其实alpha
只是根据Pearson r（即经典的相关系数）而计算出来的衍生物，而Pearson r 则是一种
Interclass Correlation Coefficient（注意其中的“Interclass”，即“组间相关系数 ”，与ICC是
相反的一对统计量）。相反，如果我们想检验的信度，涉及到的却是 the stability between
two or more measures of the same concept（同一个概念的两个或多个测量指标之间的稳
定性），这时Pearson r及其衍生物Cronbach’s alpha不不合适了（参见我的旧贴Difference
vs. Correlation，虽然文中没有出现组间和组内相关的名词，但谈到的是同一问题），而可
以用ICC。你面临的“健康行为”的“重测信度”，就是涉及一个概念（健康行为）的两个测量 指标。内容分析中的inter-coder reliability也是一个概念（即内容分析的某个变量）的多个
coders决策之间的稳定性。
顺便提一下，在ICC研究的文献中，上述“同一个概念的不同测量”是被叫做“different
variables of a common class”。这里所涉及到的名词，如class,cases, variable（以及可能会
出现的measurements, raters, judges, items, objects等等），如果翻成中文、都很容易产
生望文生义的误导。不知你的迷惑，是否与这些名词有所关系？我一开始接触有关文献时，
也曾迷惑过，后来把ICC的公式（右下）与Pe arson r公式（左下）比较一下，就清楚了这
些名词的真正含义。所以，我们还是不能不看公式。

在r的公式中，x
i
和y
i
分别是概念X和Y的测量值、和分别是X和Y的均值、S
x
和
S
y
分别是X和Y的标准差，n是样本数。（由此可见，X和Y的取值范围可以完全不一样，
如X可以是从-1到1而Y可以从0到100 00；两者的标准差也由此可以完全不一样。其结
果根本不会影响r的值。）而在icc中，为了强调“ 组内”的意义，我将X改写成X
1
、Y改写
成X
2
（当然改写前后变量并没有本质区别）。两个公式的真正区别在于均值及标准差的计
算，r中的X和Y均值及标准差是分别独立计算的、而icc中的
（联合均值）、而
是X
1
和X
2
的pooled mean
也是X
1
和X
2
的pooled var iance（联合方差、即联合标准差之平方）。
由于ICC值是每个观察值减去“联合均值”（而不是各自的独立均值）、加总后再除以“联合
方差”（而不是除以各自的独立标准差之乘积），所以其计算结果反映了“组内”的相关系数。
（注意，“联合方差”背后有一个更严格的要求，即X
1
和X
2
的方差要相等。这一要求不是很
容易满足的。如果你的两次测试之间有一定的时间间隔而其中有发生过什么重要的事件，如
学校开设了卫生课或召开了运动会，使得学生之间健康行为的差异缩小了或扩大了，那么就
不适合用ICC了。）

好了，在上述简单背景的基础上，我们来讨论你的问题：如何检验ICC？具体来说，就是如
何选择合适的ICC模型。让我们从计算ICC所需要的数据结构说起（右图）。图a是最常
见的结构，其中每个row（行）代表一个cas e（本例是ID从1到n的学生），每个column
（列）是同一概念的某个观测指标（本例中是X 1
和X
2
前后两次观测），每个cell（格）中
是每个学生的每次观测值（即上述公式中的x
1i
或x
2i
，在本例中取值1到7）。按ANOV A
的术语，每个x
i
受到三个来源的影响：一是between-columns effects（在本例中是over-time
effects，但内容分析的inter- coder reliability则是两个coders之间的coder effects、等等）；
二是within-columns effects（在本例中是within-subjects effects，即每个学生的特定因素）； 三、无法被columns和rows所解释的残差。三者之间，残差和within-columns effects 总
是（假定为）random（随机）的，前者是ANOVA能够成立的必要前提、而后者则是因为n
个学生是从N总体中随机抽取的一个样本。剩下的between-columns e ffects则需要根据研
究设计、数据采集方式等各种因素而来确定是fixed（固定）还是随机的，因此而形成了你
所提到的三种模型：
Source of Variance
One-way Random Model
ICC (1)
Two-way Random Model
ICC (2)
Two-way Mixed Model
ICC (3)
Within-columns effects
Random
Random
Random
Between-columns effects
--
Random
Fixed
首先来看ICC(1)。它并不考虑X 1
和X
2
的区别，所以实际上是将数据表中的X
1
和X
2
两列数
据合成一列（即图b的结构，其中共有2n行），为了说明图a和图b的相等性，我在图b
中加了变量Time，但实际上ICC(1)模型是估算Time的，而是只含一个因子（即自变量）
的one-way ANOVA（单因子方差分析）。其自变量是ID，当只有两个重测指标时，自变量
的values（即unique的ID数）很多、但每个value下面只有2个cases（所以是个很奇怪
的模型），其F值是用来检验每个学生的均值全部为零的假设。由此可见，ICC(1) 并不能
检验X的重测信度（当然它有很多其它用途，尤其是作为一个基准模型）。你说看到“过去
的文献，针对同一道问题，如上题，三种算法都被用过”。我很难想象这种情况。建议你搞
清作者用I CC(1)检验的零假设到底是什么。
回到图a的常见数据。如上所说，它可以用来同时分解colu mns和rows的影响，也就是ICC(2)
和 ICC(3) 所需要的数据。所以ICC(1) 和 ICC(2) 都可以用来检验重测信度。两者的区别
在于如何看待我开始时说的“同一概念的各种测量指标”的产生机制。这不是一个统计问题、
而是研究设计问题或数据采集方法问题，即取决于每个研究的具体情况。一般而言，如果
X
1
和X
2
是该概念的所有可能测量指标（最极端的例子是“匹配”样本，如夫妻、双胞胎、师
生、上下级等“对子”对同一问题的回答），那么它们应该是fixed。反之，如果该概念除了
X
k
和X
2
之外，还可以有X
3
、… X
k
指标，那么它们应该是random的。同理，检验在内容分
析的inter- coder reliability时，coders应该都是从一个理论上无限大的总体中抽出来的样本， 所以也应该是random的。你说你的两次测试是“two same judges in different time with
fixed effect”，我没有足够信息来否定你，但直觉上感到它们是无限空间中的两个时间样本
点，所以为什么不是random的？
我们还可以从模型结果的使用来理解between-columns effects到底是fixe d还是random的。
如果你只想（或只能）将其结果限制在本研究的具体时空中（如这两个特定测量时间点、这
两个特定coders、等等），那么可以采用fixed模型（3）；反之如果你希望将结果推及其
它时间或空间（其它任何测量时点、任何coders、等等），那么就应该用random模型（2）。
除了between-columns effects的不同选择之外，ICC还涉及其它两个层面的选择，一是估
算的ICC是consistency还是absolute agreem ent（两者的差别就是我上面提到的旧帖中描
述的correlation与difference），二是single 还是average。这些分别涉及到一些新的问题，
暂且不谈了。
如果谁真的要用ICC，应该认真读一下ICC的权威文献：K. O. McGraw & S. P. Wong
(1996). Forming inferences about some intraclass correlation coefficients、以及该文的纠
错补充。
最后，想说几句感受。常有网友在此问及各种进阶的统计问题、如SEM、multilevel、IC C
等等。我是又喜又愁。喜的是后生可畏，敢于玩前沿。愁的是（从提问中推测），有关网友
缺乏必要的基础知识，借助于统计软件而捷径上山、一步到顶峰。定量分析与其它绝大多数
知识不同，只能循序渐进、一个台阶一个台阶往上爬。如果对进阶的方法不甚了了，与其大
胆试用（大部分情况下会用错，而且错了还不知道原因何在），我强烈建议使用熟悉的经典
方法，如回归、方差、crosstabs 等等。经典方法也许用到你的数据上会有些问题、但那是
已知的问题，而新方法可能带来的风险是无法预知。如果医生不了解某一新药，绝不敢乱用，
而会使用已知作用有限并有副作用的旧药。我们是给数据看病的Data Doctor，也要有如此
的基本医德。共勉。

制冷与空调技术-西南名族大学

新东方学校学费-心烦的句子说说心情

滁州学院地址-招生简章

多元文化-youmo

微电子专业大学排名-赞颂老师的文章

豆瓣评分排行榜-商务管理专业

重庆高职院校排名-会更好的

半圆有几条对称轴-描写中秋节的句子

本文更新与2020-11-21 02:25，由作者提供，不代表本网站立场，转载请注明出处：https://www.bjmy2z.cn/gaokao/451401.html

返回列表：高中公式大全

利用R求简单相关系数及其显著性检验

《长方形、正方形周长的计算》教案设计

当前您在：主页 > 高中公式大全 >

ch3coona：icc组内相关系数

北京民办-励志幽默有深意的故事

制冷与空调技术-西南名族大学

新东方学校学费-心烦的句子说说心情

滁州学院地址-招生简章

多元文化-youmo

微电子专业大学排名-赞颂老师的文章

豆瓣评分排行榜-商务管理专业

重庆高职院校排名-会更好的

半圆有几条对称轴-描写中秋节的句子

返回列表：高中公式大全

icc组内相关系数的相关文章

爱心与尊严的高中作文题库

爱心与尊严高中作文题库

爱心与尊重的作文题库

爱心责任100字作文题库

爱心责任心的作文题库

爱心责任作文题库

爱心长在作文题库

爱心中国感恩励志作文题

爱心助考作文题库

爱心助农作文题库

爱心尊重宽容拒绝作文题

爱心尊重作文题库

爱心作文题库好段

爱心作文题库120字

爱心作文题库读者

爱心作文题库分论点

爱心作文题库简短

爱心作文有哪些题库

爱需要被尊重作文题库

爱需要传递200字作文题库

爱需要公平作文题库

爱需要行动作文800高中作

爱需要行动作文题库

爱需要交流与沟通作文题

当前您在： 主页 > 高中公式大全 >

北京民办-励志幽默有深意的故事

制冷与空调技术-西南名族大学

新东方学校学费-心烦的句子说说心情

滁州学院地址-招生简章

多元文化-youmo

微电子专业大学排名-赞颂老师的文章

豆瓣评分排行榜-商务管理专业

重庆高职院校排名-会更好的

半圆有几条对称轴-描写中秋节的句子

icc组内相关系数的相关文章

当前您在：主页 > 高中公式大全 >