添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
相关文章推荐
儒雅的机器猫  ·  iOS ...·  1 年前    · 
欢快的手电筒  ·  python ...·  1 年前    · 
SPSS简单效应检验的终极解决方案:MANOVA?GLM!

SPSS简单效应检验的终极解决方案:MANOVA?GLM!

1 年前 · 来自专栏 只求甚解

这大概会是我在知乎上最后一次正式谈如何用SPSS做方差分析简单效应检验,也是我对之前自己一直秉持并坚信的观点(即要用MANOVA语句做简单效应检验)的一次彻底颠覆。

在开始之前,要特别感谢师兄 @Rowlin ,如果没有和师兄的深入讨论,就不会有这篇彻底推翻自己原有观念的文章。正所谓,不破不立。

(知识产权声明:本文的一部分观点来自 @Rowlin


欲了解相关问题,可先行浏览我之前的文章和回答:


本文主旨:

做方差分析中的简单效应检验,从现在开始,别再用MANOVA了,用GLM及其/EMMEANS子句就好。

(这里所说的GLM是一个总称,在SPSS里可以对应于GLM语句模块,也可以对应于UNIANOVA语句模块,语句写法都是差不多的)


写在前面:

先打好预防针,本文不是教程,不会事无巨细地把语句、结果都贴出来,而是会从一个更宏观的视角与大家分享我和师兄讨论后达成一致的观点。自从我2016年回答了 SPSS三因素方差分析的简单简单效应语句 这个问题之后,已经在评论区和知乎私信里又回答了至少50位知友的关于MANOVA或者简单效应检验的个性化问题,其中有的问题比较有技术含量,有的问题却属于最基本的SPSS操作或代码规范问题。讲真,在知乎上,我不负责大家的SPSS入门,也不负责大家的统计入门(虽然我未来确实想成为一名教心理学研究方法和应用统计的大学老师)。大家都是做科研的才会用到简单效应检验,既然做科研,多一点探索精神可以吗?我对简单效应检验的熟悉、对SPSS语句规律的掌握,也不是无中生有的啊,也是靠一点点探索才慢慢明白的啊。

除了个人的尝试和探索,这个问题大多数的参考资料是来自于SPSS自带的说明文档 “syntaxreference.pdf” ,无论在SPSS窗口界面的Help菜单里,还是在SPSS的安装路径里,都可以找到它,别问我怎么找。虽然文档有点长,也没有中文翻译,但请大家还是读一读里面的内容,并且自己熟悉熟悉SPSS的代码风格,别问我怎么读、怎么熟悉,没有人能帮你做这件事。

PS:本文的封面图其实就是这个参考文档的封面,本文的一小部分内容也是参考了这个文档(简便起见,引用时标记为“syntaxreference.pdf”)。


正文:

首先,澄清一些必要的事实:

  1. MANOVA算的结果没错。
  2. GLM+/EMMEANS算的结果可能会不一样,但也没错。
  3. MANOVA和GLM都可以适用于各种情形(我之前的说法“GLM的/EMMEANS有局限”可能有误)。
  4. MANOVA和GLM的计算原理不同,MANOVA使用“full-rank”方法(矩阵满秩),GLM使用“non-full-rank”方法(矩阵不满秩)(syntaxreference.pdf,p. 906,1111; Matrix Rank ;参考文档没有说得更细,我也不清楚这两者的区别在哪里,别问我数学上到底有怎样的差异)。
  5. 如果每个处理条件或处理条件结合(cell)下,样本量都是均衡的,那么MANOVA和GLM算出来的简单效应检验结果是一样的;如果样本量不均衡,则结果不同。

然后,阐述一下选择GLM而不选择MANOVA的理由:

  1. MANOVA实在是太古老、太不方便了,古老到后续都没有相应的菜单操作补上,古老到连输出结果都是纯文本的。 不可否认,在舒华老师的经典教材《 心理与教育研究中的多因素实验设计 》一书中,MANOVA语句被用来计算方差分析的简单效应,北师大多少年来的统计课、多因素实验设计课都会教大家如何写MANOVA语句,MANOVA的地位不言而喻。然而要知道,这本书是1994年出版的,舒华老师从国外学到这一套方法则是年代更加久远的事了,当时的技术条件能和现在相提并论吗?完全不能。虽然MANOVA的计算结果似乎没错,但是从语句的书写,到结果的解读,我要用整整一篇知乎文章才能讲清楚、讲透彻( SPSS方差分析中的简单效应检验:完整教程 ),这与操作简单方便的SPSS格格不入。——相比之下, 如果用GLM,只需要在菜单操作完了之后,不直接运行,而是paste语句,然后在中间加一句/EMMEANS=...,就能实现任何你想做的简单效应检验以及简单效应基础之上的多重比较 ,多方便。
  2. MANOVA的计算结果真的没错吗?这个问题其实没办法下定论,因为随着统计方法的革新,原本被认为是正确的统计方法,之后也可能会被认为是不够妥当的。比如,如何处理每组样本量不均衡的情况?MANOVA和GLM对于非均衡样本量的处理方法不一样,自然导致了不一样的计算结果。我们没办法下定论说哪一种方法是必然正确的:并不是教科书上的做法就一定正确,尤其是20多年前出版的教科书;也并不是新的处理方法就一定最好。不过,即便如此,我们依然可以发现 MANOVA在某些时候似乎会出一些bug,需要我们去手动debug ,比如/ERROR=WITHIN的问题、/DESIGN里面被试间因素设定的问题,实例请参见: 如何调解MANOVA与T检验的不一致结果?
  3. 如果简单效应显著,并且水平数大于2,你还需要做简单效应基础之上的多重比较——这时, 只有GLM的/EMMEANS子句能做到 。翻过来倒过去,一开始做方差分析用GLM(或者用鼠标点击菜单操作,生成以UNIANOVA开头的语句,两者都一样的,没差),然后交互作用显著,做简单效应检验转而用MANOVA,发现简单效应也显著,又倒回去再用GLM——累不累?别说你们,我都嫌累。何必呢?直接一条龙下来用GLM不就好了吗?
  4. (最有说服力的一个理由)IBM SPSS官方推荐,简单效应检验用GLM语句,并且用实例讲解了怎么用(怎么改写语句) :(1) Significant interaction in ANOVA: how to obtain a Simple Effects Test ;(2) Repeated measures ANOVA: Interpreting a significant interaction in SPSS GLM )。这里再次感谢师兄 @Rowlin 分享的这两个资料。


总结:

简单来说,为什么选择GLM而从此放弃MANOVA语句呢?因为 MANOVA过于古老、不方便、bug多、结果难看,而GLM是一种合理的修正、很方便、很稳健、结果易读

如果知友们阅读了syntaxreference.pdf里面的GLM部分,或者阅读了更有针对性的上述理由(4)提到的两个官方资料,应该能够很轻松地掌握GLM和/EMMEANS的写法,因为 其实就一句话的事 ,大道至简。

如果还需要再留下一些take-home messages,也就剩下这两张PPT截图了:

编辑于 2022-04-30 11:07

文章被以下专栏收录

    只求甚解

    只求甚解

    心理学 | 研究方法 | 统计学 | 数据分析