发新话题
打印

SPSS探索性因素分析之具体步骤探讨

SPSS探索性因素分析之具体步骤探讨

这主要针对的是预试问卷而言,也就是说在初试问卷经过了语义分析,专家讨论论证之后最终得出的问卷。以下的经验是根据我编制职业承诺问卷的基础上总结而来,错误之处希望同行指教。首先要说的是关于样本数量的问题。按照统计学标准而言,一般样本数应为题目数的5-10倍。由于我的题目为50,故样本至少为250个。前期我计划发放样本数为6倍也就是300份,由于样本流失及废卷的原因,最终回收到有效问卷为256份,有效率为85.33%。当然这是无法避免的。
  下面我主要谈一下进行探索性分析的具体步骤:
   第一:比较明确的一步就是做一下关于各个项目的鉴别度(区分度)的分析。在这个条件下会删除一部分不适合的题目。删除程序为SPSS下的Analyze→Scale→ReliabilityAnalysis。比较保险的的是从比较小的鉴别度一步一步删除,每次删一些较低的题目就看一下科隆巴赫系数的大小,直到满意为止。当然也可以直接将低于0.3的题目删除。注意的是删除的应为那些删除后科隆巴赫系数值提高的题目,如果删除后科隆巴赫系数值降低,这就需要重新考虑了。结合语义分析取舍。
   第二:在这种情况下一般而言,进行问卷设计之前所有的题目究竟是属于哪一个维度或者有几个维度应该有一定的假设,此时应该如下操作:(1)首先是反向题目的更改。这方面需要注意的就是每次关闭文件的时候注意不要保存或者你将反向题目更改后的文件保存下来,一定要注明,因为如果你忘记了,就会混淆到底反向题目有没有修改过。(2)也就是重点阶段。顾名思义探索性因子分析就好比你是一个探险家在探索一块未知的领域,你不知道去哪一个方向才是正确的,也许你走了很长的路却与你所期望的目的地相反。为避免在进行探索性因子分析的时候做无用功,我采用了如下的方法:在最大变异法和极大相等法两种正交旋转下分别对题目进行讨论。比如在最大变异下有四种情况:A:最大变异下不控制因素个数。  B:最大变异下,强制性因素个数为3. C:最大变异下,强制性因素个数为4.  D:最大变异下,强制性因素个数为5.关于强制性因素个数的设定一般情况下为3-5个因素,当然也可以根据先前的研究理论具体分析。我们记录下四种情况下的KMO,项目共同度<0.3的题目,以及最大贡献率的情况。然后改用正交旋转下的极大相等法,同上四个情况并分别记录下来。为什么要用到极大相等法呢?这主要考虑到在最大变异的情况下第一个因素的负载通常会很大,为了使各个项目平均分配到各因子上去,极大相等法是个不错的选择,而事实上目前的硕博论文很多都在用极大相等法,只是台湾地区一部分人在用斜交的方法,我认为正交旋转下的极大相等法是第一选择,这也得益于哈师大崔洪弟老师的指点。这样我们就记录下了8中情况下三个方面的数据,经过比较分析和先前的理论,我们就可以推断出大致的因素个数。(3)在确定因素个数后,下面的工作就轻松了许多。尤其是我们对那些在以上8中情况下共同度均小于0.3的题目进行删减。(4)然后就是对各因素命名并删除的过程。其中一点值得注意的是一定要结合题目的意义进行删减。有些题目的得分不高但是意义可能很重要;另外就是关于横跨两个因素的数目,一般而言也是要删减的。在李茂能的书里也提到了计算各个题目与总题目的相关度,删除那些低相关的题目也是有必要的。
    第三:在我进行分析的时候出现了在因素个数为5的情况下总的贡献率大于因素个数为4的情况,但是碎石图却显示在特征根值为1的情况下对应的最佳因素个数为4。但是在4的情况下运用极大相等法正交旋转后对各因素命名的难度很大,且不容易解释。当时我想到的是将5因素其中的两个合并成一个,而且理论上也与以往的理论大致上相同,也很好解释。但是经过和崔老师的讨论发现其实5因素就已经解释的很好,没有必要合并,并且发现了与以往某些研究不同的结论,也许这就是本研究的创新所在。
   以上删题,留题,区分度分析与共同度分析,KMO值等都是在反复验证的情况下进行的,最终得到比较容易解释、简洁而且符合前提理论假设的模型。
   当然这只是对预试问卷的探索性因素分析阶段,模型与现实的匹配是否完全,还需要进行正式问卷的验证性因素分析即结构方程AMOS的分析,来讨论模型与数据的拟合程度。到目前为止我只是完成了毕业论文的第一部分,最重要也最有难度的是第二部分。包括预试问卷的结果即职业承诺问卷、大五人格问卷和工作绩效问卷合并一个统合问卷,大约需要700个左右的样本,从而最终得出影响人格与绩效的中介和调节变量。

TOP

发新话题