发新话题
打印

因子分析详解

因子分析详解

一、因子分析的意义
   在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、完整的把握和认识。
±计算量的问题

±变量间的相关性问题
[size=+0]为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。
因子分析的概念起源于20世纪初Karl PearsonCharles Spearmen等人关于智力测验的统计分析。目前,因子分析已成功应用于心理学、医学、气象、地址、经济学等领域,并因此促进了理论的不断丰富和完善。
因子分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,名为因子。
   ê因子个数远远少于原有变量的个数
    原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模
    ê因子能够反映原有变量的绝大部分信息
    因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息
    ê因子具有命名解释性
    命名解释性有助于对因子分析结果的解释评价,对因子的进一步应用有重要意义。例如,对高校科研情况的因子分析中,如果能够得到两个因子,其中一个因子是对科研人力投入、经费投入、立项项目数等变量的综合,而另一个是对结项项目数、发表论文数、获奖成果数等变量的综合,那么,该因子分析就是较为理想的。因为这两个因子均有命名可解释性,其中一个反映了科研投入方面的情况,可命名为科研投入因子,另一个反映了科研产出方面的情况,可命名为科研产出因子。
二、因子分析的基本概念
1、因子分析模型
因子分析模型中,假定每个原始变量由两部分组成:共同因子(commonfactors)和唯一因子(unique factors)。共同因子是各个原始变量所共有的因子,解释变量之间的相关关系唯一因子顾名思义是每个原始变量所特有的因子表示该变量不能被共同因子解释的部分原始变量与因子分析时抽出的共同因子的相关关系用因子负荷(factorloadings)表示。
因子分析最常用的理论模式如下:
负荷。(理解:因为是多维空间(即:高维空间),所以,原始变量对因子的承载是随机的。)
U称为特殊因子,表示了原有变量不能被因子解释的部分,其均值为0,
注:特征值(Initial Eigenvalue)> 1 ,即 多维的主轴长度
   累计贡献值(Extraction Sums of Squared Loadings) > 0.8
F前的值越大,说明主成分对该变量的代表性也越大,解释也越充分。而后的几个主成分和原变量就不那么相关了。


1.根据因子分析模型的特点,因子旋转(factorrotation);这个步骤可使结果更好。
ex:

这里,第一个因子主要和语文、历史、英语三科有很强的正相关;而第二个因子主要和数学、物理、化学三科有很强的正相关。因此可以给第一个因子起名为“文科因子”,而给第二个因子起名为“理科因子”。从这个例子可以看出,因子分析的结果比主成分分析解释性更强。

2•这两个因子的系数所形成的散点图

虽然不是载荷,在SPSS中也称载荷图,可以直观看出每个因子代表了一类学科。
3.计算因子得分
可以根据前面的因子得分公式(因子得分系数和原始变量的标准化值的乘积之和),算出每个学生的第一个因子和第二个因子的大小,即算出每个学生的因子得分f1f2
人们可以根据这两套因子得分对学生分别按照文科和理科排序。当然得到因子得分只是SPSS软件的一个选项(可将因子得分存为新变量、显示因子得分系数矩阵)
4.SPSS实现

AnalyzeDataReductionFactor进入主对话框;


mathphyschemliterathistoryenglish选入Variables,然后点击Extraction


之后回到主对话框(用Continue)。然后点击Rotation,再在该对话框中的Method选择一个旋转方法



DisplayRotatedsolution(以输出和旋转有关的结果)和Loadingplot(以输出载荷图);之后回到主对话框(用Continue)。


如果要计算因子得分就要点击Scores,再选择Saveas variables(因子得分就会作为变量存在数据中的附加列上)和计算因子得分的方法(比如Regression);之后回到主对话框(用Continue)。这时点OK即可。

TOP

发新话题