发新话题
打印

SPSS交流——相关分析与相关系数

SPSS交流——相关分析与相关系数

相关分析是描述两变量间是否有线性关系的分析方法,用相关系数r来描述。相关关系的特征体现在两个方面,一个是方向(是正相关、负相关还是零相关?),另一个是强度(到底密切的程度有多大)。如果x,y变化的方向一致,就是正相关,如身高与体重的关系,r>0;负相关:如果x,y变化的方向相反,就是负相关,如吸烟与肺功能的关系,r<0。
一、相关关系的判定
ü  |r|>0.95 存在显著性相关;
ü  |r|≥0.8 高度相关;
ü  0.5≤|r|<0.8 中度相关;
ü  0.3≤|r|<0.5 低度相关;
ü  |r|<0.3 关系极弱,认为不相关
ü  r=0无线性相关:。
如果变量Y与X间是函数关系,则r=1或r=-1;如果变量Y与X间是统计关系,则-1<r<1。
二、常用的相关系数
2.1 Pearson相关系数
亦称积差相关系数(coefficient of product-moment correlation),用r表示样本相关系数,P表示总体相关系数。它是说明有直线关系的两变量间,相关关系密切程度和相关方向的统计指标。计算公式:



注意事项:
ü  变量是正态分布,没有奇异值噪音。所以做相关性分析之前要去除可能的奇异值,而且如果不是正态分布,可以通过取对数来近似获得。
ü  另外,对于某些数据样本,考查两个变量之间的相关性,按照某类属性将样本分割,分别考查,或许会获取更有价值的知识。
2.2 Spearman相关系数
又称秩相关系数、等级相关系数,或顺序相关系数,是利用两变量的秩次大小作线性相关分析,具体是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。Spearman对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。
计算等级相关系数,可以将数据变换成等级以后用原有的相关系数公式计算,也可以将算出每一对样本的等级之差di,然后用下列公式计算,所以又称为“等级差数法”。
2.3 Kendall相关系数:
肯德尔系数又称和谐系数(the Kendall coefficient of concordance)是表示多列等级变量相关程度的一种方法。这种资料的获得一般采用等级评定的方法,即让K个被试(或称评价者)对N件事物或N种作品进行等级评定,每个评价者都能对N件事物 (或作品)好坏、优劣、喜好、大小、高低等排出一个等级顺序。因此,最小的等级序数为1,最大的为N,这样,K个评价者便可得到K列从1至N的等级变量资料,这是一种情况。另一种情况是一个评价者先后K次评价N件事物或N件作品,也是采用等级评定的方法,这样也可得到K列从1至N的等级变量资料。这类K列等级变量资料综合起来求相关,可用肯德尔系数。如欲考察几位老师对多篇作文的评分标准是否一致(又称评分者信度),就应该使用肯德尔系数。
德尔和谐系数常用符号W表示。其公式为:



Ri为每一件被评价事物的K个等级之和,
N为被评价事物的件数即等级数,
K为评价者的数目或等级变量的列数。
W值介于0与1之间,计算值都为正值,若表示相关方向,可从实际资料中进行分析。这种方法的原理是基于这样一种思想:如果各列变量完全一致,那么各被评价的事物(或人),其各评价者所评的等级应该相同,其等级和的最大方差即最大可能的S应为K2(N3-N)/12。如果评价的等级不同,则S变小,一致性程度降低,如果完全没有相关,则所评各等级之和应该相等,其最大可能方差(S)应为零,这样实际资料等级和的方差与最大可能的方差的比值,便是和谐系数,其值必介于0与1之间。
三、其他相关介绍
自相关:按时间(时间序列)或空间(横截面数据)排序的观察值序列的成员之间的相关。虽然现在把名词自相关与序列相关看做同义词,但有些学者也喜欢把二者区别开来。把“自相关”定义为一个序列与其滞后若干期的序列的滞后相关,把“序列相关”定义为两个不同序列的滞后相关。
偏相关:又称净相关或部分相关,是在研究在多变量的情况下,当控制其他变量影响后,两个变量间的直线相关程度。偏相关系数较简单直线相关系数更能真实反映两变量间的联系。
质量相关:当一个变量是等比或等距变量,而另一个变量是按性质划分的变量,求这样的两个变量之间的线性关系时,叫做质量相关。质量相关包括点二列相关和二列相关,他俩之间的区别就是按性质划分的那个变量是人为给划分成两个的离散型变量,而原来是个连续型变量,这种情况是二列相关;当按性质划分的那个变量本身就是两个的离散型变量时,叫点二列相关,如性别分为:男、女。
复相关:研究一个变量 x0与另一组变量 (x1,x2,…,xn)之间的相关程度。例如,职业声望同时受到一系列因素(收入、文化、权力……)的影响,那么这一系列因素的总和与职业声望之间的关系,就是复相关。复相关系数R的测定,可先求出 x0对一组变量x1,x2,…,xn的回归直线,再计算x0与用回归直线估计值悯之间的简单直线回归。
典型相关:典型相关是分析两组随机变量间线性密切程度的统计方法,是两变量间线性相关分析的拓广。各组随机变量中既可有定量随机变量,也可有定性随机变量。本法还可以用于分析高维列联表各边际变量的线性关系。

TOP

发新话题