1. 首页 > 科技快讯 >

pearson相关系数怎么用_pe arSon

怎样用spss做pearson相关性分析

pearson相关系数怎么用_pe arSonpearson相关系数怎么用_pe arSon


相关性是指两个变量之间的变化趋势的一致性,如果两个变量变化趋势一致,那么就可以认为这两个变量之间存在着一定的关系(但必须是有实际经济意义的两个变量才能说有一定的关系)。相关性分析也是常用的统计方法,用SPSS统计软件作起来也很简单,具体方法步骤如下。

方法步骤

选取在理论上有一定关系的两个变量,如用X,Y表示,数据输入到SPSS中。

从总体上来看,X和Y的趋势有一定的一致性。

为了解决相似性强弱用SPSS进行分析,从分析-相关-双变量。

打开双变量相关对话框,将X和Y选中导入到变量窗口。

然后相关系数选择Pearson相关系数,也可以选择其他两个,这个只是统计方法稍有异,一般不影响结论。

点击确定在结果输出窗口显示相关性分析结果,可以看到X和Y的相关性系数为0.766,对应的显著性为0.076,如果设置的显著性水平位0.05,则未通过显著性检验,即认为虽然两个变量总体趋势有一致性,但并不显著。

皮尔逊相关系数的适用条件

皮尔逊相关系数的适用条件:当两个变量的标准都不为零。两个变量之间是线性关系,都是连续数据。两个变量的总体是正态分布,或接近正态的单峰分布。

皮尔逊相关系数衡量随机变量X与Y线性相关程度的一种方法,相关系数的取值范围是[-1,1]。相关系数的越大,则表明X与Y相关度越高。当X与Y线性相关时,相关系数取值为1(正线性相关)或-1(负线性相关)。

皮尔逊相关系数的适用范围:

当两个变量的标准都不为零。

两个变量之间是线性关系,都是连续数据。

两个变量的总体是正态分布,或接近正态的单峰分布。

两个变量的观测值是成对的,每对观测值之间相互独立。

请点击输入图片描述

理解皮尔逊相关系数:

两组数据首先做Z分数处理之后, 然后两组数据的乘积和除以样本数

以看做是两组数据的向量夹角的余弦

皮尔森相关系数怎么看?

皮尔森相关系数也称皮尔森积矩相关系数是一种线性相关系数,是常用的一种相关系数。记为r用来反映两个变量X和Y的线性相关程度,r值介于-1到1之间,越大表明相关性越强。

pearson是用来反应俩变量之间相似程度的统计量,在机器学习中可以用来计算特征与类别间的相似度,即可判断所提取到的特征和类别是正相关、负相关还是没有相关程度。

数据分析

1、当r>0时,表明两个变量正相关,即一个变量值越大则另一个变量值也会越大;

2、当r<0时,表明两个变量负相关,即一个变量值越大则另一个变量值反而会越小;

3、当r=0时,表明两个变量不是线性相关的(注意只是非线性相关),但是可能存在其他方式的相关性(比如曲线方式)。

皮尔逊(Pearson)相关系数

1、协方能完美的解释两个变量之间相关的方向,但在解释强度上却不太行,举个例子:每个变量都是有量纲的,这里假设变量x的量纲为距离,可以是米,也可以是千米,甚至可以是光年,针对协方的量纲问题,统一除以同样的量纲就可以搞定。正态分布标准化需要除以标准偏,标准偏的量纲与变量一致,这样就可以消除量纲了。让每一个变量x与变量x的均值的,都除以x的标准偏Sx,变量y也同理,则有以下关系式:(该关系式即为皮尔逊相关系数,简称相关系数,可以认为是协方的标准化)。

上图中,r即为相关系数,Sxy为协方。

2、皮尔逊相关系数的范围

皮尔逊相关系数不关心变量的量纲是什么,只关心变量x值距离平均值

变动了多少个标准偏,也就是自己跟自己比,少拿量纲吓唬人。

3、由1、2解读可知,Pearson相关系数的范围是在[-1,1]之间,下面给出 Pearson相关系数的应用理解 :

假设有X,Y两个变量,那么有:

(1) 当相关系数为0时,X变量和Y变量不相关;

(2) 当X的值和Y值同增或同减,则这两个变量正相关,相关系数在0到1之间;

(3) 当X的值增大,而Y值减小,或者X值减小而Y值增大时两个变量为负相关,相关系数在-1到0之间。

注:相关系数的越大,相关性越强,相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。通常情况下通过以下取值范围判断变量的相关强度:

0.8-1.0 极强相关

0.6-0.8 强相关

0.4-0.6 中等程度相关

0.2-0.4 弱相关

0.0-0.2 极弱相关或无相关

4、Pearson系数的适用范围

当两个变量的标准都不为零时,相关系数才有定义,皮尔逊相关系数适用于:

(1)、两个变量之间是线性关系,都是连续数据。

(2)、两个变量的总体是正态分布,或接近正态的单峰分布。

(3)、两个变量的观测值是成对的,每对观测值之间相互独立。

5、Pearson相关系数的举例

[图片上传失败...(image-b9d6aa-1616642849334)]

上图中,几组(x,y)的点集,以及各个点集中和之间的相关系数。我们可以发现相关系数反映的是变量之间的线性关系和相关性的方向(排),而不是相关性的斜率(中间),也不是各种非线性关系(第三排)。请注意:中间的图中斜率为0,但相关系数是没有意义的,因为此时变量是0。

参数说明:

1)输入:x为特征,y为目标变量.

2)输出:r: 相关系数 [-1,1]之间,p-value: p值。

注: p值越小,表示相关系数越显著,一般p值在500个样本以上时有较高的可靠性。

下面看示例:

样本数:1000

特征数:3(总共3维)

重要特征:1

spss皮尔森相关如何算?

spss皮尔森相关系数分析表示在样本中变量间的相关系数,表示相关性的大小。

一般来说相关性大小要看显著性达到什么程度。显著性越明相关程度越高。显著性小于0.05则为显著先关,小于0.01则为极显著相关。

spss皮尔森相关系数分析研究报告:

相关系数的越大,相关性越强:相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。

通常情况下通过以下取值范围判断变量的相关强度:

相关系数 0.8-1.0 极强相关。

以上内容参考:

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至836084111@qq.com 举报,一经查实,本站将立刻删除。

联系我们

工作日:9:30-18:30,节假日休息