Pearson相关分析:那些看似很简单的相关性分析,你用对了吗?
haoteby 2025-04-09 16:14 11 浏览
从某种意义上说,世间万物存在千丝万缕的关系。在数据分析中,两变量间的关系包括确定性关系(即函数关系)和非确定性关系。
非确定性关系指两个变量宏观上存在关系,但不能用具体的函数关系来表示,这种既是必然的又是不确定的关系称为相关关系。相关关系进一步分为平行关系(两变量互相影响)和依存关系(一个影响另一个)。
两个连续随机变量之间的线性联系称为线性相关(linear correlation),亦称为简单相关,联系强度用相关系数来描述。Pearson相关性分析是分析两变量间线性相关最常的方法。
1.Pearson相关性分析,需要满足以下5个条件:
(1)两变量均为连续变量。
(2)两变量应当是配对的,即来源于同一个个体。
(3)两变量之间存在线性关系。
(4)两变量没有明显的异常值。
(5)两变量呈双变量正态分布或近似正态分布。
2.Pearson积矩相关系数
Pearson相关系数,又称积差相关系数。定义为两个变量之间的协方差和标准差之积的商(又称为归一化的协方差)。总体的相关系数用ρ表示,样本的相关系数用r表示。
从总体相关系数和样本相关系数的计算公式都可以看出:
(1)分母为两变量标准差的乘积,只可能为正数。
(2)分子为两变量的协方差,表示两个变量的观测值对均值的偏离构成的向量的内积。
a.当X的离均差和Y的离均差均为正数或者均为负数时,说明X和Y有同时增加或者同时减少的倾向,乘积为正,称 与 正相关;
b.当X的离均差和Y的离均差一正一负时,说明有X增加Y减少或者X减少Y增加的倾向,乘积为负数,称 与 负相关。
c.特别地,若X和Y部分取值同方向部分取值反方向,离均差乘积有正有负,加和就接近于0,即这时候X和Y呈无序变化,称 与 不相关,严格来说是无线性相关关系。
(3)根据柯西-施瓦尔兹不等式(Cauchy–Schwarz inequality):
可知-1≤ρ≤1,ρ越靠近-1或1,线性相关程度越强,越接近于0,越弱。
此外,因为分子协方差的量纲除以了分母、分子相同的量纲,所以Pearson相关系数是没有单位的,而且具有对称性、位移不变性和尺度不变性。
3.Pearson相关系数的假设检验
通常我们分析的数据是来自总体的样本,所得到的r只是ρ的一个估计值,也有抽样误差,因此还要进一步作总体相关系数ρ是否为0的假设检验。即:
H0:ρ=0,H1:ρ≠0,α=0.05
来自 =0 的总体的所有样本相关系数 是呈对称分布的,所以r的显著性检验可以用双侧t检验来进行。直接查t分布表即可获得P值。
需要注意的是,相关系数的显著性是与自由度 (-2) 有关,即与样本数量 有关。样本量小,r绝对值容易接近于 1 ,样本量大,r绝对值容易偏小,容易给人一种假象,但样本少,即使r很大,但会发现是没有显著性的,相反,样本量很大时,即使r=0.1,也是有显著性的。
4.Pearson相关系数的区间估计
在实际分析时,我们往往想得到总体相关系数以一定概率所在的大致范围,即ρ的置信区间。
由于-1≤ρ≤1,不服从正态分布,在估计置信区间前需要先进行转换,如对数转换:
此时-∞<z<+∞,z近似服从正态分布,则z的1-α置信区间为:
然后再作反变换即可得到总体相关系数ρ的置信区间:
关于相关性的强弱没有固定的界限,不同的参考书定义不同,但更应该关注样本量是否足够大。
在很多学位论文和期刊论文中,经常能看到Pearson相关分析的误用和滥用,即使不能满足必须的5个条件,也盲目应用Pearson相关分析,这是不可取的。
在结果阐述部分特别需要注意的是:
(1)r=0只能说明两变量无线性相关关系,并不表示两者无相关性,可通过散点图初步判断。
(2)Pearson相关分析只探讨两变量具有线性相关性,不能得出因果关系。
(3)Pearson相关分析与Spearman相关分析的区别。
(4)Pearson相关分析和线性回归分析的联系和区别。
相关推荐
- DIY桌面激光雕刻机#是时候展现真正的技术了
-
激光雕刻机。这期视频我们来看一下我是如何DIY一台桌面激光雕刻机。前几天在水池子边上发现了一台旧电脑,我看这电脑上还有一些东西可以利用到,比如光驱上面拆出了步进电机和滑轨。所以本期视频我将用这些废品去...
- 100000块多米诺骨牌拼成超级马里奥,这款机器人1天就完成了
-
智东西(公众号:zhidxcom)编译|王健恩编辑|高歌智东西7月30日消息,美国工程师兼YouTube博主MarkRober创造出了一个可以自动摆放多米诺骨牌的机器人。这个机器人被命名为D...
- 这个3D打印机器人可以在30秒内打开密码锁
-
密码锁看似很安全?也许曾经是,但现在你可要当心了!这是因为一台3D打印制造的机器人就可以在半分钟内打开你的密码锁。上周四,知名黑客萨米·卡姆卡尔(SamyKamkar)在自己的网站上公布了一个称之为...
- 密码锁也不安全 这款机器人30秒即可自动打开
-
大学生和体育爱好者们要注意了,千万不要再把贵重物品存放在公共储物柜里。因为现在已经出现了一种3D打印的机器人,据说世界上各大锁商推出的大部分密码锁,它都能够在30秒之内打开。著名黑客山米·卡姆卡(Sa...
- 硬件单片机模拟器,再也不用买开发板了...
-
#头条创作挑战赛#记得2006年在凌阳科技(sunplus)工作的时候,凌阳科技开发了自己的编译器/集成开发环境(unspIDE),那个IDE除了有keil那样的编辑器、编译器、链接器、调试器、下载...
- 3D打印机分哪几部分构成?(3d打印机结构组成及系统分析)
-
3D打印机的构成根据技术类型(如FDM、SLA、SLS等)有所不同,但以最常见的FDM(熔融沉积成型)3D打印机为例,其核心组成部分可分为以下模块:1.机械结构框架提供整体支撑和稳定性,常见材质为金...
- 初学者学伺服都需要什么?石家庄诺仕通
-
#初学者学伺服都需要什么?#对于初学者学习伺服系统,需要从...
- arduino(arduino是单片机吗)
-
arduino学习笔记arduino学习笔记1-什么是arduino?...
- 自制写字机,你需要的全套资料都在这里
-
小编之前发过《用废旧光驱制作迷你绘图仪》,很多读者都成功制作了自己的绘图仪。但是该方法的缺点是gcode要在inkscape软件中生成,然后通过grbl-controller这个没有界面的程序发送画图...
- 自己动手DIY3D打印机 瞬间效果出现桌面时,大家都惊呆了!
-
3D打印机,对数码产品比较了解的朋友都知道,但是真正玩过的童鞋可能就不多了。其实3D打印机离我们并不远,随着3D打印技术越来越成熟,3D打印机的学习资料也越来越多,这让自己动手做一台桌面3D打印机也成...
- 机器人仅用24小时将十万块多米诺骨牌拼出马里奥,创下世界纪录
-
十万块多米诺骨牌倒下是个啥场面?等等,十万块?那得搭多久啊?...
- 如何制作一个机器人?(制作机器人的方法)
-
1.简单机械机器人(例如自动小车)2.智能机器人(带有人工智能或计算机视觉)3.工业机器人(用于生产自动化)4.人形机器人(类人结构,可以行走、对话)...
- CrowPi2树莓派4学习套件评测第1部分–开箱和首次启动
-
文章来源:CNXSoftware中文站2020年6月,我曾写过一篇关于深圳易科诺...
- 基于 Arduino UNO 的蓝牙汽车(arduino智能小车蓝牙控制app)
-
HC-05蓝牙模块HC-05是一款易于使用的蓝牙SPP模块,针对流畅的串行无线通信配置进行了优化。串口蓝牙模块是完全合格的蓝牙V2.0+EDR(增强数据速率)3Mbps调制,具有总2.4...
- 电机驱动设计方案带你初识机电一体化
-
在直流电机驱动电路的设计中,主要考虑以下几点:功能:电机是单向还是双向转动?需不需要调速?...