相关性和协方差
相关和协方差是理论统计学中密切相关的概念。它们在确定两个随机变量之间的关系时很重要。
相关性是什么?
相关性是衡量两个变量之间关系强度的指标。相关系数量化了一个变量的变化程度基于另一个变量的变化。在统计学中,相关性与相依性的概念有关,相依性是两个变量之间的统计关系
皮尔逊相关系数或相关系数r的值介于-1和1之间(-1≤r≤+1)它是最常用的相关系数,仅对变量之间的线性关系有效。如果r=0则不存在相关关系,如果r≥0则成正比关系;一个变量的值随着另一个变量的增加而增加。当r≤0时,两者成反比;一个变量随着另一个变量的增加而减少。
由于线性条件,相关系数r也可以用来建立变量之间线性关系的存在。
协方差是什么?
在统计理论中,协方差是衡量两个随机变量一起变化的量。换句话说,协方差是衡量两个随机变量之间相关性的强度。
从另一个角度来看,相关性就是协方差的归一化版本,即协方差除以两个随机变量标准差的乘积。协方差的范围可能很大;因此不容易进行比较。这个困难是通过将协方差值带入一个可以通过规范化进行比较的范围来克服的(有点像z分数)。虽然协方差和方差以上述方式相互联系,但它们的概率分布并不是简单地相互联系,必须单独处理。
相关和协方差的区别是什么?
相关性和协方差都是两个随机变量之间关系的度量。相关性是对两个变量的线性强度的度量,协方差是对相关性强度的度量。
•相关系数值是-1和+1之间的值,而协方差的范围不是恒定的,但可以是正的或负的。但如果在计算协方差之前对随机变量进行标准化,那么协方差就等于相关性,其值在-1到+1之间。
朱莉说
相关系数量化了一个变量在另一个变量变化基础上的变化程度。
这句话可能会被误解,因为斜率的大小(当变量A与变量B绘图时)是由相关系数表示的,但它不是。
此外,我不会在这里使用“比例”这个术语,因为这意味着当B = 0时A = 0,反之亦然,这并不一定如此。这可能是与偏移量的线性关系。