您的位置:首页 > 其它

Pearson’s product moment correlation/皮尔逊(森)积矩相关系数

2014-09-04 00:19 1741 查看
相关系数:

相关系数士一种用以衡量俩对随机变量(bivariate random variables)的关系的度量。一般用来度量俩随机变量x和y 的相关度(measure of correlation)必须满足下列条件:

相关度数值应该 介于-1 和 +1 之间
若随机变数 x 的较大值倾向于 y 较大值配对,且 x 的较小值倾向于 y 较小值配对, 则其相关测度值应该为正值,若此配对越密切,则其值应该越接近+1。
若随机变数 x 的较大值倾向于 y 较小值配对,且 x 的较小值倾向于 y 较大值配对, 则其相关测度值应该为负值,若此配对越密切,则其值应该越接近-1。
若随机变数 x 的值似乎与y值随机配对,则其相关测度值应该接近于0。此时俩随机变量x与y 无关 

皮尔森相关系数:

在统计学中,皮尔逊积矩相关系数(英语:Pearson
product-moment correlation coefficient,又称作 PPMCC或PCCs, 文章中常用r或Pearson's r表示)用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。

在自然科学领域中,该系数广泛用于度量两个变量之间的相关程度。它是由卡尔·皮尔逊从弗朗西斯·高尔顿在19世纪80年代提出的一个相似却又稍有不同的想法演变而来的。这个相关系数也称作“皮尔森相关系数r”。

皮尔逊相关系数是一种度量两个变量间相关程度的方法。它是一个介于 1 和 -1 之间的值,其中,1 表示变量完全正相关, 0 表示无关,-1
表示完全负相关。





or:



公式:【可以看出该系数即为我们非常熟悉的一元线性回归中的测定系数“R2”的开方值】

使用条件:样本来自正态总体

统计检验:可以用t 统计量对总体相关系数为0的原假设进行检验。若t 检验显著,则拒绝原假设,即两个变量是线性相关的;若t 检验不显著,则不能拒绝原假设,即两个变量不是线性相关的。【本质上是一元回归中的回归参数显著性检验】

R语言实现:

> n <- 10

> x <- rnorm(n)

> y <- rnorm(n)

> cor(x,y)

[1] -0.4132864

> cor.test(x,y)

Pearson's product-moment correlation

data: x and y

t = -1.2837, df = 8, p-value = 0.2352

alternative hypothesis: true correlation is not equal to 0

95 percent confidence interval:

-0.8275666 0.2924366

sample estimates:

cor

-0.4132864

上面给出了相关系数的可信度区间和P-value。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: