相关系数
总体:所考察对象的全部个体
样本:从总体中抽取的一部分个体
Pearson 相关系数
注意,在确定这两个变量是线性相关之前,算这个没毛用。
总体 Pearson 相关系数
剔除了量纲影响,标准化之后的协方差。 \[ \text{如果两组数据}X:\{X_1,X_2,...X_n\}和\{Y_1,Y_2,...Y_n\}\text{是总体数据}\\ 那么总体均值:E(X)=\frac{\sum^{n}_{i=1}X_i}{n},\ E(Y)=\frac{\sum^{n}_{i=1}Y_i}{n} \\ 总体协方差:Cov(X,Y)=\frac{\sum^n_{i=1}(X_i-E(X))(Y_i-E(Y))}{n}\\ 总体Pearson相关系数:\rho_{XY}=\frac{Cov(X,Y)}{\sigma_X\sigma_Y}=\frac{\sum_{i=1}^n\frac{X_i-E(X)}{\sigma_X}\frac{Y_i-E(Y)}{\sigma_Y}}{n}\\ 其中\sigma_X是X的标准差,\sigma_X=\sqrt{\frac{\sum_{i=1}^n(X_i-E(X))^2}{n}},\ \sigma_Y=\sqrt{\frac{\sum_{i=1}^n(Y_i-E(Y))^2}{n}} \\ |\rho_{XY} |\leq1,\ 且Y=aX+b时,\ \rho_{XY} = \left\{ \begin{aligned} 1,\ a>0\\ -1, \ a<0 \end{aligned} \right. \]
样本 Pearson 相关系数
懒得写了