优劣解距离法
TOPSIS
构造计算评分的公式
\[ \frac{x-min}{max-min} = \frac{x-min}{(max-x)+(x-min)} \]
指标正向化
极小型转换为极大型:\(max - x\),如果所有元素都为正数,也可以使用:\(\frac{1}{x}\)。
中间型转换为极大型:
\[ M = max\{|x_i - x_{best}|\}, \]
\[ \tilde{x_i} = 1-\frac{|x_i-x_{best}|}{M} \]
区间型指标 \[ M = max\{a-min\{x_i\}, max\{x_i\}-b\}, \]
\[ \tilde{x_i} = \begin{cases} 1-\frac{a-x}{M},\ \ x<a\\ 1,\ \ \ \ \ \ \ \ \ \ \ \ \ \ a\leq x \leq b\\ 1-\frac{x-b}{M},\ \ x>b \end{cases} \]
标准化处理(消除不同指标量纲的影响): \[ z_{ij}=\frac{x_{ij}}{\sqrt{\sum^n_{i=1}x^2_{ij}}} \]
TOPSIS
与最大值的距离: \[ D_i^+ = \sqrt{\sum^m_{j=1}(Z^+_j-z_{ij})^2} \] 与最小值的距离: \[ D_i^- = \sqrt{\sum^m_{j=1}(Z^-_j-z_{ij})^2} \] 得分: \[ S_i= \frac{D^-_i}{D^+_i+D^-_i} \]
基于层次分析法修正
权重可以不同 \[ D_i^+ = \sqrt{\sum^m_{j=1}{\color{red}{\omega_j}}(Z^+_j-z_{ij})^2} \]
\[ D_i^- = \sqrt{\sum^m_{j=1}{\color{red}{\omega_j}}(Z^-_j-z_{ij})^2} \]
基于熵权法修正
原理:指标的变异程度越少,所反映的信息量也越少,其对应的权值也应该越低。
信息熵
\[ H(X) = \sum^n_{i=1}[p(x_i)I(x_i)] = - \sum^n_{i=1}[p(x_i)ln(p(x_i))] \]
信息量越大,信息熵越小。
计算步骤:
标准化到非负区间
计算第 j 项指标下第 i 个样本所占的比重,并将其看作相对熵计算中用到的概率
经过第一步处理得到非负矩阵 \[ \tilde{Z} = \begin{pmatrix} \tilde{z_{11}}&\tilde{z_{12}}&\cdots&\tilde{z_{1m}}\\ \tilde{z_{21}}&\tilde{z_{22}}&\cdots&\tilde{z_{2m}}\\ \vdots & \vdots & \ddots & \vdots \\ \tilde{z_{n1}}&\tilde{z_{n2}}&\cdots&\tilde{z_{nm}} \end{pmatrix} \] 计算概率矩阵\(P\), 其中 \[ p_{ij} = \frac{\tilde{z_{ij}}}{\sum^n_{i=1}{\tilde{z_{ij}}}}\\ \text{其中, }\sum^n_{i=1}p_{ij}=1 \]
计算每个指标的信息熵,并计算信息效用值,并归一化得到每个指标的熵权 \[ e_j=-\frac{1}{\ln n}\sum_{i=1}^np_{ij}\ln(p_{ij})\ (j=1, 2, ..., m) \]
这方法挺扯的我只能说。