Python学习系列文章: 目录
一、概述
前面我们提到了 欧式距离,而这里提到的 标准化欧氏距离 (Standardized EuclideanDistance) 是针对 欧式距离 的一种改进。
标准化欧式距离(Standardized EuclideanDistance)主要针对变量
x
x
x 进行了修改。使其变成了标准化变量。
二、计算公式
数据各维分量的分布不一样,那就先将各个分量都“标准化”到均值、方差等。
假设样本集
X
X
X 的 均值 (mean) 为
m
m
m,标准差 (standard deviation) 为
s
s
s,那么
X
X
X 的 标准化变量 为:
X
∗
=
X
−
m
s
X^*=frac{X-m}{s}
X∗=sX−m
带入欧式距离公式得:
d
12
=
∑
k
=
1
n
(
x
1
k
−
x
2
k
s
k
)
2
d_{12}=sqrt{sum_{k=1}^n(frac{x_{1k}-x_{2k}}{s_{k}})^2}
d12=k=1∑n(skx1k−x2k)2
便得到了上面的 标准化欧式距离 公式。
暂无评论内容