距离度量 —— 杰卡德距离(Jaccard Distance)-繁依Fanyi

Python学习系列文章 目录

在这里插入图片描述

一、概述

杰卡德距离(Jaccard Distance),是用来衡量两个集合差异性的一种指标,它是杰卡德相似系数的补集。

二、计算公式

① 杰卡德相似系数

杰卡德相似系数(Jaccard similarity coefficient):两个集合 A 和 B 的交集元素在 A,B 的并集中所占的比例,称为两个集合的杰卡德相似系数,用符号

J

(

A

,

B

)

J(A,B)

J(A,B) 表示,则其表达式为:

J

(

A

,

B

)

=

A

B

A

B

J(A,B)=frac{|Acap B|}{|Acup B| }

J(A,B)=ABAB

② 杰卡德距离

杰卡德距离(Jaccard Distance):与杰卡德相似系数相反,用两个集合中不同元素占所有元素的比例来衡量两个集合的区分度。杰卡德距离的表达式为:

J

δ

(

A

,

B

)

=

1

J

(

A

,

B

)

=

A

B

A

B

A

B

J_{delta}(A,B)=1-J(A,B)=frac{|Acup B|-|Acap B|}{|Acup B|}

Jδ(A,B)=1J(A,B)=ABABAB

在这里插入图片描述

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容