余弦距离在计算相似度的应用中经常使用,比如: 文本相似度检索 人脸识别检索 相似图片检索 原理简述 下面是余弦相似度的计算公式(图来自wikipedia): 但是,余弦相似度和常用的欧式距离的有所区别. 余弦相似度的取值范围在-1到1之间.完全相同时数值为1,相反反向时为-1,正交或不相关是为0.(如下图,来源) 欧式距离一般为正值,归一化之后在0~1之间.距离越小,越相似. 欧式距离用于相似度检索更符合直觉.因此在使用时,需要将余弦相似度转化成类似欧氏距离的余弦距离. 维基页面中给出的角距离计