皮尔逊相关系数的java实现
相关系数的值介于–1与+1之间,即–1≤r≤+1。其性质如下:
当r>0时,表示两变量正相关,r<0时,两变量为负相关。
当|r|=1时,表示两变量为完全线性相关,即为函数关系。
当r=0时,表示两变量间无线性相关关系。
当0<|r|<1时,表示两变量存在一定程度的线性相关。
且|r|越接近1,两变量间线性关系越密切;
|r|越接近于0,表示两变量的线性相关越弱。
一般可按三级划分:|r|<0.4为低度线性相关;
0.4≤|r|<0.7为显著性相关;0.7≤|r|<1为高度线性相关。
1. [代码][Java]代码
package com.Social.cbra.praron2;
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;
import java.util.logging.Logger;
/**
*
* @author larry
*
*/
public class Similarity {
static Logger logger = Logger.getLogger(Similarity.class.getName());
Map<String, Double> rating_map = new HashMap<String, Double>();
/**
* @param args
*/
public static void main(String[] args) {
Similarity similarity1 = new Similarity();
similarity1.rating_map.put("1", 434d);
similarity1.rating_map.put("2", 7d);
similarity1.rating_map.put("3", 23d);
Similarity similarity2 = new Similarity();
similarity2.rating_map.put("1", 6d);
similarity2.rating_map.put("2", 2d);
similarity2.rating_map.put("3", 6d);
logger.info("" + similarity1.getsimilarity_bydim(similarity2));
}
public double getsimilarity_bydim(Similarity u) {
double sim = 0d;
double common_items_len = 0;
double this_sum = 0d;
double u_sum = 0d;
double this_sum_sq = 0d;
double u_sum_sq = 0d;
double p_sum = 0d;
Iterator<String> rating_map_iterator = this.rating_map.keySet().iterator();
while(rating_map_iterator.hasNext()){http://www.huiyi8.com/flashjc/
String rating_map_iterator_key = rating_map_iterator.next();
Iterator<String> u_rating_map_iterator = u.rating_map.keySet().iterator();
while(u_rating_map_iterator.hasNext()){flash教程
String u_rating_map_iterator_key = u_rating_map_iterator.next();
if(rating_map_iterator_key.equals(u_rating_map_iterator_key)){
double this_grade = this.rating_map.get(rating_map_iterator_key);
double u_grade = u.rating_map.get(u_rating_map_iterator_key);
//评分求和
//平方和
//乘积和
this_sum += this_grade;
u_sum += u_grade;
this_sum_sq += Math.pow(this_grade, 2);
u_sum_sq += Math.pow(u_grade, 2);
p_sum += this_grade * u_grade;
common_items_len++;
}
}
}
//如果等于零则无相同条目,返回sim=0即可
if(common_items_len > 0){
logger.info("common_items_len:"+common_items_len);
logger.info("p_sum:"+p_sum);
logger.info("this_sum:"+this_sum);
logger.info("u_sum:"+u_sum);
double num = common_items_len * p_sum - this_sum * u_sum;
double den = Math.sqrt((common_items_len * this_sum_sq - Math.pow(this_sum, 2)) * (common_items_len * u_sum_sq - Math.pow(u_sum, 2)));
logger.info("" + num + ":" + den);
sim = (den == 0) ? 1 : num / den;
}
//如果等于零则无相同条目,返回sim=0即可
return sim;
}
}
皮尔逊相关系数的java实现的更多相关文章
- 皮尔逊相关系数与余弦相似度(Pearson Correlation Coefficient & Cosine Similarity)
之前<皮尔逊相关系数(Pearson Correlation Coefficient, Pearson's r)>一文介绍了皮尔逊相关系数.那么,皮尔逊相关系数(Pearson Corre ...
- 皮尔逊相关系数(Pearson Correlation Coefficient, Pearson's r)
Pearson's r,称为皮尔逊相关系数(Pearson correlation coefficient),用来反映两个随机变量之间的线性相关程度. 用于总体(population)时记作ρ (rh ...
- 【Python学习笔记】使用Python计算皮尔逊相关系数
源代码不记得是哪里获取的了,侵删.此处博客仅作为自己笔记学习. def multipl(a,b): sumofab=0.0 for i in range(len(a)): temp=a[i]*b[i] ...
- 皮尔逊相关系数的计算(python代码版)
from math import sqrt def multipl(a,b): sumofab=0.0 for i in range(len(a)): temp=a[i]*b[i] sumofab+= ...
- 协同过滤算法中皮尔逊相关系数的计算 C++
template <class T1, class T2>double Pearson(std::vector<T1> &inst1, std::vector<T ...
- Python 余弦相似度与皮尔逊相关系数 计算
夹角余弦(Cosine) 也可以叫余弦相似度. 几何中夹角余弦可用来衡量两个向量方向的差异,机器学习中借用这一概念来衡量样本向量之间的差异. (1)在二维空间中向量A(x1,y1)与向量B(x2,y2 ...
- Spark/Scala实现推荐系统中的相似度算法(欧几里得距离、皮尔逊相关系数、余弦相似度:附实现代码)
在推荐系统中,协同过滤算法是应用较多的,具体又主要划分为基于用户和基于物品的协同过滤算法,核心点就是基于"一个人"或"一件物品",根据这个人或物品所具有的属性, ...
- Pearson product-moment correlation coefficient in java(java的简单相关系数算法)
一.什么是Pearson product-moment correlation coefficient(简单相关系数)? 相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变 ...
- 从欧几里得距离、向量、皮尔逊系数到http://guessthecorrelation.com/
一.欧几里得距离就是向量的距离公式 二.皮尔逊相关系数反应的就是线性相关 游戏http://guessthecorrelation.com/ 的秘诀也就是判断一组点的拟合线的斜率y/x ------- ...
随机推荐
- 【Codeforces Round #504 (Div. 1 + Div. 2) 】
A:https://www.cnblogs.com/myx12345/p/9843678.html B:https://www.cnblogs.com/myx12345/p/9843709.html ...
- 从dataset表中获取某一列的所有值方法
原文发布时间为:2008-07-31 -- 来源于本人的百度文章 [由搬家工具导入] 可以datarow遍历所有行即可,如下:pubauthor这个表中的au_lname的所有值加到listbox上面 ...
- Python入门--番外--中文目录乱码问题
写Python的程序,读取含有中文目录下的文件,结果发现根本读取不了该中文目录下的文件, 原因:通过调试发现:该文件的目录乱码,目录无法解析,自然导致无法读取文件内容 解决方法: strPath = ...
- js采用concat和sort将N个数组拼接起来的方法
<script type="text/javascript" > function concatAndSortArray(array1, array2) { if (a ...
- Java ListIterator 与 Iterator 异同
一.概述 基于 fail-fast 机制,我们知道对于ArrayList等集合在迭代过程中是不可进行结构修改操作的,唯一能使用的结构修改操作只有Iterator接口中的remove()方法. 而jav ...
- 深入GCD(五):资源竞争
概述我将分四步来带大家研究研究程序的并发计算.第一步是基本的串行程序,然后使用GCD把它并行计算化.如果你想顺着步骤来尝试这些程序的话,可以下载源码.注意,别运行imagegcd2.m,这是个反面教材 ...
- win7配置java环境变量
http://jingyan.baidu.com/article/9f63fb91d87fb0c8400f0e93.html 安装JDK,从Oracel官方网站上下载,也可以通过搜索,进入链接.下载完 ...
- Angularjs: call other scope which in iframe
Angularjs: call other scope which in iframe -------------------------------------------------------- ...
- Android开发系列(二十一):Spinner的功能和使用方法以及实现列表选择框
Spinner是一个列表选择框.相当于弹出一个菜单供用户进行选择. Spinner继承AdapterView Spinnet支持的XML的属性: android:entries:使用数组资源设置该下拉 ...
- grunt 试用笔记
Gruntjs是JavaScript项目的构建工具,也是基于node的一个命令行工具.很多开源JS项目都是使用它搭建.如jQuery.Qunit.CanJS等.它有以下作用 合并JS文件压缩JS文件单 ...