本博客所有文章分类的总目录:【总目录】本博客博文总目录-实时更新 

开源Math.NET基础数学类库使用总目录:【目录】开源Math.NET基础数学类库使用总目录

前言

  数据集的基本统计计算是应用数学,以及统计应用中最常用的功能。如计算数据集的均值,方差,标准差,最大值,最小值,熵等等。Math.NET中的MathNet.Numerics.Statistics命名空间就包括了大量的这些统计计算的函数。今天就为大家介绍的是使用Math.NET计算相关系数的类:Correlation。

  如果本文资源或者显示有问题,请参考 本文原文地址http://www.cnblogs.com/asxinyu/p/4301519.html

1.Math.NET计算相关系数的类

  Correlation类在Math.NET在MathNet.Numerics.Statistics的命名空间下:

Correlation,静态类,计算2个数据集的相关度,如皮尔逊积差相关系数,加权皮尔逊积差相关系数,皮尔逊积差相关矩阵等;

  相关系数的定义如下:

  相关系数,或称线性相关系数、皮氏积矩相关系数(Pearson product-moment correlation coefficient, PPCC)等,是衡量两个随机变量之间线性相关程度的指标。它由卡尔·皮尔森(Karl Pearson)在1880年代提出[1],现已广泛地应用于科学的各个领域。 相关系数计算公式中,取值范围为[-1,1],r>0表示正相关,r<0表示负相关,|r|表示了变量之间相关程度的高低。特殊地,r=1称为完全正相关,r=-1称为完全负相关,r=0称为不相关。通常|r|大于0.8时,认为两个变量有很强的线性相关性。

  Correlation类中的相关系数类型,如加权皮尔逊积差相关系数,皮尔逊积差相关矩阵的含义大家自己进行百度或者根据需要选择阅读。

2.Correlation的实现

  在介绍其使用之前,还是介绍一下Correlation类型的实现和源码。该类型是静态类,其中的静态方法都是每一个类型的相关系数的计算,因此在使用的时候,根据需要进行调用即可。其包含的内容如下,为了方便大家观看,已经将其中的注释翻译为英文了,也相对于说明吧。

/// <summary>2个数据集的相关度计算类</summary>
public static class Correlation
{
/// <summary>计算皮尔逊积差相关系数</summary>
/// <param name="dataA">数据样本A.</param>
/// <param name="dataB">数据样本B.</param>
/// <returns>返回皮尔逊积差相关系数.</returns>
public static double Pearson(IEnumerable<double> dataA, IEnumerable<double> dataB)
{
int n = 0;
double r = 0.0; double meanA = 0;
double meanB = 0;
double varA = 0;
double varB = 0; using (IEnumerator<double> ieA = dataA.GetEnumerator())
using (IEnumerator<double> ieB = dataB.GetEnumerator())
{
while (ieA.MoveNext())
{
if (!ieB.MoveNext())
{
throw new ArgumentOutOfRangeException("dataB", Resources.ArgumentArraysSameLength);
} double currentA = ieA.Current;
double currentB = ieB.Current; double deltaA = currentA - meanA;
double scaleDeltaA = deltaA/++n; double deltaB = currentB - meanB;
double scaleDeltaB = deltaB/n; meanA += scaleDeltaA;
meanB += scaleDeltaB; varA += scaleDeltaA*deltaA*(n - 1);
varB += scaleDeltaB*deltaB*(n - 1);
r += (deltaA*deltaB*(n - 1))/n;
} if (ieB.MoveNext())
{
throw new ArgumentOutOfRangeException("dataA", Resources.ArgumentArraysSameLength);
}
} return r/Math.Sqrt(varA*varB);
} /// <summary>计算加权皮尔逊积差相关系数.</summary>
/// <param name="dataA">数据样本A.</param>
/// <param name="dataB">数据样本B.</param>
/// <param name="weights">数据权重.</param>
/// <returns>加权皮尔逊积差相关系数.</returns>
public static double WeightedPearson(IEnumerable<double> dataA, IEnumerable<double> dataB, IEnumerable<double> weights)
{
int n = 0; double meanA = 0;
double meanB = 0;
double varA = 0;
double varB = 0;
double sumWeight = 0; double covariance = 0; using (IEnumerator<double> ieA = dataA.GetEnumerator())
using (IEnumerator<double> ieB = dataB.GetEnumerator())
using (IEnumerator<double> ieW = weights.GetEnumerator())
{
while (ieA.MoveNext())
{
if (!ieB.MoveNext())
{
throw new ArgumentOutOfRangeException("dataB", Resources.ArgumentArraysSameLength);
}
if (!ieW.MoveNext())
{
throw new ArgumentOutOfRangeException("weights", Resources.ArgumentArraysSameLength);
}
++n; double xi = ieA.Current;
double yi = ieB.Current;
double wi = ieW.Current; double temp = sumWeight + wi; double deltaX = xi - meanA;
double rX = deltaX*wi/temp;
meanA += rX;
varA += sumWeight*deltaX*rX; double deltaY = yi - meanB;
double rY = deltaY*wi/temp;
meanB += rY;
varB += sumWeight*deltaY*rY; sumWeight = temp; covariance += deltaX*deltaY*(n - 1)*wi/n;
}
if (ieB.MoveNext())
{
throw new ArgumentOutOfRangeException("dataB", Resources.ArgumentArraysSameLength);
}
if (ieW.MoveNext())
{
throw new ArgumentOutOfRangeException("weights", Resources.ArgumentArraysSameLength);
}
}
return covariance/Math.Sqrt(varA*varB);
} /// <summary>计算皮尔逊积差相关矩阵</summary>
/// <param name="vectors">数据矩阵</param>
/// <returns>皮尔逊积差相关矩阵.</returns>
public static Matrix<double> PearsonMatrix(params double[][] vectors)
{
var m = Matrix<double>.Build.DenseIdentity(vectors.Length);
for (int i = 0; i < vectors.Length; i++)
{
for (int j = i + 1; j < vectors.Length; j++)
{
var c = Pearson(vectors[i], vectors[j]);
m.At(i, j, c);
m.At(j, i, c);
}
} return m;
} /// <summary> 计算皮尔逊积差相关矩阵</summary>
/// <param name="vectors">数据集合.</param>
/// <returns>皮尔逊积差相关矩阵.</returns>
public static Matrix<double> PearsonMatrix(IEnumerable<double[]> vectors)
{
return PearsonMatrix(vectors as double[][] ?? vectors.ToArray());
} /// <summary>
/// 斯皮尔曼等级相关系数
/// </summary>
/// <param name="dataA">数据集A.</param>
/// <param name="dataB">数据集B.</param>
/// <returns>斯皮尔曼等级相关系数.</returns>
public static double Spearman(IEnumerable<double> dataA, IEnumerable<double> dataB)
{
return Pearson(Rank(dataA), Rank(dataB));
} /// <summary>
/// 斯皮尔曼等级相关矩阵
/// Computes the Spearman Ranked Correlation matrix.
/// </summary>
/// <param name="vectors">数据集.</param>
/// <returns>斯皮尔曼等级相关矩阵.</returns>
public static Matrix<double> SpearmanMatrix(params double[][] vectors)
{
return PearsonMatrix(vectors.Select(Rank).ToArray());
} /// <summary>计算斯皮尔曼等级相关矩阵</summary>
/// <param name="vectors">数据集合.</param>
/// <returns>斯皮尔曼等级相关矩阵.</returns>
public static Matrix<double> SpearmanMatrix(IEnumerable<double[]> vectors)
{
return PearsonMatrix(vectors.Select(Rank).ToArray());
} static double[] Rank(IEnumerable<double> series)
{
if (series == null)
{
return new double[0];
} // WARNING: do not try to cast series to an array and use it directly,
// as we need to sort it (inplace operation) var data = series.ToArray();
return ArrayStatistics.RanksInplace(data, RankDefinition.Average);
}
}

3.使用案例

  使用非常简单,看下面代码,随便生成的一个数据,没有啥意思,实际中,大家按需进行吧。  

 1 //先生成数据集合data
2 var chiSquare = new ChiSquared(5);
3 Console.WriteLine(@"2. Generate 1000 samples of the ChiSquare(5) distribution");
4 var data = new double[1000];
5 for (var i = 0; i < data.Length; i++)
6 {
7 data[i] = chiSquare.Sample();
8 }
9
10 //生成数据集合dataB
11 var chiSquareB = new ChiSquared(2);
12 var dataB = new double[1000];
13 for (var i = 0; i < data.Length; i++)
14 {
15 dataB[i] = chiSquareB.Sample();
16 }
17
18 // 5. 计算data和dataB的相关系数
19 var r1 = Correlation.Pearson(data, dataB);
20 var r2 = Correlation.Spearman(data, dataB);

4.资源

  源码下载:http://www.cnblogs.com/asxinyu/p/4264638.html

  如果本文资源或者显示有问题,请参考 本文原文地址http://www.cnblogs.com/asxinyu/p/4301519.html

开源Math.NET基础数学类库使用(11)C#计算相关系数的更多相关文章

  1. 【原创】开源Math.NET基础数学类库使用(11)C#计算相关系数

                   本博客所有文章分类的总目录:[总目录]本博客博文总目录-实时更新  开源Math.NET基础数学类库使用总目录:[目录]开源Math.NET基础数学类库使用总目录 前言 ...

  2. 开源Math.NET基础数学类库使用(17)C#计算矩阵条件数

    原文:[原创]开源Math.NET基础数学类库使用(17)C#计算矩阵条件数                本博客所有文章分类的总目录:http://www.cnblogs.com/asxinyu/p ...

  3. 开源Math.NET基础数学类库使用(16)C#计算矩阵秩

    原文:[原创]开源Math.NET基础数学类库使用(16)C#计算矩阵秩                本博客所有文章分类的总目录:http://www.cnblogs.com/asxinyu/p/4 ...

  4. 开源Math.NET基础数学类库使用(15)C#计算矩阵行列式

    原文:[原创]开源Math.NET基础数学类库使用(15)C#计算矩阵行列式                本博客所有文章分类的总目录:http://www.cnblogs.com/asxinyu/p ...

  5. 【原创】开源Math.NET基础数学类库使用(16)C#计算矩阵秩

                   本博客所有文章分类的总目录:[总目录]本博客博文总目录-实时更新  开源Math.NET基础数学类库使用总目录:[目录]开源Math.NET基础数学类库使用总目录 上个月 ...

  6. 【原创】开源Math.NET基础数学类库使用(17)C#计算矩阵条件数

                   本博客所有文章分类的总目录:[总目录]本博客博文总目录-实时更新  开源Math.NET基础数学类库使用总目录:[目录]开源Math.NET基础数学类库使用总目录 上个月 ...

  7. 【原创】开源Math.NET基础数学类库使用(15)C#计算矩阵行列式

                   本博客所有文章分类的总目录:[总目录]本博客博文总目录-实时更新  开源Math.NET基础数学类库使用总目录:[目录]开源Math.NET基础数学类库使用总目录 上个月 ...

  8. 【目录】开源Math.NET基础数学类库使用总目录

    本博客所有文章分类的总目录链接:[总目录]本博客博文总目录-实时更新  1.开源Math.NET数学组件文章   1.开源Math.NET基础数学类库使用(01)综合介绍   2.开源Math.NET ...

  9. 【原创】开源Math.NET基础数学类库使用(07)常用的数学物理常数

                   本博客所有文章分类的总目录:[总目录]本博客博文总目录-实时更新  开源Math.NET基础数学类库使用总目录:[目录]开源Math.NET基础数学类库使用总目录 1.前 ...

随机推荐

  1. iOS App 唤醒另一个App

    网上也有讲这块的,感觉讲得都不是很好.而且有一些细节根本没有讲清楚.这里重写整理一下相关知识点. 主要内容 URL Scheme 是什么? 项目中关键的配置 注意事项 URL Scheme 是什么? ...

  2. JLINK V8 升级5.12E 在MDK5.20不变砖

    转载:只是用了新的固件,步骤跟原子提供的方法 是一模一样的.这边也把步骤写了上来. 使用 SAM-PROG 更新 JLINK 固件一 :安装软件 安装 Install AT91-ISP v1.13.e ...

  3. Centos环境下部署游戏服务器-Eclipse

    一直在想这篇文章该不该写,因为这篇文章更像是教你如何使用一个ide这种文章,毫无价值可言.但思来想去还是应给写.上篇文章主要说了编译原理和过程,这篇文章就是理论联系实际的典范.并且很多工程师一辈子都不 ...

  4. [转]应聘Java,jsp,j2ee软件工程师笔试中可能出现的问题

    相信大家应聘的时候第一关就是笔试,即使是一位很有经验的工程师也不一定能够顺利通过,笔试不好,可能就无法进行面试,即使能够进行面试,考官对你的印象也不会很好,问的问题也会很多,估计很难吃的消,当然如果你 ...

  5. 276. Paint Fence

    题目: There is a fence with n posts, each post can be painted with one of the k colors. You have to pa ...

  6. CentOS启动和停止服务详解

    服务简介Linux 系统服务是在Linux启 动时自动加载,并在Linux退出时自动停止的系统任务.在Linux 启动过程中,我们可以看得很多“starting … ”提示信息,该信息表示正在启动系统 ...

  7. CentOS单用户模式下修改ROOT密码和grub加密

    Linux 系统处于正常状态时,服务器主机开机(或重新启动)后,能够由系统引导器程序自动引导 Linux 系统启动到多用户模式,并提供正常的网络服务.如果系统管理员需要进行系统维护或系统出现启动异常时 ...

  8. Java:字符串缓冲区StringBuffer和StringBuilder的使用

    StringBuffer特点: 1.是字符缓冲区,一个容器(不论缓冲区内容怎么变化,StringBuffer这个容器对象都不会改变) 2.是可变长度的 3.可以直接操作多个数据类型 4.最终会通过to ...

  9. oracle层次查询的陷阱

    今天开发组同事找到我,说一个简单的层次查询非常慢,业务就是有一个存设备表连接关系的表,从node1连入,从node2连出,现在要找出node2的连出顺序,sql类似于: SELECT LEVEL ID ...

  10. Linux-0.00运行环境搭建【转】

    转自:http://blog.csdn.net/rosetta/article/details/8933240 这里的Linux-0.00由Linus Torvalds写的Linux最初版本,只是打印 ...