[Java] 数据分析--统计

二项分布

需求：5个四面体筛子，筛子三面绿色，一面红色，模拟1000000次，统计每次试验红色落地筛子个数的分布
实现：用循环实现5个筛子和1000000次试验，定义函数numRedDown模拟5个筛子试验结果，redDown模拟单次试验结果

Simulation.java

 1 import java.util.Random;

 2

 3 public class Simulation{

 4     static final Random RANDOM = new Random();

 5     static final int n = 5;

 6     static final int N = 1000000;

 7

 8     public static void main(String[] args){

 9         double[] dist = new double[n+1];

10         for(int i = 0; i < N ; i++){

11             int x = numRedDown(n);

12             ++dist[x];

13         }

14         for(int i = 0; i <=n;i++){

15             System.out.printf("%4d%8.4f%n",i,dist[i]/N);

16         }

17     }

18

19     static boolean redDown(){

20         int m = RANDOM.nextInt(4);

21         return (m==0);

22     }

23

24     static int numRedDown(int n){

25         int numRed = 0;

26         for(int i = 0; i < n; i++){

27             if(redDown()){

28                 ++numRed;

29             }

30         }

31         return numRed;

32     }

33 }

BinomialDistrabutionTester.java

 1 import org.apache.commons.math3.distribution.BinomialDistribution;

 2

 3 public class BinomialDistributionTester {

 4     static final int n = 5;

 5     static final double p = 0.25;

 6

 7     public static void main(String[] args) {

 8         BinomialDistribution bd = new BinomialDistribution(n, p);

 9         for (int x = 0; x <= n; x++) {

10             System.out.printf("%4d%8.4f%n", x, bd.probability(x));

11         }

12         System.out.printf("mean = %6.4f%n", bd.getNumericalMean());

13         double variance = bd.getNumericalVariance();

14         double stdv = Math.sqrt(variance);

15         System.out.printf("standard deviation = %6.4f%n", stdv);

16     }

17 }

0 0.2381
1 0.3954
2 0.2629
3 0.0880
4 0.0145
5 0.0010

协方差

需求：生成1000个随机数对(x,y)，并计算x和y的相关系数
实现：Apache Commons Math library 中相应方法

 1 import java.util.Random;

 2 import org.apache.commons.math3.stat.correlation.Covariance;

 3 import org.apache.commons.math3.stat.descriptive.moment.Variance;

 4

 5 public class CorrelationExample {

 6     static final Random RANDOM = new Random();

 7     static double[][] data1 = random(1000);

 8     static double[][] data2 = {{1, 2, 3, 4, 5}, {1, 3, 5, 7, 9}};

 9     static double[][] data3 = {{1, 2, 3, 4, 5}, {9, 8, 7, 6, 5}};

10

11     public static void main(String[] args) {

12         System.out.printf("rho1 = %6.3f%n", rho(data1));

13         System.out.printf("rho2 = %6.3f%n", rho(data2));

14         System.out.printf("rho3 = %6.3f%n", rho(data3));

15     }

16

17     static double[][] random(int n) {

18         double[][] a = new double[2][n];

19         for (int i = 0; i < n; i++) {

20             a[0][i] = RANDOM.nextDouble();

21             a[1][i] = RANDOM.nextDouble();

22         }

23         return a;

24     }

25

26     static double rho(double[][] data) {

27         Variance v = new Variance();

28         double varX = v.evaluate(data[0]);

29         double sigX = Math.sqrt(varX);

30         double varY = v.evaluate(data[1]);

31         double sigY = Math.sqrt(varY);

32         Covariance c = new Covariance(data);

33         double sigXY = c.covariance(data[0], data[1]);

34         return sigXY/(sigX*sigY);

35     }

36 }

rho1 = -0.036
rho2 = 1.000
rho3 = -1.000

正态分布

需求：模拟均值16，标准差2.82的正态分布
实现：Apache Commons Math library 的 NomorDistribution类

 1 import org.apache.commons.math3.distribution.NormalDistribution;

 2

 3 public class NormalDistributionTester {

 4     static int n = 32;

 5     static double p = 0.5;

 6     static double mu = n*p;

 7     static double sigma = Math.sqrt(n*p*(1-p));

 8

 9     public static void main(String[] args) {

10         NormalDistribution nd = new NormalDistribution(mu, sigma);

11

12         double a = 17.5, b = 21.5;

13         double Fa = nd.cumulativeProbability(a);

14         System.out.printf("F(a) = %6.4f%n", Fa);

15         double Fb = nd.cumulativeProbability(b);

16         System.out.printf("F(b) = %6.4f%n", Fb);

17         System.out.printf("F(b) - F(a) = %6.4f%n", Fb - Fa);

18     }

19 }

F(a) = 0.7021
F(b) = 0.9741
F(b) - F(a) = 0.2720

[Java] 数据分析--统计的更多相关文章

编写Java脚本统计工程代码总行数
在新公司工作将近一年了,一直独自一人负责服务端集群的运维和代码的编写.不知不觉从一个Project发展到了七八个Project. 看着越来越多的代码,今天突然想统计一下一共写了多少代码.[这里只统计完 ...
基于Hadoop的地震数据分析统计
源码下载地址:http://download.csdn.net/detail/huhui_bj/5645641 opencsv下载地址:http://download.csdn.net/detail/ ...
通过java api统计hive库下的所有表的文件个数、文件大小
更新hadoop fs 命令实现: [ss@db csv]$ hadoop fs -count /my_rc/my_hive_db/* 18/01/14 15:40:19 INFO hdfs.Peer ...
Java 中统计文件中出现单词的次数练习
统计英文article.txt文件中出现hello这个单词的次数这个是article.txt文件内容 { hello The Royal Navy is trying hello to play h ...
Java中统计字符串中各个字符出现的次数
import java.util.Iterator; import java.util.Set; import java.util.TreeMap; public class TreeMapDemo ...
Java实验--统计字母出现频率及其单词个数
本周的实验要求在之前实现统计单词的基础之上(可以见之前博客的统计单词的那个实验),对其进行修改成所需要的格式,统计字母出现频率的功能,并按照一定的格式把最终结果的用特定的格式在文本中显示出来统计过程 ...
JAVA实验--统计文章中单词的个数并排序
分析: 1)要统计单词的个数,就自己的对文章中单词出现的判断的理解来说是:当出现一个非字母的字符的时候,对前面的一部分字符串归结为单词 2)对于最后要判断字母出现的个数这个问题,我认为应该是要用到ma ...
Java报表统计导出Word-xdocin方式
官网:http://www.xdocin.com Controller层: //创建对象 XDocService xdocService = new XDocService(); //封装参数 Map ...
Java查找统计文中字母，单词
package io; import java.io.BufferedReader; import java.io.File; import java.io.FileOutputStream; imp ...

随机推荐

idea报错Selected Java version 11 is not supported by SDK (maximum 8)
解决方案
[.net] 关于Exception的几点思考和在项目中的使用（三）
本文链接: https://www.cnblogs.com/hubaijia/p/about-exceptions-3.html 系列文章: 关于Exception的几点思考和在项目中的使用(一) 关 ...
kubernetes 降本增效标准指南| 资源利用率提升工具大全
背景公有云的发展为业务的稳定性.可拓展性.便利性带来了极大帮助.这种用租代替买.并且提供完善的技术支持和保障的服务,理应为业务带来降本增效的效果.但实际上业务上云并不意味着成本一定较少,还需适配云上 ...
C# List常用方法及Dictionary常用方法汇总
本文主要汇总了在开发过程中,使用List和Dictionary常用的方法,例如增.删.改.查.排序等等各种常用操作. 在平时的开发过程中,List和Dictionary是我们经常使用到的数据结构,而且 ...
UnitThreeSummary
目录一.JML的梳理与总结二.SMT Solver的部署与验证三.JMLUnitNG的部署与测试四.作业的设计与总结第一次作业第二次作业第三次作业五.BUG 六.总结与反思一.JML ...
浅谈在c#中使用Zlib压缩与解压的方法
作者:Compasslg 介绍近期用c#开发一个游戏的存档编辑工具需要用 Zlib 标准的 Deflate 算法对数据进行解压. 在 StackOverflow 上逛了一圈,发现 c# 比较常用到的 ...
hdu5062 简单题
题意: 求区间逆序数的个数,逆序数增加了个要求就是必须要是先升序在降序例如12321或者123321这样的. 思路: 水题直接写就行了,数据范围不大,估计直接求也不会超时,我 ...
hdu 3265 线段树扫描线（拆分矩形）
题意: 给你n个矩形,每个矩形上都有一个矩形的空洞,所有的矩形都是平行于x,y轴的,最后问所有矩形的覆盖面积是多少. 思路: 是典型的矩形覆盖问题,只不过每个矩形上多了一个矩 ...
poj2175费用流消圈算法
题意: 有n个建筑,每个建筑有ai个人,有m个避难所,每个避难所的容量是bi,ai到bi的费用是|x1-x2|+|y1-y2|+1,然后给你一个n*m的矩阵,表示当前方案,问当前避难方案是否 ...
Python学习笔记-StatsModels 统计回归（3）模型数据的准备
1.读取数据文件回归分析问题所用的数据都是保存在数据文件中的,首先就要从数据文件读取数据. 数据文件的格式很多,最常用的是 .csv,.xls 和 .txt 文件,以及 sql 数据库文件的读取 . ...

[Java] 数据分析--统计

[Java] 数据分析--统计的更多相关文章

随机推荐

热门专题