[Java]数据分析--数据可视化
时间序列
- 需求:将一组字符顺序添加到时间序列中
- 实现:定义时间序列类TimeSeries,包含静态类Entry表示序列类中的各项,以及add,get,iterator,entry方法
TimeSeries.java

1 import java.util.ArrayList;
2 import java.util.Iterator;
3 import java.util.Map;
4 import java.util.TreeMap;
5 import java.util.concurrent.TimeUnit;
6
7 public class TimeSeries<T> implements Iterable<TimeSeries.Entry> {
8 private final Map<Long,T> map = new TreeMap();
9
10 public void add(long time, T event) {
11 map.put(time, event);
12 try {
13 TimeUnit.MICROSECONDS.sleep(1); // 0.000001 sec delay
14 } catch(InterruptedException e) {
15 System.err.println(e);
16 }
17 }
18
19 public T get(long time) {
20 return map.get(time);
21 }
22
23 ArrayList getList() {
24 ArrayList<Entry> list = new ArrayList();
25 for (Entry entry : this) {
26 list.add(entry);
27 }
28 return list;
29 }
30
31 public int size() {
32 return map.size();
33 }
34
35 @Override
36 public Iterator iterator() {
37 return new Iterator() { // anonymous inner class
38 private final Iterator it = map.keySet().iterator();
39
40 @Override
41 public boolean hasNext() {
42 return it.hasNext();
43 }
44
45 @Override
46 public Entry<T> next() {
47 long time = (Long)it.next();
48 T event = map.get(time);
49 return new Entry(time, event);
50 }
51 };
52 }
53
54 public static class Entry<T> {
55 private final Long time;
56 private final T event;
57
58 public Entry(long time, T event) {
59 this.time = time;
60 this.event = event;
61 }
62
63 public long getTime() {
64 return time;
65 }
66
67 public T getEvent() {
68 return event;
69 }
70
71 @Override
72 public String toString() {
73 return String.format("(%d, %s)", time, event);
74 }
75 }
76 }
TimeSeriesTester.java

1 import java.util.ArrayList;
2
3 public class TimeSeriesTester {
4 final static String[] EVENTS = {"It", "was", "the", "best", "of", "times"};
5
6 public static void main(String[] args) {
7 TimeSeries<String> series = new TimeSeries();
8 load(series);
9
10 for (TimeSeries.Entry<String> entry : series) {
11 long time = entry.getTime();
12 String event = entry.getEvent();
13 System.out.printf("%16d: %s%n", time, event);
14 }
15
16 ArrayList list = series.getList();
17 System.out.printf("list.get(3) = %s%n", list.get(3));
18 }
19
20 static void load(TimeSeries<String> series) {
21 for (String event : EVENTS) {
22 series.add(System.currentTimeMillis(), event);
23 }
24 }
25 }

移动平均
- 需求:实现一个序列,其值是原始序列连续片段的平均值
- 实现:定义移动平均类MovingAverage,继承TimeSeries,同时实现根据原始序列和片段长度生成新序列的构造方法,tmp每次计算保存一个片段,sum计算片段元素之和,最后把平均值添加到序列中
- 注意
- 如原始序列有8个元素,片段长度为3,则新序列长度为 8-8%3=6
- 对于a=b=c,先执行b=c,再执行a=b
- tmp不是每次全部更新,替换一个元素即可,求和后i自增
MovingAverage.java

1 import java.util.Iterator;
2
3 public class MovingAverage extends TimeSeries<Double> {
4 private final TimeSeries parent;
5 private final int length;
6
7 public MovingAverage(TimeSeries parent, int length) {
8 this.parent = parent;
9 this.length = length;
10 if (length > parent.size()) {
11 throw new IllegalArgumentException("That's too long.");
12 }
13
14 double[] tmp = new double[length]; // temp array to compute averages
15 double sum = 0;
16 int i=0;
17 Iterator it = parent.iterator();
18 for (int j = 0; j < length; j++) {
19 sum += tmp[i++] = nextValue(it);
20 }
21 this.add(System.currentTimeMillis(), sum/length);
22
23 while (it.hasNext()) {
24 sum -= tmp[i%length];
25 sum += tmp[i++%length] = nextValue(it);
26 this.add(System.currentTimeMillis(), sum/length);
27 }
28 }
29
30 /* Returns the double value in the Entry currently located by it.
31 */
32 private static double nextValue(Iterator it) {
33 TimeSeries.Entry<Double> entry = (TimeSeries.Entry)it.next();
34 return entry.getEvent();
35 }
36 }
MovingAverageTester.java

1 public class MovingAverageTester {
2 static final double[] DATA = {20, 25, 21, 26, 28, 27, 29, 31};
3
4 public static void main(String[] args) {
5 TimeSeries<Double> series = new TimeSeries();
6 for (double x : DATA) {
7 series.add(System.currentTimeMillis(), x);
8 }
9 System.out.println(series.getList());
10
11 TimeSeries<Double> ma3 = new MovingAverage(series, 3);
12 System.out.println(ma3.getList());
13
14 TimeSeries<Double> ma5 = new MovingAverage(series, 5);
15 System.out.println(ma5.getList());
16 }
17 }

指数分布
- 需求:模拟输出客服接电话的时间,两次电话之间的时间为指数分布,已知平均8小时接到120个电话
- 实现:平均等待时间为4分钟,密度参数为0.25,生成随机数后代入指数分布公式,即得到时间

1 import java.util.Random;
2
3 public class ArrivalTimesTester {
4 static final Random random = new Random();
5 static final double LAMBDA = 0.25;
6
7 static double time() {
8 double p = random.nextDouble();
9 return -Math.log(1 - p)/LAMBDA;
10 }
11
12 public static void main(String[] args) {
13 double sum=0;
14 for (int i = 0; i < 8; i++) {
15 System.out.println(time());
16 sum += time();
17 }
18 System.out.println("\n");
19 System.out.println(sum/8);
20 }
21 }

[Java]数据分析--数据可视化的更多相关文章
- 数据分析 | 数据可视化图表,BI工具构建逻辑
本文源码:GitHub·点这里 || GitEE·点这里 一.数据可视化 1.基础概念 数据可视化,是关于数据视觉表现形式的科学技术研究.其中,这种数据的视觉表现形式被定义为,一种以某种概要形式抽取出 ...
- [Java] 数据分析--数据预处理
数据结构 键-值对:HashMap 1 import java.io.File; 2 import java.io.FileNotFoundException; 3 import java.util. ...
- 超级好用的 Java 数据可视化库:Tablesaw
本文适合刚学习完 Java 语言基础的人群,跟着本文可了解和使用 Tablesaw 项目.示例均在 Windows 操作系统下演示 本文作者:HelloGitHub-秦人 HelloGitHub 推出 ...
- 数据可视化工具zeppelin安装
介绍 zeppelin主要有以下功能 数据提取 数据发现 数据分析 数据可视化 目前版本(0.5-0.6)之前支持的数据搜索引擎有如下 安装 环境 centOS 6.6 编译准备工作 sudo yum ...
- 【PyQt5-Qt Designer】PyQt5+pyecharts 实现GUI界面的数据可视化展示
先用纯Python代码写一个简单的小案例: from PyQt5.QtCore import QUrl from PyQt5.QtWidgets import QApplication,QWidget ...
- 推荐几款顶级的数据可视化及大数据分析BI工具
如今,有大量强大的可视化工具可用于表达想法.可视化数据.向客户和全球社区分享重要的分析结果.现在大大小小的企业都可以利用商业智能工具来理解复杂的大数据. 这些解决方案可以收集,分析这些数据并将其转换为 ...
- 2017 年 机器学习之数据挖据、数据分析,可视化,ML,DL,NLP等知识记录和总结
今天是2017年12月30日,2017年的年尾,2018年马上就要到了,回顾2017过的确实很快,不知不觉就到年末了,再次开篇对2016.2017年的学习数据挖掘,机器学习方面的知识做一个总结,对自己 ...
- 动态可视化 数据可视化之魅D3,Processing,pandas数据分析,科学计算包Numpy,可视化包Matplotlib,Matlab语言可视化的工作,Matlab没有指针和引用是个大问题
动态可视化 数据可视化之魅D3,Processing,pandas数据分析,科学计算包Numpy,可视化包Matplotlib,Matlab语言可视化的工作,Matlab没有指针和引用是个大问题 D3 ...
- (数据科学学习手札78)基于geopandas的空间数据分析——基础可视化
本文对应代码和数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 通过前面的文章,我们已经对geopanda ...
随机推荐
- 解决跨域问题chrome浏览器插件
https://www.crx4chrome.com/crx/53489/ 解决chrome浏览器跨域的问题
- BUAAOO第一单元代码分析
1.HomeWork1 思路 一个主类用于字符串得操作, 一个Poly类用于对一个多项式进行抽象,用Arraylist来对term进行封装.内部含有求导方法,添加并合并同类项的方法,toString方 ...
- 记一次metasploitable2内网渗透之samba服务的攻击
80端口中对应一些web靶场,在这里不记录 111端口的利用是向rpcbind服务的UDP套接字发送60字节载荷,便可填充目标内存,搞崩主机系统.在这里也不记录 Samba服务简介 Samba是在Li ...
- Netcore webapi action swagger response返回参数使用匿名类型
问题:action中返回匿名对象时,swagger只能按强类型生成返回值描述 解决办法:使用roslyn在内存中动态执行代码,使用json.net反序列化匿名对象,向swagger返回动态匿名对象 效 ...
- JVM经典垃圾收集器
这个关系不是一成不变的,由于维护和兼容性测试的成本,在JDK 8时将Serial+CMS. ParNew+Serial Old这两个组合声明为废弃(JEP 173),并在JDK 9中完全取消了这些 ...
- 关于Kotlin中日志的使用方法
1 引言 想必学过Java的人都知道一个@Slf4j使用得多么的舒服: @Slf4j public class TestController{ @GetMapping("/test" ...
- JAVAEE_03_HTTP
HTTP\HTTPS\TCP HTTP协议 什么是HTTP协议 HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wi ...
- 锁定项目的 node 版本
一些老项目对 node 版本是有要求的,往往使用默认的新版本包安装不上,scripts 也跑不起来. 之前就遇到过运行一个小程序项目时,根据文档来,第一步安装就出错.本着办法总比问题多的理念,来一个解 ...
- D - The Frog's Games (二分)
The annual Games in frogs' kingdom started again. The most famous game is the Ironfrog Triathlon. On ...
- 技术分享|SQL和 NoSQL数据库之间的差异:MySQL(VS)MongoDB
在当今市场上,存在各种类型的数据库,选择适合你业务类型的数据库对应用的开发和维护有着重要意义.本篇文章,将为大家分享SQL和NoSQL语言之间的区别,同时还将比较这两种类型的数据库,以帮助小伙伴们选择 ...