多线程笔记 - Master-Worker
多线程的 Master-Worker 从字面上也是可以理解的.
Master 相当于领导, 一个就够了, 如果是多个, 那么听谁的, 是个大问题. Master负责指派任务给 Worker. 然后对每个人完成的情况进行汇总.
Worker 相当于具体干活的人, 完成领导分配的任务, 然后把成果交给领导.
这种模式, 有点类似大数据的 MapReduce. 但是比那个简单很多.
这里有个例子:
计算 1²+2²+......+100²的结果.
假如使用 Master-Worker 的方式来计算, 先假设 平方计算 比较耗时, 此处假设每一次平方运算耗时为 100ms.
那么此处要得到计算结果, 就至少需要 100 * 100ms = 10000 ms, 也就是 10s 的时间.
如果此处通过 Master-Worker 的模式来解决此问题, 那么时间会大大缩短.
MyTask 用来存储待计算的数值, 如: 1, 2, 3
public class MyTask implements Serializable {
private int id;
private int num;
public MyTask(int id, int num) {
this.id = id;
this.num = num;
}
......
@Override
public String toString() {
return "MyTask{" +
"id=" + id +
", num=" + num +
'}';
}
}
Master既然是领导, 肯定需要知道来了哪些任务, 要分配给哪些下属, 且下属干活的成果是什么
public class MyMaster {
//1. 需要一个容器来存储待执行任务
private final ConcurrentLinkedQueue<MyTask> tasks = new ConcurrentLinkedQueue<>(); //2. 需要一个容器来存储执行任务的线程 <线程名称, 线程>
private HashMap<String, Thread> workThreads = new HashMap<>(); //3. 需要一个容器来存储每一个线程执行后的结果 <任务id, 任务结果>
private ConcurrentHashMap<Integer, Object> resMap = new ConcurrentHashMap<>(); //4. 构造函数, 将 Worker 传入, 让每个线程都执行相同的方法
public MyMaster(AbstractWorker myWorker, int workerCount) {
myWorker.setTasks(tasks);
myWorker.setResMap(resMap); for (int i = 1; i <= workerCount; i++) {
String name = "worker" + i;
workThreads.put(name, new Thread(myWorker));
}
} //5. 任务提交到容器中
public boolean addTask(MyTask task) {
return tasks.add(task);
} //6. 任务开始执行方法
public void execute(){
for (Map.Entry<String, Thread> worker : workThreads.entrySet()) {
worker.getValue().start();
}
} //7. 判断所有线程是否执行完毕
public boolean isComplated(){
for (Map.Entry<String, Thread> worker : workThreads.entrySet()) {
if(worker.getValue().getState() != Thread.State.TERMINATED){
return false;
}
}
return true;
} //8. 总结归纳, 获取结果
public int getResult(){
int res = 0;
for (Map.Entry<Integer, Object> resItem : resMap.entrySet()) {
res += (int) resItem.getValue();
}
return res;
}
}
Worker 作为干活的人, 也需要知道任务列表, 当干完一个之后, 可以再领取一个任务撸起袖子加油干. 然后还需要知道需要将干活的成果放到哪里去.
public abstract class AbstractWorker implements Runnable {
// <线程名称, 线程>, 子类持有 Master 的任务列表, 从中拿取任务
private ConcurrentLinkedQueue<MyTask> tasks; //<任务id, 任务结果>, 子类持有 Master 的结果列表, 将计算结果放进去
private ConcurrentHashMap<Integer, Object> resMap; public void setTasks(ConcurrentLinkedQueue<MyTask> tasks) {
this.tasks = tasks;
} public void setResMap(ConcurrentHashMap<Integer, Object> resMap) {
this.resMap = resMap;
} @Override
public void run() {
while (true) {
MyTask task = tasks.poll();
if (task == null) {
break;
}
Object res = handle(task);
resMap.put(task.getId(), res);
System.out.println(Thread.currentThread().getName() + " 计算 " + task.getNum() + " 结果为 : " + res);
}
} //这里将具体的实现逻辑放到子类里去, 可以增加扩展性, 此例中现在是算平方, 那通过传入不同的Worker, 也可以算开方
public abstract Object handle(MyTask task);
} public class SquareWorker extends AbstractWorker { public Object handle(MyTask task) {
int res= task.getNum() * task.getNum();
try {
//模拟运算耗时
Thread.sleep(100);
}
catch (InterruptedException e) {
e.printStackTrace();
}
return res;
}
}
测试:
public static void main(String[] args) throws InterruptedException {
SquareWorker worker = new SquareWorker();
MyMaster master = new MyMaster(worker, 10);
String outPrint = "";
for (int i = 1; i <= 100; i++) {
MyTask task = new MyTask(i, i);
master.addTask(task); outPrint += i + "²" ;
if(i < 100){
outPrint += " + ";
}
}
System.out.println(outPrint);
//统计下计算时间
long startTime = System.currentTimeMillis();
master.execute(); while (true){
if(!master.isComplated()){
Thread.sleep(50);
continue;
} int result = master.getResult();
System.out.println("计算的结果为 : " + result + ", 耗时为 : " + (System.currentTimeMillis() - startTime));
break;
}
}
结果:
可以看到, 耗时才 1s 多一点, 比之前的 10s 中, 确实缩短了很多.
此处的输出顺序, 并不是有序的. 这也是多线程的一个特点, 正常情况下代码书写顺序和多线程的执行顺序, 往往不是一致的.
当然任何方式, 都是有优点和缺点的.
优点是缩短了执行时间
缺点却是起了更多的线程, 要知道起线程(还有的优化)是有开销的. 起了更多的线程, 就占了更多的空间. 相当于是用空间换时间的一种干法.
这里可以先做一个小优化, 将线程交给线程池托管. 可以不用知道下面具体是那些人干活, 有点外包的意思. master 只要发布任务, 然后拿到自己想要的结果就行了.
先对 Master 进行改写:
public class MyMaster { // <线程名称, 线程>, 子类持有 Master 的任务列表, 从中拿取任务
private final ConcurrentLinkedQueue<MyTask> tasks = new ConcurrentLinkedQueue<>(); //2. 需要线程池来对线程进行托管
private ThreadPoolExecutor pool; //3. 具体干活的标准
private AbstractWorker worker; //4. 雇佣几个人干活
private int workerCount ; //3. 需要一个容器来存储每一个线程执行后的结果 <任务id, 任务结果>
private ConcurrentHashMap<Integer, Object> resMap = new ConcurrentHashMap<>(); //4. 构造函数, 将 Worker 传入, 让每个线程都执行相同的方法
public MyMaster(AbstractWorker worker, int workerCount) { this.worker = worker;
worker.setResMap(resMap);
worker.setTasks(tasks); this.workerCount = workerCount; pool = new ThreadPoolExecutor(workerCount, workerCount, 0, TimeUnit.SECONDS, new LinkedBlockingQueue());
} public void addTask(MyTask task) {
tasks.add(task);
} public void execute(){
for (int i = 0; i < workerCount; i++) {
pool.execute(worker);
}
} //7. 判断所有线程是否执行完毕
public void finish() {
pool.shutdown();
} public boolean isFinished() {
return pool.isTerminated();
} //8. 总结归纳, 获取结果
public int getResult() {
int res = 0;
for (Map.Entry<Integer, Object> resItem : resMap.entrySet()) {
res += (int) resItem.getValue();
}
return res;
}
}
测试方法:
public static void main(String[] args) throws InterruptedException {
SquareWorker worker = new SquareWorker();
MyMaster master = new MyMaster(worker, 10); String outPrint = "";
long startTime = System.currentTimeMillis();
for (int i = 1; i <= 100; i++) {
MyTask task = new MyTask(i, i);
master.addTask(task); outPrint += i + "²";
if (i < 100) {
outPrint += " + ";
}
}
System.out.println(outPrint); master.execute(); master.finish(); while (!master.isFinished()){
Thread.sleep(10);
} int res = master.getResult();
System.out.println("计算的结果为 : " + res + ", 耗时为 : " + (System.currentTimeMillis() - startTime));
}
结果:
多线程笔记 - Master-Worker的更多相关文章
- 2016/1/25 多线程 作业 方法一 继承Thread 方法二 实现Runnable 多线程笔记
/* * 1,尝试定义一个继承Thread类的类,并覆盖run()方法, * 在run()方法中每隔100毫秒打印一句话.*/ package Stream; //方法一 继承Thread 实现多线程 ...
- Java基础知识强化之多线程笔记01:多线程基础知识(详见Android(java)笔记61~76)
1. 基础知识: Android(java)学习笔记61:多线程程序的引入 ~ Android(java)学习笔记76:多线程-定时器概述和使用
- Java多线程笔记总结
1.线程的三种创建方式 对比三种方式: 通过继承Thread类实现 通过实现Runnable接口 实现Callable接口 第1种方式无法继承其他类,第2,3种可以继承其他类: 第2,3种方式多线程可 ...
- 多线程笔记 - provider-consumer
通过多线程实现一个简单的生产者-消费者案例(笔记). 首先定义一个要生产消费的数据类 : public class Data { private String id; private String n ...
- iOS多线程笔记
在iOS开发中,有三种多线程处理方式: 1. 利用NSThread 2. NSOperation和NSOperationQueue 3. 利用GCD(Grand Central Dispatch) 使 ...
- MongoDB学习笔记——Master/Slave主从复制
Master/Slave主从复制 主从复制MongoDB中比较常用的一种方式,如果要实现主从复制至少应该有两个MongoDB实例,一个作为主节点负责客户端请求,另一个作为从节点负责从主节点映射数据,提 ...
- Java基础知识强化之多线程笔记05:Java中继承thread类 与 实现Runnable接口的区别
1. Java中线程的创建有两种方式: (1)通过继承Thread类,重写Thread的run()方法,将线程运行的逻辑放在其中. (2)通过实现Runnable接口,实例化Thread类. 2. ...
- QT多线程笔记
1.QT多线程涉及到主线程和子线程之间交互大量数据的时候,使用QThread并不方便,因为run()函数本身不能接受任何参数,因此只能通过信号和槽的交互来获取数据,如果只是单方面简单交互数据还过得去, ...
- Java基础知识强化之多线程笔记05:Java程序运行原理 和 JVM的启动是多线程的吗
1. Java程序运行原理: Java 命令会启动Java 虚拟机,启动 JVM,等于启动了一个应用程序,也就是启动了一个进程.该进程会自动启动一个 “主线程” ,然后主线程去调用某个类的 m ...
随机推荐
- spring boot 的 userRepository无法注入的问题
No qualifying bean of type 'xxx.xxx.xxx' available: expected at least 1 bean which qualifies as auto ...
- (转)Bypass xss过滤的测试方法
from wooyun//五道口杀气 · 2014/01/02 19:16 0x00 背景 本文来自于<Modern Web Application Firewalls Fingerprinti ...
- xlwings API Documentation
http://docs.xlwings.org/en/stable/api.html Top-level functions xlwings.view(obj, sheet=None) Opens a ...
- 缓冲区溢出实例(二)--Linux
原理:crossfire 1.9.0 版本接受入站 socket 连接时存在缓冲区溢出漏洞. 工具: 调试工具:edb: ###python在漏洞溢出方面的渗透测试和漏洞攻击中,具有很大的优势 实 ...
- 字符串(String)的创建,以及字符串的属性及方法
1.String对象的创建 方法1: var txt = new String("i am String"); console.log(txt); // 结果为:i am Stri ...
- larabel Artisan Command 使用总结
larabel Artisan Command 使用总结 定义命令 在routes/console.php下定义命令 Artisan::command('ltf', function () { (ne ...
- JVM源码分析之警惕存在内存泄漏风险的FinalReference(增强版)
概述 JAVA对象引用体系除了强引用之外,出于对性能.可扩展性等方面考虑还特地实现了四种其他引用:SoftReference.WeakReference.PhantomReference.FinalR ...
- python中Threadlocal变量
在多线程环境下,每个线程都有自己的数据.一个线程使用自己的局部变量比使用全局变量好,因为局部变量只有线程自己能看见,不会影响其他线程,而全局变量的修改必须加锁. 不加锁就会出现变量会被修改的问题,进而 ...
- javabst1an
(单选题)下列概念中不包括任何实现,与存储空间没有任何关系的是() A)类 B)接口 C)抽象类 D)对象 正确答案为:B解析:接口是一种只含有抽象方法或常量的一种特殊的抽象类,因为接口不包括任何实现 ...
- 浅谈C语言的数据存储(二)
作者:冯老师,华清远见嵌入式学院讲师. 静态区是一个抽象笼统的概念,在实际的Linux/C的可执行程序中并没有静态区这个区域,具体来讲它主要由两个段组成:.data段和.bss段.其中.data段就是 ...