这是一个基于threading可停止线程的有限容量有限并行度的python任务管理器
这是一个可停止线程的有限容量有限并行度的任务管理器
基于:GitHub - AlitaIcon/StopableThreadJob: 可停止线程任务管理器
Quick Start
基础调用与效果
import time
import datetime
from loguru import logger
from StopableThreadJob.job_manager import JobManager
if __name__ == '__main__':
def slow_func( name):
for i in range(5):
logger.info(f"{name} -- {datetime.datetime.now()}")
time.sleep(1)
job_manager = JobManager()
# 删除未添加任务
job_manager.remove_job('2')
for pid in range(6):
logger.info(f"添加任务: {pid}")
job_manager.add_job(target=slow_func, args=(pid,), job_id=f'{pid}')
time.sleep(1)
job_manager.start_job()
# 删除已添加运行中任务
job_manager.remove_job('1')
# 删除已添加未运行中任务
job_manager.remove_job('4')
time.sleep(5)
# 删除运行完成任务
job_manager.remove_job('0')
job_manager.print_current_job()
print(job_manager.job_store)
for i in [0, 1, 2, 4]:
logger.info(f"添加任务: {i}")
job_manager.add_job(target=slow_func, args=(i,), job_id=f'{i}')
job_manager.print_current_job()
job_manager.start_job()
time.sleep(6)
print(job_manager.job_store)
job_manager.print_current_job()
time.sleep(30)
文件job_manager
import ctypes
import threading
from loguru import logger
class TerminableThread(threading.Thread):
"""
a thread that can be stopped by forcing an exception in the execution context
可以通过在执行上下文中强制异常来停止的线程
"""
def terminate(self, exception_cls, repeat_sec=2.0):
if self.is_alive() is False:
return True
killer = ThreadKiller(self, exception_cls, repeat_sec=repeat_sec)
killer.start()
class ThreadKiller(threading.Thread):
"""
separate thread to kill TerminableThread
单独的线程来终止可终止线程
"""
def __init__(self, target_thread, exception_cls, repeat_sec=2.0):
threading.Thread.__init__(self)
self.target_thread = target_thread
self.exception_cls = exception_cls
self.repeat_sec = repeat_sec
self.daemon = True
def run(self):
"""loop raising exception incase it's caught hopefully this breaks us far out"""
while self.target_thread.is_alive():
ctypes.pythonapi.PyThreadState_SetAsyncExc(ctypes.c_long(self.target_thread.ident),
ctypes.py_object(self.exception_cls))
self.target_thread.join(self.repeat_sec)
# 自定义错误类型:
class StopRunningCommand(Exception):
pass
class JobManagerID:
"""
任务ID池,用于初始化任务ID列表,
"""
def __init__(self, pool_size=5):
self.pid_list = list(range(pool_size))
def list_move(self):
# 将pid_list 列表循环左移一位,既列表第一项移动至末尾
b = self.pid_list[:1][0]
c = self.pid_list[1:]
c.append(b)
self.pid_list = c
# 主要的任务调用对象类
class JobManager:
def __init__(self, semaphore=2):
"""
:param semaphore: 任务池中可并行的任务数
"""
self.job_store = {}
self.job_lock = threading.RLock()
self.semaphore = threading.Semaphore(semaphore)
def add_job(self, job_id, target, *args, **kwargs):
# 新增指定ID的任务
def inner_job(*args, **kwargs):
try:
self.semaphore.acquire()
ret = target(*args, **kwargs)
print(f"{job_id} is finished.")
return ret
except StopRunningCommand as e:
print(f"{job_id} has been stopped.")
except Exception as e:
print(f"{job_id} is finished.")
raise e
finally:
if job_id in self.job_store:
self.job_store.pop(job_id) # 运行完毕后在job_store中删除任务
self.semaphore.release()
with self.job_lock:
t = TerminableThread(target=inner_job, *args, **kwargs)
t.daemon = True
# if job_id in self.job:
# self.job[job_id].terminate(StopRunningCommand)
self.job_store[job_id] = t
return self.job_store[job_id]
def remove_job(self, job_id):
# 删除指定ID的任务
with self.job_lock:
if job_id in self.job_store:
self.job_store[job_id].terminate(StopRunningCommand)
def start_job(self):
# 开始任务池中全部的任务,当任务执行较快时会出现该循环还未结束但已经有任务结束了,
# 从而导致循环的字典发生变化导致错误
with self.job_lock:
for j, t in self.job_store.items():
if t.is_alive() is False:
t.start()
def start_job_id(self,pid):
# 指定id开始执行任务
with self.job_lock:
if self.job_store[pid].is_alive() is False:
self.job_store[pid].start()
def job_start(self,pid):
# 返回指定id的任务当前状态,True为正在计算
return self.job_store[pid].is_alive()
def print_current_job(self):
# 返回指定任务池中全部的任务的当前状态,True为正在计算
info = {jid: t.is_alive() for jid, t in self.job_store.items()}
logger.info(info)
为实现任务运行异步且可并行的效果
定义的方法函数
from StopableThreadJob.job_manager import *
job_manager = JobManager(semaphore=4)
job_manager_list = JobManagerID(pool_size = 5)
# pool_size 用于设置任务池容量的大小
# semaphore 用于设置并行度,既任务池中可同时计算的任务数
def job():
def slow_func(name):
for i in range(10):
logger.info(f"{name} -- {datetime.datetime.now()}")
time.sleep(1)
pid = job_manager_list.pid_list[0]
if pid in job_manager.job_store:
job_manager.remove_job(pid)
job_manager.add_job(target=slow_func, args=(pid,), job_id=pid)
job_manager.start_job_id(pid)
job_manager_list.list_move()
- pool_size 用于设置任务池容量的大小
- semaphore 用于设置并行度,既任务池中可同时计算的任务数
实现有限的任务池以及有限的并行度的计算模块。
当任务池满的时候新的任务会将旧的任务挤出任务池。
所有的任务都在任务池中排队,根据并行度决定同时计算的数目。
这是一个基于threading可停止线程的有限容量有限并行度的python任务管理器的更多相关文章
- Java模拟生产者-消费者问题。生产者不断的往仓库中存放产品,消费者从仓库中消费产品。其中生产者和消费者都可以有若干个。在这里,生产者是一个线程,消费者是一个线程。仓库容量有限,只有库满时生产者不能存
需求分析:生产者生产产品,存放在仓库里,消费者从仓库里消费产品. 程序分析: 1.生产者仅仅在仓储未满时候生产,仓满则停止生产. 2.消费者仅仅在仓储有产品时候才能消费,仓空则等待. 3.当消费者发现 ...
- Java 创建线程/停止线程
继承 Thread 类 class MyThread1 extends Thread{ @Override public void run(){ System.out.println("继承 ...
- 如何停止一个正在运行的java线程
与此问题相关的内容主要涉及三部分:已废弃的Thread.stop().迷惑的thread.interrupt系列.最佳实践Shared Variable. 已废弃的Thread.stop() @Dep ...
- 一个基于.NET平台的自动化/压力测试系统设计简述
AutoTest系统设计概述 AutoTest是一个基于.NET平台实现的自动化/压力测试的系统,可独立运行于windows平台下,支持分布式部署,不需要其他配置或编译器的支持.(本质是一个基于协议的 ...
- 基于condition 实现的线程安全的优先队列(python实现)
可以把Condiftion理解为一把高级的琐,它提供了比Lock, RLock更高级的功能,允许我们能够控制复杂的线程同步问题.threadiong.Condition在内部维护一个琐对象(默认是RL ...
- 基于C++11实现线程池的工作原理
目录 基于C++11实现线程池的工作原理. 简介 线程池的组成 1.线程池管理器 2.工作线程 3.任务接口, 4.任务队列 线程池工作的四种情况. 1.主程序当前没有任务要执行,线程池中的任务队列为 ...
- Go/Python/Erlang编程语言对比分析及示例 基于RabbitMQ.Client组件实现RabbitMQ可复用的 ConnectionPool(连接池) 封装一个基于NLog+NLog.Mongo的日志记录工具类LogUtil 分享基于MemoryCache(内存缓存)的缓存工具类,C# B/S 、C/S项目均可以使用!
Go/Python/Erlang编程语言对比分析及示例 本文主要是介绍Go,从语言对比分析的角度切入.之所以选择与Python.Erlang对比,是因为做为高级语言,它们语言特性上有较大的相似性, ...
- 写一个基于TCP协议套接字,服务端实现接收客户端的连接并发
''' 写一个基于TCP协议套接字,服务端实现接收客户端的连接并发 ''' client import socket import time client = socket.socket() clie ...
- Linux是一个基于POSIX和Unix的多用户、多任务、支持多线程和多CPU的性能稳定的操作系统,可免费使用并自由传播。
Linux是一个基于POSIX和Unix的多用户.多任务.支持多线程和多CPU的性能稳定的操作系统,可免费使用并自由传播. Linux是众多操作系统之一 , 目前流行的服务器和 PC 端操作系统有 L ...
- 一个基于mysql构建的队列表
通常大家都会使用redis作为应用的任务队列表,redis的List结构,在一段进行任务的插入,在另一端进行任务的提取. 任务的插入 $redis->lPush("key:task:l ...
随机推荐
- 构建动态交互式H5导航栏:滑动高亮、吸顶和锚点导航技巧详解
功能描述 产品要求在h5页面实现集锚点.吸顶及滑动高亮为一体的功能,如下图展示的一样.当页面滑动时,内容区域对应的选项卡高亮.当点击选项卡时,内容区域自动滑动到选项卡正下方. 布局设计 css 布局 ...
- Python2同时输出中文和变量时中文乱码
Python2同时输出中文和变量时中文乱码 一.问题描述 最近在学习tensorflow时,突然发现一个问题,python2在输出中文和变量时会出现一点问题,如下图: 可以看到,输出并不是想要的结果, ...
- 重新点亮linux 命令树————网络管理[十一二]
前言 简单整理一下网络管理. 正文 网络管理需要掌握: 网络状态查看 网络配置 路由命令 网络故障排除 网络服务管理 常用网络配置文件 网络状态的查看: 1.net-tools ---->1.i ...
- 纯钧chunjun的http-x插件修复
简介 chunjun是一款基于flink的开源数据同步工具,官方文档,其提供了很多flink官方未提供的插件供大家来使用,特别是达梦插件在国产化环境中很方便! 本次介绍的是chunjun中的一款htt ...
- ImportError: Cannot load backend 'TkAgg' which requires the 'tk' interactive framework, as 'headless' is currently running
MMdetection多卡训练常遇到的两个错误,百度无果,没解决,去github里mmdetection的issue模块搜索了一下找到正解. 这里记录一下,方便后者. 1️⃣ ImportError: ...
- 获取电脑真实的IP地址,忽略虚拟机等IP地址的干扰
/** * @author yins * @date 2018年8月12日下午9:53:58 */ import java.net.Inet4Address; import java.net.Inet ...
- MaxCompute笛卡尔积逻辑的参数优化&复杂JOIN逻辑优化
简介: 这篇文章主要讲一个SQL优化反映的两个优化点.分别是: 一.笛卡尔积逻辑的参数优化. 二.一个复杂JOIN逻辑的优化思路. 1. 优化概述 最近协助一个项目做下优化任务的工作.因为主要数据都 ...
- 飞天大数据产品价值解读— SaaS模式云数据仓库MaxCompute
飞天大数据产品价值解读 - SaaS模式云数据仓库 MaxCompute摘要:企业在数字化转型过程中面临数据技术平台建设和运营的诸多挑战,随着现代化数据仓库向多功能.服务化方向发展演进,技术侧的变革为 ...
- Spring Boot 微服务性能下降九成!使用 Arthas 定位根因
简介: 接收到公司业务部门的开发反馈,应用在升级公司内部框架后,UAT(预生产)环境接口性能压测不达标. 背景 接收到公司业务部门的开发反馈,应用在升级公司内部框架后,UAT(预生产)环境接口性能压测 ...
- Java单元测试技巧之PowerMock
简介: 高德的技术大佬向老师在谈论方法论时说到:"复杂的问题要简单化,简单的问题要深入化." 这句话让我感触颇深,这何尝不是一套编写代码的方法--把一个复杂逻辑拆分为许多简单逻辑, ...