作者 吕亚霖,2019年加入作业帮,作业帮架构研发负责人,在作业帮期间主导了云原生架构演进.推动实施容器化改造.服务治理.GO微服务框架.DevOps的落地实践. 简介 调度系统的本质是为计算服务/任务匹配合适的资源,使其能够稳定高效地运行,以及在此的基础上进一步提高资源使用密度,而影响应用运行的因素非常多,比如 CPU.内存.IO.差异化的资源设备等等一系列因素都会影响应用运行的表现.同时,单独和整体的资源请求.硬件/软件/策略限制. 亲和性要求.数据区域.负载间的干扰等因素以及周期性流量场景…
作者 吕亚霖,2019年加入作业帮,作业帮基础架构-架构研发团队负责人,在作业帮期间主导了云原生架构演进.推动实施容器化改造.服务治理.GO微服务框架.DevOps的落地实践. 张浩然,2019年加入作业帮,作业帮基础架构-高级架构师,在作业帮期间,推动了作业帮云原生架构演进.负责多云k8s集群建设.k8s组件研发.linux内核优化调优.底层服务容器化相关工作. 背景 大规模检索系统一直都是各个公司平台业务的底层基石,往往是以千台裸金属服务器级别的超大规模集群的方式运行,数据量巨大,对于性能.…
作者 吕亚霖,2019年加入作业帮,作业帮架构研发负责人,在作业帮期间主导了云原生架构演进.推动实施容器化改造.服务治理.GO微服务框架.DevOps的落地实践. 莫仁鹏,2020年加入作业帮,作业帮高级架构师,在作业帮期间,推动了作业帮云原生架构演进,负责作业帮服务治理体系的设计和落地.服务感知体系建设以及自研mesh.MQproxy研发工作. 摘要 日志是服务观察的主要方式,我们依赖日志去感知服务的运行状态.历史状况:当发生错误时,我们又依赖日志去了解现场,定位问题.日志对研发工程师来说异常…
一.概述 一个容器平台的主要功能就是为容器分配运行时所需要的计算,存储和网络资源.容器调 度系统负责选择在最合适的主机上启动容器,并且将它们关联起来.它必须能够自动的处 理容器故障并且能够在更多的主机上自动启动更多的容器来应对更多的应用访问. 目前三大主流的容器平台 Swarm, Mesos 和 Kubernetes 具有不同的容器调度系统. 1.Swarm 的特点是直接调度 Docker 容器,并且提供和标准 Docker API 一致的 API. 2.Mesos 针对不同的运行框架采用相对独…
转自:https://www.ibm.com/developerworks/cn/linux/l-lo-io-scheduler-optimize-performance/index.html 调整 Linux I/O 调度器优化系统性能 曹 元其2017 年 8 月 30 日发布 WeiboGoogle+用电子邮件发送本页面 0 前言 Linux I/O 调度器是Linux内核中的一个组成部分,用户可以通过调整这个调度器来优化系统性能.本文首先介绍Linux I/O 调度器的结构,然后介绍如何…
[摘要] Volcano 是基于 Kubernetes 的批处理系统,源自于华为云开源出来的.Volcano 方便 AI.大数据.基因.渲染等诸多行业通用计算框架接入,提供高性能任务调度引擎,高性能异构芯片管理,高性能任务运行管理等能力. 1      为什么K8S需要Volcano K8S自带的的资源调度器,有一个明显的特点是:依次调度每个容器.但在AI训练或者大数据,这种必须多个容器同时配合执行的情况下,容器依次调度是无法满足需要的.因为这些计算任务包含的容器们想要的是,要么同时都成功,要么…
[摘要] Volcano 是基于 Kubernetes 的批处理系统,源自于华为云开源出来的.Volcano 方便 AI.大数据.基因.渲染等诸多行业通用计算框架接入,提供高性能任务调度引擎,高性能异构芯片管理,高性能任务运行管理等能力. 1 为什么K8S需要Volcano K8S自带的的资源调度器,有一个明显的特点是:依次调度每个容器.但在AI训练或者大数据,这种必须多个容器同时配合执行的情况下,容器依次调度是无法满足需要的.因为这些计算任务包含的容器们想要的是,要么同时都成功,要么就都别执行…
Jenkins K8S Slave 调度效率优化 by yue994488@126.com 使用kubernetes为测试工具Gatling进行大规模压测,压测期间发现Jenkins调度压测实例较慢,单批几百实例需要十分钟左右也不能保证完整调度. 结合Jenkins Master源码 和Jenkins Kubernetes插件源码,对调度进行了细节的优化.调优过程中目标实例个数都设为300,调优后可以大体上允许一分钟内从Jenkins Master调度完毕.如果目标实例个数线性增加,调度的时间也…
https://tech.meituan.com/2019/08/01/hadoop-yarn-scheduling-performance-optimization-practice.html 文章对性能优化的思路,如果评测性能,找到性能瓶颈,优化,优化效果评估,上线部署给出了很好的教科书式的案例,值得一看!! 背景 YARN作为Hadoop的资源管理系统,负责Hadoop集群上计算资源的管理和作业调度. 美团的YARN以社区2.7.1版本为基础构建分支.目前在YARN上支撑离线业务.实时业务…
scheduler 当Scheduler通过API server 的watch接口监听到新建Pod副本的信息后,它会检查所有符合该Pod要求的Node列表,开始执行Pod调度逻辑.调度成功后将Pod绑定到目标节点上.Scheduler在整个系统中承担了承上启下的作用,承上是负责接收创建的新Pod,为安排一个落脚的地(Node),启下是安置工作完成后,目标Node上的kubelet服务进程接管后继工作,负责Pod生命周期的后半生.具体来说,Scheduler的作用是将待调度的Pod安装特定的调度算…