*日,由天翼云科技有限公司弹性计算产品线天玑实验室撰写的两篇论文《PheCon: Fine-Grained VM Consolidation with Nimble Resource Defragmentation in Public Cloud Platforms》及《Yggdrasil: Reducing Network I/O Tax with (CXL-Based) Distributed Shared Memory》被ACM International Conference on Parallel Processing(ICPP)收录。

ACM ICPP是计算机体系结构、并行与分布计算、存储系统领域的顶级会议之一,也是世界上最古老的连续举办的并行计算国际会议之一。ACM ICPP收录论文均经过严格的同行双盲评审,*五年*均接收率为27.9%。此次天玑实验室两篇论文的成功收录,既是顶级权威机构对天翼云技术创新能力的认可,也是中国企业在国际学术舞台影响力日益增强的有力证明。

本次收录的两篇论文分别阐述了天翼云天玑实验室团队自主设计与研发的两大创新成果,包括面向大规模云数据中心管理的智能资源调度技术——PheCon,和基于“聚合计算”产品理念的面向新一代云计算基础设施的网络I/O加速技术——Yggdrasil。

PheCon:细粒度云数据中心

智能资源碎片整理算法

在云计算场景下,由于数据中心负载水*的波动性和需求的不确定性,各个物理服务器普遍存在资源碎片问题,造成数据中心资源浪费。如图1所示,客户需要紧急开通6台指定规格的云服务器,但集群内剩余资源只能满足4台云服务器,形成典型的资源碎片现象。如何应对资源扩容中常见的周期长、成本高等挑战,满足极端场景下的客户需求,成为亟需解决的难题。

图1. 碎片整理示意图

本论文创新性提出一种新型细粒度碎片整理算法——PheCon,通过云服务器二次调度的方式聚合集群内资源碎片,以满足更大规格资源的开通需求。同时,该论文还提出了基于分治思想的NUMA感知启发式算法和“诱导迁移”(Induced Migration)技术,通过规格填充、物理服务器选择、云服务器排序和NUMA调度,实现集群布局优化。

基于上述技术特点,PheCon可适配天翼云“2+4+31+X”的资源布局和异构数据中心的异构资源特点,做到一池一算、算无遗策,满足全域异构资源的二次调度,实现分钟级的快速碎片整理,提供优质的上云体验。目前,天玑智能调度*台稳定运行PheCon碎片整理功能,累计提供服务72次,每年节省运营成本超过千万元,减少碳排放超百吨。

Yggdrasil:CXL使能的无感

网络I/O性能加速

在通信密集型应用程序的运行过程中,基于Linux内核的操作系统网络通讯组件面临巨大的运行负担。为有效解决上述问题,本论文提出Yggdrasil网络通讯*替方案。

Yggdrasil是天翼云聚合计算团队预研的下一代数据中心网络通信技术。如图2所示,该技术可基于CXL共享内存实现用户态的高性能TCP/IP通信,且完全兼容现有的socket API,无需修改代码即可完成性能加速。天玑实验室团队通过模拟和真实CXL硬件进行评估的结果表明,Yggdrasil 可使Memcached的吞吐性能相比传统Linux socket高出8.2倍,并在不同消息大小的微基准测试中,将通讯延迟降低到传统方式的0.3%到4.1%。

图2. 关于Yggdrasil快速/慢速通信路径示意图

Yggdrasil的性能优势与易用性主要得益于三个方面的设计优化:

(1)在跨主机通信中,Yggdrasil采用基于CXL的分布式共享内存(即快速通信路径)以提升性能,在CXL不可用的情况下,自动无感切换回传统socket(即慢速通信路径)。

(2)Yggdrasil依托于受信任的用户空间监控守护进程管理通讯连接控制*面操作,减少上下文切换开销。数据*面采用对等模型进行跨物理主机的进程间通信,充分利用CXL共享内存的性能优势。

(3)为弥补socket API和共享内存之间的语义鸿沟,采取多种技术兼顾接口兼容性和性能优势。

基于Yggdrasil的I/O网络性能优势及良好的API接口兼容性,Yggdrasil方案将在天翼云弹性计算产品线自主设计和研发的聚合计算*台进行落地,以减少网络I/O税,从而为客户提供更澎湃的算力资源,助力千行百业创造更多价值。

面向未来,天翼云将继续加强关键核心技术自主攻关,以领先的产品能力夯实数字基础设施底座,为千行百业数字化转型保驾护航。

“翼”鸣惊人,天翼云两篇论文被ACM ICPP 2024收录!的更多相关文章

  1. 顶会两篇论文连发,华为云医疗AI低调中崭露头角

    摘要:2020年国际医学图像计算和计算机辅助干预会议(MICCAI 2020),论文接收结果已经公布.华为云医疗AI团队和华中科技大学合作的2篇研究成果入选. 同时两篇研究成果被行业顶会收录,华为云医 ...

  2. 网易云安全两篇论文入选计算机视觉顶级会议ICCV

    本文由  网易云发布. 10月22日至29日,全球计算机视觉顶尖专家们共聚威尼斯,参加ICCV2017国际计算机视觉大会,就领域内最新成果展开集中研讨,大会论文集也代表了计算机视觉领域最新的发展方向和 ...

  3. 两篇论文之CNN中正交操作

    CNN的权值正交性和特征正交性,在一定程度上是和特征表达的差异性存在一定联系的. 下面两篇论文,一篇是在训练中对权值添加正交正则提高训练稳定性,一篇是对特征添加正交性的损失抑制过拟合. 第一篇:Ort ...

  4. 自监督学习(Self-Supervised Learning)多篇论文解读(下)

    自监督学习(Self-Supervised Learning)多篇论文解读(下) 之前的研究思路主要是设计各种各样的pretext任务,比如patch相对位置预测.旋转预测.灰度图片上色.视频帧排序等 ...

  5. 京东云与AI 10 篇论文被AAAI 2020 收录,京东科技实力亮相世界舞台

    美国时间2月7-12日,AAAI 2020大会在纽约正式拉开序幕,AAAI作为全球人工智能领域的顶级学术会议,每年评审并收录来自全球最顶尖的学术论文,这些学术研究引领着技术的趋势和未来.京东云与AI在 ...

  6. 国内首篇云厂商 Serverless 论文入选全球顶会:突发流量下,如何加速容器启动?

    作者 | 王骜 来源 | Serverless 公众号 导读 ​ USENIX ATC (USENIX Annual Technical Conference) 学术会议是计算机系统领域的顶级会议,入 ...

  7. 两篇文章带你走入.NET Core 世界:Kestrel+Nginx+Supervisor 部署上云服务器(二)

    背景: 上一篇:两篇文章带你走入.NET Core 世界:CentOS+Kestrel+Ngnix 虚拟机先走一遍(一) 已经交待了背景,这篇就省下背景了,这是第二篇文章了,看完就木有下篇了. 直接进 ...

  8. SLAM架构的两篇顶会论文解析

    SLAM架构的两篇顶会论文解析 一. 基于superpoint的词袋和图验证的鲁棒闭环检测 标题:Robust Loop Closure Detection Based on Bag of Super ...

  9. TDSQL|三篇论文入选国际顶会SIGMOD,厉害了腾讯云数据库

    好消息!6月13日,腾讯云数据库三篇论文再次入选数据库行业顶会SIGMOD,被SIGMOD 2022 Research Full Paper(研究类长文)收录. 本次被收录的研究成果中,新型数据结构设 ...

  10. Shachar Fleishma的论文,做点云重建的几篇论文都不错

    http://www.sci.utah.edu/~shachar/ 几篇论文都不错,但貌似05年之后就没有什么动作了.

随机推荐

  1. Java中使用FFmpeg拉取RTSP流

    在Java中使用FFmpeg拉取RTSP流并推送到另一个目标地址是一个相对复杂的任务,因为Java本身并没有直接处理视频流的功能.但是,我们可以借助FFmpeg命令行工具来实现这个功能.FFmpeg是 ...

  2. axios获取上传进度报错xhr.upload.addEventListener is not a function

    错误问题 Vue:xhr.upload.addEventListener is not a function 这个问题是因为mockjs改动了axios里面XMLHttpRequest对象致使的 根据 ...

  3. WiFi流量劫持—— 浏览任意页面即可中毒!

    大家都知道公共场所的Wifi安全性很差,但并不清楚究竟有多差.大多以为只要不上QQ.不登陆网站账号就没事了,看看新闻小说什么的应该毫无关系. 的确如此,看看新闻网页没有涉及任何敏感的账号信息.即便是数 ...

  4. Java开发

    总结java开发中知识点和问题点 基础: 常用加解密算法: [md5] import java.security.MessageDigest; public static final String e ...

  5. ZCMU-1033

    我觉得这位大佬说的已经很好了,可以直接看她的思路了: 大佬思路 但是她的代码没有考虑到1 1 1 1的情况, 代码思路 这个是可以的很长且没有注释: #include<bits/stdc++.h ...

  6. SpringBoot 整合Swagger2 踩坑记录

    SpringBoot 整合Swagger2 踩坑记录 Failed to start bean 'documentationPluginsBootstrapper'; nested exception ...

  7. 某开源ERP最新版SQL与RCE的审计过程

    文章首发于 https://forum.butian.net/share/134 前言 代码路径 https://gitee.com/jishenghua/JSH_ERP 软件版本 华夏ERP_v2. ...

  8. WSLg 中文输入法 fcitx5

    随着 Win11 22H2 和 WSLg 的推出,很多开启输入法的教程都过时了.记录一下最新实践: WSL 安装 Ubuntu 后,安装中文语言 sudo /usr/bin/gnome-languag ...

  9. 2024年1月Java项目开发指南13:登录注册实现

    创建文件,如上图 创建好文件后去router.index.js配置路由 import { createRouter, createWebHistory } from 'vue-router'; // ...

  10. IDEA跳转到上一个下一个方法的快捷键

    假如一个方法很不规范,写了好几百行,你想去下一个方法,如果用鼠标往下滑,会挺崩溃的.或者有的时候,就是需要一个一个方法往下看,那么IDEA有没有这样方便的快捷键呢?是有的:按住Alt键,再按上/下方向 ...