WAIC 2024盛大召开,天翼云以全栈智算能力赋能AI时代!
7月5日,2024世界人工智能大会期间,中国电信星辰人工智能生态论坛在上海世博中心启幕。论坛以“星辰注智,焕新领航”为主题,围绕人工智能技术发展趋势,分享中国电信与产业各界在人工智能领域的创新与实践。天翼云科技有限公司董事长、总经理胡志强出席,并发表演讲《云智一体 国云焕新》。他表示,人工智能已成为新一轮科技革命和产业变革的核心驱动力量。天翼云坚持科技创新驱动高质量发展,以丰富的智算资源供给、强大的智算服务能力和开放的模型应用生态,为数字经济发展注入新动能。
天翼云科技有限公司董事长、总经理 胡志强
丰富的智算资源供给
在智算资源供给方面,天翼云自建了丰富、多样化的智能算力资源。围绕AI产业集聚地区,天翼云规划建设北京、上海、广东、浙江、安徽人工智能公共算力中心,提供训推一体化能力,并先后建成上海、北京万卡池,这也是全国最早建成并真正投产运行的两个国产化、全液冷、单集群万卡公共智算中心;在清洁能源集聚地,建设内蒙、贵州、宁夏智算中心,提供绿色算力;此外,天翼云还在31省预部署AI云电脑和推理池,在280多个地市的一城一池节点和1000多个边缘节点按需下沉AI云电脑算力和推理算力;提供国内外主流的GPU、NPU算力方案,面向不同场景为用户提供公有云、私有云、边缘云多种形态服务。
另一方面,天翼云汇聚社会多方算力,通过高效调度实现算力供需匹配。天翼云重点研发算力分发网络平台“息壤”,从算力统一接入、算数网一体化调度、算力简便易用三方面进行技术创新,实现裸算力云化接入、算力更泛在、算力选择和应用部署更简单,促进算力互联互通、高效利用、供需匹配。
基于此,息壤可赋能三大算力服务场景。一是天翼云自营的公共算力服务平台,目前已接入多家算力伙伴,扩大了天翼云算力规模和品类,满足公有云客户的多元算力需求;二是行业算力互联网,如国资央企智算云管理调度平台,接入多家央企算力,提高国资监管水平,提升算力利用率;三是城市算力互联网,通过整合区域内多方算力,结合产业政策,实现一体化统筹调度算力,目前已在多个区域成功实践。
强大的智算服务能力
当前,基础大模型训练呈现参数越来越大的趋势,在超大规模参数的基础大模型开发训练场景中,对AI基础设施的算力、性能、稳定性都提出了更高要求。天翼云基于单集群万卡智算中心,搭载一体化计算加速平台“云骁”和一站式智算服务平台“慧聚”,从基础设施到平台,构建了基础大模型训练解决方案。
在大算力需求方面,天翼云建设了可横向扩展的PB级HPFS,满足存储要求;组建了低延时的超大规模RDMA网络,满足基础算力需求;同时,通过计算、内存、通信多维优化,提升综合算效。在性能方面,天翼云升级AI框架,编译效率翻番,通过拓扑感知调度,集合通信效率提升显著,多种加速优化后将国产算力的综合算效比提升到了行业可比水平。在稳定性方面,故障训前发现,结合断点续训能力,实现训练任务长期稳定、高可用运行。
构建国产万卡集群不是一万张卡的简单堆叠,而是一项高度复杂的系统工程,需要解决超大规模的组网互联、高效率的集群计算、长期稳定性和高可用性等众多技术难题。天翼云基于国产万卡智算集群和自研智算平台,已具备支撑万亿参数基础大模型训练的能力。
在行业大模型训推过程中,普遍存在着训练部署工程化复杂、训推效率有待提高、训练中断频繁等挑战。面向行业大模型训推场景,天翼云提供一站式智算服务。其中,“慧聚”平台预置行业数据集、纳管国内外主流AI加速硬件、并预置基于国产算力的基础大模型等全栈工具链能力,大模型精调场景通过选数据、选硬件、选模型3步,即可实现大模型训推;通过自研AI框架、3D并行加速、自研训练加速库、容器调度优化等核心技术,大幅提升训练效率;通过模型量化压缩、自研推理加速算子库、自硏AI推理加速框架等核心技术,推理效率也明显提升;通过全链路故障分钟级检测、定位、告警,全链路日志监控与可视化、断点续训快速恢复等核心技术,实现训推过程全链路监控。
基于技术创新与项目经验沉淀,天翼云打造了全面的平台化能力和解决方案,保障客户高效、便捷、稳定、安全使用智算服务。
开放的模型应用生态
在模型应用生态建设方面,天翼云在业界率先发布AI云电脑。AI云电脑具有算力更强大、更弹性、更安全、更优惠的优势,降低大众使用AI的门槛,加速推进AI普惠化。目前天翼AI云电脑已接入多个主流通用大模型,以及教育、医疗、法律、心理等多个行业大模型,打造AI应用中心,创新推出AI会议、AI低代码、AI文档、AI教育等场景化标杆应用,提升客户办公、生产效率。
此外,天翼云打造红云大模型开发者社区,聚合本土中文优质AI资源,加速AI应用创新和商业闭环。通过简单易用的工具链,端到端使能AI应用开发全流程,助力孵化国产原生模型。
大会期间,天翼云携智算创新成果亮相世博展览馆,展出了国内领先的单体万卡液冷智算池、“息壤”“云骁”“慧聚”三大智算平台、AI云电脑以及基于天翼云智算云底座的星辰大模型等硬核技术成果,全方位展现在人工智能领域的深厚实力。
“息壤”“云骁”“慧聚”三大智算平台
人工智能正成为发展新质生产力的重要引擎,作为云服务国家队,天翼云具有丰富的智算资源储备、强大的智算平台能力以及开放的模型应用生态。未来,天翼云将持续深耕技术创新,携手产业各界共创智算未来,共赢AI时代。
WAIC 2024盛大召开,天翼云以全栈智算能力赋能AI时代!的更多相关文章
- [cnBeta]阿里云推出全栈IPv6解决方案 加速推进下一代互联网应用
https://www.cnbeta.com/articles/tech/795695.htm 访问: 阿里云 - 最高1888元通用代金券立即可用 作为国内首个全面支持IPv6的云厂商,过去5个月, ...
- 微信小程序云开发-从0打造云音乐全栈小程序
第1章 首门小程序“云开发”课程,你值得学习本章主要介绍什么是小程序云开发以及学习云开发的重要性,并介绍项目的整体架构,真机演示项目功能,详细介绍整体课程安排.课程适用人群以及需要掌握的前置知识.通过 ...
- 重大升级!灵雀云发布全栈云原生开放平台ACP 3.0
云原生技术的发展正在改变全球软件业的格局,随着云原生技术生态体系的日趋完善,灵雀云的云原生平台也进入了成熟阶段.近日,灵雀云发布重大产品升级,推出全栈云原生开放平台ACP 3.0.作为面向企业级用户的 ...
- Slog71_选取、上传和显示本地图片GET !(微信小程序之云开发-全栈时代3)
ArthurSlog SLog-71 Year·1 Guangzhou·China Sep 12th 2018 ArthurSlog Page GitHub NPM Package Page 掘金主页 ...
- Python全栈-day1-day2-计算机基础
计算机基础 1.编程语言 语言即事物之间沟通的介质,编程语言即程序员与计算机沟通的介质.程序员通过编写计算机程序使得计算机能够按照人预先的期望执行相应的动作,从而达到在某种程度上解放人和实现人类难以实 ...
- 怎样成为全栈工程师(Full Stack Developer)?
"Facebook 工程师说 Facebook 只招 full stack engineer,那么 Facebook engineer 都是怎样的人啦."? 具体经验不重要,重要的 ...
- 全栈设计模式套餐MVVM, RESTful, MVC的历史探索
众所周知, 软件开发时遵守一个规范的设计模式非常重要, 学习行业内主流的design pattern往往能够为你节省大部分时间. 根据我2年的全栈经验, 在Web应用程序领域最流行的, 并且若干年内不 ...
- K8S全栈容器服务如何助力企业云化创新?
容器编排管理平台Kubernetes在实践两年多后,市场主导地位被正式确定,随着首批认证服务商的宣布,围绕着容器的应用编排部署服务已然成熟,Kubernetes开始在商业场景为企业创造价值.华为云在K ...
- 天翼云 RDS数据库操作
1.RDS数据库创建好之后点击RDS实例管理找到已下信息 官方文档 -1:http://www.ctyun.cn/help/qslist/567 官方文档 -2:http://www.ctyun.cn ...
- 联万物,+智能,为行业,华为云升级OceanConnect IoT全栈云服务
[中国,上海,2019年9月19日] 9月18日,在HUAWEI CONNECT 2019期间,华为云CTO张宇昕在华为云峰会上升级OceanConnect IoT全栈云服务,发布包括端.边.管.云. ...
随机推荐
- java——棋牌类游戏斗地主(webddz1.0)之一
这是本人最近一段时间写的斗地主的java代码,大体框架都实现了,主要缺少,AI的智能算法. 本版本是在singleddz3.0的基础上修改的,修改为了网络版本. 主要修改代码如下: package c ...
- Ollma本地部署Qwen2.5 14B(不使用docker)
部署机器硬件情况: 内存 :32GB 显卡 :3060 为什么不使用docker: 1.网上教程大多以docker为主 2.安装docker的时间太长,在等待的时候顺便尝试一下不用docker的部署 ...
- JPEG格式研究——(2)JPEG文件格式
JPEG文件除了图像数据之外,还保存了与图片相关的各种信息,这些信息通过不同类型的TAG存储在文件中. TAG JPEG通过TAG标记压缩书记之外的信息.所有的TAG都包含一个TAG类型,TAG类型大 ...
- MySQL底层概述—7.优化原则及慢查询
大纲 1.Explain概述 2.Explain详解 3.索引优化数据准备 4.索引优化原则详解 5.慢查询设置与测试 6.慢查询SQL优化思路 1.Explain概述 使用Explain关键字可以模 ...
- 试了下Cursor,感觉程序员工种危险了
大家好,我是汤师爷~ 今年8月份,AI 编程工具 Cursor 在开发者社区彻底火了.在 Twitter 平台上,Cloudflare 副总裁分享了一段视频,展示了一个令人震惊的案例.他年仅 8 岁的 ...
- WPS Pro 最新专业版,一站式办公
聊一聊 随着科技的进步,办公软件已经成为现代人工作和学习中不可或缺的重要工具.无论是在企业.学校还是个人使用中,办公软件都能够帮助我们提高工作效率.组织信息和进行沟通.在众多的办公套件中,微软的Off ...
- 腾讯技术岗位笔试&面试题(四)
说在前面 本篇文章是腾讯技术面试题目汇总第四篇. 后续将持续推出互联网大厂,如阿里,腾讯,百度,美团,头条等技术面试题目,以及答案和分析. 欢迎大家点赞关注转发. 原文链接:https://mp.we ...
- Centos更改SSH端口的方法
1,vi sshd vi /etc/ssh/sshd_config 2,添加PORT #AddressFamily any #ListenAddress 0.0.0.0 #ListenAddress ...
- NATS: 自定义服务 (Service)
使用 NATS 服务框架来创建服务会变得非常简单,基于 NATS 的服务框架,NAST 的客户端库可以更简单的构建.服务发现和监控服务.服务框架自动将所有的订阅归类到一个队列组中,提供构建基于层次化的 ...
- SprinfBoot报警告WARNING: An illegal reflective access operation has occurred
警告如图所示,该警告是因为jdk版本太高(我用的是10.0,据说9.0的也会这样),具体的原理还没有研究,它不影响项目的正常运行,但是看着很糟心有木有~~~~ 解决方案是把项目jdk降低到1.8及以下 ...