昨天,AI 圈又迎来一位重量级选手,智谱开源的新一代旗舰模型——GLM-4.5。

我知道,你可能下意识就想说:“哦,又一个?”

这其实不是智谱第一次、第一时间开源自家最先进的大模型了,他们似乎总觉得好东西就该拿出来分享,每次都是掏空“家底儿”式开源。这次更是一口气开源了两个模型:GLM-4.5 和它的“青春版” GLM-4.5-Air,模型权重还是最宽松的 MIT 协议。

GitHub 地址:github.com/zai-org/GLM-4.5

Hugging Face 地址:huggingface.co/zai-org/GLM-4.5

当所有人的目光都还盯着大模型评测排行榜时,智谱却反其道而行之,仿佛在说:“卷排名多累啊,我只想安安静静做个能干活的好同志。

一、有实力登顶,但更在乎你的体验

要挑战“刷榜”文化,首先得有能上榜的实力。

这次,智谱官方选择了最具代表性的 12 个评测数据集,从 MMLU Pro 到 AIME 24,GLM-4.5 直接斩获全球第三、国产第一、开源第一的成绩。

但智谱的目标并不止于榜单分数。他们坦言:“榜单分数看看就好,真实体验才是王道。” 如今,顶级大模型的跑分差距都不是很大,与其比拼分数,不如拉到真实、复杂的应用场景里一较高下,来得痛快!

为此,智谱团队直接发起了一场硬核“蒙眼乱斗”:让 GLM-4.5 与业内顶尖模型(Claude-4-Sonnet、Kimi-K2、Qwen3-Coder)匿名挑战 52 道真实编程任务。

结果显示,GLM-4.5 在开源模型中展现出不俗的竞争力,尤其在工具调用可靠性和任务完成度方面表现突出。虽然与 Claude-4-Sonnet 尚有差距,但在多数场景下已具备“平替”能力。

为保证评测的透明与公正,智谱还开源了全部 52 道题目和 Agent 运行轨迹。

数据集:huggingface.co/datasets/zai-org/CC-Bench-trajectories

二、用一半资源,做翻倍的事

众所周知,模型越大能力越强,但更高效的工程实力同样重要。GLM-4.5 的卓越表现,正是得益于其工程优化和出色的参数效率。GLM-4.5 系列均采用先进的混合专家(MoE)架构:

  • GLM-4.5 总参数为 355B,激活参数为 32B
  • GLM-4.5-Air 总参数为 106B,激活参数为 12B

GLM-4.5 的总参数量仅为 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3,却在多项权威基准测试中表现得更为出色。

如果你是个人开发者,苦于无法运行万亿参数的大模型?不用担心。智谱还提供了远低于主流模型 API 服务的定价:

  • 输入仅 0.8 元/百万 tokens
  • 输出仅 2 元/百万 tokens

这个定价,让个人开发者、初创企业也能毫无压力地使用最前沿的旗舰大模型。接入模型同样非常简单,只需几行代码即可快速上手:

from zhipuai import ZhipuAI

client = ZhipuAI(api_key="YOUR_API_KEY") # 替换成你的API Key

response = client.chat.completions.create(
model="glm-4.5", # 或者 glm-4.5-air
messages=[
{"role": "user", "content": "你好,请你帮我写一个 HelloGitHub 网站。"},
],
thinking={"type":"enabled"}
)
print(response.choices[0].message.content)

三、原生智能体,一模多能

说回“干活儿”,GLM-4.5 可不是只会聊天的“嘴强王者”,而是个正儿八经的“全栈大神”。

GLM-4.5 系列不是仅仅把多个能力简单拼在一起,而是实现了原生智能的深度融合。它在工具调用、网页浏览、软件工程、前端编程等领域都做了专项优化,既兼容 Claude Code 等代码智能体,也支持通过工具调用接口灵活扩展到各种智能体应用。

这种“一模多能”的原生 Agent 能力,让 GLM-4.5 能够胜任从前端 UI 设计、后端数据库管理到复杂的交互动画制作等全栈开发任务。

能用的搜索网站

提示词:做一个 Google 搜索网站。

制作 PPT

提示词:帮我做一份《WAIC Geoffrey Hinton 演讲要点》的 PPT

四、写在最后

GLM-4.5 的发布,不只是又一个强大的开源模型问世,更代表了一种务实、高效、以应用为核心的理念。它不炫耀难懂的技术原理,也不执着于榜单虚名,唯一的目标就是:在你需要它的时候,能让你由衷感叹一句:“真不错,把活儿干完了!”

目前,Z.ai 已经免费开放「满血版 GLM-4.5」,快去体验这个“真正能干活”的强大 AI 帮手吧!

开源新旗舰 GLM-4.5:不想刷榜,只想干活儿的更多相关文章

  1. 2015年十大热门Android开源新项目

    2015年十大热门Android开源新项目 2015 即将结束,又到了大家喜闻乐见的年终盘点时刻啦,今天给大家盘点一下 2015 年 Android 开发领域新出现的 10 大热门开源项目.数据来自于 ...

  2. 2018 dnc 公司案例大全,迎接.NET Core开源新时代

    2018 dnc 公司案例大全,迎接.NET Core开源新时代   dnc = .NET Core.dotnet Core dnc是微软新一代主力编程平台,开源.免费.跨平台.轻量级.高性能,支持L ...

  3. 自动驾驶汽车数据不再封闭,Uber 开源新的数据可视化系统

    日前,Uber 开源了基于 web 的自动驾驶可视化系统(AVS),称该系统为自动驾驶行业带来理解和共享数据的新方式.AVS 由Uber旗下负责自动驾驶汽车研发的技术事业群(ATG)开发,目前该系统已 ...

  4. 叮咚recovery——想刷什么包就刷什么包

    我手机vivo s11t,我之前试过刷机,刷过很多包,发现只有官网下载的相同版本的固件包可以成功刷入,其他的任何的包都不行,我弟弟的手机vivo x3L,遇见和我一样的情况,他想刷小米的MIUI,开始 ...

  5. 想进大厂,想收获高薪offer,资深猎头告诉你怎么做......

    其实吧,面试官面试的时候主要就看三个方面:现在能力如何,未来潜力如何,人品如何. 第一个因素是最重要的,因为后面两个因素有太多的人为判断因素,无法量化.所谓的面试准备,"现在能力如何&quo ...

  6. Excel只想显示一部分日期,怎样把其余部分隐藏起来?

      问题:只想显示一部分日期,怎样把其余部分隐藏起来? 方法:分列 Step1:选中需要修改的单元格——数据——分列. Step2:固定宽度——点击下一步. Step3:在建立分列处单击鼠标(若想取消 ...

  7. 重磅!GitHub官方开源新命令行工具

    近日,GitHub 发布命令列工具 (Beta) 测试版,官方表示,GitHub CLI提供了一种更简单.更无缝的方法来使用Github.这个命令行工具叫做GitHub CLI,别名gh. 现在,你就 ...

  8. Google开源新的 RISC-V IP核: “BottleRocket”(https://cnrv.io)

    BottleRocket是RISCV RV32IMC的实现. Google在2017年11月29日在Github上非官方开源了BottleRocket的RTL代码,同时表明这并不是一个官方支持的Goo ...

  9. 想晋级高级工程师只知道表面是不够的!Git内部原理介绍

    本文由云+社区发表 作者:腾讯工蜂用户:王二卫 从不一样的视角了解git,以便更好的使用git 一.git & git 版本库认识 git 是一个内容寻址的文件系统,其核心部分是一个简单的键值 ...

  10. [think]关于个人发展值得记住的一些建议 听别人的话,即使你不想听 不要只做不想 成功不能被复制,但失败总在不停复制。看看别人是怎么倒下的,你可以更早地成功

    [think]关于个人发展值得记住的一些建议 偶然看到一篇采访周爱民的文章,里面的一些建议虽然朴实无华,却感觉很有道理,特此记录: 记者:对于程序员的技术发展和职业规划能否给大家一些建议呢?----- ...

随机推荐

  1. 递归神经网络 RNN 原理(下)

    基于对 RNN 的初步认识, 还是先回顾一下它核心的步骤: (1) words / onehot vectors : \(x^{(t)} \in R^{|v|}\) **(2) word embedd ...

  2. JDK安装及IDE安装编辑

    1.下载及安装JDK 下载地址:http://www.oracle.com/technetwork/java/javase/downloads/index.html 环境变量的系统变量填上如下: 变量 ...

  3. 实现一个前端动态模块组件(Vite+原生JS)

    1. 引言 在前面的文章<使用Vite创建一个动态网页的前端项目>中我们实现了一个动态网页.不过这个动态网页的实用价值并不高,在真正实际的项目中我们希望的是能实现一个动态的模块组件.具体来 ...

  4. odoo14忘记后台密码解决办法

    直接在数据库里面修改: # 更新密码(假设用为 id 为 1,可通过 SELECT 进行查询) UPDATE res_users SET password_crypt='your new passwo ...

  5. MySQL修改表和字段的字符集和排序规则

    摘要:通过设置表的字符集和排序规则,解决MySQL查询时不区分字母大小写.插入时不支持特殊字符的问题.   关于MySQL查询时不区分字母大小写.插入时不支持特殊字符的问题,只有修改表的字符集和排序规 ...

  6. Spring注解之@Value注解读取配置文件属性和设置默认值

    概述   在Spring 组件中,通常使用@Value注解读取 properties 文件的配置值.但如果在配置文件或启动参数中未指定对应的参数值,则项目在启动的时候会抛出异常,导致服务启动失败,异常 ...

  7. 在 Mac 系统上使用 docker

    1.通过 brew 安装 docker client brew install docker 2.通过 brew 安装 colima(开源的轻量级容器,可以在 linux 和 mac 上运行) bre ...

  8. Caddy自编译

    转载自我的个人博客:Caddy自编译 配置 Golang 环境 需要先配置 Golang 环境:Download and install - The Go Programming Language w ...

  9. 运用servlet来实现文件的上传与下载

    文件的上传: 1 /** 2 * 1. 文件的上传必须使用post请求,因为get请求的数据是在 url地址上, 但是url地址 3 * 能够携带数据大小是有限:2k 4k 4 * 2. 文件上传必须 ...

  10. 边学边练,福利无限 —— OceanBase DBA 实战营(第一季)火热进行中!

    首先为大家推荐这个 OceanBase 开源负责人老纪的公众号 "老纪的技术唠嗑局",会持续更新和 OceanBase 相关的各种技术内容.欢迎感兴趣的朋友们关注! 活动背景 20 ...