Manus,没有秘密「注解版」

近来Manus走红,「争论」不断,我也在前文《Manus爆火,是硬核还是营销?》中阐述过自Manus发布后,行业讨论以及开源复刻的信息,以及我们如何结合蚂蚁图计算(TuGraph)技术,实践Graph Manus的方法思路。
昨天,明浩老师在他的播客「屠龙之术」发布了「Manus,没有秘密 - 70页PPT解读AI Agent」,分享了AI Agent的定义、Manus实现逻辑等非常有深度的观点,并无私地共享了这份PPT。我个人看完后大呼过瘾,相信Agent建设者也能从中找到诸多共鸣。我这里结合了个人的理解对其做了简单的释义和备注,姑且称之为「注解版」吧,内容实在太好,忍不住向大家及时分享。

1. 核心叙事

「注」:L1代表案例有ChatGPT,Claude等一系列大模型,从文本生成模型到多模态模型。L2代表案例有GPT-o1、DeepSeek-R1等一众推理模型,以及早期的ReAct、CoT、ToT等智能体思维链探索。L3代表案例有Cursor、Devin、Manus等,但离大家心中真正的Agent可能还有一点距离。至于L4和L5,具体形态如何,可能需要脑补了。

「注」:这些问题很值得深思,比如怎么到L1的,是Scaling Law吗?怎么到L2的,只是从快思考模式到慢思考模式吗?

「注」:通用的本质是去特化。模型能力不再受限于数据格式,而是规模;推理能力不再受限于规则,而是奖励。智能体能力不再受限于流程结构(Workflow),而是简约设计(Less is More)。





「注」:DeepSeek-R1技术报告刚出来时,诸多反应皆是「大道至简」,工程人士和架构师的最爱。

「注」:那问题来了,技术人员眼中的「Aha Moment」应该是什么样的呢?

「注」:那么「提示工程」和「Workflow」到底是不是「弯路」,可能事情并非那么绝对。不过L2让我们看到了「提示工程」简化的曙光,L3也让我们看到了「Workflow」简化的可能。

「注」:事物的初期一定是不完美的,但「取法乎上,得乎其中」,想象DeepSeek-R1的训练成本的逻辑,其实是一个道理。这里「看见」应该有几层含义:一是推理过程可观测可干预,这是个产品体验问题;另一个是推理要白盒化,其实就是「开源」。
2. 定义Agent

「注」:这里的嘲讽值直接拉满了,哈哈。

「注」:其实「套壳」这个词已经「骂」得很委婉了,写过代码的应该都听过这句话:「你这不就是包了个皮么」,自己体会【手动狗头】。做模型训推的看做模型应用的,和当年做基础技术的看做Web服务的可能是同一拨人,这种行业技术「鄙视链」一直存在。但是很多人忘了做模型训推和基础技术到底是为谁服务的?吃饭砸锅,这种事屡见不鲜了。

「注」:不管是传统软件工程,还是大模型软件工程,产品力永远有价值!



「注」:在「看见」这一条上,Manus的产品力着实令人惊艳。
3. 实现原理


「注」:做出Agent千篇一律,做好Agent万里挑一。直观上,推理模型提升了任务拆解能力,但只靠推理模型并不一定是最终答案。MCP提供的是标准,但标准的普及和适配仍需要时间。

「注」:去年Workflow几乎成为Agent的标配,但也成为了Agent通用化的软肋。我们也看到一些变通的工作,比如自动工作流生成(AFlow)。未来,是否应该是自动Agent生成(无Workflow)。

「注」:「Less Structure, More Intelligence」,这是极具Unix哲学的理念。

「注」:再回头看,「虚拟机」和传统意义的工具(搜索、浏览器、IDE)的差异是什么?想一想PC时代的人机关系:它是不是一直都是连接这些工具和人的「MCP」?当然,现在叫ACI(Agentic Compute Interface)。


「注」:打了榜,仍有质疑。不打榜,连牌桌都上不去。


「注」:先试被「惊」到,然后打开YouTube,试了一下「K」和「3」……


「注」:AHPU,这应该是智能体时代的「用户停留时间」了。


「注」:所以大模型时代的「杀手级应用」出现的时刻,也是大模型的「摩尔定律」诱发质变的时刻。更小的模型、更快的性能、更优的结果,历史经验告诉我们创新就是这么「既要也要还要」产生的。

「注」:从「Use Browser」到「Not In Browser」,再到「Browser In Cloud」。这产品思维也是没谁了!

「注」:虚拟机提供了两个重要的技术价值:「错误容忍(Fault Tolerance)」和「无状态化(Stateless)」。

4. 使用体验




「注」:引导提示词输出金句SVG是「继刚」的专长,Manus将此效果进一步放大了。








5. 暴论输出

「注」:很好,行业里的热门词基本上都在这了。

「注」:未经校验的预测永远都会被怀疑,没毛病。

「注」:「这不就是XXX么」的潜台词是「我X,这我也能搞啊」,然后是拍一下大腿「为啥我没这么搞」,再然后就是「好事怎么让你给占了」,最后含泪吞下一片「奥美拉唑」。


「注」:反正不是在套壳,就是在套壳的路上,你套我套大家套,挣钱嘛,不寒碜。

「注」:从早上200星开始关注,刷着劲宇的朋友圈(PS:也是AFlow的作者),眼看着一天破万星,社区热闹得感觉过了个小年。当然OWL也很错了,现在也破万星了。


「注」:有时给人的体感就是这样,「Money Out, Infra In; Training In, LLM Out」,好像大模型时代的创新只有大模型了,是不是还是技术鄙视链在作祟?

「注」:简单说就是「我能接受你笨点,但别让我手把手教」,想想你带不动的「队友」是不是也酱紫?


「注」:先不说模型能不能做到,如果这个世界「丰富」到只有模型,你觉得会是好事吗?



「注」:你的大厂会跟进,但你的老板还真不一定哈哈……






「注」:无意义的争论纯粹是浪费时间。

「注」:看「Richard Lin」直播Manus时,经常会说「我这是不是在PUA他」。看看最近热门的「PUA提示词」,动不动就是「干得好奖励十个亿,干不好你老婆就没命」。人和AI的博弈,才刚刚开始。


「注」:2025,与君同行!
参考资料
- Manus没有秘密.pdf
Manus,没有秘密「注解版」的更多相关文章
- Mditor 发布「桌面版」了 - http://mditor.com
简单说明 Mditor 最早只有「组件版」,随着「桌面版」的发布,Mditor 目前有两个版本: 可嵌入到任意 Web 应用的 Embed 版本,这是一桌面版的基础,Repo: https://git ...
- Linux 小知识翻译 - 「Linux」和「发行版」之间的关系
「Linux」本来指的仅仅是内核.5年之前大多都是这么认为的,但是最近不这么说了. 最近一般都说「Linux」是个 OS,这里的OS,不仅仅是内核,而是指电脑的整体环境(除了内核,还包括一些外围的软件 ...
- 从开发属于你自己的第一个 Python 库,做一名真正的程序员「双语版」
你好,我是悦创.之前我在 CSDN 编写了一篇开发 Python 库的教程,有人加我提问到的一些问题,我来更新一下这篇文章:https://blog.csdn.net/qq_33254766/arti ...
- 使用 Redis 如何实现查询附近的人?「视频版」——面试突击 003 期
面试问题 Redis 如何实现查询附近的人? 涉及知识点 Redis 中如何操作位置信息? GEO 底层是如何实现的? 如何在程序实现查询附近的人? 在实际使用中需要注意哪些问题? 视频答案 视频地址 ...
- 分享开源 Markdown 编辑器 Mditor 的「桌面版」
简单说明 Mditor 最早只有「组件版」,随着「桌面版」的发布,Mditor 目前有两个版本: 可嵌入到任意 Web 应用的 Embed 版本,这是一桌面版的基础,Repo: https://git ...
- 在Windows上安装「算法 第四版」组件
这篇文档将向你介绍如何在Windows系统上安装本书将用到的Java开发环境,同时我们也提供了一个手把手的.使用我们提供的DrJava工具或者用命令行来创建.编译和运行你的第一个Java程序的手册,这 ...
- Spring Boot 实战 —— MyBatis(注解版)使用方法
原文链接: Spring Boot 实战 -- MyBatis(注解版)使用方法 简介 MyBatis 官网 是这么介绍它自己的: MyBatis 是一款优秀的持久层框架,它支持定制化 SQL.存储过 ...
- fir.im Weekly - 如何打造 Github 「爆款」开源项目
最近 Android 转用 Swift 的传闻甚嚣尘上,Swift 的 Github 主页上已经有了一次 merge>>「Port to Android」,让我们对 Swift 的想象又多 ...
- 更新日志 - fir.im「高级统计」功能上线
距离 2016 年到来只剩 10 个日夜,fir.im 也准备了一些新鲜的东西,比如「高级统计」功能和「跳转应用商店」功能,帮助你更好地管理.优化应用,欢迎大家试用反馈:) 新增高级统计功能 这次更新 ...
- 如何对抗 WhatsApp「蓝色双勾」-- 3 个方法让你偷偷看讯息
WhatsApp 强制推出新功能「蓝色双勾 (✔✔)」 ,让对方知道你已经看过讯息.一众用户反应极大,因为以后不能再藉口说未看到讯息而不回覆.究竟以后 WhatsApp 是否真的「更难用」? 幸好还有 ...
随机推荐
- Javadoc 使用详解
很多程序对Javadoc都不重视,认识不到Javadoc的作用,很多人都是这样认为的:"我只要写好功能就够了,写Javadoc太浪费时间,也没啥作用,还不如用写Javadoc的时间再多些个功 ...
- java - Powermock-Failed to transform class with name...ArrayIndexOutOfBoundsException: 3
I'm trying to run a junit test. i'm using: junit 4.10,easymock 3.0,powermock-core 1.4.10 (uses javas ...
- Qt/C++音视频开发75-获取本地有哪些摄像头名称/Qt内置函数方式
一.前言 在需要打开本地摄像头的场景中,有个需求绕不开,那就是如何获取本地有哪些摄像头设备名称,这样可以提供下拉框给用户选择,不然你让用户去填设备名,你觉得用户会知道是啥,他会操作吗?就算你提供了详细 ...
- Qt/C++视频监控安卓版/多通道显示视频画面/录像存储/视频播放安卓版/ffmpeg安卓
一.前言 随着监控行业的发展,越来越多的用户场景是需要在手机上查看监控,而之前主要的监控系统都是在PC端,毕竟PC端屏幕大,能够看到的画面多,解码性能也强劲.早期的手机估计性能弱鸡,而现在的手机性能不 ...
- Qt编写安防视频监控系统21-摄像机管理
一.前言 摄像机管理在整个系统中是数据库部分最核心的,只有添加了摄像机信息,才能进行加载,生成树状列表等,摄像机表信息的字段内容改过好几次,有可能后期还需要修改,目前摄像机表信息主要包括摄像机编号.摄 ...
- FFmpeg命令行选项
如下内容取自官网文档"Documentation-ffmpeg"和"Documentation-ffmpeg-all" 1 帮助信息 如下选项适用于 ff 系列 ...
- 【Java 温故而知新系列】基础知识-03 基本类型对应之包装类
1.包装类都有哪些? 基本类型都有对应的包装类型,这些包装类提供了一种面向对象的方式来处理基本数据类型,允许它们被用于需要对象的场景,如集合框架.泛型等. 对应关系: 基本类型 包装类型 boolea ...
- CDS标准视图:催款级别分配 I_DunningLevelDistribution
视图名称:催款级别分配 I_DunningLevelDistribution 视图类型:参数视图 视图代码: 点击查看代码 @AbapCatalog.sqlViewName: 'IFIDUNLVLDI ...
- CDS标准视图:设备描述 I_EquipmentText
视图名称: I_EquipmentText 视图类型:基础视图 视图代码: 点击查看代码 @EndUserText.label: 'Equipment - Text' @ObjectModel.dat ...
- nginx平台初探-1
初探nginx架构(100%) 众所周知,nginx性能高,而nginx的高性能与其架构是分不开的.那么nginx究竟是怎么样的呢?这一节我们先来初识一下nginx框架吧. nginx在启动后,在un ...