让AI“上天”“入地” 百度打开未来世界
将大模型和生成式AI送到普通人手里,让大模型触手可得。
从ChatGPT问世至今,已经过去2年。大模型和生成式AI带给人们的,除了无限畅想,还有理想与现实的差距。
即便AI手机、AI PC、AI汽车相继问世;即便随便打开一个大模型,让AI搜集一些资料、扩展一篇文章,已经“So Easy”,但大多数人仍觉得“不解渴”。用一句话总结,人民群众日益增长的AI理想与AI现实之间存在巨大矛盾。
那么,如果从专业角度,该如何评价过去两年大模型和生成式AI的发展?

“AI先生”李彦宏11月12日做了总结:“大模型最大的变化是基本消除了幻觉,回答问题的准确性大大地提升,变得可用、可被信赖。”同时,他认为智能体是AI应用的最主流形态,即将迎来爆发点。
消除幻觉的一个标志性产品是百度自研的iRAG,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,没有了幻觉,少了AI味儿。比如车企可以用iRAG生成宣传海报,还原真实的车型,再也不用画几十万去拍摄了。再比如马斯克在故宫旅游,不仅马斯克和故宫都能精准呈现,还能将人与场景非常自然地融合在一起。

作为国内大模型和生成式AI参与国际竞争的种子选手,百度在AI领域的进展值得关注。11月12日的百度世界大会上,李彦宏就重点介绍了百度大模型和生成式AI的当下进展以及未来空间。
陡峭增长,日调用量超15亿
北京上班的小徐,最近尝到了AI的甜头。因公司设计人员不多,且集中精力备战双十一,给领导做PPT的任务就落在他头上。可他只擅长文字工作,制作PPT是短板,心里犯怵。
经同事点拨,他知道了百度文库可以一键生成PPT,将发言稿全文上传后,就能生成个七七八八,再更换下配图、调整下文字图片大小即可。这可帮了他大忙,接到领导这样的任务,他再也不担心了。
百度文库的一键生成PPT功能背后正是百度文心大模型在发挥作用,小徐的每次使用,都需要调用一次大模型。除了制作PPT,用户每一次在百度App搜索智能体,每一次在文心一言问答,每一次用文心一言生成图文都会调用文心大模型。
除了C端用户,B端企业用户的数字人、智能客服等每一次服务用户,也都会调用一次文心大模型。这个调用量规模有多大呢?

李彦宏透露,截至11月初,百度文心大模型的日均调用量超15亿。这足以表明大模型已经深入用户日常生活。
更值得关注的是,日调用量增长的速度。李彦宏表示,百度内部曾讨论大模型的未来,“怎么才叫成了”。他当时说,如果文心一言大模型日均API调用量,一年之内涨10倍,从今年5月初的2亿到明年5月涨到20亿,就认为成了。因为这说明,大家是真的需要。
而目前,仅半年过去,就超过15亿,逼近20亿,这条超出百度预期的陡峭增长曲线,正是中国大模型应用大爆发的缩影。此外,文心一言用户规模达到4.3亿。
AI从量变迎来了质量时刻。

AI需求侧的爆发式增长,离不开供给侧的持续迭代。比如,百度研发了“理解—检索—生成”协同优化的检索增强技术。检索增强是大模型去幻觉,增强答案可靠性的主要路径,即用海量搜索信息指导内容生产,提高准确度。
再比如,服务程序员的智能代码助手文心快码升级至3.0版本,不仅功能开发、代码测试、问题修复等能力有所提升,还能实现多个智能体流水线协同,进一步提升程序员工作成效。
面向产业端,百度构建了文心大模型矩阵,包括ERNIE 4.0 Turbo等旗舰大模型、ERNIE Speed等轻量模型,以及基于基础模型生产的系列思考模型和场景模型,满足不同应用的需要。
当然,这更离不开百度AI先人一步出发。ALL in AI到李彦宏获评AI先生,百度几乎是国内唯一持续多年在AI领域做投入、开源、人才培养、生态共建的企业。10多年来,百度为人工智能和自动驾驶研发投入超过1700亿,聘请2024物理诺奖得主辛顿、吴恩达、Dario Amodei等全球科技领军人物,使得百度在大模型领域成为真正的扛旗者。
打开多个增长通道
AI正在重塑百度。除了大众知道的百度将旗下产品全部AI化以外,文心大模型还在至少三个维度为百度提供新的增长动力,由内到外改变这家公司。

- 一是智能体。这被李彦宏看作是AI原生时代,融合内容、信息、服务的新载体,类似PC时代的官网,移动时代的自媒体账号。与智能体紧密相关的是百度的搜索业务,以前用户百度搜索之后的结果页是官网或者其他SEO之后的内容,如今得到的更大概率会是智能体。
有何区别呢?以往,用户在百度App搜索比亚迪,通过首个结果进入比亚迪官网,自主浏览、查看。现在,搜索结果第一条是比亚迪智能体,变成了一个类似生成式AI的互动界面。用户可以问某款车型信息,多款车型对比,或者线下门店信息等,智能体可第一时间生成答案,告知用户。这种模式下,品牌与用户的链接更精准、高效。

在百度看来,搜索是智能体最大分发入口,智能体的爆发会使搜索成为AI时代的第一入口。数据显示,截至2024年11月,百度文心智能体平台已经吸引了15万家企业、80万名开发者入驻。
越来越多的智能体出现,将彻底改变原有的搜索体验,为百度赖以起家的搜索业务带来新的合作模式、盈利模式,打开新的增长通道。
- 二是百度智能云。近几个季度,百度智能云营收增长强劲、持续盈利,正是与大模型绑定的结果。因为大模型,解决了企业客户在AI时代的需求,带动了模型构建、算力消耗、接口调用等需求,并帮助企业客户催生了AI原生应用。
最初,云服务是解决企业客户信息化、数字化的成本问题、效率问题,更多属于CTO决策的范畴。后来,各个云服务厂商增加了行业解决方案,将云服务深入到企业经营管理各方面,涵盖了生产、销售、服务、管理等多个环节,帮助CEO解决问题。
在AI原生时代,企业客户迫切需要借助大模型工具,实现自身业务的重构。文心大模型与百度智能云结合,让企业客户应用AI、大模型的门槛降低,不仅仅是成本,还包括人员组织等多维度。
为实现这一步,百度在文心大模型旗舰版的3.5和4.0版本基础上,推出了5款轻量级/特定模型、AI原生应用开发工具AppBuilder等,帮助企业更低门槛、更高性价比的进入AI原生时代。
目前。百度智能云千帆大模型平台已帮助客户精调了3.3万个模型、开发了77万个企业应用。百度智能云也成为中国最大的大模型产业落地云,60%以上的央企,以及大量的民营企业,都在联合百度智能云进行AI创新。

- 三是自动驾驶。自动驾驶是百度面向未来,需要长期培养的增长点。在大模型的加持下,百度自动驾驶技术迭代更快,商业空间更大。今年,百度Apollo发布了支持L4级自动驾驶的大模型Apollo ADFM(Autonomous Driving Foundation Model),可以兼顾技术的安全性和泛化性,做到安全性高于人类驾驶员10倍以上,实现城市级全域复杂场景落地。
门槛越低,商业版图越大
纵观百度大模型近两年发展,明显朝着“上天”“入地”两个方向发展。
“上天”是不断优化大模型技术,持续迭代,提高竞争壁垒。不论从专利数量还是应用规模,百度在大模型领域都走在全球第一梯队。前不久,沙利文发布的《2024年全球AI生态全景概览》中,百度与谷歌、OpenAI等位于AI-Native Giant(AI巨头)同一序列。
“入地”是百度在不断降低大模型应用成本和门槛,让更多人触手可及。除了各种开放平台、开发工具,百度还亲自下场,为高校、企业培养了数百万的AI人才,让AI普及的速度越来越快。
本次百度世界大会再次体现了这两点。李彦宏在会上发布了两项新技术。

一是iRAG技术。回顾过去两年,李彦宏认为,文字层面的RAG(检索增强生产)已经做得很好基本让大模型消除了幻觉,即用户跟大模型一问一答,大概率能得到用户想要的答案。
但在图像等多模态方面,还存在较大幻觉,比如让大模型生成一张某历史人物在某景点的照片,还是存在“一眼假”的情况。要么是事实性错误,如人物张冠李戴,要么是画质“机器味儿”太重,缺乏真实感。
针对于此,百度开发了检索增强的文生图技术iRAG(image based RAG),将百度搜索的亿级图片资源跟基础模型能力相结合,可生成超真实的图片。这项技术拥有广泛应用场景,比如过往汽车品牌要拍一组海报大片,动辄要大几十万,应用百度iRAG,可立刻生成,且成本几乎等于零。
这是百度不断“上天”,向技术高峰攀爬的行动。当天,李彦宏还重点介绍了计划明年一季度上线的无代码工具“秒哒”,是百度不断降低大模型门槛,“入地”的体现。

“秒哒”可以说,满足了大多数人对于大模型和生成式AI应用的想象,即不需要懂编程,只需要说出想法,AI就能实现和生产所需要的应用。
具体如何实现?用户只需对准秒哒用中文描述需求,如需要搭建一场活动的在线报名系统,并上传活动时间、地点等信息。之后,秒哒会自动调取多个智能体、多个工具,实现程序的开发、BUG检查、视觉设计等工作,完成报名系统的开发。也就是说,只要有想法,你就可以心想事成,这也将迎来一个前所未有的只靠想法就能赚钱的时代——点子时代。

当一个复杂的事务变得简单化,将是其走向千家万户,占领大众市场的开始。比如微软的可视化桌面系统取代Dos系统,让普通人可以使用原本复杂的计算机。而“秒哒”的落地,意味着将开启一个全新的点子时代,这才是AI真正的价值所在。
“秒哒”正是这样一个工具,让每个人都变成程序员,将极大提高AI原生应用的生成效率,带来更多智能体,进一步繁荣AI生态。而百度作为这一生态的主要创建者,未来的获益无需多言。
【结束语】
作为全世界最成功的快消品之一,可口可乐的成功有其独特配方、成功的营销,还有重要的一条,即建立了全球最大的饮料分销系统。2019年其已在200多个国家建立超30000万个销售网点,覆盖了全球约60%的零售店。这样的结局是,世界各地的人们触手可得可口可乐。
当前的百度正在做类似的事情,将大模型和生成式AI送到普通人手里,让大模型触手可得。AI的普及和商业化自此打开,百度更广阔的未来世界也被打开。
让AI“上天”“入地” 百度打开未来世界的更多相关文章
- python预课06 基于百度大脑AI的人工智能,百度颜值检测,语音合成与识别
百度大脑: 如下图,百度开放了许多人工智能接口可以使用,先注册一个百度大脑账户 点击创建应用,选择需要的功能,如人脸识别,语音识别等 点击查看文档,可以查看功能对应语言的方法,参数.首先在CMD命令下 ...
- AI+教育落地,百度大脑如何让校园更智能?
人工智能作为影响社会底层技术革命逐渐向传统行业渗透,“AI+”已经替代“互联网+”成为创业创新的新引擎,出人意料的是,在AI在教育业的率先落地并且相当火爆. 现在,人工智能教育已成为从业者心目中的“教 ...
- 发布AI芯片昆仑和百度大脑3.0、L4自动驾驶巴士量产下线,这是百度All in AI一年后的最新答卷...
机器之心报道,作者:李泽南. 去年的 7 月 5 日,百度在北京国际会议中心开办了首届「AI 开发者大会」.在会上,百度首次喊出了「All in AI」的口号.一年的时间过去了,今天在同样地点举行的第 ...
- bootstarp-fileinput上传 火狐防止拖入文件直接打开新页面
今日接触了一个bootstarp的上传插件,发现其功能很强大,具体名为bootstarp-fileinput,需要的可以自行度一下. 然后当使用其拖拽功能时,其他浏览器没出毛病,独火狐浏览器拖入时直接 ...
- 综合5项百度大脑AI技术,快速构建智能交通方案
一.整体方案:思路:整合百度AI功能,通过百度AI解决.优化在公交运行过程中遇到的运营.管理.安全等方面的问题.具体如下: 安全方面:通过驾驶员检测+语音合成,对驾驶员状态进行实时检测,跟踪,告警. ...
- 百度AI开发平台简介
AIstudio https://aistudio.baidu.com/aistudio/index 关于AI Studio AI Studio是基于百度深度学习平台飞桨的一站式AI开发平台,提供在线 ...
- ASP.NET MVC WebApi 返回数据类型序列化控制(json,xml) 用javascript在客户端删除某一个cookie键值对 input点击链接另一个页面,各种操作。 C# 往线程里传参数的方法总结 TCP/IP 协议 用C#+Selenium+ChromeDriver 生成我的咕咚跑步路线地图 (转)值得学习百度开源70+项目
ASP.NET MVC WebApi 返回数据类型序列化控制(json,xml) 我们都知道在使用WebApi的时候Controller会自动将Action的返回值自动进行各种序列化处理(序列化为 ...
- 一文解读AI芯片之间的战争 (转)
2015年的秋天,北京的雨水比往年要多些,温度却不算太冷.这一年里,年仅23岁的姚颂刚刚拿到清华大学的毕业证书;32岁的陈天石博士毕业后已在中科院计算所待了整整8年;而在芯片界摸爬滚打了14年的老将何 ...
- 谁能真正替代你?AI辅助编码工具深度对比(chatGPT/Copilot/Cursor/New Bing)
写在开头 这几个月AI相关新闻的火爆程度大家都已经看见了,作为一个被裹挟在AI时代浪潮中的程序员,在这几个月里我也是异常兴奋和焦虑.甚至都兴奋的不想拖更了.不仅仅兴奋于AI对于我们生产力的全面提升,也 ...
- 新鲜出炉的百度js面试题
(文章是从我的个人主页上粘贴过来的,大家也可以访问我的主页 www.iwangzheng.com) 最近两位同学入职百度,带回来的笔试题基本上毫无悬念,不过有一个小题看到让人忍不住笑出声来,真的很无聊 ...
随机推荐
- java--Hibernate框架基础
SSH框架: Struts框架, 基于mvc模式的应用层框架技术! Hibernate, 基于持久层的框架(数据访问层使用)! Spring, 创建对象处理对象的依赖关系以及框架整合! Hiberna ...
- 关于模考 T2
今天做到模考的 T2,太有意思了. 题目描述 最近,Bob 学习了整数除法.受到这一神圣知识的启发,他决定进一步了解满足某些整除条件的正整数数组.具体来说,Bob 将一个数组 \(a=a_1,a_2, ...
- ICEE-家电-电饭锅原理: MCU交互与程控(弱电)+强电(NTC温控+继电器+电阻发热管)
客户需求与竞争情报.董事会决策. 市场调研.试制预研.商业计划. 组织管理.人才招聘培训. 样品与采购.研发生产与量产. 市场营销与推广.客户服务与反馈. firmware.软件.电路硬件.机械与材料 ...
- Linguistics-English-Happy Labor Day September 2, 2024
Celebrating the many contributions workers have made to America's strength, prosperity and well-bein ...
- SciTech-EECS-MCU/CPU: DMA(直接内存访问): 开始时由CPU进行协调配对+传数据时DMA+结束时触发硬件中断通知MCU/CPU并解除配对
MEM可以是: MCU/CPU自带的内存: 容量由"芯片设计师"根据常用场景统计确定大小. 常能满足大多数用途. MCU/CPU的外部内存: 容量由"硬件设计师" ...
- 标准结构篇:9.1)JB5054-2000流程
本章目的:了解这个最基础的产品设计研发流程标准 1.前言 JB5054-2000流程是2000年的研发流程,如果你自家公司的研发流程环节或提交资料比这个还少,就真的要考虑一下,到底是什么地方漏了. 2 ...
- unity文件夹复制
如果是编辑器不使用运行时的话,直接使用UnityEditor下的API即可 FileUtil.CopyFileOrDirectory 如果是运行时 /// <summary> /// 文件 ...
- CF542C 解题分析
1 题目大意 1.1 题目翻译: 给定一个值域为 \([1,n]\) 的函数 \(f(x)\),让你求出最小的 \(k\),其中 \(k\) 满足 \(f^{(2k)}(x) = f^{(k)}(x) ...
- JavaSE-跳转语句(return,break,continue,goto,throw)
跳转语句 Java 中的跳转语句允许你控制程序的流程,主要有以下几种: return:从方法返回一个值,并退出当前方法. break:跳出当前的循环(for.while 或 do-while). co ...
- [题解]AtCoder Beginner Contest 380(ABC380) A~F
A - 123233 照题意统计即可. 点击查看代码 #include<bits/stdc++.h> using namespace std; string s; map<char, ...