将大模型和生成式AI送到普通人手里,让大模型触手可得。

从ChatGPT问世至今,已经过去2年。大模型和生成式AI带给人们的,除了无限畅想,还有理想与现实的差距。

即便AI手机、AI PC、AI汽车相继问世;即便随便打开一个大模型,让AI搜集一些资料、扩展一篇文章,已经“So Easy”,但大多数人仍觉得“不解渴”。用一句话总结,人民群众日益增长的AI理想与AI现实之间存在巨大矛盾。

那么,如果从专业角度,该如何评价过去两年大模型和生成式AI的发展?

“AI先生”李彦宏11月12日做了总结:“大模型最大的变化是基本消除了幻觉,回答问题的准确性大大地提升,变得可用、可被信赖。”同时,他认为智能体是AI应用的最主流形态,即将迎来爆发点。

消除幻觉的一个标志性产品是百度自研的iRAG,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,没有了幻觉,少了AI味儿。比如车企可以用iRAG生成宣传海报,还原真实的车型,再也不用画几十万去拍摄了。再比如马斯克在故宫旅游,不仅马斯克和故宫都能精准呈现,还能将人与场景非常自然地融合在一起。

作为国内大模型和生成式AI参与国际竞争的种子选手,百度在AI领域的进展值得关注。11月12日的百度世界大会上,李彦宏就重点介绍了百度大模型和生成式AI的当下进展以及未来空间。

陡峭增长,日调用量超15亿

北京上班的小徐,最近尝到了AI的甜头。因公司设计人员不多,且集中精力备战双十一,给领导做PPT的任务就落在他头上。可他只擅长文字工作,制作PPT是短板,心里犯怵。

经同事点拨,他知道了百度文库可以一键生成PPT,将发言稿全文上传后,就能生成个七七八八,再更换下配图、调整下文字图片大小即可。这可帮了他大忙,接到领导这样的任务,他再也不担心了。

百度文库的一键生成PPT功能背后正是百度文心大模型在发挥作用,小徐的每次使用,都需要调用一次大模型。除了制作PPT,用户每一次在百度App搜索智能体,每一次在文心一言问答,每一次用文心一言生成图文都会调用文心大模型。

除了C端用户,B端企业用户的数字人、智能客服等每一次服务用户,也都会调用一次文心大模型。这个调用量规模有多大呢?

李彦宏透露,截至11月初,百度文心大模型的日均调用量超15亿。这足以表明大模型已经深入用户日常生活。

更值得关注的是,日调用量增长的速度。李彦宏表示,百度内部曾讨论大模型的未来,“怎么才叫成了”。他当时说,如果文心一言大模型日均API调用量,一年之内涨10倍,从今年5月初的2亿到明年5月涨到20亿,就认为成了。因为这说明,大家是真的需要。

而目前,仅半年过去,就超过15亿,逼近20亿,这条超出百度预期的陡峭增长曲线,正是中国大模型应用大爆发的缩影。此外,文心一言用户规模达到4.3亿。

AI从量变迎来了质量时刻。

AI需求侧的爆发式增长,离不开供给侧的持续迭代。比如,百度研发了“理解—检索—生成”协同优化的检索增强技术。检索增强是大模型去幻觉,增强答案可靠性的主要路径,即用海量搜索信息指导内容生产,提高准确度。

再比如,服务程序员的智能代码助手文心快码升级至3.0版本,不仅功能开发、代码测试、问题修复等能力有所提升,还能实现多个智能体流水线协同,进一步提升程序员工作成效。

面向产业端,百度构建了文心大模型矩阵,包括ERNIE 4.0 Turbo等旗舰大模型、ERNIE Speed等轻量模型,以及基于基础模型生产的系列思考模型和场景模型,满足不同应用的需要。

当然,这更离不开百度AI先人一步出发。ALL in AI到李彦宏获评AI先生,百度几乎是国内唯一持续多年在AI领域做投入、开源、人才培养、生态共建的企业。10多年来,百度为人工智能和自动驾驶研发投入超过1700亿,聘请2024物理诺奖得主辛顿、吴恩达、Dario Amodei等全球科技领军人物,使得百度在大模型领域成为真正的扛旗者。

打开多个增长通道

AI正在重塑百度。除了大众知道的百度将旗下产品全部AI化以外,文心大模型还在至少三个维度为百度提供新的增长动力,由内到外改变这家公司。

  • 一是智能体。这被李彦宏看作是AI原生时代,融合内容、信息、服务的新载体,类似PC时代的官网,移动时代的自媒体账号。与智能体紧密相关的是百度的搜索业务,以前用户百度搜索之后的结果页是官网或者其他SEO之后的内容,如今得到的更大概率会是智能体。

有何区别呢?以往,用户在百度App搜索比亚迪,通过首个结果进入比亚迪官网,自主浏览、查看。现在,搜索结果第一条是比亚迪智能体,变成了一个类似生成式AI的互动界面。用户可以问某款车型信息,多款车型对比,或者线下门店信息等,智能体可第一时间生成答案,告知用户。这种模式下,品牌与用户的链接更精准、高效。

在百度看来,搜索是智能体最大分发入口,智能体的爆发会使搜索成为AI时代的第一入口。数据显示,截至2024年11月,百度文心智能体平台已经吸引了15万家企业、80万名开发者入驻。

越来越多的智能体出现,将彻底改变原有的搜索体验,为百度赖以起家的搜索业务带来新的合作模式、盈利模式,打开新的增长通道。

  • 二是百度智能云。近几个季度,百度智能云营收增长强劲、持续盈利,正是与大模型绑定的结果。因为大模型,解决了企业客户在AI时代的需求,带动了模型构建、算力消耗、接口调用等需求,并帮助企业客户催生了AI原生应用。

最初,云服务是解决企业客户信息化、数字化的成本问题、效率问题,更多属于CTO决策的范畴。后来,各个云服务厂商增加了行业解决方案,将云服务深入到企业经营管理各方面,涵盖了生产、销售、服务、管理等多个环节,帮助CEO解决问题。

在AI原生时代,企业客户迫切需要借助大模型工具,实现自身业务的重构。文心大模型与百度智能云结合,让企业客户应用AI、大模型的门槛降低,不仅仅是成本,还包括人员组织等多维度。

为实现这一步,百度在文心大模型旗舰版的3.5和4.0版本基础上,推出了5款轻量级/特定模型、AI原生应用开发工具AppBuilder等,帮助企业更低门槛、更高性价比的进入AI原生时代。

目前。百度智能云千帆大模型平台已帮助客户精调了3.3万个模型、开发了77万个企业应用。百度智能云也成为中国最大的大模型产业落地云,60%以上的央企,以及大量的民营企业,都在联合百度智能云进行AI创新。

  • 三是自动驾驶。自动驾驶是百度面向未来,需要长期培养的增长点。在大模型的加持下,百度自动驾驶技术迭代更快,商业空间更大。今年,百度Apollo发布了支持L4级自动驾驶的大模型Apollo ADFM(Autonomous Driving Foundation Model),可以兼顾技术的安全性和泛化性,做到安全性高于人类驾驶员10倍以上,实现城市级全域复杂场景落地。

门槛越低,商业版图越大

纵观百度大模型近两年发展,明显朝着“上天”“入地”两个方向发展。

“上天”是不断优化大模型技术,持续迭代,提高竞争壁垒。不论从专利数量还是应用规模,百度在大模型领域都走在全球第一梯队。前不久,沙利文发布的《2024年全球AI生态全景概览》中,百度与谷歌、OpenAI等位于AI-Native Giant(AI巨头)同一序列。

“入地”是百度在不断降低大模型应用成本和门槛,让更多人触手可及。除了各种开放平台、开发工具,百度还亲自下场,为高校、企业培养了数百万的AI人才,让AI普及的速度越来越快。

本次百度世界大会再次体现了这两点。李彦宏在会上发布了两项新技术。

一是iRAG技术。回顾过去两年,李彦宏认为,文字层面的RAG(检索增强生产)已经做得很好基本让大模型消除了幻觉,即用户跟大模型一问一答,大概率能得到用户想要的答案。

但在图像等多模态方面,还存在较大幻觉,比如让大模型生成一张某历史人物在某景点的照片,还是存在“一眼假”的情况。要么是事实性错误,如人物张冠李戴,要么是画质“机器味儿”太重,缺乏真实感。

针对于此,百度开发了检索增强的文生图技术iRAG(image based RAG),将百度搜索的亿级图片资源跟基础模型能力相结合,可生成超真实的图片。这项技术拥有广泛应用场景,比如过往汽车品牌要拍一组海报大片,动辄要大几十万,应用百度iRAG,可立刻生成,且成本几乎等于零。

这是百度不断“上天”,向技术高峰攀爬的行动。当天,李彦宏还重点介绍了计划明年一季度上线的无代码工具“秒哒”,是百度不断降低大模型门槛,“入地”的体现。

“秒哒”可以说,满足了大多数人对于大模型和生成式AI应用的想象,即不需要懂编程,只需要说出想法,AI就能实现和生产所需要的应用。

具体如何实现?用户只需对准秒哒用中文描述需求,如需要搭建一场活动的在线报名系统,并上传活动时间、地点等信息。之后,秒哒会自动调取多个智能体、多个工具,实现程序的开发、BUG检查、视觉设计等工作,完成报名系统的开发。也就是说,只要有想法,你就可以心想事成,这也将迎来一个前所未有的只靠想法就能赚钱的时代——点子时代。

当一个复杂的事务变得简单化,将是其走向千家万户,占领大众市场的开始。比如微软的可视化桌面系统取代Dos系统,让普通人可以使用原本复杂的计算机。而“秒哒”的落地,意味着将开启一个全新的点子时代,这才是AI真正的价值所在。

“秒哒”正是这样一个工具,让每个人都变成程序员,将极大提高AI原生应用的生成效率,带来更多智能体,进一步繁荣AI生态。而百度作为这一生态的主要创建者,未来的获益无需多言。

【结束语】

作为全世界最成功的快消品之一,可口可乐的成功有其独特配方、成功的营销,还有重要的一条,即建立了全球最大的饮料分销系统。2019年其已在200多个国家建立超30000万个销售网点,覆盖了全球约60%的零售店。这样的结局是,世界各地的人们触手可得可口可乐。

当前的百度正在做类似的事情,将大模型和生成式AI送到普通人手里,让大模型触手可得。AI的普及和商业化自此打开,百度更广阔的未来世界也被打开。

让AI“上天”“入地” 百度打开未来世界的更多相关文章

  1. python预课06 基于百度大脑AI的人工智能,百度颜值检测,语音合成与识别

    百度大脑: 如下图,百度开放了许多人工智能接口可以使用,先注册一个百度大脑账户 点击创建应用,选择需要的功能,如人脸识别,语音识别等 点击查看文档,可以查看功能对应语言的方法,参数.首先在CMD命令下 ...

  2. AI+教育落地,百度大脑如何让校园更智能?

    人工智能作为影响社会底层技术革命逐渐向传统行业渗透,“AI+”已经替代“互联网+”成为创业创新的新引擎,出人意料的是,在AI在教育业的率先落地并且相当火爆. 现在,人工智能教育已成为从业者心目中的“教 ...

  3. 发布AI芯片昆仑和百度大脑3.0、L4自动驾驶巴士量产下线,这是百度All in AI一年后的最新答卷...

    机器之心报道,作者:李泽南. 去年的 7 月 5 日,百度在北京国际会议中心开办了首届「AI 开发者大会」.在会上,百度首次喊出了「All in AI」的口号.一年的时间过去了,今天在同样地点举行的第 ...

  4. bootstarp-fileinput上传 火狐防止拖入文件直接打开新页面

    今日接触了一个bootstarp的上传插件,发现其功能很强大,具体名为bootstarp-fileinput,需要的可以自行度一下. 然后当使用其拖拽功能时,其他浏览器没出毛病,独火狐浏览器拖入时直接 ...

  5. 综合5项百度大脑AI技术,快速构建智能交通方案

    一.整体方案:思路:整合百度AI功能,通过百度AI解决.优化在公交运行过程中遇到的运营.管理.安全等方面的问题.具体如下: 安全方面:通过驾驶员检测+语音合成,对驾驶员状态进行实时检测,跟踪,告警.  ...

  6. 百度AI开发平台简介

    AIstudio https://aistudio.baidu.com/aistudio/index 关于AI Studio AI Studio是基于百度深度学习平台飞桨的一站式AI开发平台,提供在线 ...

  7. ASP.NET MVC WebApi 返回数据类型序列化控制(json,xml) 用javascript在客户端删除某一个cookie键值对 input点击链接另一个页面,各种操作。 C# 往线程里传参数的方法总结 TCP/IP 协议 用C#+Selenium+ChromeDriver 生成我的咕咚跑步路线地图 (转)值得学习百度开源70+项目

    ASP.NET MVC WebApi 返回数据类型序列化控制(json,xml)   我们都知道在使用WebApi的时候Controller会自动将Action的返回值自动进行各种序列化处理(序列化为 ...

  8. 一文解读AI芯片之间的战争 (转)

    2015年的秋天,北京的雨水比往年要多些,温度却不算太冷.这一年里,年仅23岁的姚颂刚刚拿到清华大学的毕业证书;32岁的陈天石博士毕业后已在中科院计算所待了整整8年;而在芯片界摸爬滚打了14年的老将何 ...

  9. 谁能真正替代你?AI辅助编码工具深度对比(chatGPT/Copilot/Cursor/New Bing)

    写在开头 这几个月AI相关新闻的火爆程度大家都已经看见了,作为一个被裹挟在AI时代浪潮中的程序员,在这几个月里我也是异常兴奋和焦虑.甚至都兴奋的不想拖更了.不仅仅兴奋于AI对于我们生产力的全面提升,也 ...

  10. 新鲜出炉的百度js面试题

    (文章是从我的个人主页上粘贴过来的,大家也可以访问我的主页 www.iwangzheng.com) 最近两位同学入职百度,带回来的笔试题基本上毫无悬念,不过有一个小题看到让人忍不住笑出声来,真的很无聊 ...

随机推荐

  1. C2. Pokémon Army (hard version) CF #672

    题意:给你一个序列,让你任意选出一个子序列,使得奇数位和减去偶数位和最大.同时有q个询问,输出每次交换完a[l]和a[r]后的上述最大值. 思路:首先肯定可以确定选出来的子序列长度为奇数,因为偶数位只 ...

  2. 离线环境下的AI模型部署实战:基于Xinference搭建嵌入、重排与语音处理平台

    1. 引言:为什么选择离线部署 在当今AI技术快速发展的时代,许多企业面临着数据安全与合规性的严格要求,特别是在金融.医疗和政府等领域,离线部署AI模型成为刚需.本文将详细介绍如何利用Xinferen ...

  3. 谷云科技RestCloud完成数千万人民币Pre-A轮融资

    聚焦企业系统集成及数据融合场景的谷云科技RestCloud iPaaS于近期完成数千万人民币Pre-A轮融资,本轮融资由SIG 海纳亚洲创投基金独家投资. 谷云科技RestCloud是一家专注于大型企 ...

  4. ETL的数据脱敏方式

    数据脱敏是什么? 数据脱敏是在数据处理过程中采用各种技术手段去除或替换敏感信息,以保障个人隐私和敏感信息的安全措施.通常应用于数据共享.数据分析和软件测试等场景,其目的在于减少数据泄露和滥用的风险. ...

  5. 企业API网关适用业务场景

    什么是企业级API网关 企业级API网关是一种用于管理.保护和监控企业内部和外部API(Application Programming Interface)的解决方案.它提供了一套统一的接入点,帮助企 ...

  6. 马帮ERP与ETLCloud快速同步

    马帮ERP介绍 上海马帮科技有限公司,是一家专注于提供全流程跨境电商ERP管理软件解决方案的企业.聚焦服务于各阶段.各领域的跨境电商从业者,旗下包含专业版ERP.亚马逊专用版ERP.东南亚海外版ERP ...

  7. Podman + Nginx + Affine 踩坑教程

    安装 Podman 安装 podman 很简单 sudo apt install podman 验证安装 podman info 创建一个 pod 用于安装 Nginx 和 Affine podman ...

  8. SciTech-Wireless-WiFi-WDS(无线路由桥接扩网)两个路由器无线桥接(WDS)要点

    两个路由器无线桥接(WDS)要点 当上网点距离路由器有好几道墙,连接WiFi信号很差时: 可用另外一个路由器无线桥接(大多数路由器的WDS功能)到主路由器(连光猫连接的路由器), 扩大主WiFi路由器 ...

  9. SciTech-BigDataAIML-Jupyter- 扩展Jupyter 的 Notebook + LSP(语言服务) 的文档 Extending the Notebook

    https://jupyterlab-lsp.readthedocs.io/en/latest/Installation.html https://github.com/jupyter-lsp/jup ...

  10. SciTech-Printing-精密成像+印刷-静电成像(激光印刷/成像)的原理介绍

    静电成像的原理介绍 (2014-01-09 17:32:11) 标签: 静电成像 静电成像原理 文化 分类: 印艺技术 静电成像是利用光导材料的"光敏变电阻"特性: 在黑暗中为绝缘 ...