提供AI咨询+AI项目陪跑服务,有需要回复1

大模型一直有个难以解决的问题:系统的知识是过时的,他们难以跟进最新的信息

基于这个原因,ChatGPT以及DeepSeek都提出了联网功能,只不过效果嘛绝不可能太好(绝不会有用会从CSDN搜寻程序员要的答案):

AI应用团队的话,一般会使用爬虫到各个目标网站整理信息,提前存入到知识库,以保证AI应用的先进性,只不过这在特定领域是适用的,如果是泛问题,知识库没有信息的话,模型依旧会胡说八道。

在这个基础上,事实上各个AI应用团队对AI浏览器是有诉求的,于是就有很多公司在做相关功能:

  1. 2023年:Opera推出Aria,内置AI助手,支持网页内容摘要和实时回答;
  2. 2024年:微软Edge推出Copilot,嵌入生成式AI,提升生产力;
  3. 2025年:Brave推出Leo,支持网页自动摘要和多功能助手;

其实,RAG的本质和搜索引擎是很类似的,也可以将AI浏览器理解为一个MCP应用,提供给AI产品调用即可。

PS:抛开浏览器提供接口给我使用这个点,我其实已经想不到太多浏览器的生存空间了,

我只有在不想看AI回答的情况下,才会去用搜索,而且一定不是浏览器搜索...

以上是AI浏览器诞生的一些背景,以及我的一些认识,接下来我们来具体的了解其中一些表现不俗的AI浏览器。

从Arc到Dia

The Browser Company 成立于2019年,融资1个多亿,估值5.5亿美金。

其核心产品是Arc,一款被极客喜爱的浏览器,被认为远超Chrome的用户体验。

而在24年完成5000万美金融资后,其毅然决然的放弃了Arc的研发投入,开始转向为全新的AI浏览器研发

同年,Dia浏览器发布,这也是现在被认为非常优秀的AI浏览器

AI不会以一个应用或者一个按钮的形式存在,它将是一个全新的环境——建立在网页浏览器之上的。

这句话透露出一种坚定的信念:AI将不再是我们如今所见的简单工具,而是将彻底重塑我们与技术互动的方式,成为一个无处不在、深度融合的全新生态。

在使用之前,浏览器会搜集很多个人倾向性信息:

我猜测,他会根据用户的喜好,返回最合适的信息。

只不过使用下来,不知道是不是错觉,感觉跟Manus想要达到的体验很类似...

这其实都还是在走OpenAI的L3路径:

L1级别(聊天机器人)。AI系统能够进行基本的对话和交流,显示出对自然语言的基本理解能力,并能对各种提示和问题作出响应。

L2:推理者(Reasoners)。AI系统能够以人类专家的熟练程度解决复杂问题,标志着其从单纯模仿人类行为升级到展现真实的智能水平。这些AI不仅擅长对话,更具备了解决问题的能力,其推理和决策能力已接近人类水平。

L3:智能体(Agents)。AI系统能够承担复杂的任务、作出决策和适应不断变化的环境,并在无须持续人类监督的情况下自主行动。这一阶段的AI不仅具备推理能力,更能自主执行各类复杂的操作任务。

与其说他是浏览器,不如说他是智能体...

AI需要浏览器

事实上,AI需要的不是浏览器,AI需要的是最新的知识库,并且真人使用的浏览器与AI想要的浏览器非常不一样。

比如Manus团队之前就想打造一款适应于AI的浏览器,以便AI产品的体验更好,最终他们也确实这么做了,这里以我的理解来说的话,与其说做了一个AI浏览器,倒不如说做了一个适应于AI使用的知识库。

综上,事实上我们是不需要AI浏览器的,我们只需要AI Agent,是AI Agent需要一个适应于他的浏览器(更确切的说是知识库),比如browser-use、Nova Act SDK。

只不过,浏览器是极其重要的关键词,因为他是一个非常好的入口,入口代表着流量,流量意味着争夺,所以很多公司都在开始布局AI浏览器,其本质其实在争夺下一个Agent入口...

事实上,从The Browser Company宣布放弃旗舰产品Arc、转投Dia研发时就是一个非常重要的信号:浏览器已不再是单纯的网页容器,而正在经历从"工具"到"智能体"的跃迁。

当AI出现那一刻,就宣布了传统浏览器的死亡,因为三大核心交互正在变化:

  1. 信息获取方式:从"用户主动搜索"转向"Agent预判需求";
  2. 交互界面:从"URL+网页"转向"多模态对话空间";
  3. 底层架构:从"页面渲染引擎"转向"实时数据处理器";

微软Edge Copilot的代码自动补全功能已展示这种转变:当开发者输入注释时,AI直接调用GitHub最新代码库生成解决方案,整个过程无需打开任何技术文档网站...

入口之争

随着AI Agent的崛起,科技巨头纷纷布局,争夺下一代用户“入口”。现在有两类玩家:

传统玩家

对于已有入口占领者,会发挥好本来优势:

  1. 微软:将Copilot深度植入Windows内核,实现系统级Agent调用;
  2. 谷歌:通过Gemini重构Chrome,搜索结果直接呈现动态生成的3D模型演示;
  3. 苹果:Siri升级为Proactive Agent,可跨设备预测用户行为轨迹;

新秀玩家

与此同时,各种新兴势力也在冲击这一领域:

  1. Dia浏览器:通过实时屏幕语义分析,在用户点击前预加载所需信息;
  2. Manus智能体:首创"认知沙盒"技术,可并行运行多个Agent处理复杂任务;
  3. Nova Act SDK:提供跨平台Agent运行时,打破浏览器与本地应用的界限;

这些公司通过不断扩展AI Agent的能力,推动用户体验的提升,争夺用户的核心“入口”,这个行为不再局限于操作界面,而是进入了工作流、决策支持和深度集成的层面。

具体到行业应用,AI Agent在各领域中的应用正以惊人的速度改变传统的用户体验。

例如,在医疗行业,AI Agent能够分析患者的病史、症状,并根据最新的医学研究提出精准的治疗建议。

在教育领域,AI Agent通过个性化学习路径帮助学生提高成绩,在金融行业,AI Agent可以帮助金融顾问根据实时数据做出投资决策。

在这些应用中,AI Agent的存在不再是“工具”,而是用户的“合伙人”。用户不再只是被动接受信息,而是通过AI Agent主动获取、分析和执行任务,这使得用户体验变得更加智能化、动态化。

尽管AI Agent的前景广阔,但它的发展仍面临诸多挑战。其中包括如何解决隐私保护问题、如何确保数据安全、以及如何实现算法的透明性等...

聊聊AI浏览器的更多相关文章

  1. 聊聊一直困扰前端程序员的浏览器兼容-【css】

    1.为什么会出现浏览器兼容问题? 由于各大主流浏览器由不同的厂家开发,所用的核心架构和代码也很难重和,这就为各种莫名其妙的Bug(代码错误)提供了温床.再加上各大厂商出于自身利益考虑而设置的种种技术壁 ...

  2. 浏览器兼容css

    原文:https://www.cnblogs.com/shizk/p/8459362.html 1.为什么会出现浏览器兼容问题? 由于各大主流浏览器由不同的厂家开发,所用的核心架构和代码也很难重和,这 ...

  3. 智慧金融时代,大数据和AI如何为业务赋能

    前言:宜信技术人物专访是宜信技术学院推出的系列性专题,我们邀请软件研发行业的优秀技术人,分享自己在软件研发领域的实践经验和前瞻性观点. 第一期专访我们邀请到宜信科技中心AI中台负责人王东老师,从大数据 ...

  4. 华为五大专家亲述:如何转型搞 AI?

    导语:非AI专业技术人员转型AI技术,或是作为一名学生学习AI技术开发,对每个有这样诉求和经历的人来说,都希望能够看到AI技术人才的成长经历,给出自己的真实经历分享. 前言 参考塞缪尔.约翰逊(18世 ...

  5. 聊聊找AI算法岗工作

    https://blog.csdn.net/weixin_42137700/article/details/81628028 首先,本文不是为了增加大家的焦虑感,而是站在一名学生的角度聊聊找AI算法岗 ...

  6. 聊聊 CDN 缓存与浏览器缓存

    CDN 是互联网上内容分发的重要一环.无论您之前是否了解过 CDN,其实它已经在您的日常生活中发挥作用了.比如您正在淘宝挑选心仪的商品,或者在观看一段令人捧腹的视频,以及您正在阅读的这篇文章,这些资源 ...

  7. 聊聊浏览器(webkit)资源加载机制

    一些准备 在开始这个话题之前,我们有必要简单回顾一下 浏览器(webkit)的网页渲染过程(如果想要详细了解这个过程,可以戳我几年前写的一篇文章.): 我们知道,浏览器在渲染过程中,如遇到节点需要依赖 ...

  8. 【浏览器】聊聊DOM

    [浏览器]聊聊DOM 博客说明 文章所涉及的资料来自互联网整理和个人总结,意在于个人学习和经验汇总,如有什么地方侵权,请联系本人删除,谢谢! 说明 作为前端开发,在以前的工作中大多是和DOM打交道,到 ...

  9. 转---JS 一定要放在 Body 的最底部么?聊聊浏览器的渲染机制

    作者:德来 segmentfault.com/a/1190000004292479 如有好文章投稿,请点击 → 这里了解详情 一.从一个面试题说起 面试前端的时候我喜欢问一些看上去是常识的问题.比如: ...

  10. 聊聊一直困扰前端程序员的浏览器兼容-【JavaScript】

    上篇已经写过浏览器的兼容发展历史以及主流浏览器,主要的css兼容我知道的已全部写到,这篇这篇专攻javascript的兼容. 1.getYear()方法 var year = new Date().g ...

随机推荐

  1. 从cos下载文件

    新建test.sh脚本 #!/bin/bash set -e cospath=https://11111.cos.ap-beijing.myqcloud.com/emr/hive/script/202 ...

  2. Luogu P11280 GFOI Round 2 Jom & Terry 题解 [ 黄 ] [ BFS ]

    Jom & Terry:讲个笑话,我赛时被诈骗了. 思路 先放结论:如果 Terry 到终点的距离小于等于 Jom 到终点的距离,那么 Terry 一定不会被抓. 为啥呢,因为不管 Jom 堵 ...

  3. 『Python底层原理』--CPython的变量实现机制

    在Python中,变量的使用看起来非常简单,例如 a = 10,s = "hello"等等. 然而,这种简单的赋值操作背后,CPython其实做了很多复杂的工作. 本文将通过一些简 ...

  4. [WC2014] 紫荆花之恋 题解

    啊啊啊啊啊啊啊啊啊啊啊我终于改完啦啊啊啊啊啊啊啊. 因为没有在最开始的时候将所有点设置为已经重构的,所以直接 \(R15-R70\) 间卡了两三天. 似乎也是我第一次大规模使用指针了. 这道题假如只有 ...

  5. Netty实战:Netty优雅的创建高性能TCP服务器(附源码)

    文章目录 前言 1. 前置准备 2. 消息处理器 3. 重写通道初始化类 4. 核心服务 5. 效果预览 6. 添加通道管理,给指定的客户端发送消息 7. 源码分享 前言 Springboot使用Ne ...

  6. 【质点弹簧实现】Unity 版示例

    [质点弹簧实现]Unity 版示例 急速搭建的 Unity 版本的质点弹簧 Demo,不要在意帧率,这个 Demo 没有做任何优化.整个 Demo 就一个文件,直接在 Unity 创建里创建一个名为& ...

  7. 用于敏捷开发的最佳免费 UML 工具 2022

    Table of Contents  hide  1 最好的在线免费 UML图工具 2 免费的 UML Visual Paradigm 在线平台 3 其他福利 4 用于正式和大规模可视化建模的 Vis ...

  8. 解决黑群晖 Docker 日志八小时时间差的有效方法

    步骤一:登录黑群晖控制台 首先,我们需要登录到黑群晖控制台.可以通过SSH登录,或是直接在黑群晖控制台界面上操作. 步骤二:停止相关的Docker容器 在解决时间差问题之前,我们需要停止相关的Dock ...

  9. C#(面向对象的托管语言)类库(区别于应用程序)的异常处理思路

    1.不要做出任何应用程序才需要考虑抉择策略,不能想当然的决定一些错误情形.具体的一个体现形式是什么异常都捕获.这不是类库的职责,因为无法掌握所有的调用者的使用情形,这些不确定性是委托.虚方法.接口等特 ...

  10. MyCat分库分表-安装

    准备3台虚拟机CentOS7,一台MyCat,两台MySQL 一.安装MySQL 打开MySQL官网mysql.com根据提示安装 1.yum仓库 https://dev.mysql.com/down ...