概述:基于大模型的AI搜索引擎 ∈ 大模型智能体应用

AI搜索引擎的架构与组成

  • 用户层:用户输入问题/关键词
  • Agent层:

用户的输入(当前和历史) + 问题提问模板 => 标准的问题

...

  • 记忆层:用户的历史对话

  • 大模型层(Ollama + 私有大模型 | 公有大模型)

大模型层的优化技术方向:指令微调(Fine-Tuning) / RAG + 向量数据库

  • 数据存储层:向量数据库 / 业务库(ES/MYSQL)

  • 数据采集层(定时采集/不定时采集):搜索引擎 / 目标网站 / ...

SearXNG(多搜索引擎的匿名搜索框架)

网络爬虫

  • 配置层:问题模板集 等

大模型智能体应用的关键技术

  • llm : deepseek / qwen2.5 / llama3 / ...

  • llm 私有化部署 : ollama

  • llm应用开发

  • 终端层:小程序 / Teams应用
  • Agent层
  • 记忆层:记录所有对话
  • LLM应用编程框架: lang-chain

  • 数据源

  • 向量数据库:Faiss / Milvus
  • 业务数据库: MySQL / Redis / ES / MongoDB / ...
  • 搜索引擎 & 网络爬虫

开源AI搜索引擎

MemFree

  • Intro

MemFree是一款开源的混合AI搜索引擎,可搜索个人知识库和互联网。

MemFree 是一个开源的混合AI搜索引擎,可以同时在你的个人知识库(如书签、笔记、文档等)和互联网中进行搜索。

  • url
  • demo

https://www.memfree.me/zh

  • slogan / 项目定位 : 混合AI搜索引擎 + AI页面生成器
  • MemFree 是一个混合 AI 搜索引擎
  • 使用 MemFree,您可以立即从您的知识库和整个互联网中获得准确的答案。
  • MemFree 也是一个 AI 页面生成器

Memfree 使用最强大的 AI 模型 - Claude 3.5 Sonnet 和最流行的前端框架 - React + Tailwind + Shadcn UI,在几秒钟内为您生成生产就绪的 UI 页面。

https://pagegen.ai

  • 技术栈
  • AI 模型 : Claude 3.5 Sonnet
  • 前端框架 : React + Tailwind + Shadcn UI
  • MemFree Hybrid AI 搜索功能

MemFree 配备了强大的功能,可满足各种搜索和生产力需求:

  • 多种 AI 模型:集成 ChatGPT、Claude 和 Gemini,以实现多种 AI 功能。
  • 支持多个搜索引擎: 与 Google、Exa 和 Vector 配合使用。
  • ️ 多种搜索输入格式:文本、图像、文件和网页,特别是它支持多图像搜索、比较、汇总和分析。
  • 多种结果呈现方法: 文本、思维导图、图像和视频。
  • 本地文件格式兼容性: 支持文本、PDF、Docx、PPTX 和 Markdown 文件。
  • 跨设备同步:在多个设备之间保存和同步搜索历史记录。
  • 多语言支持:提供英语、中文、德语、法语、西班牙语、日语和阿拉伯语版本。
  • Chrome 书签同步:一键同步和索引。
  • 结果共享:轻松共享您的搜索结果。
  • 上下文连续搜索:根据上下文无缝搜索。
  • ⚙️ 自动 Web 搜索决策:自动确定何时执行 Internet 搜索。
  • MemFree AI UI 生成器功能
  • ️ 实时 UI 预览 : 即时渲染和预览生成的 UI
  • AI 驱动的内容搜索 : 使用我们先进的 AI 搜索功能,通过相关内容丰富您的 UI
  • 图像驱动的 UI 生成 :创建与您的参考图像紧密匹配的 UI 组件和页面
  • 文件到页面生成 : 通过 AI 解析和 AI 摘要将任何文件内容转换为结构精美的网页
  • ️ 代码编辑器集成 : 使用类似 VSCode 的编辑功能编辑和优化生成的代码,并完成语法高亮和自动完成
  • 动画支持:使用内置动画效果创建引人入胜的网页,通过平滑的过渡和动态元素使您的内容栩栩如生
  • ⚛️ React + TailWind + Shadcn UI 集成:使用最流行的前端堆栈:React、TailWind 和 Shadcn UI 利用 AI 生成的代码
  • 一键式 UI 发布 : 只需单击一下即可立即将您的 UI 发布并共享到 Web
  • 响应式代码和预览 : 在各种设备上实时预览您的 UI,确保完美适应所有屏幕尺寸
  • 深色模式代码和预览 : 通过内置的深色模式支持轻松生成 AI 驱动的 UI 代码,让您可以立即预览浅色和深色模式
  • UI 屏幕截图导出 : 轻松将您的 UI 设计导出并共享为高质量的屏幕截图,以实现无缝协作
  • ️ 智能纠错 : 虽然 MemFree 的高级 AI 模型和复杂的代码规则力求完美,但偶尔可能会出现错误。我们的智能纠错功能让您只需单击一下即可立即修复任何问题
  • 项目的价值
  • 高效的知识管理:MemFree 消除了手动组织笔记、书签和文档的需要。当您需要信息时,只需在 MemFree 中搜索即可快速找到相关答案,从而释放您的内存并提高工作效率。
  • 节省时间的 AI 摘要:MemFree 使用 AI 立即总结网页和知识库中的最佳内容,从而节省宝贵的时间,而不是点击多个 Google 搜索结果。
  • 具有成本效益的解决方案:避免多次订阅 ChatGPT Plus、Claude Pro 和 Gemini Advanced 等服务。MemFree 集成了他们的功能,大大降低了每月成本。
  • UI 页面创建速度提高 100 倍: 在几秒钟内将文本或图像转换为令人惊叹的生产就绪代码,在创建时可视化您的设计,无缝发布您的页面。
  • MemFree Hybrid AI 搜索工作流程

  • RoadMap

MindSearch

  • Slogan / 项目定位: 模仿人类思维激发深度人工智能搜索

  • Intro

  • MindSearch 是一个模拟人类思维的开源深度 AI 搜索引擎框架。
  • MindSearch是一个开源的AI搜索引擎框架,具备类似Perplexity.ai Pro的性能。

    用户可以通过使用闭源LLMs(如GPT、Claude)或开源LLMs(如InternLM2.5-7b-chat)来简单地部署自己风格的搜索引擎。
  • 主要特点:
  • 全面提问支持:MindSearch旨在解决生活中的各种问题,并使用网络知识进行回答。
  • 深入的知识发现:通过浏览数百个网页,MindSearch提供更深、更广泛的知识基础答案。
  • 详细解决路径:MindSearch公开所有细节,让用户可以查看所有内容,从而大大提高最终回答的可信度和可用性。
  • 优化的UI体验:提供了包括React、Gradio、Streamlit和终端在内的各种接口,用户可以根据需要选择任何一种。
  • 动态图构建过程:MindSearch将用户查询分解为图中的原子子问题节点,并根据WebSearcher的搜索结果逐步扩展图。
  • 技术栈
  • 支持的搜索引擎:DuckDuckGoSearch / BingSearch / BraveSearch / GoogleSearch / TencentSearch
  • 前端框架: React /
  • Web 服务端框架: Gradio / Streamlit
  • Gradio 是一个用于快速构建机器学习模型的交互式Web应用的Python库,它主要是用在简化模型的演示和测试过程,通过一些简单的代码和组件布局,而不需要精通 HTML、CSS 或 Javascript 等,就能让开发者能够快速搭建起一个可视化的界面。
  • https://www.gradio.app
  • Streamlit是一个用于机器学习、数据可视化的 Python 框架,它能几行代码就构建出一个精美的在线 app 应用。相比于Gradio,能展示更多的功能
  • URL
  • url
  • demo

Sensei Search: AI搜索引擎

  • Intro

Sensei Search 是一款基于人工智能的问答引擎,旨在为用户提供快速、准确的信息查询服务;支持本地和云端运行。

它利用开源的大型语言模型 (LLM) 来生成回答,并结合多种搜索引擎和数据库以提升搜索效果。

  • 智能问答:通过先进的 AI 技术,Sensei Search 能够理解用户的查询并提供相应的答案。
  • 支持多种模式:用户可以选择光亮模式或黑暗模式,以适应不同的视觉体验。
  • 灵活的技术架构:系统基于 Next.js 和 FastAPI 构建,使用多种开源 LLMs,如 Command-R、Qwen-2 和 GPT-3.5-turbo,支持高效的数据处理和响应生成。
  • url

  • 技术栈

Sensei Search 采用以下技术构建:

  • 前端:Next.js、Tailwind CSS
  • 后端:FastAPI、OpenAI 客户端
  • 大模型:Command-R、Qwen-2-72b-instruct、WizardLM-2 8x22B、Claude Haiku、GPT-3.5-turbo
  • 搜索:SearxNG、Bing
  • 内存:Redis
  • 部署:AWS、Paka
  • 参考文献

OpenPerPlex

  • Intro
  • OpenPerPlex是一个使用最新技术的开源AI搜索引擎,提供强大的互联网搜索功能。
  • OpenPerPlex 是一个开源的AI搜索引擎,利用先进的技术提供网络搜索功能。
  • 技术栈
  • URL

OpenSearch GPT

  • Intro
  • OpenSearch GPT是一款能够根据用户兴趣个性化学习的AI搜索引擎。
  • OpenSearch GPT 是一款个性化的人工智能搜索引擎,它在用户浏览网络时学习用户的兴趣和偏好。

    与 Perplexity 或 SearchGPT 类似,OpenSearch GPT 专注于为每个用户提供个性化的搜索结果。
  • 功能
  • 个性化搜索:OpenSearch GPT 提供个性化的搜索结果,使用户能够快速找到与自己兴趣相关的信息。
  • 信息检索和知识管理:通过自动记忆功能,帮助用户管理和检索信息,适用于研究和学习。
  • 动态兴趣学习:随着用户的浏览活动,AI 不断更新和优化用户的兴趣模型,使推荐结果更加精准。
  • 浏览体验优化:

整合多种先进技术框架,提供流畅、直观的用户界面体验。通过这些场景,OpenSearch GPT 不仅提升了搜索的效率和准确性,也改善了用户的整体浏览体验。

  • URL

LangChain-SearXNG

  • url

other url

TurboSeek

  • Intro
  • TurboSeek 是一个由 Together.ai 提供支持的开源人工智能搜索引擎
  • TurboSeek 是一个开源的人工智能搜索引擎,由 Together.ai 提供技术支持。
  • 它采用多种先进的技术,结合了多个大语言模型(如 Mixtral 8x7B 和 Llama-3),以及 Bing 搜索API来实现智能问答和信息检索。
  • TurboSeek 的开发灵感来源于类似的智能搜索引擎,如 Perplexity、You.com 和 Lepton search。

    这样,TurboSeek 既能为普通用户提供便捷的智能问答服务,也为开发者提供了一个强大的平台进行二次开发和定制。
  • URL

Perplexica

  • Inro

开放源码的AI驱动搜索引擎,提供准确且最新的搜索结果

Perplexica 是一个开源的AI驱动搜索引擎,能够深入互联网寻找答案。

灵感来自Perplexity AI,Perplexica不仅进行网络搜索,还能理解用户的问题。

它利用先进的机器学习算法如相似度搜索和嵌入技术来优化搜索结果,并提供带有引文的清晰答案。

使用SearxNG确保信息的实时性和开放性,且不影响用户隐私。

  • URL

Farfalle

  • Inro
  • Farfalle 是一个支持本地和云端模型的开源AI搜索引擎
  • Farfalle 是一个开源的、由人工智能驱动的搜索引擎。
  • 这个工具的核心功能是利用本地大型语言模型(LLM)或云端模型来回答问题和进行搜索。
  • 能够运行本地的LLM,如llama3、gemma、mistral,也支持使用云端模型,如Groq/Llama3、OpenAI/gpt4-o。
  • 既可以在本地运行,也可以通过云端进行部署。
  • URL

X 参考文献

https://www.gradio.app

[AI] 基于大模型的AI搜索引擎的更多相关文章

  1. 华为高级研究员谢凌曦:下一代AI将走向何方?盘古大模型探路之旅

    摘要:为了更深入理解千亿参数的盘古大模型,华为云社区采访到了华为云EI盘古团队高级研究员谢凌曦.谢博士以非常通俗的方式为我们娓娓道来了盘古大模型研发的"前世今生",以及它背后的艰难 ...

  2. 智慧金融时代,大数据和AI如何为业务赋能

    前言:宜信技术人物专访是宜信技术学院推出的系列性专题,我们邀请软件研发行业的优秀技术人,分享自己在软件研发领域的实践经验和前瞻性观点. 第一期专访我们邀请到宜信科技中心AI中台负责人王东老师,从大数据 ...

  3. AI大模型学习了解

    # 百度文心 上线时间:2019年3月 官方介绍:https://wenxin.baidu.com/ 发布地点: 参考资料: 2600亿!全球最大中文单体模型鹏城-百度·文心发布 # 华为盘古 上线时 ...

  4. 基于Text-CNN模型的中文文本分类实战 流川枫 发表于AI星球订阅

    Text-CNN 1.文本分类 转眼学生生涯就结束了,在家待就业期间正好有一段空闲期,可以对曾经感兴趣的一些知识点进行总结. 本文介绍NLP中文本分类任务中核心流程进行了系统的介绍,文末给出一个基于T ...

  5. 大数据与 AI 生态中的开源技术总结

    本文由云+社区发表 作者:堵俊平 在数据爆炸与智能革命的新时代,新的平台与应用层出不穷,开源项目推动了前沿技术和业界生态快速发展.本次分享将以技术和生态两大视角来看大数据和人工智能技术的发展,通过分析 ...

  6. 新的一年,来看看大数据与AI的未来展望

    本文由云+社区发表 作者:堵俊平 在数据爆炸与智能革命的新时代,新的平台与应用层出不穷,开源项目推动了前沿技术和业界生态快速发展.本次分享将以技术和生态两大视角来看大数据和人工智能技术的发展,通过分析 ...

  7. 2018 AI产业界大盘点

    2018  AI产业界大盘点 大事件盘点 “ 1.24——Facebook人工智能部门负责人Yann LeCun宣布卸任 Facebook人工智能研究部门(FAIR)的负责人Yann LeCun宣布卸 ...

  8. AI时代大点兵-国内外知名AI公司2018年最新盘点

    AI时代大点兵-国内外知名AI公司2018年最新盘点 导言 据腾讯研究院统计,截至2017年6月,全球人工智能初创企业共计2617家.美国占据1078家居首,中国以592家企业排名第二,其后分别是英国 ...

  9. AI,大数据,复杂系统 最精 40本大书单

    AI,大数据,复杂系统 最精 40本大书单 原创 2017-10-30 Peter 混沌巡洋舰 如果这篇文的题目变成最全书单,那么这篇文会变得又臭又长,这个年代,关于人工智能和大数据的书,没有一万本也 ...

  10. 大数据、AI“武装”企业服务:风控、检索、安全

    大数据.AI“武装”企业服务:风控.检索.安全 小饭桌创业课堂2017-05-06 15:26:42阅读(127)评论(0) + - 文|吴杨可月 - - 小饭桌创业研究院出品 - 两件秘闻,将美国大 ...

随机推荐

  1. Awesome Tools,程序员常用高效实用工具、软件资源精选,办公效率提升利器!

    前言 在当今这个技术日新月异的时代,开发者只有持续学习,才能紧跟时代的浪潮.为了助力开发者在高效学习与工作中实现平衡(告别996的束缚),众多卓越且实用的开发工具应运而生,它们如同强大的助力器,极大地 ...

  2. Elasticsearch倒排索引结构【转载】

    一切设计都是为了提高搜索的性能 倒排索引(Inverted Index)也叫反向索引,有反向索引必有正向索引.通俗地来讲,正向索引是通过key找value,反向索引则是通过value找key. 先来回 ...

  3. centos 的yum源设置

    转载请注明出处: 在CentOS系统中,yum是自带的.yum(Yellowdog Updater, Modified)是一款在CentOS及其他基于Red Hat的Linux发行版中广泛使用的包管理 ...

  4. 管中窥豹----从String Intern中观察.NET Core到.NET 8 托管堆的变迁

    简介 https://www.cnblogs.com/lmy5215006/p/18494483 在此文中,研究.NET String底层结构时,我所观察到的情况与<.NET Core底层入门& ...

  5. SpringBoot项目集成MinIO

    一.MinIO的下载安装以及基本使用 1.下载地址:https://dl.min.io/server/minio/release/windows-amd64/minio.exe 2.下载好后需要手动创 ...

  6. Codeforces 983 A-E

    题解 A 难度:黄 算法标签:数学.进制 题目翻译:给定进制 \(b\) 和分数 \(\frac{p}{q}\),求这个分数在 \(b\) 进制下是否是有限小数. 题目分析: 首先将分数化简(不用说了 ...

  7. IBM 开源的文档转化利器「GitHub 热点速览」

    上周的热门开源项目,Star 数增长犹如坐上了火箭,一飞冲天.短短一周就飙升了 6k Star 的多格式文档解析和导出神器 Docling,支持库和命令行的使用方式.全新的可视化爬虫平台 Maxun, ...

  8. Apache Shiro 550反序列化漏洞复现

    目录 漏洞原理 复现 漏洞探测 方式一 ysoserial反弹shell 方式二 ShiroAttack2一键利用 修复措施 Apache Shiro 是一个用于身份验证.授权.加密和会话管理的Jav ...

  9. 2025年前端面试准备vue篇

      1.VUE的声明周期有哪些及每个生命周期做了什么 beforeCreate: 是new Vue() 之后触发的第一个钩子,data,methods,computed 以及watch 上的数据和方法 ...

  10. after_request 可以直接用于接口日志