LLM技术全景图:技术人必备的技术指南,一张图带你掌握从基础设施到AI应用的全面梳理

LLM 技术图谱(LLM Tech Map)是将 LLM 相关技术进行系统化和图形化的呈现,此图谱主要特点是“专注于技术人视角”,不求从 LLM 产业角度汇聚信息,而是希望让从事相关工作或是想了解 LLM 的技术人有一个快速感知。

LLM 技术图谱(LLM Tech Map)从基础设施、大模型、Agent、AI 编程、工具和平台,以及算力几个方面,为开发者整理了当前 LLM 中最为热门和硬核的技术领域以及相关的软件产品和开源项目。

核心价值:帮助技术人快速了解 LLM 的核心技术和关键方向。

1.基础设施

LLM 技术图谱(LLM Tech Map)的基础设施部分主要包括以下几个方面:

  • 向量数据库:向量数据库是专门用于存储和检索向量数据的数据库,它可以为 LLM 提供高效的存储和检索能力。
  • 数据库向量支持:传统数据库通常不支持向量数据的存储和检索,数据库向量支持可以为传统数据库添加向量数据的存储和检索能力。
  • 大模型框架、微调 (Fine Tuning):针对大模型的开发。
  • 大模型训练平台与工具

1.1向量数据库

  • Milvus
  • Pinecone
  • Weaviate
  • Chroma
  • Qdrant
  • Vespa
  • Vald
  • Faiss
  • ScaNN
  • Vearch
  • AquilaDB
  • Marqo
  • LanceDB
  • Annoy
  • NucliaDB
  • DeepLake
  • MongoDB

1.2数据库向量支持

  • pgvector
  • Redis Vector
  • Elastic
  • SingleStoreDB
  • Solr
  • OpenSearch
  • ClickHouse
  • Rockset
  • Cassandra
  • Lucene
  • Neo4j
  • Kinetica
  • Supabase
  • Timescale

1.3大模型框架、微调 (Fine Tuning)

  • OneFlow
  • LMFlow
  • LoRA
  • Alpaca-LoRA
  • PEFT
  • ChatGLM-Efficient-Tuning
  • LLaMA-Efficient-Tuning
  • P-tuning v2
  • OpenLLM
  • h2o-llmstudio
  • xTuring
  • finetuner
  • YiVal

1.4大模型训练平台与工具

  • Pytorch
  • BMtrain
  • colossalAI
  • Tensorflow
  • PaddlePaddle
  • MindSpore
  • Deepspeed
  • XGBoost
  • Transformers
  • Apache MXNet
  • Ray

2.大模型

LLM 技术图谱(LLM Tech Map)的大模型部分主要包括以下几个方面:

  • 备案上线的中国大模型:有牌照提供服务的大模型,需要注意的是大模型和相应的产品多半名称不同。
  • 知名大模型:在全球范围内,已经发布了多款知名大模型,这些大模型在各个领域都取得了突破性的进展。
  • 知名大模型应用:LLM 已经在多种应用场景中得到了应用,包括文本生成、机器翻译、问答、自然语言推理等。

2.1中国大模型

  • 文心一言
  • 云雀
  • GLM
  • 紫东太初
  • 百川
  • 日日新
  • ABAB 大模型
  • 书生通用大模型
  • 混元大模型

2.2知名大模型

  • Llama 2
  • OpenLLaMA
  • 百川
  • 通义大模型
  • 文心一言
  • StableLM
  • MOSS
  • Dolly
  • BLOOM
  • Falcon LLM
  • ChatGLM
  • PaLM 2
  • 盘古
  • GPT-4
  • Stable Diffusion
  • DALL·E 3

2.3 知名大模型应用

  • ChatGPT
  • Claude
  • Cursor
  • Mochi Diffusion
  • Midjourey
  • DragGAN
  • Bard
  • Bing

3.AI Agent(LLM Agent)

AI Agent是一种能够自主运作并完成特定任务的计算实体或程序。它能够通过传感器感知周围环境,并根据感知到的信息做出决策,然后通过执行器采取行动。LLM Agent 是指基于 LLM 技术构建的智能代理,它可以用于各种任务,比如让机器与 ChatGPT 交互,一层一层挖掘信息,自动化完成任务;比如由机器人构成的虚拟小镇。

  • 核心特点

    • 自主性:AI Agent具有独立思考和行动的能力,能够在没有人类直接指导的情况下完成任务。
    • 交互性:AI Agent能够与环境或其他Agent进行交互,这在游戏、对话系统、推荐系统等场景中尤为重要。
    • 目的性:AI Agent设计有明确的目标或意图,其行为是为了实现这些目标。
    • 适应性:AI Agent能够根据环境的变化调整自己的行为,以适应新的情境。
    • 进化性:随着技术的发展,AI Agent的功能和智能水平也在不断提升。
  • 技术特点

    • AI Agent与大模型的主要区别在于,大模型与人类之间的交互是基于prompt实现的,而AI Agent仅需给定一个目标,它就能够针对目标独立思考并做出行动。
    • AI Agent的核心驱动力是大模型,并在此基础上增加了规划(Planning)、记忆(Memory)和工具使用(Tool Use)三个关键组件。
  • 类型从工作模式来看,AI Agent可以分为以下三种类型:

    • 单Agent:侧重于执行单一任务或一系列相关任务,且不需要与其他智能体进行交互。
    • 多Agent:涉及多个智能体之间的协作和交互,以完成更复杂的任务。
    • 混合Agent(人机交互Agent):结合了人类和智能体的交互,以实现更高效的任务执行。
  • Rivet

  • JARVIS

  • MetaGPT

  • AutoGPT

  • BabyAGI

  • NexusGPT

  • Generative Agents

  • Voyager

  • GPTeam

  • GPT Researcher

  • Amazon Bedrock Agents

4.AI 编程

AI编程是指利用计算机编程语言和技术来创建、训练和优化人工智能算法的过程。它涵盖了数据的收集、清洗、转换以及算法的选择和应用。AI编程是构建未来智能系统的关键,通过模拟人类智能的能力,使计算机能够执行类似于人类的决策和任务。编程语言如Python因其强大的数据处理库和简洁的语法,成为AI编程的常用工具。

  • codeium.vim
  • Cursor
  • GitHub Copilot
  • Comate
  • StableCode
  • CodeGeeX
  • TabbyML
  • CodeArts Snap
  • Code Llama
  • CodeFuse
  • 姜子牙
  • CodeShell

5.工具和平台

LLM 技术图谱(LLM Tech Map)的工具和平台部分主要包括以下几个方面:

  • LLMOps:简单点说(大家当前在说的),就是“快速从大模型到应用”。
  • 大模型聚合平台:汇聚大模型能力,提供服务。
  • 开发工具:其它开发相关的 LLM 工具。

5.1 LLMOps

  • BentoML
  • LangChain
  • Dify.ai
  • Semantic Kernel
  • Arize-Phoenix
  • GPTCache
  • Flowise

5.2 大模型聚合平台(☆)

  • Gitee AI
  • SOTA!模型
  • 魔搭ModelScope
  • Hugging Face

5.3 开发工具

  • v0
  • txtai
  • Jina-AI
  • Deco
  • imgcook
  • Quest AI
  • CodiumAI
  • Codeium Vim
  • Project IDX
  • MakerSuite

6.算力

LLM 模型的训练和部署需要大量的算力,算力是 LLM 技术发展的关键因素。

  • 英伟达
  • 昇腾
  • AMD
  • 海光
  • 昆仑芯
  • 天数智芯

LLM技术全景图:技术人必备的技术指南,一张图带你掌握从基础设施到AI应用的全面梳理的更多相关文章

  1. 直击JDD | 京东技术全景图首次展示 四大重磅智能技术驱动产业未来!

    11月19日,主题为"突破与裂变"的2019京东全球科技探索者大会(JDDiscovery)在京盛大开幕,京东集团展示了完整的技术布局与先进而丰富的对外技术服务,对外明确诠释了&q ...

  2. 深入探索Android热修复技术原理读书笔记 —— 热修复技术介绍

    1.1 什么是热修复 对于广大的移动开发者而言,发版更新是最为寻常不过的事了.然而,如果你 发现刚发出去的包有紧急的BUG需要修复,那你就必须需要经过下面这样的流程: 这就是传统的更新流程,步骤十分繁 ...

  3. 【转】【技术博客】Spark性能优化指南——高级篇

    http://mp.weixin.qq.com/s?__biz=MjM5NjQ5MTI5OA==&mid=2651745207&idx=1&sn=3d70d59cede236e ...

  4. P2P技术详解(三):P2P技术之STUN、TURN、ICE详解

    1.内容概述 在现实Internet网络环境中,大多数计算机主机都位于防火墙或NAT之后,只有少部分主机能够直接接入Internet.很多时候,我们希望网络中的两台主机能够直接进行通信,即所谓的P2P ...

  5. 腾讯技术分享:GIF动图技术详解及手机QQ动态表情压缩技术实践

    本文来自腾讯前端开发工程师“ wendygogogo”的技术分享,作者自评:“在Web前端摸爬滚打的码农一枚,对技术充满热情的菜鸟,致力为手Q的建设添砖加瓦.” 1.GIF格式的历史 GIF ( Gr ...

  6. 20151028整理罗列某种开发所包括对技术(技术栈),“较为全面”地表述各种技术大系的图表:系统开发技术栈图、Web前端技术栈图、数据库技术栈图、.NET技术栈图

    ———————————— 我的软件开发生涯 (10年开发经验总结和爆栈人生) 爆栈人生 现在流行说全栈.每种开发都有其相关的技术.您是否觉得难以罗列某种开发所包括对技术(技术栈)呢?   您是否想过: ...

  7. [转帖]技术盛宴 | 关于PoE以太网供电技术详解

    技术盛宴 | 关于PoE以太网供电技术详解 https://smb.pconline.com.cn/1208/12085824.html   [PConline 干货铺]随着物联网技术飞速发展,需要提 ...

  8. [IC]Lithograph(2)光刻技术的分辨率与分辨率增强技术

    接上一篇介绍IC制造的基本过程,光刻的基本过程.这篇文章继续介绍光刻过程中的一些概念. 该系列文章的目录如下: [IC]Lithograph(0)半导体制造的基本过程 [IC]Lithograph(1 ...

  9. 转:WebRTC技术及应用2 – NAT穿越技术的使用

    评:webrtc自带的打洞,穿透协议. 转: http://www.unclekevin.org/?p=924 959 views WebRTC技术及应用2 – NAT穿越技术的使用 发表回复 (题图 ...

  10. Android 插件技术:动态加载dex技术初探

    1.Android动态加载dex技术初探 http://blog.csdn.net/u013478336/article/details/50734108 Android使用Dalvik虚拟机加载可执 ...

随机推荐

  1. WPF 应用启动过程同时启动多个 UI 线程且访问 ContentPresenter 可能让多个 UI 线程互等

    在应用启动过程里,除了主 UI 线程之外,如果还多启动了新的 UI 线程,且此新的 UI 线程碰到 ContentPresenter 类型,那么将可能存在让新的 UI 线程和主 UI 线程互等.这是多 ...

  2. 7.deployment扩容-查看pod使用的CPU-统计ready状态节点数量

    官方文档:https://kubernetes.io/zh-cn/docs/tasks/run-application/scale-stateful-set/题目1: 将名为loadbalancer的 ...

  3. vue使用websoket(非封装)

    上代码: create:function(){ this.initWebpack() } methods:{ initWebpack(){//初始化websocket           let us ...

  4. VUE中具名插槽和匿名插槽的使用

    在我的项目中由于使用的是vue+element一个自用框架进行开发,插槽用法相较简单 比如在列表字段columns使用slotname即可 <template v-slot:_spec=&quo ...

  5. VMware虚拟机安装Centos-7.9

    VMware虚拟机安装Centos-7.9 创作不易,点赞关注一下吧 1.安装VMware Workstation Pro 大家根据自己的实际情况安装合适版本的VMware Workstation P ...

  6. 超轻量级的c#版基于文件的日志记录工具,可定制输出格式,可指定日志文件

    这是我自己个人编写的日志记录,主要使用在只需要记录日志,偶尔到文件中查看一下日志记录的情况.我自己写的一些服务之类的是使用了这个的,代码很少,使用很简单. 第一步 搜索和安装我的Nuget包 搜索和安 ...

  7. CSS样式第四篇

    ​针对现在网站的图片过大问题,可以用相应的工具进行压缩,并且可对图片进行切割处理. 1.如果一个页面的图片过大,可以对其切割,代码<img src="1.jpg">&l ...

  8. AI 一键生成高清短视频,视频 UP 主们卷起来...

    现在短视频越来越火,据统计,2023年全球短视频用户数量已达 10 亿,预计到2027年将突破 24 亿.对于产品展示和用户营销来说,短视频已经成为重要阵地,不管你喜不喜欢它,你都得面对它,学会使用它 ...

  9. 鸿蒙HarmonyOS实战-Stage模型(ExtensionAbility组件)

    一.ExtensionAbility组件 1.概念 HarmonyOS中的ExtensionAbility组件是一种能够扩展系统功能的能力组件.它可以通过扩展系统能力接口,为应用程序提供一些特定的功能 ...

  10. golang import 导入的四种方式

    1 标准导入: import "package_name" 2 导入别名: import ( alias "package_name" ) 3 匿名导入: _ ...