LLM技术全景图:技术人必备的技术指南,一张图带你掌握从基础设施到AI应用的全面梳理
LLM技术全景图:技术人必备的技术指南,一张图带你掌握从基础设施到AI应用的全面梳理
LLM 技术图谱(LLM Tech Map)是将 LLM 相关技术进行系统化和图形化的呈现,此图谱主要特点是“专注于技术人视角”,不求从 LLM 产业角度汇聚信息,而是希望让从事相关工作或是想了解 LLM 的技术人有一个快速感知。
LLM 技术图谱(LLM Tech Map)从基础设施、大模型、Agent、AI 编程、工具和平台,以及算力几个方面,为开发者整理了当前 LLM 中最为热门和硬核的技术领域以及相关的软件产品和开源项目。
核心价值:帮助技术人快速了解 LLM 的核心技术和关键方向。
1.基础设施
LLM 技术图谱(LLM Tech Map)的基础设施部分主要包括以下几个方面:
- 向量数据库:向量数据库是专门用于存储和检索向量数据的数据库,它可以为 LLM 提供高效的存储和检索能力。
- 数据库向量支持:传统数据库通常不支持向量数据的存储和检索,数据库向量支持可以为传统数据库添加向量数据的存储和检索能力。
- 大模型框架、微调 (Fine Tuning):针对大模型的开发。
- 大模型训练平台与工具
1.1向量数据库
- Milvus
- Pinecone
- Weaviate
- Chroma
- Qdrant
- Vespa
- Vald
- Faiss
- ScaNN
- Vearch
- AquilaDB
- Marqo
- LanceDB
- Annoy
- NucliaDB
- DeepLake
- MongoDB
1.2数据库向量支持
- pgvector
- Redis Vector
- Elastic
- SingleStoreDB
- Solr
- OpenSearch
- ClickHouse
- Rockset
- Cassandra
- Lucene
- Neo4j
- Kinetica
- Supabase
- Timescale
1.3大模型框架、微调 (Fine Tuning)
- OneFlow
- LMFlow
- LoRA
- Alpaca-LoRA
- PEFT
- ChatGLM-Efficient-Tuning
- LLaMA-Efficient-Tuning
- P-tuning v2
- OpenLLM
- h2o-llmstudio
- xTuring
- finetuner
- YiVal
1.4大模型训练平台与工具
- Pytorch
- BMtrain
- colossalAI
- Tensorflow
- PaddlePaddle
- MindSpore
- Deepspeed
- XGBoost
- Transformers
- Apache MXNet
- Ray
2.大模型
LLM 技术图谱(LLM Tech Map)的大模型部分主要包括以下几个方面:
- 备案上线的中国大模型:有牌照提供服务的大模型,需要注意的是大模型和相应的产品多半名称不同。
- 知名大模型:在全球范围内,已经发布了多款知名大模型,这些大模型在各个领域都取得了突破性的进展。
- 知名大模型应用:LLM 已经在多种应用场景中得到了应用,包括文本生成、机器翻译、问答、自然语言推理等。
2.1中国大模型
- 文心一言
- 云雀
- GLM
- 紫东太初
- 百川
- 日日新
- ABAB 大模型
- 书生通用大模型
- 混元大模型
2.2知名大模型
- Llama 2
- OpenLLaMA
- 百川
- 通义大模型
- 文心一言
- StableLM
- MOSS
- Dolly
- BLOOM
- Falcon LLM
- ChatGLM
- PaLM 2
- 盘古
- GPT-4
- Stable Diffusion
- DALL·E 3
2.3 知名大模型应用
- ChatGPT
- Claude
- Cursor
- Mochi Diffusion
- Midjourey
- DragGAN
- Bard
- Bing
3.AI Agent(LLM Agent)
AI Agent是一种能够自主运作并完成特定任务的计算实体或程序。它能够通过传感器感知周围环境,并根据感知到的信息做出决策,然后通过执行器采取行动。LLM Agent 是指基于 LLM 技术构建的智能代理,它可以用于各种任务,比如让机器与 ChatGPT 交互,一层一层挖掘信息,自动化完成任务;比如由机器人构成的虚拟小镇。
核心特点
- 自主性:AI Agent具有独立思考和行动的能力,能够在没有人类直接指导的情况下完成任务。
- 交互性:AI Agent能够与环境或其他Agent进行交互,这在游戏、对话系统、推荐系统等场景中尤为重要。
- 目的性:AI Agent设计有明确的目标或意图,其行为是为了实现这些目标。
- 适应性:AI Agent能够根据环境的变化调整自己的行为,以适应新的情境。
- 进化性:随着技术的发展,AI Agent的功能和智能水平也在不断提升。
技术特点
- AI Agent与大模型的主要区别在于,大模型与人类之间的交互是基于prompt实现的,而AI Agent仅需给定一个目标,它就能够针对目标独立思考并做出行动。
- AI Agent的核心驱动力是大模型,并在此基础上增加了规划(Planning)、记忆(Memory)和工具使用(Tool Use)三个关键组件。
类型从工作模式来看,AI Agent可以分为以下三种类型:
- 单Agent:侧重于执行单一任务或一系列相关任务,且不需要与其他智能体进行交互。
- 多Agent:涉及多个智能体之间的协作和交互,以完成更复杂的任务。
- 混合Agent(人机交互Agent):结合了人类和智能体的交互,以实现更高效的任务执行。
Rivet
JARVIS
MetaGPT
AutoGPT
BabyAGI
NexusGPT
Generative Agents
Voyager
GPTeam
GPT Researcher
Amazon Bedrock Agents
4.AI 编程
AI编程是指利用计算机编程语言和技术来创建、训练和优化人工智能算法的过程。它涵盖了数据的收集、清洗、转换以及算法的选择和应用。AI编程是构建未来智能系统的关键,通过模拟人类智能的能力,使计算机能够执行类似于人类的决策和任务。编程语言如Python因其强大的数据处理库和简洁的语法,成为AI编程的常用工具。
- codeium.vim
- Cursor
- GitHub Copilot
- Comate
- StableCode
- CodeGeeX
- TabbyML
- CodeArts Snap
- Code Llama
- CodeFuse
- 姜子牙
- CodeShell
5.工具和平台
LLM 技术图谱(LLM Tech Map)的工具和平台部分主要包括以下几个方面:
- LLMOps:简单点说(大家当前在说的),就是“快速从大模型到应用”。
- 大模型聚合平台:汇聚大模型能力,提供服务。
- 开发工具:其它开发相关的 LLM 工具。
5.1 LLMOps
- BentoML
- LangChain
- Dify.ai
- Semantic Kernel
- Arize-Phoenix
- GPTCache
- Flowise
5.2 大模型聚合平台(☆)
- Gitee AI
- SOTA!模型
- 魔搭ModelScope
- Hugging Face
5.3 开发工具
- v0
- txtai
- Jina-AI
- Deco
- imgcook
- Quest AI
- CodiumAI
- Codeium Vim
- Project IDX
- MakerSuite
6.算力
LLM 模型的训练和部署需要大量的算力,算力是 LLM 技术发展的关键因素。
- 英伟达
- 昇腾
- AMD
- 海光
- 昆仑芯
- 天数智芯
LLM技术全景图:技术人必备的技术指南,一张图带你掌握从基础设施到AI应用的全面梳理的更多相关文章
- 直击JDD | 京东技术全景图首次展示 四大重磅智能技术驱动产业未来!
11月19日,主题为"突破与裂变"的2019京东全球科技探索者大会(JDDiscovery)在京盛大开幕,京东集团展示了完整的技术布局与先进而丰富的对外技术服务,对外明确诠释了&q ...
- 深入探索Android热修复技术原理读书笔记 —— 热修复技术介绍
1.1 什么是热修复 对于广大的移动开发者而言,发版更新是最为寻常不过的事了.然而,如果你 发现刚发出去的包有紧急的BUG需要修复,那你就必须需要经过下面这样的流程: 这就是传统的更新流程,步骤十分繁 ...
- 【转】【技术博客】Spark性能优化指南——高级篇
http://mp.weixin.qq.com/s?__biz=MjM5NjQ5MTI5OA==&mid=2651745207&idx=1&sn=3d70d59cede236e ...
- P2P技术详解(三):P2P技术之STUN、TURN、ICE详解
1.内容概述 在现实Internet网络环境中,大多数计算机主机都位于防火墙或NAT之后,只有少部分主机能够直接接入Internet.很多时候,我们希望网络中的两台主机能够直接进行通信,即所谓的P2P ...
- 腾讯技术分享:GIF动图技术详解及手机QQ动态表情压缩技术实践
本文来自腾讯前端开发工程师“ wendygogogo”的技术分享,作者自评:“在Web前端摸爬滚打的码农一枚,对技术充满热情的菜鸟,致力为手Q的建设添砖加瓦.” 1.GIF格式的历史 GIF ( Gr ...
- 20151028整理罗列某种开发所包括对技术(技术栈),“较为全面”地表述各种技术大系的图表:系统开发技术栈图、Web前端技术栈图、数据库技术栈图、.NET技术栈图
———————————— 我的软件开发生涯 (10年开发经验总结和爆栈人生) 爆栈人生 现在流行说全栈.每种开发都有其相关的技术.您是否觉得难以罗列某种开发所包括对技术(技术栈)呢? 您是否想过: ...
- [转帖]技术盛宴 | 关于PoE以太网供电技术详解
技术盛宴 | 关于PoE以太网供电技术详解 https://smb.pconline.com.cn/1208/12085824.html [PConline 干货铺]随着物联网技术飞速发展,需要提 ...
- [IC]Lithograph(2)光刻技术的分辨率与分辨率增强技术
接上一篇介绍IC制造的基本过程,光刻的基本过程.这篇文章继续介绍光刻过程中的一些概念. 该系列文章的目录如下: [IC]Lithograph(0)半导体制造的基本过程 [IC]Lithograph(1 ...
- 转:WebRTC技术及应用2 – NAT穿越技术的使用
评:webrtc自带的打洞,穿透协议. 转: http://www.unclekevin.org/?p=924 959 views WebRTC技术及应用2 – NAT穿越技术的使用 发表回复 (题图 ...
- Android 插件技术:动态加载dex技术初探
1.Android动态加载dex技术初探 http://blog.csdn.net/u013478336/article/details/50734108 Android使用Dalvik虚拟机加载可执 ...
随机推荐
- python实现打扑克方法
# 游戏规则:# 一付扑克牌,去掉大小王,每个玩家发3张牌,最后比大小,看谁赢.## 有以下几种牌:# 豹子:三张一样的牌,如3张6.# 同花顺:即3张同样花色的顺子, 如红桃 5.6.7# 顺子:又 ...
- 21°C的冬天
2023-12-08 16:15:36 星期五 标题没有在胡说,今天穿着初秋的衣服还嫌热,尤其是蒋震图书馆的空调更是燥热. 明天就去考教资面试了,但是一点也没有学习的兴趣,今天下午四点就写完了这周所有 ...
- Blazor流程编排的艺术:深入Z.Blazor.Diagrams库的使用与实践
为现代网页应用开发提供动力的其中一个重要方面就是前端框架的强大功能与灵活性.而在.NET生态中,Blazor以其独特的工作方式和优势逐渐获得了开发者们的青睐.今天,在这篇文章中,我将带你深入探索一个基 ...
- java代码审计跨站脚本(XSS)--反射型
一.基础:跨站脚本(Xss) 一.原理: 恶意攻击者往web页面里插入恶意js代码,而在服务端没有对数据进行严格的过滤.当用户浏览页面时,js代码必须在该html页面中(hrml必须要存在这个而已艾玛 ...
- 检索增强生成(RAG)实践:基于LlamaIndex和Qwen1.5搭建智能问答系统
检索增强生成(RAG)实践:基于LlamaIndex和Qwen1.5搭建智能问答系统 什么是 RAG LLM 会产生误导性的 "幻觉",依赖的信息可能过时,处理特定知识时效率不高, ...
- CSS样式(第二篇)
CSS样式(第二篇) 关于定位position: li.widget {position: relative;}相对定位,设定一个参照物. @media (max-width: 980px) .t ...
- nginx中目录浏览配置
root方式配置:(会自动加目录名) #开放本地目录-root server { listen 81; server_name localhost 127.0.0.1 0.0.0.0; charset ...
- leaflet 使用高德地图实例
let map = L.map("mapid", { minZoom: 10, maxZoom: 15, center: [37.005646, 114.52044], zoom: ...
- 每天上一当系列之vue修饰符.number
今天使用number修饰符去处理el-input的内容为数字做校验原本以为省事不少,没想到,为0开头无法输入第二位以后,并且输入的比较多的时候会出现Infinity 很神奇,网上查了说是element ...
- 给公众号接入`FastWiki`智能AI知识库,让您的公众号加入智能行列
最近由于公众号用户太多,我就在思考有啥方式能给微信公众号的粉丝提供更多的更好的服务?这个时候我就想是否可以给公众号接入一下AI?让用户跟微信公众号对话,然后还能回到用户的问题,并且我提供一些资料让AI ...