深入浅出分析最近火热的Mem0个性化AI记忆层

最近Mem0横空出世，官方称之为PA的记忆层，The memory layer for Personalized AI，有好事者还称这个是RAG的替代者，Mem0究竟为何物，背后的原理是什么，我们今天来一探究竟。

Mem0 介绍

官方介绍为：

Mem0 provides a smart, self-improving memory layer for Large Language Models, enabling personalized AI experiences across applications.

关键点，是为LLM提供的智能的，可自我改进的记忆层，从而可以实现在各种应用中提供更加个性化的和连贯一致的用户体验。

主要特点

多层次记忆：支持用户级、会话级和AI代理级的记忆保留。
自适应个性化：根据用户交互不断改进，提供精准个性化记忆。
开发者友好API：简单易用，易于集成。
跨平台一致性：保持不同设备上的行为一致性。
托管服务：简化部署和维护。

快速开始

安装：通过pip安装mem0ai。

pip install mem0ai

基本用法：

import os

from mem0 import Memory

# 依赖LLM提取记忆，所以需要open ai

os.environ["OPENAI_API_KEY"] = "xxx"

# 吃石化 Mem0

m = Memory()

# 通过add方法，存储非结构化的记忆，metadata提供schema定义

result = m.add("I am working on improving my tennis skills. Suggest some online courses.", user_id="alice", metadata={"category": "hobbies"})

print(result)

# Created memory: Improving her tennis skills. Looking for online suggestions.

# Retrieve memories

all_memories = m.get_all()

print(all_memories)

# 搜索记忆  Search memories

related_memories = m.search(query="What are Alice's hobbies?", user_id="alice")

print(related_memories)

# 更新记忆 Update a memory

result = m.update(memory_id="m1", data="Likes to play tennis on weekends")

print(result)

# Get memory history

history = m.history(memory_id="m1")

print(history)

上述的示例代码展示了如何添加记忆、检索记忆、搜索、更新和获取记忆历史。

注意代码里的metadata, 这里相当于定义了一个schema，让LLM从非结构化数据里提取相关的记忆信息。

原理分析

透过上面的示例代码，我们先来猜测下mem0的原理：

通过LLM+制定的metadata，抽取记忆信息，这里雷士知识图谱抽取，重点是定制一个合适的prompt来抽取有效信息
相关记忆信息通过向量化存储，因此可以支持记忆信息检索
记忆支持更新，例如demo里的hobbies更新

我们下载代码一探究竟。

记忆管理

def add(

        self,

        data,

        user_id=None,

        agent_id=None,

        run_id=None,

        metadata=None,

        filters=None,

        prompt=None,

    ):

        """

        Create a new memory.

        Args:

            data (str): Data to store in the memory.

            user_id (str, optional): ID of the user creating the memory. Defaults to None.

            agent_id (str, optional): ID of the agent creating the memory. Defaults to None.

            run_id (str, optional): ID of the run creating the memory. Defaults to None.

            metadata (dict, optional): Metadata to store with the memory. Defaults to None.

            filters (dict, optional): Filters to apply to the search. Defaults to None.

        Returns:

            str: ID of the created memory.

        """

        if metadata is None:

            metadata = {}

        embeddings = self.embedding_model.embed(data)

        filters = filters or {}

        if user_id:

            filters["user_id"] = metadata["user_id"] = user_id

        if agent_id:

            filters["agent_id"] = metadata["agent_id"] = agent_id

        if run_id:

            filters["run_id"] = metadata["run_id"] = run_id

        if not prompt:

            prompt = MEMORY_DEDUCTION_PROMPT.format(user_input=data, metadata=metadata)

        extracted_memories = self.llm.generate_response(

            messages=[

                {

                    "role": "system",

                    "content": "You are an expert at deducing facts, preferences and memories from unstructured text.",

                },

                {"role": "user", "content": prompt},

            ]

        )

        existing_memories = self.vector_store.search(

            name=self.collection_name,

            query=embeddings,

            limit=5,

            filters=filters,

        )

        existing_memories = [

            MemoryItem(

                id=mem.id,

                score=mem.score,

                metadata=mem.payload,

                text=mem.payload["data"],

            )

            for mem in existing_memories

        ]

        serialized_existing_memories = [

            item.model_dump(include={"id", "text", "score"})

            for item in existing_memories

        ]

        logging.info(f"Total existing memories: {len(existing_memories)}")

        messages = get_update_memory_messages(

            serialized_existing_memories, extracted_memories

        )

        # Add tools for noop, add, update, delete memory.

        tools = [ADD_MEMORY_TOOL, UPDATE_MEMORY_TOOL, DELETE_MEMORY_TOOL]

        response = self.llm.generate_response(messages=messages, tools=tools)

        tool_calls = response["tool_calls"]

        response = []

        if tool_calls:

            # Create a new memory

            available_functions = {

                "add_memory": self._create_memory_tool,

                "update_memory": self._update_memory_tool,

                "delete_memory": self._delete_memory_tool,

            }

            for tool_call in tool_calls:

                function_name = tool_call["name"]

                function_to_call = available_functions[function_name]

                function_args = tool_call["arguments"]

                logging.info(

                    f"[openai_func] func: {function_name}, args: {function_args}"

                )

                # Pass metadata to the function if it requires it

                if function_name in ["add_memory", "update_memory"]:

                    function_args["metadata"] = metadata

                function_result = function_to_call(**function_args)

                # Fetch the memory_id from the response

                response.append(

                    {

                        "id": function_result,

                        "event": function_name.replace("_memory", ""),

                        "data": function_args.get("data"),

                    }

                )

                capture_event(

                    "mem0.add.function_call",

                    self,

                    {"memory_id": function_result, "function_name": function_name},

                )

        capture_event("mem0.add", self)

        return response

这里的逻辑比较简单

参数的判断、处理
通过 MEMORY_DEDUCTION_PROMPT 结合用户的data，抽取记忆，得到extracted_memories
然后通过data查询相关的existing_memories
然后将extracted_memories、existing_memories 拼接到一起，交予大模型，让大模型调用合适的tool来更新记忆，tools ： [ADD_MEMORY_TOOL, UPDATE_MEMORY_TOOL, DELETE_MEMORY_TOOL]
根据function call的结果，调用tool_calls更新记忆

本质上全部委托给大模型，通过prompt做了一定的约束。

Mem0 点评

Mem0 是RAG的杀手?

NO, Mem0 是RAG的助手，可以帮助提供更个性化的内容。

Mem0 有什么用处？

Mem0可以显著提升个性化AI的能力。通过记住用户的偏好等用户画像信息，AI产品就可以提供更加个性化服务，有较好的想象空间。传统的用户画像依赖于产研去设计schema，只能挖掘存储设计好的一些特征，而Mem0通过大模型，可以提供schame base和大模型自己挖掘的记忆，提供了一条更通用的方案
PA产品、泛娱乐、教育等各个领域，都可以发挥出作用

Mem0 有什么不足？

mem0当前未看到提供一些通用的schema，提供graph base的管理支持
用户的memory应该区分短中长期记忆，mem0当前是未区分的，需要有解决方案
自定义的记忆管理规则
支持结合RAG 和用户对话历史，初始化记忆
完全依赖LLM，成本较大

我们也可以看下mem0的roadmap，有规划提供一些自定义规则支持：

Integration with various LLM providers
Support for LLM frameworks
Integration with AI Agents frameworks
Customizable memory creation/update rules
Hosted platform support

深入浅出分析最近火热的Mem0个性化AI记忆层的更多相关文章

深入浅出分析C#接口的作用
1.C#接口的作用 :C#接口是一个让很多初学C#者容易迷糊的东西,用起来好像很简单,定义接口,里面包含方法,但没有方法具体实现的代码,然后在继承该接口的类里面要实现接口的所有方法的代码,但没有真正认 ...
Android指纹识别深入浅出分析到实战（6.0以下系统适配方案）
指纹识别这个名词听起来并不陌生,但是实际开发过程中用得并不多.Google从Android6.0(api23)开始才提供标准指纹识别支持,并对外提供指纹识别相关的接口.本文除了能适配6.0及以上系统, ...
深入浅出分析MySQL MyISAM与INNODB索引原理、优缺点、主程面试常问问题详解
本文浅显的分析了MySQL索引的原理及针对主程面试的一些问题,对各种资料进行了分析总结,分享给大家,希望祝大家早上走上属于自己的"成金之路". 学习知识最好的方式是带着问题去研究所 ...
深入浅出分析MySQL索引设计背后的数据结构
在我们公司的DB规范中,明确规定: 1.建表语句必须明确指定主键 2.无特殊情况,主键必须单调递增对于这项规定,很多研发小伙伴不理解.本文就来深入简出地分析MySQL索引设计背后的数据结构和算法,从 ...
深入浅出分析MySQL MyISAM与INNODB索引原理、优缺点分析
本文浅显的分析了MySQL索引的原理及针对主程面试的一些问题,对各种资料进行了分析总结,分享给大家,希望祝大家早上走上属于自己的"成金之路". 学习知识最好的方式是带着问题去研究所 ...
深入浅出分析MySQL常用存储引擎
MyISAM是MySQL的默认数据库引擎(5.5版之前),由早期的ISAM(Indexed Sequential Access Method:有索引的顺序访问方法)所改良.虽然性能极佳,但却有一个缺点 ...
Android指纹识别深入浅出分析到实战
指纹识别这个名词听起来并不陌生,但是实际开发过程中用得并不多.Google从Android6.0(api23)开始才提供标准指纹识别支持,并对外提供指纹识别相关的接口.本文除了能适配6.0及以上系统, ...
【集合系列】- 深入浅出分析Collection中的List接口
一.List简介 List 的数据结构就是一个序列,存储内容时直接在内存中开辟一块连续的空间,然后将空间地址与索引对应. 以下是List集合简易架构图由图中的继承关系,可以知道,ArrayList. ...
【集合系列】- 深入浅出分析HashMap
一.摘要在集合系列的第一章,咱们了解到,Map的实现类有HashMap.LinkedHashMap.TreeMap.IdentityHashMap.WeakHashMap.Hashtable.Pro ...
【集合系列】- 深入浅出分析 ArrayDeque
一.摘要在 jdk1.5 中,新增了 Queue 接口,代表一种队列集合的实现,咱们继续来聊聊 java 集合体系中的 Queue 接口. Queue 接口是由大名鼎鼎的 Doug Lea 创建,中 ...

随机推荐

.NET桌面程序混合开发之二：在原生WinFrom程序中使用WebView2
本文将介绍如何在WinForms中嵌入WebView2,并讲到WebView2的主要特征.点击了解更多WebView2的API. 1. 准备 Visual Studio 2017 及以上版本 WebV ...
Yarp 让系统内调度更灵活 http、https、websocket 反向代理
简介 Yarp 是微软团队开发的一个反向代理组件, 除了常规的 http 和 https 转换通讯,它最大的特点是可定制化,很容易根据特定场景开发出需要的定制代理通道. 详细介绍:https://de ...
7.12考试总结(NOIP模拟12)[简单的区间·简单的玄学·简单的填数]
即使想放弃,也没法放弃最想要的东西,这就是人前言这次应该是和 SDFZ 一起打的第一场比赛吧. 然而我还是 FW 一个... 这次考试也有不少遗憾,主要的问题是码力不足,不敢去直面正解,思考程度不 ...
30万奖金池鼓励工控人，AIRIOT智慧物联应用场景创新大赛等你来战！
随着工业和智慧领域数智化发展步伐的逐步加快,智慧物联应用场景越来越广泛,涵盖了智慧城市.智能园区.智慧能源.智慧电力.智能制造.工业物联网等多个领域.航天科技控股集团股份有限公司举办[AIRIOT智慧 ...
RHCSA认证学习_尝试
第一天一,linux系统的基本概念以及命令终端字段含义介绍 linux系统的基本概念: ·多用户的系统:允许同时执行多个任务 ·多任务的系统:允许同时执行多个任务 ·严格区分大小写:命令,选项,参数 ...
webpack externals忽略不打入的包
例如项目中使用从 CDN 引入 jQuery,而不是把它打包进来使用 import $ from 'jquery' webpack.config.js externals: { jquery: 'jQ ...
Windows下cmd命令行ssh连接Linux服务器
1.window+R键进入运行 2.输入cmd,运行命令行工具 3.使用,命令ssh连接服务器 ssh -t 用户名@ip地址 -p 22 例如: 输入密码,显示连接成功
C# .NET 国密 SM2 签名默认USER ID
C# .NET 国密 SM2 签名默认USER ID: 1234567812345678 string userId = "1234567812345678"; byte[] b ...
C#.NET 4.8 WEBP 转 GIF
C#.NET 4.8 WEBP 转 GIF 项目是.NET 4.8. nuget 引用 Magick.NET-Q16-AnyCPU ,版本:7.14.5.高版本,如:12.2 已经不支持.NET FR ...
vmware 和 hyper-v不兼容，此主机不支持64位客户机操作系统
在控制面板中关闭hyper-v功能后,仍然提示此主机不支持64位客户机操作系统. 解决方法: 需要在开始按钮 - 右键 -打开Windows PowerShell(管理员). 输入: bcdedit ...