一、概述

dify运行在容器中,PostgreSQL用的是阿里云,已经运行了很长一段时间。某些表的数据量很大,比如workflowruns表,就有100GB。这个主要是,详细记录了工作流的执行情况,包括执行时间、状态、结果等信息。
版本比较老,0.14.2,需要升级到0.15.3。

升级之前,除了对数据库做备份之外,还需要知道升级过程中,哪些表需要做更新处理。因为某些大表如果要添加字段,索引等操作,非常耗费时间,长达3个小时以上。

为了缩短升级过程,需要对数据库的某些大表,提前进行清理,一些不重要的数据,保留1个月即可。

二、代码分析

访问github官网,https://github.com/langgenius/dify

下载releases对应的版本的代码,0.14.2,0.15.3

得到文件,dify-0.14.2.zip,dify-0.15.3.zip

首先解压文件dify-0.14.2.zip

进入文件夹,dify-0.14.2\api\models

api是基于python flask框架开发的, models里面的python文件,都是数据库表结构文件。

然后解压文件dify-0.15.3.zip,对比2个model文件,发现workflowruns表,确实是有更新的

0.14.2如下:

total_tokens = db.Column(db.Integer, nullable=False, server_default=db.text("0"))

0.15.3 如下:

total_tokens: Mapped[int] = mapped_column(sa.BigInteger, server_default=sa.text("0"))

直接对比python文件,不够直观,涉及的文件比较多。就算看出来差异了,也不能直接看到具体的表字段是怎么变化的。

接下来,使用sql文件分析,会更加直观一些。

三、sql文件分析

演示环境,我们弄2台服务器,分别运行0.14.2,0.15.3。不需要任何数据库,直接空数据运行都没问题,主要是为了分析表结构。

0.14.2

进入0.14.2版本的容器,找到dify_db_1,进入docker

docker exec -it dify_db_1 /bin/bash

导出dify表结构

pg_dump -h localhost -p 5432 -U postgres -d dify -s -f dify-0.14.2.sql

将文件拷贝出来

docker cp dify_db_1:/dify-0.14.2.sql /tmp/dify-0.14.2.sql

0.15.3

进入0.15.3版本的容器,找到dify_db_1,进入docker

docker exec -it dify_db_1 /bin/bash

导出dify表结构

pg_dump -h localhost -p 5432 -U postgres -d dify -s -f dify-0.15.3.sql

将文件拷贝出来

docker cp dify_db_1:/dify-0.15.3.sql /tmp/dify-0.15.3.sql

对比差异

使用VsCode编辑器对比2个文件,dify-0.14.2.sql,dify-0.15.3.sql

差异如下:

左边是0.14.2,右边是0.15.3

新增表child_chunks

新增表data_source_oauth_bindings

比较关心的表workflowruns,确实发生了变化。

0.14.2版本total_tokens字段是int类型

0.15.3版本total_tokens字段是bigint类型

child_chunks表添加一个主键约束,确保 id 列中的值是唯一的。

dataset_auto_disable_logs表添加一个主键约束,确保 id 列中的值是唯一的。

child_chunks表添加组合索引child_chunk_dataset_id_idx

dataset_auto_disable_logs表添加索引dataset_auto_disable_log_created_atx,dataset_auto_disable_log_dataset_idx,dataset_auto_disable_log_tenant_idx

知道以上这些差异之后,就可以对生产PostgreSQL数据库做进一步处理了

dify升级,PostgreSQL数据库字段更新处理的更多相关文章

  1. db2数据库字段更新当前时间

    db2数据库中想要将字段的时间通过sql语句的方式更新: 例如: Update tablename set 字段1='打酱油', 字段2 = TO_CHAR(current timestamp,'YY ...

  2. 【EF】EntityFramework 更新数据库字段的三种方法

    实体类 public class TestDbContext : DbContext { public DbSet<Test> Tests { get; set; } public Tes ...

  3. 关于EF更新数据库,更新指定字段的设置

    1.关于EF跟新数据库更新指定字段的设置 在EF提交到数据库的时候或许某些字段不想更新.或者自己更新一个模型到数据库去! 1.更新数据不更新一些字段 /// <summary> /// 数 ...

  4. 【hibernate postgresql】注解@TypeDef/@Enumerated/数据库字段gender为枚举类型,从前台接受到实体后进行保存报错:org.postgresql.util.PSQLException: ERROR: column "gender" is of type gender but expression is of type character varying

    数据库字段gender为枚举类型,从前台接受到实体后进行保存报错:org.postgresql.util.PSQLException: ERROR: column "gender" ...

  5. Python numpy插入、读取至postgreSQL数据库中bytea类型字段

    安装psycopg2模块,此模块用于连接PostgreSQL数据库 ​pip install psycopg2 # -*- coding: utf-8 -*- import psycopg2 impo ...

  6. 【Jhipster】升级/修改 数据库结构

    前提 1.jhipster环境,jdk1.8,yeoman,node.js安装环境参考官方wiki,环境问题参考我的博客,如果出现注册中心空白页,请参考博客 2.首先需要启动jhipster基础服务, ...

  7. PostgreSQL介绍以及如何开发框架中使用PostgreSQL数据库

    最近准备下PostgreSQL数据库开发的相关知识,本文把总结的PPT内容通过博客记录分享,本随笔的主要内容是介绍PostgreSQL数据库的基础信息,以及如何在我们的开发框架中使用PostgreSQ ...

  8. android开发--数据库(更新或者降低版本)

    Andoird的SQLiteOpenHelper类中有一个onUpgrade方法. 1. 帮助文档里说的"数据库升级"是指什么? 你开发了一个应用,当前是1.0版本.该程序用到了数 ...

  9. C#访问postgresql数据库

    最近开始做C#的DotNet的工作,因为对PostgreSQL数据库比较有兴趣,所以自己研究了一下如何访问PostgreSQL的 数据库的问题. 1.为了访问PostgreSQL数据库,需要从pgfo ...

  10. 【转】使用PowerDesigner的建模创建升级管理数据库

    使用PowerDesigner的建模创建升级管理数据库 PowerDesigner是一种著名的CASE建摸工具,最开始为数据库建模设计,即物理模型(Physical Data Model)用于生成数据 ...

随机推荐

  1. 一步一步abp电商模块-1、搭建模块环境

    前言 目前在开发abp电商模块,打算做一步,写一步,算是对自己的记录,主要是参考nopcommoner 并结合abp模块开发 知识都是连贯的,如果你熟悉asp.net core 3.x.abp(非vN ...

  2. springboot-多模块构建-2

    三个标签完成springboot定时任务配置 1. 问题描述 Java项目定时任务是必备模块,月高风黑夜跑个批处理,记录或者统计一些系统信息. 2. 解决方案: 结合springboot,只需三个标签 ...

  3. 基于Fluss 的流式湖仓架构

    目录 1. What 2. 架构 2.1 CoordinatorServer 2.2 TabletServer 2.3 LogStore 2.4 KvStore 2.5 Tablet / Bucket ...

  4. DeepSeek 全面指南,95% 的人都不知道的9个技巧(建议收藏)

    大家好,我是汤师爷~ 最近,DeepSeek这款AI工具爆火国内外. 虽然许多人都开始尝试使用它,但有人吐槽说,没想象中那么牛. 其实问题不在工具,很多人的使用姿势就搞错了,用大炮打蚊子,白白浪费De ...

  5. last和history 查看登录和操作命令

    last命令 last命令:用于显示用户最近登录信息.单独执行last命令,它会读取/var/log/wtmp的文件,并把该文件的内容记录的登入系统的用户名单全部显示出来. 语法 last(选项)(参 ...

  6. DeepSeek本地化部署超简单,比装个office还简单

    一.背景 最近DeepSeek太火了,以至于每位伙伴都想尝试,都想说上几句.作为一名程序员,不仅想使用这个DeeptSeek的AI工具,还是用其做更多的事情,比如本地化部署.构建自己的知识库,或者其他 ...

  7. 用脚本采用wget方式直接下载谷歌云盘里面的文件实操

    今天在工作中遇到了一个挑战,在这里和大家分享一下我的解决过程.突然接到一个紧急需求,需要在服务器上部署一个模型文件,而这个文件存储在谷歌云盘里.摆在面前有两个选择: 方案一:先在本地下载,然后再上传到 ...

  8. 问题-ifconfig

    在运行centos7 运行ifconfig命令时出现: [root@kvm1 ~]# ifconfig -bash: ifconfig: command not found 原来是这样: 1.ifco ...

  9. QT5笔记: 22. 自定义代理

    代理作用:在界面发生编辑时可以指定编辑所用的组件,可以沟通Model和View 自定义代理需要继承的基类和需要实现的方法 使用步骤: 继承QStyledItemDelegate,实现上面的四个方法 在 ...

  10. AI与.NET技术实操系列(二):开始使用ML.NET

    引言 在当今技术飞速发展的时代,机器学习(Machine Learning, ML)已成为推动创新和变革的核心力量.从智能推荐系统到自动化决策工具,ML的应用无处不在,深刻影响着我们的生活和工作方式. ...