最近组里安排了点调研Dify任务。我跟着基于Docker+DeepSeek+Dify :搭建企业级本地私有化知识库超详细教程一步一步走,前面都挺顺利,但在Dify的Ollama中引入大模型这一步卡住了:按照原文,我添加了本地安装的deepseek-r1:1.5b,点击“保存”,提示“保存成功”但模型列表却是空的。

我摸索了半天,改了一通配置终于搞定,其中关键的一步配置在CXXN上看到了一些蛛丝马迹,但CXXN搞的付费订阅非常恶心,我从其他渠道弄明白以后,总结了一下自己做的操作,共享出来。

问题的根因

  • Dify默认配置对插件安装过程的​​超时限制较短​​,且依赖下载可能因网络问题失败
  • 确保 Ollama 插件有足够时间完成安装,并通过国内镜像源加速依赖下载

解决方法

假定你已经在Windows环境完成了Docker安装、Dify镜像的下载和启动、Ollama的本地安装,要在Dify里的Ollama插件添加大模型:

先把Dify镜像停掉:去dify/docker目录下执行

docker-compose down

可以看到关联的镜像状态都是Removed

编辑dify/docker/docker-compose.yaml,在environment部分增加

PYTHON_ENV_INIT_TIMEOUT: 600 # 延长超时时间(默认值较低可能导致安装超时)

PIP_MIRROR_URL: "https://pypi.tuna.tsinghua.edu.cn/simple" # 替换为国内镜像源加速依赖安装

重启dify

docker-compose up -d

先看下Docker的日志,出现了一些相关的信息:



等到Ollama安装完成时,再回到Dify的Ollama添加大模型,发现之前保存的模型都出现,可以继续下一步了,Good Job!

其他的排查手段和配置更改

在排查过程中,我还做了一些其他配置变更,关系应该不大但是还是记录下,便于后续查阅。

如何判断Docker中运行的Dify能访问本地安装的Ollama?

Windows/Mac是默认支持的,Linux需要一些配置。进入Dify运行中的镜像,执行curl http://host.docker.internal:11434确认。还可以执行curl http://host.docker.internal:11434/api/tags确认ollama已安装的模型。

Ollama是否要手动启动(执行ollama serve)?

Windows确定它在运行即可,如果在运行就不需要再次执行。

是否要降低Ollama版本到0.15.x?

没必要。Ollama的版本号遵循语义化版本规范,看上去比较跳跃:如1.6.0 → 0.15.8 → 1.4.1,某些博文提到添加模型不成功可以通过降低版本到0.15.x来解决。但我在最新的1.6.0通过上文中的配置也解决了这个问题。

Ollama的环境变量是否是必须的?

也许不是必须的,但是在我之前的尝试里已经添加过了:OLLAMA_HOST:0.0.0.0OLLAMA_ORIGING:*

配置变更后重启Dify服务的方法

配置变更后一般都要重启一下。这步不是在Docker Desktop,而是在Dify目录下,cmd中分别执行:

docker-compose down

docker-compose up -d

Dify配置页面“系统模型设置”提示“系统模型尚未完全配置”是否有影响?

没有任何影响。实际上当你配置好LLM和TEXT EMBEDDING两种模型后,这个提示就会消失。

附:Docker+DeepSeek+Dify安装全流程简述(Win10版)

为了便于查阅和后续的复用,我简单总结了一下整个流程。完整版可以看基于Docker+DeepSeek+Dify :搭建企业级本地私有化知识库超详细教程

  1. 下载安装docker、WSL,确定Docker Desktop启动时右下角出现Engine running

    1.1 (可选)迁移docker镜像路径:Settings->Resources->Disk image location

    1.2 (可选,国内一般必须)配置国内镜像源:Settings-> Docker Engine

    1.3 (可选)拉取镜像,cmd中docker pull hello-world
  2. 安装Omalla及DeepSeek等大模型(本地版)

    2.1 Ollama官网下载

    2.2 安装,(可选,可以通过特殊方法改变安装路径), cmd中ollama -v可以看到版本即表示安装成功

    2.3 安装DeepSeek等大模型

    2.3.1 在Ollama官网的models中找到对应模型及版本,点击复制按钮获取全名,以deepseek-r1:1.5b为例,cmd输入ollama run deepseek-r1:1.5b开始下载

    2.3.2 下载完成即进入对话模式

    2.4 (可选)安装ChatBox AI

    2.4.1 选择Ollama API即可图形化使用本地的DeepSeek

    2.4.2 连接Ollama失败时新增两个环境变量OLLAMA_HOST:0.0.0.0OLLAMA_ORIGING:*,需重启Ollama
  3. 安装Dify

    3.1 去Dify的Github,可以git clone也可以下载最新版的zip包直接解压到目标路径

    3.2 .env.example复制并重命名为.env

    3.3 在Dify目录拉去依赖docker-compose up -d,完成后在docker中确认镜像都在运行中
  4. Dify配置

    4.1 进入本地Dify:http://127.0.0.1/,创建管理员用户

    4.2 右上角头像,设置->模型供应商,添加Ollama插件

    4.3 Ollama插件中添加已安装的模型:模型名称为带版本号的全称,URL为http://host.docker.internal:11434。如果添加提示成功但仍然没有模型,参考正文的解决方法。
  5. 创建应用,开始使用。

解决Dify的Ollama插件添加模型时保存成功但模型为空的问题的更多相关文章

  1. Keras(六)Autoencoder 自编码 原理及实例 Save&reload 模型的保存和提取

    Autoencoder 自编码 压缩与解压 原来有时神经网络要接受大量的输入信息, 比如输入信息是高清图片时, 输入信息量可能达到上千万, 让神经网络直接从上千万个信息源中学习是一件很吃力的工作. 所 ...

  2. dedecms添加文章时提示标题为空,编辑文章时编辑器空白的解决办法

    dedecms添加文章时提示标题为空,编辑文章时编辑器空白的解决办法 dedecms出现这个问题与代码无关,主要是和PHP的版本有关,用的PHP5.4,更换成PHP5.2之后就不会有这个问题了. 问题 ...

  3. 解决 VS Code「Code Runner」插件运行 python 时的中文乱码问题

    描述 这里整理了两种 VS Code「Code Runner」插件运行 python 时乱码的解决方案.至于设置「Auto Guess Encoding」为 true 的操作这里就不多描述了. 乱码截 ...

  4. 解决在mysql表中删除自增id数据后,再添加数据时,id不会自增1的问题

    https://blog.csdn.net/shaojunbo24/article/details/50036859 问题:mysql表中删除自增id数据后,再添加数据时,id不会紧接.比如:自增id ...

  5. 给jquery-validation插件添加控件的验证回调方法

    jquery-validation.js在前端验证中使用起来非常方便,提供的功能基本上能满足大部分验证需求,例如:1.内置了很多常用的验证方法:2.可以自定义错误显示信息:3.可以自定义错误显示位置: ...

  6. 解决eclipse中svn插件总是提示输入密码的问题

    一.背景 最近在eclipse中使用svn插件进行远程仓库代码管理时,老是出现提示让输入密码,特别烦人,经过努力,终于解决该问题,拿来和大家分享~ 二.svn插件密码机制以及出现问题的原因分析 当我们 ...

  7. 使用mx:Repeater在删除和添加item时列表闪烁

    使用mx:Repeater在删除和添加item时列表闪烁 不可能在用户界面上闪闪的吧,recycleChildren属性可帮助我们 recycleChildren属性==缓存,设为true就可以了 本 ...

  8. phpcmsv9如何实现添加栏目时不在首页内容区显示只在导航栏显示

    之前王晟璟一直使用PHPCMSV9系统建过自己的个人门户网站,同时也建立了一个其他类型的网站,感觉非常不错,我不得不说PHPCMSV9的功能非常齐全,非常强大. 但有一点时常让王晟璟感到很烦脑,那就是 ...

  9. 警惕rapidxml的陷阱:添加节点时,请保证变量的生命周期

    http://www.cnblogs.com/chutianyao/p/3246592.html 项目中要使用xml打包.解析协议,HQ指定了使用rapidxml--号称是最快的xml解析器. 功能很 ...

  10. 如何解决FormView中实现DropDownList连动选择时出现 "Eval()、XPath() 和 Bind() 这类数据绑定方法只能在数据绑定控件的上下文中使用" 的错误

    原文:如何解决FormView中实现DropDownList连动选择时出现 "Eval().XPath() 和 Bind() 这类数据绑定方法只能在数据绑定控件的上下文中使用" 的 ...

随机推荐

  1. HttpRunner使用总结

    1.安装 打开cmd或cmder,输入命令:pip3 install httprunner 安装完成输入命令:hrun -V或hrun -h 检查安装是否成功 2.使用 1)新建test.yaml文件 ...

  2. @ResponseBody 响应 json 数据

    /** * 将json数据封装到bean对象中条件: * 1:json数据中的key名必须和bean对象的属性相同 * 2:添加jsonjar包的支持 * 作用:使用@ResponseBody 注解实 ...

  3. fiddler的自动响应器

    1.点击autoresponder,勾选enable rules和unmatched requests passthrough 2.替换步骤 (1)把要替换的会话拉取到空白处,或者选中要替换的内容点击 ...

  4. 历数java虚拟机GC的种种缺点

    Java通过垃圾收集器(Garbage Collection,简称GC)实现自动内存管理,这样可有效减轻Java应用开发人员的负担,也避免了更多内存泄露的风险. 如果你用过C++等需要手动管理内存的语 ...

  5. HarmonyOS NEXT开发实战教程--招聘app

    这一周忙到起飞,只能在周末发个文章.今天的内容比较简单,是一个招聘app,适合新手友友参考,大佬们可以直接忽略. 看一下效果图: 这是一个比较常见的应用,大家做这类应用建议大家先分析一下应用和页面的结 ...

  6. 使用Electron构建跨平台的抓取桌面程序

    谈起桌面应用开发技术, 我们会想到.Net下的WinForm, Java下的JavaFX以及Linux下的QT. 这些技术对于Web应用程序员来说一般比较陌生, 因为大多Web应用程序员的开发技能是前 ...

  7. python简单的time ticker

    在某些时候,我们需要精确的启动一个func,如果用time.sleep简单的轮询,会因为执行的任务阻塞,或者其他原因导致无法精确的定时执行. 例如在采集某些数据的时候,需要精确的每60秒采集一次,如果 ...

  8. 2025最好的Next.js面试

    2025最好的Next.js面试题(一) 最近在面试,就写一些关于问到的面试题,同时也过一下知识点. 基础概念 什么是Next.js?它与React的关系是什么? Next.js是一个基于React的 ...

  9. Deep Learning Book在线阅读

    1.Deep Learning for Anomaly Detection https://ff12.fastforwardlabs.com/

  10. 3D Gaussian splatting 03: 用户数据训练和结果查看

    目录 3D Gaussian splatting 01: 环境搭建 3D Gaussian splatting 02: 快速评估 3D Gaussian splatting 03: 用户数据训练和结果 ...