如何在离线的Linux服务器上部署 Ollama，并使用 Ollama 管理运行 Qwen 大模型

手动安装 Ollama

根据Linux的版本下载对应版本的 Ollama，

查看Linux CPU型号，使用下面的命令

#查看Linux版本号

cat /proc/version

#查看cpu架构

lscpu

x86_64 CPU选择下载ollama-linux-amd64；aarch64|arm64 CPU选择下载ollama-linux-arm64

安装和运行

在有网络的环境下载好tgz安装包，并上传到离线 Linux 服务器
安装，使用下面的命令：

sudo tar -C /usr -xzf ollama-linux-amd64.tgz

启动 Ollama，使用下面的命令：

ollama serve

另外启动一个终端验证是否运行成功，使用下面的命令：

#查看所有下载的模型

ollama list

这样 Ollama 就算安装完成了。之所以下载 Ollama，是因为 Ollama 提供了大模型运行的所有环境，使用它能方便的在本地运行各种 LLM。

在 Ollama 上部署 Qwen2.5

下载 Qwen2.5

在国内 AI 社区 ModelScope 下载 Qwen2.5 模型，国外的 AI 社区 Hugging Face 也可以下载，不过要想下载国外的大模型，例如 Llama，需要填写联系信息进行申请，不过申请了也不一定会给过的。

推荐使用 Git 下载，使用下面的命令：

git lfs install

git clone https://www.modelscope.cn/Qwen/Qwen2.5-1.5B-Instruct.git

从 Safetensors 导入模型

Git 克隆下来的仓库会包含一个 model.safetensors 文件，需要将其格式转换为二进制 .bin 形式，才能由 Ollama 着手导入进行管理。

大模型格式转换主要用到一个工具 llama.cpp，使用下面的命令同步 llm/llama.cpp 子模块：

#首先克隆 Ollama 仓库

git clone [git@github.com](mailto:git@github.com):ollama/ollama.git ollama

cd ollama

#然后同步子模块

git submodule init

git submodule update llm/llama.cpp

#接着安装 python 依赖

python3 -m venv llm/llama.cpp/.venv

source llm/llama.cpp/.venv/bin/activate

pip install -r llm/llama.cpp/requirements.txt

转换模型Qwen2.5，使用下面的命令：

python llm/llama.cpp/convert_hf_to_gguf.py ./model --outtype f16 --outfile converted.bin

编写模型文件 Modelfile (没有后缀名)，文件内容如下：

FROM converted.bin

TEMPLATE """{{ if .System }}<|im_start|>system

{{ .System }}<|im_end|>

{{ end }}{{ if .Prompt }}<|im_start|>user

{{ .Prompt }}<|im_end|>

{{ end }}<|im_start|>assistant

"""

SYSTEM """

你是一个乐于助人的助手，但你会用20世纪30年代黑手党暴徒的风格去回答问题

"""

将转换后的 .bin 文件和 Modelfile 文件上传到离线的 Linux 服务器的同一目录下，使用下面的命令导入到 Ollama：

ollama create Qwen2.5 -f Modelfile

查看和运行大模型，使用下面的命令：

#查看大模型信息

ollama show Qwen2.5

#查看 Ollama 管理的所有大模型

ollama list

#运行大模型

ollama run Qwen2.5

#查看正在运行的大模型

ollama ps

这样 Qwen2.5 就算导入成功了，实际上 llama 工具还可对大模型进行量化，量化后的大模型会更加精确，更加节省系统资源，有关量化的信息可自行研究。

如何在离线的Linux服务器上部署 Ollama，并使用 Ollama 管理运行 Qwen 大模型的更多相关文章

如何在Linux服务器上部署禅道
最近换了新的项目团队,由于新团队比较年轻化,没有实行正规的项目管理,于是我自告奋勇要为团队管理出一份力,帮助团队建立敏捷化的项目管理,经过多方考究和对比后,选择了目前较受欢迎的开源项目管理软件:禅道. ...
linux服务器上部署项目，同时运行两个或多个tomcat
在阿里云服务器上部署项目的时候,想使用阿里云提供的负载均衡服务并创建两个监听(如图), 但需要一台服务器提供两个端口,于是就请教前辈并查询资料,得知: 一台服务器提供两个端口,有两种方式: 1.一个t ...
Django项目在Linux服务器上部署和躺过的坑
引言在各方的推荐下,领导让我在测试环境部署之前开发的测试数据预报平台.那么问题来了,既然要在服务器上部署, 就需要准备: 1.linux服务器配置 2.linux安装python环境搭建与配置 3. ...
如何在Linux服务器上部署Mysql
一.安装mysql 1.通过文件上传工具,将mysql安装包上传到linux服务器上 2.卸载mariadb包,由于系统中存在mariadb包会导致mysql安装时报错mariadb-libs被mys ...
linux服务器上部署jdk+tomcat+rocketmq+redis-cluster
通常我们拿到一组干净的linux服务器,需要初始化安装一些基础软件,这里一站式介绍部署jdk+tomcat+rocketmq+redis-cluster 前言:如果要在多台服务器上安装,在一台服务器上 ...
零基础在Linux服务器上部署javaweb项目
本教程使用的工具下载链接:http://pan.baidu.com/s/1sl1qz2P 密码:43pj 一.安装JDK 1.首先要查看服务器的系统版本,是32位还是64位 #getconf LONG ...
So Easy - 在Linux服务器上部署 .NET Core App
.NET Core 是微软提供的免费.跨平台和开源的开发框架,可以构建桌面应用程序.移动端应用程序.网络应用程序.物联网应用程序和游戏应用程序等.如果你是 Windows 平台下的 dotnet 开发 ...
在Linux服务器上部署node项目（git部署，forever持续运行，配置SSL证书）
一.环境部署 1.下载安装包: wget https://nodejs.org/dist/v9.9.0/node-v9.9.0-linux-x64.tar.xz 2.解压并进入目录: xz -d no ...
.Net Core WebApi（三）在Linux服务器上部署
鸽了好久,终于有个时间继续写了,继上一篇之后,又写(水)了一篇,有什么不足之处请大家指出,多谢各位了. 下面有两个需要用到的软件,putty和pscp,我已经上传到博客园了,下载请点击这里. 一.准备 ...
linux服务器上部署springboot项目，并让他持续运行到后台
我们知道在运行springboot 项目只需要java -jar + 项目的war包(jar包)名. 但是只要终端已停止那么服务就会被关闭,也就无法访问到我们的项目了.所以我们可以使用守护进程的方式来 ...

随机推荐

一种很变态但有效的DDD建模沟通方式
本文书接上回<这就是为什么你学不会DDD>,关注公众号(老肖想当外语大佬)获取信息: 最新文章更新: DDD框架源码(.NET.Java双平台): 加群畅聊,建模分析.技术实现交流: 视频 ...
Windows 包管理器
WinGet WinGet 是微软官方的软件管理器. 搜索 WinGet 包常用命令 winget install <packaeg> # 安装包 winget uninstall &l ...
Maven 项目有Dependencies，使用时无法引用，爆红
1. 找到本地的该依赖的文件夹,将里面的.lastUpdated文件删除 2. IDEA清缓存重启
【YashanDB知识库】同时设置默认值和非空约束时报错YAS-02070
[问题分类]功能使用 [关键字]YAS-02070 [问题描述] SQL create table test01(id int,name varchar(10)); insert into test0 ...
SpringBoot定时任务实现数据同步
业务的需求是,通过中台调用api接口获得,设备数据,要求现实设备数据的同步. 方案一:通过轮询接口的方式执行 pullData() 方法实现数据同步该方式的原理是先清空之前的所有数据,然后重新插入通 ...
CIIS 2023 丨聚焦文档图像处理前沿领域，合合信息 AI 助力图像处理与内容安全保障
近日,2023第十二届中国智能产业高峰论坛(CIIS 2023)在江西南昌顺利举行.大会由中国人工智能学会.江西省科学技术厅.南昌市人民政府主办,南昌市科学技术局.中国工程科技发展战略江西研究院承办. ...
ST-SSL: 用于交通流量预测的时空自监督学习《Spatio-Temporal Self-Supervised Learning for Traffic Flow Prediction》(交通流量预测、时空异质性、自监督、数据增强)
2023年10月23日,继续论文,好困,想发疯. 论文:Spatio-Temporal Self-Supervised Learning for Traffic Flow Prediction Git ...
系统编程-进程-当文件操作遇上fork
我的关联博文: 系统编程-进程-fork深度理解.vfork简介系统编程-进程-先后fork或open一个文件的区别 test1: lseek基本使用 #include <stdio.h& ...
线段树与离散化技巧 Mayor's posters——poj 2528
问题描述: 有一堵海报墙,从左到右一共有10000000个小块,墙上贴了许多海报,每张海报的高度与墙的高度相同,宽度不同,新帖的海报会将原有的海报覆盖,问当所有人把海报贴完是,墙上可以看到几张海报输 ...
【赵渝强老师】Kafka的消息持久化
1.Kafka消息持久性概述 Kakfa依赖文件系统来存储和缓存消息.对于硬盘的传统观念是硬盘总是很慢,基于文件系统的架构能否提供优异的性能?实际上硬盘的快慢完全取决于使用方式.同时 Kafka 基于 ...

如何在离线的Linux服务器上部署 Ollama，并使用 Ollama 管理运行 Qwen 大模型

手动安装 Ollama

根据Linux的版本下载对应版本的 Ollama，

安装和运行

在 Ollama 上部署 Qwen2.5

下载 Qwen2.5

从 Safetensors 导入模型

如何在离线的Linux服务器上部署 Ollama，并使用 Ollama 管理运行 Qwen 大模型的更多相关文章

随机推荐

热门专题