上次我们大概了解了一下 DeepSeek-R1 大模型,并简单提及了 Ollama 的一些基本信息。今天,我们将深入实际操作,利用腾讯云的 HAI 服务器进行 5 分钟部署,并实现本地 DeepSeek-R1 大模型的实时调用。接下来,我们直接进入部署过程。

服务器准备

首先,我们需要登录腾讯云平台并购买 HAI 应用服务。腾讯云提供了两种计费方式:包月计费和按时计费。由于我目前并没有特别紧迫或庞大的需求,因此为了节省成本,我选择了按时计费方式。具体的购买流程和配置选项可以参考下面的图示:

在我完成购买后,腾讯云 HAI 服务器会自动为我们部署 DeepSeek-R1 模型并启动运行,整个过程非常简便。同时,HAI 还提供了算力连接的选择,具体有三种不同的方式:

  1. ChatBotUI:这是一种广泛应用的可视化聊天界面,它不仅支持实时的聊天互动,还具备管理聊天记录和提示词模板等功能,非常适合需要快速构建对话系统的场景。
  2. CloudStudio:CloudStudio 是一款功能强大的在线集成开发环境(IDE)。它允许我们编写 Python 脚本、调试代码、进行多种应用开发和测试,非常适合开发者进行项目调试和优化。
  3. JupyterLab:作为一种极为流行的数据科学工具,JupyterLab 提供了多个终端选择,包括 Linux 终端和 Python 脚本执行环境。它为数据分析、模型训练及执行等任务提供了非常便捷的支持。

ChatBotUI

在这里,我们首先来了解一下可视化界面,并演示如何快速上手使用。通过这一界面,用户可以直观地进行各种操作,轻松实现需求的配置和调整。具体的操作步骤和界面效果可以参考下面的图示:

可以选择其他选项,虽然有时候需要进行角色授权,授权过程非常简单,点击“授权”按钮即可完成,无需进行复杂操作。一旦授权完成,你便可以进入聊天界面。在该界面中,HAI服务器提供了多种参数选项,例如7B和1.5B。选择合适的参数后,你就可以立即开始实时聊天,无需等待。

ollama终端

我们继续选择JupyterLab方式连接算力,这里选择终端,如图所示:

我们去看下终端命令查看下,如图所示:

在这里,我们可以看到其实它使用的也是基于Ollama运行的DeepSeek-R1大模型。通过这种方式,用户可以非常方便地直接使用Ollama提供的命令,来查看和操作相应的API接口。如图所示:

这里我们演示的是直接使用 Ollama 运行 DeepSeek-R1 大模型,模型参数为 1.5B。要结束当前会话,您可以使用快捷键 Ctrl + D 退出。不过,需要注意的是,采用这种方式仅支持在本地运行和启动,无法进行外网调用或配置远程访问。

因此,如果希望实现外网访问或其他更复杂的配置,接下来的步骤将会介绍相关方法。

ollama-API服务

这里我们查看ollama如果想要启动大模型服务接口,可以使用ollama serve命令启动,如图所示:

可以看到,系统已经成功开机并启动,且绑定的端口号为6399。在这种情况下,我们只需直接开放该端口即可。值得注意的是,HAI服务器还提供了外网IP地址,因此我们可以通过访问该IP来进行端口的开放设置。

接下来,我们将按照Ollama的API文档中的指引,完成端口设置的操作。具体操作流程如下所示:

CloudStudio连接

启动完API服务后,我们直接使用CloudStudio进行本地调用。新建一个py文件,代码内容如下:

from openai import OpenAI

client = OpenAI(api_key="ollama", base_url="http://localhost:6399/v1/")

response = client.chat.completions.create(
model="deepseek-r1:1.5b",
messages=[
{"role": "system", "content": "You are a helpful assistant"},
{"role": "user", "content": "Hello"},
],
stream=False
) print(response.choices[0].message.content)

这里虽然写了api-key信息,但是ollama是不会校验的,你可以写任何字符串,以为这个参数是方法必传参数。结果运行如下:

如果你安装完openai依赖包,但仍是无法找到,那么你就在CloudStudio中添加虚拟环境即可,命令如下:

python -m venv venv

然后再执行pip3 install openai命令即可成功运行。当然这里是本地测试,你也可以使用公网IP进行配置并调试。

总结

通过本次实践,我们成功地使用腾讯云的HAI服务器进行了DeepSeek-R1大模型的部署与实时调用。从购买HAI应用服务,到通过ChatBotUI、JupyterLab、CloudStudio等工具进行配置和调试,我们详细介绍了每个步骤。

通过本地和外网API的操作,我们不仅了解了模型部署的基本流程,还掌握了如何利用Ollama提供的API服务进行大模型调用。


我是努力的小雨,一个正经的 Java 东北服务端开发,整天琢磨着 AI 技术这块儿的奥秘。特爱跟人交流技术,喜欢把自己的心得和大家分享。还当上了腾讯云创作之星,阿里云专家博主,华为云云享专家,掘金优秀作者。各种征文、开源比赛的牌子也拿了。

想把我在技术路上走过的弯路和经验全都分享出来,给你们的学习和成长带来点启发,帮一把。

欢迎关注努力的小雨,咱一块儿进步!

腾讯云HAI服务器上部署与调用DeepSeek-R1大模型的实战指南的更多相关文章

  1. 阿里云esc服务器上部署java项目

    文章中使用centos(6和7版本).Xshell.Xftp 因为部署过程直接从操作服务器开始,如果你还没有连接好服务器请参考http://blog.csdn.net/ctrlxv/article/d ...

  2. PHP--腾讯云服务器上部署LNMP环境

    本文参考 云服务器上部署Laravel的实例教程 腾讯云 创建 Laravel5.4 项目 阿里云服务器部署php的laravel项目,在阿里云买ECS 搭建 Linux+Nginx+Mysql+PH ...

  3. unigui在阿里云服务器上部署

    unigui在阿里云服务器上部署 客户租用了阿里云WINDOWS2008服务器,部署UNIGUI发现死活不行,WINDOWS2008自带的IE9浏览器打开URL,卡死在loading...... 我远 ...

  4. [原创]在HP DL380 G7服务器上部署基于Ubuntu Server 16.04 和 VirtualBox的云平台

    对于一线开发人员来说,一提到虚拟机平台,往往会让人联想到在价格昂贵的服务器上部署VMware vSphere之类软件来实现. 笔者作为一个资深码农,也是一直梦寐着在自己家中打造一个真正的家庭私有云,秒 ...

  5. 使用腾讯云无服务器云函数(SCF)分析天气数据

    欢迎大家前往云+社区,获取更多腾讯海量技术实践干货哦~ 作者:李想 无服务器云函数(SCF)是腾讯云提供的Serverless执行环境,也是国内首款FaaS(Function as a Service ...

  6. 在 Ubuntu 14.04 服务器上部署 Hexo 博客

    版权声明:本文由宋秉金 原创文章,转载请注明出处: 文章原文链接:https://www.qcloud.com/community/article/241080001487926962 来源:腾云阁  ...

  7. .Net Core WebApi(二)在Windows服务器上部署

    上一篇学习到了如何简单的创建.Net Core Api和Swagger使用,既然写了接口,那么就需要部署到服务器上才能够正式使用.服务器主要用到了两种系统,Windows和Linux,.Net和Win ...

  8. 关于腾讯云ubuntu服务器tomcat访问慢问题

    在腾讯云上配了个一元的学生云,开始一切正常,直到配置tomcat开始出现各种莫名其妙的问题.最莫名其妙的是tomcat启动了,端口也 正常监听,安全组也放行端口了,然后问题来了. 用浏览器访问tomc ...

  9. linux服务器上部署项目,同时运行两个或多个tomcat

    在阿里云服务器上部署项目的时候,想使用阿里云提供的负载均衡服务并创建两个监听(如图), 但需要一台服务器提供两个端口,于是就请教前辈并查询资料,得知: 一台服务器提供两个端口,有两种方式: 1.一个t ...

  10. 码云git使用一(上传本地项目到码云git服务器上)

    主要讲下如果将项目部署到码云git服务器上,然后使用studio导入git项目,修改本地代码后,并同步到码云git上面. 首先:我们在码云上注册账号并登陆.官网(https://git.oschina ...

随机推荐

  1. 万字长文带你深入Redis底层数据结构

    Redis数据库的数据结构 Redis 的键值对中的 key 就是字符串对象,而 value 就是指Redis的数据类型,可以是String,也可以是List.Hash.Set. Zset 的数据类型 ...

  2. Java 10大优点—Part4—Java内存模型

    本文由 ImportNew - 靳禹 翻译自 zeroturnaround.如需转载本文,请先参见文章末尾处的转载要求. 在忙着参加在爱沙尼亚进行的 TEDx talk 演讲活动以及在比利时举办的一届 ...

  3. 性能调优、虚拟机、垃圾回收、软硬件协调相关文章和视频 — Part1

    本文由 ImportNew - 顾星竹 翻译自 javacodegeeks.如需转载本文,请先参见文章末尾处的转载要求. ImportNew注:如果你也对Java技术翻译分享感兴趣,欢迎加入我们的 J ...

  4. JavaCC 研究与应用( 8000字 心得 源程序)

    一.JavaCC简介 JavaCC(Java Compiler Compiler)是一个用JAVA开发的最受欢迎的语法分析生成器.这个分析生成器工具可以读取上下文无关且有着特殊意义的语法并把它转换成可 ...

  5. 在table中,tbody没有充满整个table

    解决方法就是给table加上 display:table;就好了

  6. golang之浮点数处理库decimal

    decimal库包是用来解决float类型对象之间运算不准确的问题的.所以,如果你想使用decimal库包,你必须先把float类型对象通过decimal.NewFromFloat()函数转成deci ...

  7. PythonDay5Advance

    PythonDay5Advance 函数和模块 main函数要有,用户自己选择要做的功能,根据选择调用不同的函数 用户注册的信息需要使用一个文件存储,登录需要判断用户是否存在,密码是否正确 注册的时候 ...

  8. 修改data数据后页面未更新渲染

    只需添加 this.$forceUpdate() 在修改数据后执行即可 this.$forceUpdate()

  9. WinForm(C/S)项目中使用矢量字体(FontAwsome、Elegant)图标

    1.介绍 字体图标在Web应用中最为常见,字体图标是矢量的,矢量图意味着每个图标都能在所有大小的屏幕上完美呈现,可以随时更改大小和颜色,而且不失真.字体图标常见的有Font Awesome和Elega ...

  10. ServiceMesh 5:异常重试和超时保护提升服务可用性

    ★ ServiceMesh系列 1 背景 在复杂的互联网场景中,不可避免的会出现请求失败或者超时的情况. 从程序的的响应结果来看,一般是Response返回5xx状态的错误:从用户的角度去看,一般是请 ...