大人,时代变了! 赶快把自有业务的本地AI“模型”训练起来!
1 大人,时代变了! 赶快把自有业务的本地AI“模型”训练起来!
1.1 背景
目前AI已经大行其道,chatGPT、DeepSeek等如雨后春笋般涌现出来,笔者做为一个守旧派和顽固派,一直认为AI只是雕虫小技,根本没有办法和人写的代码相提并论,在chatGPT已经大火几年之后仍然一直无动于衷,只是在最近才慢慢使用了豆包查点资料,然后再接触Kimi、DeepSeek等AI工具和模型。
使用AI的对话问答模式,相对原来的搜索引擎,得到的结果更精练, 不会像百度、必应之类的搜索引擎,搜索到结果后还要逐页去人工筛选,AI的回答就是干干净净你要的东西,这比搜索引擎效率高太多了!
提要求让AI生成些小的代码片段,如:“给我写一个vbs获取文件扩展名的函数”,生成的代码质量也非常不错,直接拿来就能用,连测试代码也一并写好!
总结一句话:大人,时代变了,现在投降是代价最小的时候!
问题来了:目前这些AI工具,都是基于通用模型, 如果用来做一些其他业务场景的事,效果就不会太好,此时就需要训练自己的本地模型了!
注意:在训练自己的本地模型前,请首先有一个概念,如果没有充足的硬件资源,请不要尝试在本地部署DeepSeek-R1模型,该模型至少需要60G的显存,GPU也是NVidia H100规格的,且是多卡分布式!
使用线上+线下协作的方式,可能是普通人训练自己业务场景的最优选择!
1.2 准备工作
注册硅基流动账号: 硅基流动注册

下载
CherryStudio:下载CherryStudio
注:目前常用的AI客户端只有CherryStudio工具的知识库支持训练本地素材
1.3 训练本地知识库
比如:作者偶尔会写点EverEdit的宏脚本(js语法),由于EverEdit有自己的API,所以AI必须先学习EverEdit的API。
1.3.1 在CherryStudio中配置密钥
配置密钥是为了能够让CherryStudio使用AI供应商(这里是硅基流动)的模型
步骤1:在
siliconflow网站登录后,拷贝自己的密钥,如下图所示:
步骤2:在
CherryStudio中配置密钥,如下图所示:
1.3.2 在CherryStudio中训练本地知识库
训练本地知识库的目的:将自有业务知识消化成知识库,结合在线AI(如:DeepSeek),以解答自有业务领域的问题,而避免投入大量硬件训练完整的专有本地模型。
比如:我偶尔要写EverEdit宏脚本,因此我要训练关于EverEdit的API的本地知识库。
在
CherryStudio中新建本地知识库,如下图所示:
将自有业务相关的文档丢到
知识库中进行消化(近似动作),如下图所示:
消化完成后,会出现绿色的“√”符号
1.3.3 在CherryStudio中使用本地知识库(自有业务)和DeepSeek在线模型生成自有业务相关代码或答案
- 打开知识库开关,并选择本地知识库,如下图所示:
在CherryStudio的导航栏选择“助手”按钮,切换到助手模式
在界面的底部聊天窗口中选择本地知识库
提出问题并解答,如下图所示:
- 用户提出问题让AI解答

- 出现问题,让AI修正

- 还有问题,继续让AI修正

注:后面还有很多让AI修正的步骤,这里不一一列举。 - 最终AI生成的代码
// 获取当前文档对象
var doc = App.ActiveDoc; // 获取文档内容
var text = doc.Text; // 获取用户输入的分隔符,默认使用“,”
var delimiter = App.ShowInputBox("请输入分隔符(默认按','分隔):", "分隔符输入");
if (!delimiter) {
delimiter = ",";
} // 获取制表符宽度
var tabWidth = doc.TabStop; // 按换行符拆分文档内容
var lines = text.split("\n");
var columns = [];
for (var i = 0; i < lines.length; i++) {
columns.push(lines[i].split(delimiter));
} // 计算字符串的显示宽度(中文字符占2,中文符号“和”占1,英文字符占1,Tab键按制表符宽度计算)
function getDisplayWidth(str) {
var width = 0;
for (var i = 0; i < str.length; i++) {
var char = str.charAt(i); // 使用 str.charAt(i) 获取字符
if (char === "\t") {
// 计算 Tab 宽度,对齐到下一个制表符位置 [^1]
width += tabWidth - (width % tabWidth);
} else if (char === "“" || char === "”") {
width += 1; // 中文符号“和”占1个宽度
} else {
var charCode = str.charCodeAt(i);
if (charCode >= 0 && charCode <= 127) {
width += 1; // 英文字符或半角字符
} else {
width += 2; // 中文字符或全角字符
}
}
}
return width;
} // 计算每列的最大显示宽度
var maxWidths = [];
for (var i = 0; i < columns.length; i++) {
for (var j = 0; j < columns[i].length; j++) {
var width = getDisplayWidth(columns[i][j]);
if (!maxWidths[j] || width > maxWidths[j]) {
maxWidths[j] = width;
}
}
} // 生成对齐后的文本(在分隔符后面多填充1个空格)
var alignedText = "";
for (var i = 0; i < columns.length; i++) {
for (var j = 0; j < columns[i].length; j++) {
var cell = columns[i][j];
// 添加单元格内容
alignedText += cell;
// 在分隔符后面填充空格(多填充1个空格)
if (j < columns[i].length - 1) {
var cellWidth = getDisplayWidth(cell);
var padding = "";
for (var k = 0; k < maxWidths[j] - cellWidth; k++) {
padding += " ";
}
alignedText += delimiter + " " + padding; // 分隔符后多填充1个空格
}
}
if (i < columns.length - 1) {
alignedText += "\n";
}
} // 将对齐后的内容写回文档
doc.Text = alignedText;- 脚本执行后的效果
对齐前:
脚本执行列对齐后:
哇!是不是很整齐!这都是AI自己写的脚本哦!
- 用户提出问题让AI解答
作者声明:本文用于记录和分享作者的学习心得,可能有部分文字或示例来源自豆包AI,由于本人水平有限,难免存在表达错误,欢迎留言交流和指教!
Copyright 2022~2025 All rights reserved.
大人,时代变了! 赶快把自有业务的本地AI“模型”训练起来!的更多相关文章
- 15SpringMvc_在业务控制方法中写入模型变量收集参数,且使用@InitBind来解决字符串转日期类型
之前第12篇文章中提到过在业务控制方法中写入普通变量收集参数的方式,也提到了这种凡方式的弊端(参数很多怎么办),所以这篇文章讲的是在业务控制方法中写入模型变量来收集参数.本文的案例实现的功能是,在注册 ...
- mvc_第一遍_业务逻辑层和模型
常用的动态网页对象: 之前我们提到了,使用request对象可以获得和用户请求相关的一系列信息.这一节,我们来看看另外两个常用对象的常规用途. response对象:用于向客户回应.最常用的用法类似于 ...
- 在业务控制方法中写入模型变量收集参数,且使用@InitBind来解决字符串转日期类型
1) 在默认情况下,springmvc不能将String类型转成java.util.Date类型,所有我们只能在Action 中自定义类型转换器 <form action="${pa ...
- 从0到1搭建AI中台
文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 转自 | 宜信技术学院 作者 | 井玉欣 导读:随着“数据中台”的提出和成功实践,各企业纷纷在“大中台 ...
- JuiceFS 在数据湖存储架构上的探索
大家好,我是来自 Juicedata 的高昌健,今天想跟大家分享的主题是<JuiceFS 在数据湖存储架构上的探索>,以下是今天分享的提纲: 首先我会简单的介绍一下大数据存储架构变迁以及它 ...
- 2.69分钟完成BERT训练!新发CANN 5.0加持
摘要:快,着实有点快. 现在,经典模型BERT只需2.69分钟.ResNet只需16秒. 啪的一下,就能完成训练! 本文分享自华为云社区<这就是华为速度:2.69分钟完成BERT训练!新发CAN ...
- 乾象投资:基于JuiceFS 构建云上量化投研平台
背景 乾象投资 Metabit Trading 成立于2018年,是一家以人工智能为核心的科技型量化投资公司.核心成员毕业于 Stanford.CMU.清北等高校.目前,管理规模已突破 30 亿元人民 ...
- 为什么 java 容器推荐使用 ExitOnOutOfMemoryError 而非 HeapDumpOnOutOfMemoryError ?
前言 好久没写文章了, 今天之所以突然心血来潮, 是因为昨天出现了这样一个情况: 我们公司的某个手机APP后端的用户(customer)微服务出现内存泄露, 导致OutOfMemoryError, 但 ...
- 云原生的弹性 AI 训练系列之一:基于 AllReduce 的弹性分布式训练实践
引言 随着模型规模和数据量的不断增大,分布式训练已经成为了工业界主流的 AI 模型训练方式.基于 Kubernetes 的 Kubeflow 项目,能够很好地承载分布式训练的工作负载,业已成为了云原生 ...
- 英特尔® 至强® 平台集成 AI 加速构建数据中心智慧网络
英特尔 至强 平台集成 AI 加速构建数据中心智慧网络 SNA 通过 AI 方法来实时感知网络状态,基于网络数据分析来实现自动化部署和风险预测,从而让企业网络能更智能.更高效地为最终用户业务提供支撑. ...
随机推荐
- golang之常用命令
golang常用操作与命令 1.执行golang文件 go run hello_world.go 2.编译成可执行文件(交叉编译) go build hello_world 则会生成hello_wor ...
- Elasticsearch之权限验证(Basic)
目前使用的Es版本为7.5版本, 在7.X版本中已经可以免费的使用x-pack进行用户验证了 1. 修改elasticsearch主节点配置文件: action.destructive_require ...
- windows电脑在线生成ios p12证书工具和生成教程
使用hbuilderx开发ios APP的时候,打包APP提示需要IOS的打包证书 而hbuilderx本身是不能生成证书的,因为生成证书需要在苹果开发者中心生成.而在苹果开发者中心生成证书的时候,提 ...
- 生成式AI如何辅助医药行业智能营销
生成式AI如何辅助医药行业智能营销 生成式AI在医药行业的智能营销中发挥着日益重要的作用,它通过多种方式辅助医药企业提升市场洞察能力.优化营销策略.增强客户互动和体验,从而推动销售增长和品牌价值的提升 ...
- 基于CPLD/FPGA的呼吸灯效果实现(附全部verilog源码)
一.功能介绍 此设计可以让你的FPGA板子上那颗LED具有呼吸效果,像智能手机上的呼吸灯一样.以下源码已上板验证通过,大家可直接使用. 二.呼吸灯Verilog源码 ps1. 带★号处可根据需要进行修 ...
- (二)Springboot + vue + 达梦数据库构建RBAC权限模型前后端分离脚手架保姆级教程(后端项目)
XX后台管理系统 Springboot + vue + dm8 的前后端分离项目,后端项目 https://spring.io https://start.aliyun.com 1. 创建项目 初始化 ...
- OS之《进程管理》
进程同步 同步实际上是指:将多个进程,按照顺序,有序执行. 让进程有序进行的场景有很多.比如:一个进程依赖另外一个进程的计算结果:一个进程等待另外一个对临界资源的访问:还有像生产者消费者模型中的相互配 ...
- 不求甚解--详解ansible-playbook中roles的用法(二)
前言 本文将详细介绍ansible-playbook中roles的各种用法 环境准备 组件 版本 操作系统 Ubuntu 22.04.4 LTS ansible 2.17.6 基本用法 文件结构 . ...
- 中电金信:The Financial-Grade Digital Infrastructure
01 Product Introduction The Financial-Grade Digital Infrastructure is a digitally-enabled foundati ...
- T 语言语法设计(预审稿)
欢迎吐槽 一. 字面量 1. 数字字面量 0, 0xff, 0b10_01, .1 2. 字符串字面量 'x', "x\n\uffff\Uffffffff", `x{1}y` 3. ...