Datawhale2025冬令营

Datawhale 2025 AI冬令营链接:https://www.datawhale.cn/activity/110/21/76?rankingPage=1

赠送大家一个表情出处:Emoji cheat sheet for GitHub, Basecamp, Slack & more

整理者:博客园-岁月月宝贝

家人们,至今博客园是本人分享学习知识的唯一平台,如果有其他平台存在他人与我同名,直接盗用我发过的博客内容并且不注明出处的,请直接代我举报!!!

如果未来我会转到其他平台,也会在这里说明哪些账号是我的!!!


背景:现有的通用模型在一些专业化或个性化的任务上,往往并不够 专业、精准 ,比如: 角色扮演模拟特定人物的语气与行为 ,对于需要特定语言风格、情感表达和人物设定的任务,标准大模型往往难以做到精准模仿。

在这种情况下, 定制专属大模型 的技术被广泛关注,我们期待通过投喂特定语料,改造大模型,让模型在某些专业领域或特定任务中表现得更为出色。

因此,这次的任务,基于《甄嬛传》剧本中的甄嬛台词** ,打造一个模仿甄嬛语气、风格的专属聊天模型—— Chat-嬛嬛

如果你想要更多的了解 Chat-嬛嬛 的技术细节,可以关注 Chat-嬛嬛 的 Github仓库: https://github.com/KMnO4-zx/huanhuan-chat

接下来,让我们通过五个简单的步骤,不写一行代码,直接领略定制大模型的乐趣,轻松拥有专属的、个性化的AI嬛嬛!

Step1:注册讯飞星辰Maas

链接:https://training.xfyun.cn/?ch=maas-dw-mxb

讯飞星辰Maas平台 是一个模型微调的零代码平台,旨在简化模型微调过程,无需一行代码即可定制大模型!

讯飞星辰Maas平台 提供了直观的界面和高效的工具,支持快速训练和优化现有模型。

Step2:下载嬛嬛数据集

下载下方的文件即可~

huanhuan.json 291.93KB

数据来源:https://github.com/datawhalechina/self-llm/blob/master/dataset/huanhuan.json

数据集介绍:

微调的数据集是定制大模型的关键

真正复杂的工作都是在 清洗数据、处理、生成数据、归类数据 上,这些才是影响最后效果的最大难点问题。

——散步,Tianji作者

我们常见的微调数据集需要符合Alpaca格式,以我们使用的嬛嬛数据集为例,其样本如下:

在实际的交互中:

  • 用户:提供指令和输入,期望得到输出。
  • 模型:接收指令和输入,生成输出。

例如,如果用户想要查询天气:

  • 指令可能是:“告诉我明天的天气。”
  • 输入可能是用户的地理位置,或者在某些情况下,如果模型已经知道用户的位置,输入可能不需要。
  • 输出是模型根据指令和输入生成的,比如:“明天的天气预计是晴天,最高温度25度。”

在这个过程中,用户负责提供指令和可能的输入,而模型负责生成输出。

{
"instruction": "小姐,别的秀女都在求中选,唯有咱们小姐想被撂牌子,菩萨一定记得真真儿的——",
"input": "",
"output": "嘘——都说许愿说破是不灵的。"
}

字段说明

  • instruction:任务的指令,模型需要完成的具体操作,一般可以对应到用户输入Prompt
  • input:任务所需的输入内容。若任务是开放式的,或者不需要明确输入,可以为空字符串
  • output:在给定指令和输入的情况下,模型需要生成的期望输出,也就是对应的正确结果或参考答案。

特点与应用 :结构简单清晰,易于理解和处理。它明确地任务指令输入内容分离开来,能够很好地适用于各种自然语言处理任务,像文本生成、翻译、总结等任务,尤其适合单轮的、以任务为导向的指令微调任务.

此外,还有 ShareGPT 格式,此处暂时不讲。

此处,大家只需要简单了解即可,我们后续还会有更多原理学习内容。

如果想深入学习的话还可以参考self-llm的微调教程(这个真的写得很好!)或Chat-嬛嬛的Blog (这里的Blog同github链接)。

Step3:定制专属嬛嬛大模型!

目前 讯飞星辰Maas平台 可免费定制大模型!大家按照下面的步骤执行即可!

1.点击【创建模型】

2.配置基础信息, 注意不要选错模型!!!!

3.点击【创建数据集】

4.配置数据集信息

5.导入我们的嬛嬛数据集!

6.提交任务!

last:看到这张图,就妥了!

Step4: 创建应用(点击可跳转)

链接:https://console.xfyun.cn/app/myapp

PS:已经创建过的不必重复创建,直接点选即可~

0.先找到位置:

  1. 点击【创建新应用】

  1. 按需填写内容即可

结果:

Step5:体验AI嬛嬛!

大家稍微去看两个视频,或者稍微思考思考微调的定义,大概10分钟,就能得到我们的嬛嬛模型!

然后让我们发布服务,开始体验吧~

  1. 看到这个就说明任务已完成!AI嬛嬛已ready!

我们可以查看具体细节:

任务信息


任务模型文件

过程指标

2.然后,发布服务!

  1. 点击【体验】

  1. 选择之前的模型

  1. 然后就可以开始对比了!

我与嬛嬛的对话信息

下面是我的界面:

Temperature=0.5 ;Top_k=4

对话一:

对话二:

作业:尝试更多类型的模型定制!

作业1:定制你的内容创作模型,网文小说家!

一些训练细节展示(其他配置同上):

微调结果展示

Temperature=0.5 ;Top_k=4

我们的网文小说家响应时间更短,生成文本更丰富~

Temperature=0.8 ;Top_k=5

作业2:定制你的行业知识模型,法律专家!

一些训练细节展示(其他配置同上):

微调结果展示

Temperature=0.5 ;Top_k=4

我们的模型回答法律依据更强!

再补充一个!

就到这里啦!谢谢Datawhale冬令营给我卓越的体验!

Datawhale 2025冬令营“嬛嬛,我来啦!”😘的更多相关文章

  1. 【无语凝噎(wordless)】

    ·题目:         西施与范蠡泛舟而去……不对,场景不对,咳咳.在甄嬛前往蓬莱洲之前,她与皇上在碧桐书院告别.为了这可能会长达数月的离别,两个人都似乎有很多话要对对方说,却都无语凝噎.这时,皇上 ...

  2. python课程分享2-伊嬛

    2.4  模块 2.4.1  模块的概念 在计算机程序的开发过程中,随着程序代码越写越多,在一个文件里代码就会越来越长,越来越不容易维护. 为了编写可维护的代码,使用者可以把很多函数分组,分别放到不同 ...

  3. AC日记——C’s problem(c) TYVJ P4746 (清北学堂2017冬令营入学测试第三题)

    P4746 C’s problem(c)   时间: 1000ms / 空间: 655360KiB / Java类名: Main 背景 冬令营入学测试 描述 题目描述 小C是一名数学家,由于它自制力比 ...

  4. 清北学堂2017NOIP冬令营入学测试P4749 C’s problem(c)

    P4746 C's problem(c) 时间: 1000ms / 空间: 655360KiB / Java类名: Main 背景 冬令营入学测试 描述 题目描述 小C是一名数学家,由于它自制力比较差 ...

  5. 清北学堂2017NOIP冬令营入学测试P4749 F’s problem(f)

    时间: 1000ms / 空间: 655360KiB / Java类名: Main 背景 冬令营入学测试 描述 这个故事是关于小F的,它有一个怎么样的故事呢. 小F是一个田径爱好者,这天它们城市里正在 ...

  6. 清北学堂2017NOIP冬令营入学测试P4747 D’s problem(d)

    时间: 1000ms / 空间: 655360KiB / Java类名: Main 背景 冬令营入学测试题 描述 题目描述 小D是一名魔法师,它最喜欢干的事就是对批判记者了. 这次记者招待会上,记者对 ...

  7. 清北学堂2017NOIP冬令营入学测试P4745 B’s problem(b)

    清北学堂2017NOIP冬令营入学测试 P4745 B's problem(b) 时间: 1000ms / 空间: 655360KiB / Java类名: Main 背景 冬令营入学测试 描述 题目描 ...

  8. 清北学堂2017NOIP冬令营入学测试 P4744 A’s problem(a)

    清北学堂2017NOIP冬令营入学测试 P4744 A's problem(a) 时间: 1000ms / 空间: 655360KiB / Java类名: Main 背景 冬令营入学测试题,每三天结算 ...

  9. 清北学堂2017NOIP冬令营入学测试

    P4744 A's problem(a) 时间: 1000ms / 空间: 655360KiB / Java类名: Main 背景 冬令营入学测试题,每三天结算一次成绩.参与享优惠 描述 这是一道有背 ...

  10. 轮值CEO胡厚崑:到2025年所有的企业都将用到云(云的2.0时代,会有几千朵云几万朵云升起来,这将产生不同的技术模式、商业模式、思维模式)

    2016年09月04日 07:38 中国经营报   李凡 在全国工商联“2016年中国民营企业500强”排行榜上夺得头把交椅的华为,向外界描绘了面向未来进一步做大做强的路径. 华为创始人任正非于201 ...

随机推荐

  1. log4j2配置自定义filter报错Unable to invoke factory method in class

    报错Unable to invoke factory method in class com....log4j.ScheduleLoggerFilter 2020-05-13 16:32:35,613 ...

  2. 2024-10-13:用go语言,给定一个二进制数组 nums,长度为 n, 目标是让 Alice 通过最少的行动次数从 nums 中拾取 k 个1。 Alice可以选择任何索引 aliceIndex

    2024-10-13:用go语言,给定一个二进制数组 nums,长度为 n, 目标是让 Alice 通过最少的行动次数从 nums 中拾取 k 个1. Alice可以选择任何索引 aliceIndex ...

  3. 云原生周刊:CNCF 宣布 Falco 毕业|2024.3.4

    开源项目推荐 ldap-operator 用于部署和管理 LDAP 目录的 Kubernetes Operator. Updatecli Updatecli 是一个用于应用文件更新策略的工具.每个应用 ...

  4. 5.29 杭州站云原生 Meetup,邀您观看线上同步直播

    5 月 15 日在上海组织的云原生 Meetup,除了现场火爆.人数爆满之外,同步进行的线上直播也同样受到了广大社区小伙伴的关注,在线观看直播人数足有千人之众. 为了能让更多的社区小伙伴能够参与到 M ...

  5. Nuget包本地调试以及自动打包上传

    项目过程中,经常需要打包Nuget包,并且引用本地Nuget包调试,完成后上传,因此做了点配置,分享给大家.如果大家有更好的方法欢迎分享. 1. 使用生成后事件自动打包 项目文件中本身是可以配置生成时 ...

  6. springboot-实现excle文件导出的单元格相同内容合并

    导出excle文件中的单元格有些需要合并如何操作 例如:左边的表格想合并单元格成右边的表格更加便于观看           一.依赖文件 <!-- excle操作--> <depen ...

  7. 本地文件包含漏洞详解与CTF实战

    1. 本地文件包含简介 1.1 本地文件包含定义 本地文件包含是一种Web应用程序漏洞,攻击者通过操控文件路径参数,使得服务器端包含了非预期的文件,从而可能导致敏感信息泄露. 常见的攻击方式包括: 包 ...

  8. CommonsCollections5(基于ysoserial)

    环境准备 JDK1.8(8u421)我以本地的JDK8版本为准.commons-collections(3.x 4.x均可这里使用3.2版本) cc3.2: <dependency> &l ...

  9. 基于nginx的tomcat负载均衡和集群(超简单)

    今天看到"基于apache的tomcat负载均衡和集群配置 "这篇文章成为javaEye热点. 略看了一下,感觉太复杂,要配置的东西太多,因此在这里写出一种更简洁的方法. 要集群t ...

  10. Swing 线程之SwingUtilities.invokeLater()

    现在我们要做一个简单的界面. 包括一个进度条.一个输入框.开始和停止按钮. 需要实现的功能是: 当点击开始按钮,则更新进度条,并且在输入框内把完成的百分比输出(这里只做例子,没有真正去做某个工作). ...