跨越时空的对话:如何使用AI阅读工具ChatDOC快速建立数字化身?
跨越时空的对话:如何使用 ChatDOC 快速建立数字化身?以史蒂夫·乔布斯 AI 为例
开门见山,这篇文章主要介绍如何将 AI 改造为靠谱、好用、基于某个人物的数字化身。比如,乔布斯 AI、马斯克 AI、张一鸣 AI、王兴 AI、佛陀 AI、孔子 AI.
想象一下,和乔布斯聊产品,和释迦摩尼论佛法,和孔子聊人生哲学,和张爱玲聊爱情……那岂不是能够快速全面提升我们的视野和能力?
让各个领域的精英群体或者名人,成为你的专属 AI 助手,便是这篇文章的写作目的。
目前,全世界最出名的 AI 工具便是 ChatGPT. 直接让 ChatGPT 这样的 AI 模拟这些角色不好吗?答案是,NO. 这需要从 ChatGPT 的缺陷说起。
ChatGPT 模拟角色的缺陷
以 ChatGPT 为代表的 AI 产品掀起了 AI 时代的正式降临。
与以前的 AI 相比,人类可以使用自然语言,像是和好友聊天那样,对 ChatGPT 发号施令。 ChatGPT 可以模拟各种角色,与用户进行互动。在这个过程中,如果对于 ChatGPT 的命令得当,我们可以获得逼真、有趣的交互体验。在某种意义上,ChatGPT 已经可以通过图灵测试。
然而,ChatGPT 对于角色模拟,只是基于角色设定的简单表演,背后的内容,依然是基于 GPT 强大的内容生成能力。如果你的提问内容,在 ChatGPT 的数据训练集中相关数据比较少,那么只能获得一些似是而非、并不准确或者高效的回答。
打个粗略的比喻,没有采用专有数据训练的 ChatGPT,相当于一个表现尚可的演员。这只是形似。 如果需要进一步提升 ChatGPT 的表现,那么便需要让 ChatGPT 了解所需扮演角色的人物传记,深入了解这个角色的所思所想所行。如此,方能做到神似。
为了让 ChatGPT 进化,那么便需要让 AI 阅读扮演角色所需要的垂直领域的专有数据。
ChatDOC = ChatGPT + 垂直领域数据集,打造你的专属 AI
如今,ChatGPT 通过插件也可以直接上传文档进行解析。然而,存在诸多问题。
一,只有 GPT Plus 用户才能使用插件功能。
二,Plus 价格昂贵,且支付困难。
三,无法实现多文档对话。
而 ChatDOC 则是一款基于 ChatGPT,以强化 ChatDOC 读取专业文档能力的 AI 阅读工具。
基于 ChatDOC, 便可以实现将垂直领域的专有数据集投喂给 ChatGPT, 让 ChatGPT实现深度进化。
这篇文章便是以 ChatDOC 为例,展示如何打造基于人物角色的数字化身。
ChatDOC 介绍
下面是 ChatDOC 的简要介绍:
ChatDOC 是一款基于 GPT 的 AI 模型,允许 GPT 与用户所指定的文档进行对话,处理用户的专属数据的 AI 阅读辅助工具。
访问地址:https://chatdoc.com
特点
- 操作简单:一键上传,快速上手;
- 文本智能分析:文本、表格数据处理均准确高效;
- 内容回溯功能:基于问答结果快速查看原文;
- 多文档提问:支持上传一个文件夹,对文件夹进行整体提问;
- 多轮追问:支持基于某一条回答展开多轮会话,方便深度探讨内容;
- 提问支持预设自定义提示词/Prompt 功能;
- 保障用户数据安全:加密存储、数据自主;
- 支持 PDF、Word 等多种文档格式,支持 OCR;
- 开放的生态体系:支持 API, 允许企业用户将 ChatDOC 功能整合至自己的产品;
- 对中文用户友好:大陆地区稳定、流畅访问,支持大陆常见的支付方式进行付费;
如何建立虚拟人物 AI?
主要思路如下:
- 工具:ChatDOC
- 数据:用户自己收集和训练。
我决定使用 ChatDOC 建立 Steve Jobs AI. 主要原因是,数据收集简单。作为科技领袖,乔布斯在全世界范围内拥有庞大的粉丝。这些人已经在互联网将乔布斯的各种演讲视频、访谈视频、纪录片、书籍或者其他文档进行整理。我只需要采用拿来主义,便可以解决数据采集问题。
当然了,这个问题也可以问问 ChatDOC. 提问及回答如下:
对比下来,ChatDOC 比我思虑周全。
下面是具体思路介绍。
如何收集数据?
寻找数据
只有更高质量的数据,才能训练出更好的 AI. 不同资料的可信度、准确度、专业性是不同的。
以经验判断,学术论文、专业书籍、纪录片、专业博客等属于高质量数据。而很多二手信息,则必须坚决抛弃。所谓,垃圾进,垃圾出。
为此,我需要收集关于乔布斯的高质量专有数据。
经过检索,我发现以下数据:
- 综合资料:Steve Jobs Archive. 乔布斯存档内容站点,保存了关于乔布斯演讲、录音、视频、邮件、书籍。其中,Make Something Wonderful 用史蒂夫·乔布斯自己的话记录了他的一生。该书以时间轴的形式记录了这位前苹果公司 CEO 生活中的重要时刻,包括一系列以前从未向公众公开的材料。特别值得注意的是其还包含了苹果内部会议的记录和他发给自己的各种电子邮件。
- 书籍:《史蒂夫·乔布斯传》、《成为乔布斯》等是中英文世界关于乔布斯比较重要的书籍,能帮助人们深入了解乔布斯的成长经历、思维方式、行为方式、主要观点。
- 其他资料。主要是一些乔布斯的演讲、访谈视频及对应的文稿。
注释:Make Something Wonderful 这本书制作精良,质量很高,阅读体验非常好。强烈建议阅读。
如图,我使用 FlowUs 多维表格整理了乔布斯的主要资料。
处理数据
Steve Jobs Archive 为公开的免费内容,直接下载即可。
至于书籍,我在全世界最大的电子书籍图书馆 Z-Library 检索关键词下载。
由于 ChatDOC 目前只支持 PDF、Word 格式,因此,我需要将下载好的 Epub/MOBI 格式转化为 PDF 格式。
国内的格式转换工具,比较有名的便是福昕 PDF 转换大师、转转大师,两者均支持 PDF 格式的多种处理。具体参见:
福昕 PDF 转换大师:功能丰富、专业易用的 PDF 转换工具
转转大师:专业、全能的格式转换工具
其中,我使用了转转大师的电子书转换功能,对我下载的文档进行了批量处理。效果如下:
上传数据
随后,我便得到了我想要的数据集。最后,我将这些数据放在同一个文件夹之下,将整个文件夹一键上传至 ChatDOC.
如图,点击 Drag and Drop Folder as Collection.
最终效果如图:
如何设定对话系统?
在将 ChatDOC 上传后,我们便可以直接进行提问了。
我开始基于乔布斯的专有数据进行提问。使用 ChatDOC 的优点在于,已有的回答言之有物,有理有据,可以追溯答案背后的原文。
现在的问题是,ChatDOC 总是以一副冷冰冰的、论文式的风格回答问题。虽然目前的回答,是基于乔布斯的所思所想,但是表达风格并不是。
那么,应该如何调教 ChatDOC 做到神似乔布斯呢?
简单的来说,需要让 ChatDOC 分析乔布斯的语言风格、性格特征等信息,再根据范例进行回答。
不知道具体怎么提问?这个依然可以向 AI 提问,让 AI 化身为角色设定师。
将 AI 变身为角色设定师
我们的目标是让 AI 更好地扮演某个角色。 但是,我们并不知道如何提一个高质量的问题,以便让 AI 成功实现角色扮演? 对此,思路如下:
- 我们可以反过来询问 AI ,提出你的需求:如果我需要你扮演 XYZ, 需要哪些信息?
- 你可以让 AI 对回答进行总结。随后,我们将回答要点,反向写在提示词之中。再次进行测试。
- 如此,循环往复。直到优化为满足你需求的提示词。
经过几轮调试后,角色设定提示词如下:
请以角色设定师的身份,分析已有文档,并为我创建基于这些文档的角色化身,包括角色能力、成长经历、个性特点、语言风格、领导风格、思维方式、行为特征等角色分析信息。请给出角色简介及对应的对话范例。请注意,在角色设定中,不要使用“AI、人工智能、根据相关文件片段”等关键词或者字眼。下面将由你来模仿扮演该角色。你需要的扮演的角色是:Steve Jobs.
对应的答案如下:
请以角色设定师的身份,分析已有文档,并为我创建基于这些文档的角色化身,包括角色能力、成长经历、个性特点、语言风格、领导风格、思维方式、行为特征等角色分析信息。请注意以下要点:
- 我需要你扮演的角色是 Steve Jobs.
- 回答内容需要基于乔布斯的语言风格、个性特点、思维方式等因素进行回答。
- 回答中不要使用“AI、人工智能、根据相关文件片段、首先/其次/另外/最后、作为乔布斯的化身”等关键词或者字眼。
- 回答要像访谈对话那样,语言偏向口语化,需要通俗易懂。
- 回答基于第一人称进行回答。
下面将由你来模仿扮演Steve Jobs. 我的第一个问题是:你对年轻人创业有什么建议?
我的语言调试有点失败。目前,除了表达方式不太像日常对话。其他效果还是比较完美的。
再次尝试。这次加入对话示例。
回答如下
貌似 ChatDOC 预设了语言表达风格,无法强制 ChatDOC 更改语言风格。目前的回答,明显是论文式风格。这可能和 ChatDOC 的用户多是科研、金融等专业领域的垂直用户有关。
使用建议
如果忽略语言风格,我们也可以直接通过 ChatDOC 这个 AI 阅读工具,与乔布斯进行跨越时空的对话。
根据资料主题,与 AI 进行深度对话
比如,你可以和乔布斯聊苹果公司,聊产品,聊创业,聊设计。这些都是 Steve Jobs AI 所擅长的。
当然了,对于资料库中,相关数据比较少的话题,比如亲密关系。这些乔布斯 AI 的回答可能就有些吃力。不过,再怎么差,这些数据都是基于乔布斯的已有资料,有理有据,而不是基于 GPT 的瞎编乱造。
微调或者优化提示词,多次提问
在使用 ChatDOC 过程中,基于 AI 的回答,内容质量存在一定的波动。如果你对回答不太满意,可以微调提示词,尝试再次询问。
比如,以下是基于同一个问题的 2 个回答。第二个感觉更好一些。
结语
这篇文章虽然以介绍 Steve Jobs AI 为例,但是思路也适用于你训练其他 AI. 让你和这些名人展开跨越时空的对话。
除了基于名人数据训练 AI,我们每个人比较容易获取的还有自己的私人数据。比如,基于自己近几年的微信聊天记录,建立一个自己的数字分身,也未尝不可。
如果你对 ChatDOC 感兴趣,可以尝试搭建自己专属 AI.
工具箱
效率工具箱:阅读、笔记、写作 AI
AI 阅读辅助工具:ChatDOC
知识管理和在线协作工具:FlowUs 息流
特点
FlowUs AI
- 自定义问答;
- 自定义创作;
- 预设问答与创作:头脑风暴、列出执行步骤、罗列大纲、分析优缺点、内容解释、日常小记、故事创作、写文章、翻译、总结
使用教程
更多关于 FlowUs 使用技巧的介绍
书签管理: Wetab 新标签页
Wetab 是一款基于浏览器的新标签页产品,主张辅助用户打造一个兼具效率与美观的主页。
产品特色与功能
移动端使用教程
移动端·综合教程图文版
VisionOn
介绍
一款集流程图、思维导图、白板于一体的轻量级在线图形工具。
特点
跨越时空的对话:如何使用AI阅读工具ChatDOC快速建立数字化身?的更多相关文章
- AI测试101:测试AI系统的实用技巧&ML和AI自动化工具
基于人工智能的系统,也称为神经网络(NN Neural Networks),和其他应用程序一样是 "系统",因此需要测试.本文将指导你测试AI和基于NN的系统,并理解相关概念. 测 ...
- ubuntu下linux内核源码阅读工具和调试方法总结
http://blog.chinaunix.net/uid-20940095-id-66148.html 一 linux内核源码阅读工具 windows下当然首选source insight, 但是l ...
- 图形化代码阅读工具——Scitools Understand
Scitools出品的Understand 2.0.用了很多年了,比Source Insight强大很多.以前的名字叫Understand for C/C++,Understand for Java, ...
- 微软Connect(); 2017大会梳理:Azure、数据、AI开发工具
在今天召开的 Connect(); 2017 开发者大会上,微软宣布了 Azure.数据.AI 开发工具的内容.这是第一天的 Connect(); 2017 的主题演讲. 在开场视频中霍金又来了.你记 ...
- 【安卓本卓】Android系统源码篇之(一)源码获取、源码目录结构及源码阅读工具简介
前言 古人常说,“熟读唐诗三百首,不会作诗也会吟”,说明了大量阅读诗歌名篇对学习作诗有非常大的帮助.做开发也一样,Android源码是全世界最优秀的Android工程师编写的代码,也是A ...
- (3.2)mysql基础深入——mysql源码阅读工具安装与应用
(3.2)mysql基础深入——mysql源码阅读工具安装与应用 关键字:mysql源码阅读工具 工具列举:一般多用[1][2][3]吧 [1]source insight [2]写字板/记事本 UE ...
- linux下源代码分析和阅读工具比较
Windows下的源码阅读工具Souce Insight凭借着其易用性和多种编程语言的支持,无疑是这个领域的“带头大哥”.Linux/UNIX环境下呢?似乎仍然是处于百花齐放,各有千秋的春秋战国时代, ...
- Azure、数据、AI开发工具
Azure.数据.AI开发工具 在今天召开的 Connect(); 2017 开发者大会上,微软宣布了 Azure.数据.AI 开发工具的内容.这是第一天的 Connect(); 2017 的主题演讲 ...
- 如何解析EML(邮件)格式的文件以及一款小巧的EML邮件阅读工具
在理解EML格式的时候,先回顾一下历史,这样有助于理解邮件的格式,比如邮件传输时为何会有多种编码方式.此外,理解EML格式也有助于理解HTTP协议. 历史溯源 由于历史原因,我们目前看到的大部分的网络 ...
- 一键上手时下最火AI作画工具
摘要:在华为云ModelArts上, 无需考虑计算资源.环境的搭建,就算不懂代码,也能按照教程案例,通过Stable Diffusion成为艺术大师. 本文分享自华为云社区<跟着华为云Model ...
随机推荐
- oppo、一加 android14 chrome116内核 input @click不触发
// 兼容Chrome内核116及以上版本中配置disabled的input组件无法触发并冒泡click事件 .uni-input-input:disabled { pointer-events: n ...
- spark读取写入jdbc.,Caused by: java.lang.NoSuchMethodException: org.apache.spark.sql.execution.datasources.jdbc.DriverWrapper.<init>()
df.write .option("truncate", "true") .option("driver", mysqlDriver) .m ...
- JSONPATH-阿里和jayway的实现测试
业务业务的需要,所以想找一个从对象中获取属性的工具. 搜了搜发现由阿里和jayway的实现,又花费了一些时间了解和练习,总结了一些要点: 阿里的可能快一些,但考虑到完备性,也许选择jayway更好一些 ...
- HTTP 协议学习:1-HTTP概述
背景 原文:HTTP概述 HTTP是一种能够获取如 HTML 这样的网络资源的 protocol(通讯协议).它是在 Web 上进行数据交换的基础,是一种 client-server 协议,也就是说, ...
- 在centos开启防火墙没启动22/tcp or 22/udp的情况下是如何ssh连上的
偶尔间查询防火墙的22/tcp or 22/udp ,看到是no的状态,而且此时也是ssh登陆的,然后就反复尝试,关闭22端口,开启,重载,重启.甚至连上另个服务器发现还是一样的情况.在群里问大佬们终 ...
- xlookup与vlookup的区别
区别还是很大的,vlookup暂时扔不了.
- mapreduce的shuffle机制
1.1 概述: mapreduce中,map阶段处理的数据如何传递给reduce阶段,是mapreduce框架中最关键的一个流程,这个流程就叫shuffle:(从map的输出到reduce的输入) s ...
- nginx配置端口转发 并修改swagger路径配置
项目服务器为linux,仅开放特定外网端口 所以部署的docker服务需要通过nginx 做端口转发 这里的配置使用的是 nginx docker服务 配置步骤: 1. 修改nginx配置文件,我这里 ...
- 树莓派4B-PCA9685驱动舵机
前言 不知道你们有没有遇到过这么一种情况,直接用树莓派的引脚输出PWM控制舵机,舵机是会出现抖动的.就算代码进行一定的时延迟优化还是会有影响的. 现在我们可以使用PCA9685这个模块去驱动舵机. P ...
- ScreenToGif:一款开源免费且好用的录屏转Gif软件
ScreenToGif介绍 GitHub上的介绍:此工具允许您记录屏幕的选定区域.来自网络摄像头的实时提要或来自草图板的实时绘图.之后,您可以编辑动画并将其保存为 gif.apng.视频.psd 或 ...