生产力工具 + AI 是不可逆转的趋势，慢慢的大模型能力通过 AI Agent 落地的工程化能力也开始趋于成熟。作为大数据产品的数栈也必然是需要借助 AI 能力提升产品竞争力。

去年 12 月，我们在产品中上线了 AI+ 的功能，借助已经开源的大模型的能力，帮助我们探索和落地更多地应用场景。在初版 AI+ 的功能中，我们实现了基础功能的通话。

SSE

在 ChatGPT 中，我们在等待大模型生成回答的时间通常不需要很久。这是因为 ChatGPT 通过 server-sent events（SSE）来实现将生成的部分回答通过事件流传递到前端。而这就让前端不必等回答全部生成后再获取，也就使得不需要请求等待很久。

SSE 是一种基于 HTTP 协议的单向通信机制，用于服务端向客户端推送数据。

SSE	WebSocket
基于 HTTP 协议	基于 TCP 连接，本身是一种协议
单向通信	双向通信
简单易用	复杂

入门使用

// 创建 SSE 的实例

const evtSource = new EventSource("//api.example.com/ssedemo.php", {

  withCredentials: true,

});

// 添加监听事件

evtSource.onmessage = (event) => {

  const newElement = document.createElement("li");

  const eventList = document.getElementById("list");

  newElement.textContent = `message: ${event.data}`;

  eventList.appendChild(newElement);

};

// 错误处理

evtSource.onerror = (err) => {

  console.error("EventSource failed:", err);

};

// 关闭事件流

evtSource.close();

需要注意的是，SSE 请求的服务端响应信息头的 MIME 类型必须是text/event-stream，否则会无法监听到事件。

另外，由于是基于 HTTP 协议的，所以在 HTTP/1.1 或更低的时候，会受浏览器最大连接数的限制。

Fields

收到的消息格式一定是具有以下字段的某种组合，其他字段名都将忽略，每行一个：

event
data
id
retry

: this is a test stream // 第一条消息，这会被解析会注释

data: some text // 第二条消息

data: another message // 第三条消息

data: with two lines

event: userconnect // 第四条消息

data: {"username": "bobby", "time": "02:33:48"}

如上所示，默认浏览器的 EventSource API 虽然可用，但是限制比较多。

只支持 url 和 withCredentials 参数。不支持往 body 里传参数。而通常来说 URL 是有最大长度限制的。
无法自定义请求头。
只能发起 GET 请求。

其实，我们也可以通过 Fetch 来实现 SSE 的通信，只不过需要额外自行处理数据流的传递。

实现

首先，我们借助 Fetch 的能力来实现请求。

const response = await fetch(url, options);

通过接受用户提供的 url 和 options 发起一个 fetch 的请求。

然后，我们需要排除掉非 SSE 的请求类型，我们可以直接拿响应的 header 中拿 content-type进行判断。

const contentType = response.headers.get('content-type');

if (!contentType?.startsWith('text/event-stream')) {

    throw new Error('SSE 请求必须设置 content-type 为 text/event-stream');

}

接着，我们业务场景中通常直接通过 response.json()获取 JSON 格式的数据了，但这里我们由于是事件流，所以我们通过 response.body 拿到的是一个 ReadableStream。我们需要借助相关的 API 进行流的读取。

const reader = response.body.getReader();

let result: ReadableStreamDefaultReadResult<Uint8Array>;

while (!(result = await reader.read()).done) {

  	// 假定每一次 read 的 value 都是完整的消息

    onmessage(onChunk(result.value));

}

其中 onChunk 函数就是处理事件流中的每一份数据的。

// 伪代码

function onChunk(arr: Uint8Array){

  const links = seekLinks();

  // 待完善

}

在实现 seekLinks 方法之前，我们需要先知道到什么时候算每一行的结束。

从 Fields 可以知道，每一行是以\n作为区分的。

function seekLinks(arr: Uint8Array){

  const lines = [];

  const buffer = arr;

  const bufLength = buffer.length;

  let position = 0;

  let lineStart = 0;

  while(position < bufLength){

    // '\n'.charCodeAt() === 10;

    if(buffer[position] === 10){

      lines.push(buffer.slice(lineStart, position));

      lineStart = position;

    };

    position += 1;

  }

  return lines;

}

在获取到所有行后，针对每一行做处理。

// 伪代码

function onChunk(arr: Uint8Array){

  const links = seekLinks();

  const decoder = new TextDecoder();

  let message = {

    data: '',

    event: '',

    id: '',

    retry: undefined,

  }:

  links.forEach((line) => {

    // ':'.charCodeAt() === 58;

    const colon = line.findIndex(l => l === 58);

    const fieldArr = line.slice(0, colon);

    const valueArr = line.slice(colon);

    if(colon === -1){

      // 当冒号作为开头的时候，解析成注释

      return;

    }

    const field = decoder.decode(fieldArr);

    const value = decoder.decode(valueArr);

    switch (field) {

      case 'data':

          message.data = message.data

              ? message.data + '\n' + value

              : value;

          break;

      case 'event':

          message.event = value;

          break;

      case 'id':

          message.id = value;

          break;

      case 'retry':

          const retry = parseInt(value, 10);

          message.retry = retry

          break;

  	}

  });

  return message;

}

大致完成了最简单的基础功能的解析，而以上伪代码参考 fetch-event-source 的源码。

借助 fetch-event-source 的能力，在数栈产品中调用的方式和 HTTP 请求基本保持一致。

function sse(url: string, params: any, options: FetchEventSourceInit) {

  const headers = {

    'Content-Type': 'application/json',

    accept: 'text/event-stream',

  };

  fetchEventSource(url, {

    method: 'POST',

    body: JSON.stringify(params),

    headers,

    ...options,

  });

}

打字机效果

接着，我们实现具备科技感的打字机效果：

输出

这里我们不能直接将响应的消息直接打印到屏幕上，因为响应的消息通常是好多字，这样子会导致打字机效果显得非常卡顿，用户体验不佳。

在数栈产品中，我们通过将响应的消息收集到暂存区中，然后通过每秒从暂存区中取出若干个字符打印到屏幕上，优化打字机卡顿的效果。

function AIGC(){

   const typing = useTyping({

      // 暂存区启动后，每个 delay 的时间都会执行该方法将消息打印到屏幕上

      onTyping(val) {

        // ...

      },

  });

	const handleChat = (message: string) => {

      // 标志暂存区需要开始存响应的消息了

      typing.start();

      requestChat(params, {

        onmessage(event: { data: string }) {

           	const { data } = event;

            // 把响应的消息存入暂存区中

            typing.push(data);

        },

        onclose() {

            // 关闭或失败的话，释放暂存区的数据

            typing.close();

        },

        onerror() {

            typing.close();

        },

    });

  };

}

其中，相关暂存区的代码整理成 useTyping 实现。

export default function useTyping({

    onTyping,

    onEnd,

}: {

    onTyping: (val: string) => void;

    onEnd: () => void;

}) {

    const interval = useRef<number>();

    const queue = useRef<string>('');

    const isStart = useRef<boolean>(false);

    function startTyping() {

        if (interval.current) return;

        let index = 0;

        interval.current = window.setInterval(() => {

            if (index < queue.current.length) {

                const str = queue.current;

                onTyping(str.slice(0, index + 1));

                index++;

            } else if (!isStart.current) {

                // 如果发送了全部的消息且信号关闭，则清空队列

                window.clearInterval(interval.current);

                interval.current = 0;

                onEnd();

            }

            // 如果发送了全部的消息，但是信号没有关闭，则什么都不做继续轮训等待新的消息

        }, 50);

    }

    useEffect(() => {

        return () => {

            window.clearInterval(interval.current);

            interval.current = 0;

        };

    }, []);

    function start() {

        isStart.current = true;

        window.clearInterval(interval.current);

        interval.current = 0;

        queue.current = '';

    }

    function push(str: string) {

        if (!isStart.current) return;

        queue.current += str.replace(/\\n/g, '\n');

        startTyping();

    }

    // 关闭的时候不需要清空队列，因为可能还有一些消息没有发送完毕，统一等消息发送完毕后关闭

    function close() {

        isStart.current = false;

    }

    return { start, push, close };

}

光标

在实现了打字机效果后，我们还需要添加一个闪烁的光标。

原理比较简单，就是在消息区域的最后一个元素的末尾添加元素即可。

.markdown {

  >*:last-child::after {

    content: " ";

    width: 2px;

    height: 13px;

    transform: translate(1px, 2px);

    font-family: Menlo, Monaco, "Courier New", monospace;

    font-weight: normal;

    font-size: 0;

    font-feature-settings: "liga" 0, "calt" 0;

    line-height: 13px;

    letter-spacing: 0;

    display: inline-block;

    visibility: hidden;

    animation: blinker 1s step-end infinite;

    background: #000;

  }

  @keyframes blinker {

    0% {

      visibility: inherit;

    }

    50% {

      visibility: hidden;

    }

    100% {

      visibility: inherit;

    }

  }

}

当然，这里有一些问题，在 markdown 解析出 Code Block 的时候会导致光标错位，这个问题 ChatGPT 同样也有。

那么到这里，我们就实现了一个具备基础功能的 AI+ 的需求。

袋鼠云数栈产品中 AI+ 实现原理剖析的更多相关文章

深入云存储系统Swift核心组件：Ring实现原理剖析
http://www.cnblogs.com/yuxc/archive/2012/06/22/2558312.html 简介 OpenStack是一个美国国家航空航天局和Rackspace合作研发的开 ...
0000 - Spring 中常用注解原理剖析
1.概述 Spring 框架核心组件之一是 IOC,IOC 则管理 Bean 的创建和 Bean 之间的依赖注入,对于 Bean 的创建可以通过在 XML 里面使用 <bean/> 标签来 ...
Spring 中常用注解原理剖析
前言 Spring 框架核心组件之一是 IOC,IOC 则管理 Bean 的创建和 Bean 之间的依赖注入,对于 Bean 的创建可以通过在 XML 里面使用 <bean/> 标签来配置 ...
袋鼠云研发手记 | 数栈·开源：Github上400+Star的硬核分布式同步工具FlinkX
作为一家创新驱动的科技公司,袋鼠云每年研发投入达数千万,公司80%员工都是技术人员,袋鼠云产品家族包括企业级一站式数据中台PaaS数栈.交互式数据可视化大屏开发平台Easy[V]等产品也在迅速迭代.在 ...
袋鼠云研发手记 | 开源·数栈-扩展FlinkSQL实现流与维表的join
作为一家创新驱动的科技公司,袋鼠云每年研发投入达数千万,公司80%员工都是技术人员,袋鼠云产品家族包括企业级一站式数据中台PaaS数栈.交互式数据可视化大屏开发平台Easy[V]等产品也在迅速迭代.在 ...
袋鼠云出品！数栈UI 5.0全新体验升级，设计背后的故事
我们是袋鼠云数栈 UED 团队,致力于打造优秀的一站式数据中台产品.我们始终保持工匠精神,探索前端道路,为社区积累并传播经验价值. 前言数栈作为云原⽣⼀站式⼤数据开发平台,从2016年发布第⼀个版本 ...
华夏基金X袋鼠云：基金业数字化转型，为什么说用户才是解题答案？
"精准营销是以客户为中心,运用各种可利用的方式,在恰当的时间,以恰当的价格,通过恰当的渠道,向恰当的顾客提供恰当的产品." 这是学者许瑾在科特勒精准营销理论的基础上,从实践的角度对 ...
Molecule实现数栈至简前端开发新体验
Keep It Simple, Stupid. 这是开发人耳熟能详的 KISS 原则,也像是一句有调侃意味的善意提醒,提醒每个前端人,简洁易懂的用户体验和删繁就简的搭建逻辑就是前端开发的至简大道. 这 ...
袋鼠云研发手记 | 袋鼠云EasyManager的TypeScript重构纪要
作为一家创新驱动的科技公司,袋鼠云每年研发投入达数千万,公司80%员工都是技术人员,袋鼠云产品家族包括企业级一站式数据中台PaaS数栈.交互式数据可视化大屏开发平台Easy[V]等产品也在迅速迭代.在 ...
数栈运维实例：Oracle数据库运维场景下，智能运维如何落地生根？
从马车到汽车是为了提升运输效率,而随着时代的发展,如今我们又希望用自动驾驶把驾驶员从开车这项体力劳动中解放出来,增加运行效率,同时也可减少交通事故发生率,这也是企业对于智能运维的诉求. 从人工运维到自 ...

随机推荐

云小课｜MRS基础原理之Flink组件介绍
阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说).深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云.更多精彩内容请单击此处. 摘要:Flink是一个批 ...
数仓专家面对面 | 为什么我选择GaussDB(DWS)
摘要:你知道数仓是如何应运而生的吗?你了解数仓未来的发展趋势吗?想知道国内数仓专家的看法吗? 导语数据仓库的发展一直是备受关注的议题,随着近年来技术的不断演进,数仓也在更新迭代. 你知道数仓是如何应 ...
vue2升级vue3: h、createVNode、render、createApp使用
h.createVNode 杂乱笔记,凑合着看,不喜勿喷! h 函数是什么 h 函数本质就是 createElement() 的简写,作用是根据配置创建对应的虚拟节点,在vue 中占有极其重要的地位! ...
CentOS7与centOS8的抉择
目前国内各大云服务器的默认centos 系统版本还是7,vultr,centos只有8了官网,下载,默认也是8,作为本地主机玩的服务器,还是试一下centos8 国外下载之前版本,下载链接: 官网默 ...
火山引擎数智平台ByteHouse入围稀土掘金《Top10 年度创新产品》
更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群近日,国内开发者技术社区稀土掘金发布「2022 稀土掘金引力榜」,旨在盘点 2022 年在数字化转型领域内最具影响 ...
PPT 年终总结PPT 应该怎么样改
机器学习的线性代数（Python 版）
线性代数是数学的分支学科,涉及矢量.矩阵和线性变换.它是机器学习的重要基础,从描述算法操作的符号到代码中算法的实现,都属于该学科的研究范围. 虽然线性代数是机器学习领域不可或缺的一部分,但二者的紧密关 ...
通过Navicate for MySQL导入SQL文件
本文介绍通过Navicate for MySQL导入SQL文件的方法. 前提条件已安装Navicat for MySQL 和 MySql.您可以前往 Navicat官网下载Navicat for ...
Java | VS Code 如何导入外部 jar 包源
Java Extension Pack里的Project Manager for Java扩展,安装后在文档查看的下方会有"JAVA PROJECTS",在Referenced L ...
Golang之文件系统事件监听
Golang之文件系统事件监听基本介绍文件系统事件是指文件系统相关的各种操作和状态变化,当一个应用层的进程操作文件或目录时,会触发system call,内核的notification子系统可以守 ...

袋鼠云数栈产品中 AI+ 实现原理剖析

SSE

入门使用

实现

打字机效果

输出

光标

袋鼠云数栈产品中 AI+ 实现原理剖析的更多相关文章

随机推荐

热门专题