前言

由于笔者业团队的业务对即时通讯服务有很大的依赖,春节结束后的第一天,红包没到,产品同学先到了,产品同学和我说要做一款IM,看到需求文档后和设计图后笔者大吃一斤

这不就是一个翻版的web qq吗?

可以可以

联想到最最近美团的大象,头条的Lark,用户与用户,商家与用户,企业同事的沟通,及其衍生的配套增值服务,真是需求旺盛的强需求啊

如果我要做一个WebIM应用

现在的Web应用通常会考虑ajax轮询或者是long polling的方式来实现,但是频繁的建立https连接,会带来多余请求和消息精准性的问题,本质上是TCP,消息边界不清晰,会有黏包的情况

类似我司ios和andorid客户端,采用socket+PB协议来解决及时通讯问题,采用socket服务,依赖google的oc PB协议包来实现,socket是基于TCP协议,由通信协议和编程API组成的,原理一次HTTP协议握手成功后,与服务器建立双向连接,数据就可以直接从TCP 通道传输基于事件的方式,二级制传输,反编译为json或者xml

笔者在查阅翻google PB开发者文档时,看到17年下半年google发布了官方的js的版本,配合websocket,可以与PB协议进行配合,在实现原理上,优于现有的ajax轮询或者是long polling的实现方式

So,Let's rock !

Protocol Buffer是个什么东东?

Protocol Buffer是Google提供的一种数据序列化协议,下面是我从网上找到的Google官方对protobuf的定义:

Protocol Buffers 是一种轻便高效的结构化数据存储格式,可以用于结构化数据序列化,很适合做数据存储或 RPC 数据交换格式。它可用于通讯协议、数据存储等领域的语言无关、平台无关、可扩展的序列化结构数据格式。

为什么是Node,为何要和Protocol Buffer打交道?

做为javascript开发者,对我们最好的数据序列化协议当然是JSON,pb协议相较于之前流行的XML更加的简洁高效

pb属于二进制协议,更容易解析,解析速度比文本协议有二向箔级别的压制,so,在聊天场景下,udp传输明显是优于tcp的

后台通信基本是基于二进制的,以往我们开发中用到的纯文本协议是后台同学在封装一层实现的,例如我司的服务,就维护了两套,一套二进制的,一套http接口的,如果可以用Node打通了pb,可以将维护成本降到最低,理论上只有一套底层二级制服务

ps. 类似PB这样的东西,还有MessagePack和Apache Thrift

说的这么热闹,老夫已经迫不及待了!

想必你已经说,别逼逼,show me the code,怎么好的开发都么上进呢?

好吧,Let's Rock & Roll!

官方案例

我们来操作一下

安装google-protobuf

2017年4月开始官方支持javascript

github

develops

npm install google

  1. -protobuf

定义.proto文件

proto文件 messages.proto

  1. package zxwj;

  2. syntax = "proto3";

  3. message helloworld

  4. {

  5.   string zzuid = 123;  

  6.   string zzstatus = 0;

  7. }  

编译.proto文件

使用protobuf.js命令行工具编译

  1. protoc --js_out=import_style=commonjs,binary:. messages.proto

protoc会编译输入文件,并且构建messages_pb,在sever中,可以以以下方式引用

  1. var messages = require('./messages_pb');

  2. var message = new messages.MyMessage();

编写server.js

  1. var basepb = require('./messages_pb');

  2. console.log(basepb);

  3. var message = new basepb.SearchRequest();

  4. console.log(message);

  5. message.setName("TS");

  6. message.setPassword("123456");

  7. var bytes = message.serializeBinary(); //对象序列化

  8. console.log(bytes);

  9. var message2 = basepb.SearchRequest.deserializeBinary(bytes); //进制序列化

  10. console.log(message2);

运行

  1. node sever.js

总结一下

上个案例并不具备线上产品能力,但是还可以能看出PB协议的优势所在

快,从官方的测试结果来看,整体比較起來,ProtoBuf.js 則是比纯JSON 的处理快上一倍以上,附官方Github测试结果(机器配置:i7-2600K。Node.js 版本:6.9.1)

  1. benchmarking encoding performance ...

  2. Type.encode to buffer x 547,361 ops/sec ±0.27% (94 runs sampled)

  3. JSON.stringify to string x 310,848 ops/sec ±0.73% (92 runs sampled)

  4. JSON.stringify to buffer x 173,608 ops/sec ±1.51% (86 runs sampled)

  5.      Type.encode to buffer was fastest

  6.   JSON.stringify to string was 43.5% slower

  7.   JSON.stringify to buffer was 68.7% slower

  8. benchmarking decoding performance ...

  9. Type.decode from buffer x 1,294,378 ops/sec ±0.86% (90 runs sampled)

  10. JSON.parse from string x 291,944 ops/sec ±0.72% (92 runs sampled)

  11. JSON.parse from buffer x 256,325 ops/sec ±1.50% (90 runs sampled)

  12.    Type.decode from buffer was fastest

  13.     JSON.parse from string was 77.4% slower

  14.     JSON.parse from buffer was 80.3% slower

  15. benchmarking combined performance ...

  16. Type to/from buffer x 254,126 ops/sec ±1.13% (91 runs sampled)

  17. JSON to/from string x 122,896 ops/sec ±1.29% (90 runs sampled)

  18. JSON to/from buffer x 88,005 ops/sec ±0.87% (89 runs sampled)

  19.        Type to/from buffer was fastest

  20.        JSON to/from string was 51.7% slower

  21.        JSON to/from buffer was 65.3% slower

  22. benchmarking verifying performance ...

  23. Type.verify x 6,246,765 ops/sec ±2.00% (87 runs sampled)

  24. benchmarking message from object performance ...

  25. Type.fromObject x 2,892,973 ops/sec ±0.70% (92 runs sampled)

  26. benchmarking message to object performance ...

  27. Type.toObject x 3,601,738 ops/sec ±0.72% (93 runs sampled)

接下来要做的事情

PB的优势场景是IM中的数据存储和交互,如果要实现一个高品质的IM,信息流的稳定和边界很重要,我们还需要完善以下几个部分

  • 稳定可维护的Node socket.io服务(socket篇)

  • PB的动态编译的特性和嵌套message,数据结构简单化(数据篇)

  • 前端对于二级制的的处理,例如ArrayBuffer,序列化与反序列化,MD5加密(加密篇)

一看看懂Protocol Buffer(协议篇)的更多相关文章

  1. Google Protocol Buffer 协议

    1. Protocol Buffers 简介 Protocol Buffers (ProtocolBuffer/ protobuf )是Google公司开发的一种数据描述语言,类似于XML能够将结构化 ...

  2. protocol buffer第一篇:语法介绍

    先理解一下protocol buffer是什么东西. protocol buffer是google发明的一种数据序列化方案,和json是同种类型的玩意,它非常适合在rpc场景下使用.同json一样,p ...

  3. Protocol buffer序列化及其在微信蓝牙协议中的应用

    Protocol buffer是Google出品的一种轻便高效的结构化数据存储格式,可对结构化数据进行序列化,并具有语言无关.平台无关等特点,在通信协议和数据存储等领域已经得到广泛的应用.目前其已经提 ...

  4. [原创翻译]Protocol Buffer Basics: C#

    Protocol Buffer 基础知识:c#    原文地址:https://developers.google.com/protocol-buffers/docs/csharptutorial   ...

  5. Google Protocol Buffer 的使用和原理[转]

    本文转自: http://www.ibm.com/developerworks/cn/linux/l-cn-gpb/ Protocol Buffers 是一种轻便高效的结构化数据存储格式,可以用于结构 ...

  6. 学习Google Protocol buffer之语法

    上一篇结尾的时候问了几个问题,其实主要就是这个protoBuffer协议的语法,弄清楚语法后边才好开展工作嘛,不然大眼而对小眼儿,互相不认识,就没法玩耍了.其实就是学习怎么用google提供的这套 p ...

  7. Google Protocol Buffer 简单介绍

    以下内容主要整理自官方文档. 为什么使用 Protocol Buffers .proto文件 Protocol Buffers 语法 编译.proto文件 Protocol Buffers API 枚 ...

  8. Google Protocol Buffer 的使用和原理

    Google Protocol Buffer 的使用和原理 Protocol Buffers 是一种轻便高效的结构化数据存储格式,可以用于结构化数据串行化,很适合做数据存储或 RPC 数据交换格式.它 ...

  9. 【Google Protocol Buffer】Google Protocol Buffer

    http://www.ibm.com/developerworks/cn/linux/l-cn-gpb/ Google Protocol Buffer 的使用和原理 Protocol Buffers ...

随机推荐

  1. python 数据可视化 -- 生成可控的随机数据集合

    生成可控的随机数据集合 使用 numpy.random 模块 numpy.random.random(size=None)  返回 [0.0, 1.0) 区间的随机 floats, 默认返回一个 fl ...

  2. Idea如果添加Maven模块

    1.要创建一个和heaton-app同级的Maven模块,如果所示 2.点击下一步,添加ArtifactId,其中 groupId :       定义了项目属于哪个组,举个例子,如果你的公司是myc ...

  3. 项目管理 - PM、 SRS、SOW简介及范例

    PM在一个IT项目中的主要管理任务 http://blog.csdn.net/eaglezhang/article/details/1717171 计算机软件需求说明编制指南 http://blog. ...

  4. Apache Flink 简单安装

    流计算这两年很火了,可能对数据的实时性要求高.现在用的hadoop框架,对流计算的支持,主要还是微批(spark),也不支持“Exactly Once”语义(可以使用外接的数据库解决),公司项目可能会 ...

  5. idea编辑器激活码

    激活方式:License Server1.将地址 http://active.chinapyg.com/ 或者 http://idea.toocruel.net 任意一个复制到License Serv ...

  6. python_flask 基础巩固 (URL_FOR 详解)

    URL_FOR 详解 url_for 通过 视图函数能够返回对应的url,url_for 有两个参数,endpoint(视图 函数)和关键字参数 url_for('my_list',page=2),多 ...

  7. .net HttpListener 很慢

    使用   HttpListener 做的webserver ,撒逻辑没有,内网跨机器访问,都要200ms 替换方案 EvHttpSharp.dll 使用了 libevent_core,libevent ...

  8. python2 python3区别(续)

    1.除法 Python2 Python3 int/int → int int/int → float python2下整数除以整数返回整数类型,python3下整数除以整数返回浮点数类型 当某些语句假 ...

  9. vue组件通信新姿势

    在vue项目实际开发中我们经常会使用props和emit来进行子父组件的传值通信,父组件向子组件传递数据是通过prop传递的, 子组件传递数据给父组件是通过$emit触发事件来做到的.例如: Vue. ...

  10. 两个VirtualBox版本装的语言不一样?

    两个VirtualBox版本装的语言不一样? 1.这个是我用的两个版本的VirtualBox. 2.用这个 VirtualBox-4.3.20-96997-Win.exe安装的时候,一直是英文. 3. ...